Überblick Teil 1











Überblick empirische Forschung
Einführung: Neopositivismus
Stichprobe (n), Variable(n)
Skalenniveaus
Hauptgütekriterien: Objektivität, Reliabilität,
Validität
Hypothesen u. Hypothesenbildung
Versuchsplanung und Fehlerquellen
Testinstrumente insbesondere Fragebogen
Mittelwert, Median, Modalwert, Varianz,
Streuungsmaße
Normalverteilung
Chi-Quadrat-Test
1
Überblick Statistik
Deskriptive Statistik=beschreibende Statistik
Inferenzstatistik=schließende Statistik
2 Arten von Hypothesenprüfungen möglich
1) Zusammenhänge: Korrelation,
Regression
2) Unterschiede: X2, T-Test, U-Test,
Wilcoxon, KS-Test, Varianzanalysen etc.
2
KORRELATION
Tamara Katschnig
Definition
Korrelation bezeichnet den
Zusammenhang zwischen zwei
Variablen;
„Korrelationskoeffizienten
informieren über den
Zusammenhang zwischen zwei
Variablen.“ (Clauss u. Ebner
1974, 115)
4
Korrelationskoeffizienten
Variable x Intervallskaliert
Variable y
Intervallskaliert
Variable y
Ordinal/Rangskaliert
Variable y
Nominal
Variable x
Ordinal/
Rangskaliert
Variable x
Nominal
MaßkorrelationsKoeffizient r (Pearson)
lineare Korrelation
Produkt-MomentKorrelation
RangkorrelationsKoeffizient R
(Spearman) oder
Kendall Tau τ
Vierfelderkorrelation: Φ PhiKoeffizient 5
Werte der Korrelation
r= +1 starker positiver Zusammenhang
z.B. Leistung und Intelligenz
r= -1 starker negativer Zusammenhang
z.B. Leistung und Angst
r= 0 kein Zusammenhang
z.B. Schuhgröße und Haarfarbe
6
Werte der Korrelation
r= 0,00000001 bis 0,3 geringer Zus.hang
r= 0,4 bis 0,7 mittlerer Zusammenhang
r= 0,8 bis 1 starker Zusammenhang
7
Vierfelderkorrelation rΦ
Zus.hang zw. zwei dichotomen Variablen
rΦ=
a.d-b.c
√(a+c).(b+d).(a+b).(c+d)
A1
A2
Zeilensumme
B1
a
b
a+b
B2
c
d
C+d
b+d
a+b+c+d=N
Spaltensumme a+c
8
Vierfelderkorrelation rΦ
Bspl. Zusammenhang zwischen Geschlecht +
Essensgewohnheiten (normalesser vs. Vegetarier)
HO: Es gibt keinen Zusammenhang zwischen
Geschlecht+Essgewohnheiten
H1: Es gibt einen Zus. hang. Zwischen
Geschlecht+Essgewohnheiten
weiblich
Vege- Normal Zeilensumme
tarier esser
35
90
125
männlich
15
110
125
Spaltensumme 50
200
250=N
9
Vierfelderkorrelation rΦ
rΦ= (35.110-90.15)
2500
√(50.200.125.125) = 12500 =0,2
Ergebnis : rΦ=0,2 d. h. es besteht nur ein
sehr geringer Zusammenhang zw. G+E
H1 gilt: Es gibt einen Zusammenhang
zwischen Geschlecht+Essgewohnheiten
10
Pearson-Korrelation r
Zus.hang zw. zwei intervallskalierten Variablen
Berechnung erfolgt durch Mittelwert und
Standardabweichung
Maß, das über die Enge des Zusammenhangs
zwischen Variable x und y unterrichtet =
Kovarianz =“gemeinsame Varianz von x und y“
Das daraus resultierende Maß wird als
Korrelationskoeffizient (r) bezeichnet
11
Pearson-Korrelation r
Um zu bestimmen, ob es sich dabei um einen
hohen Zusammenhang handelt, muss man den
Korelationskoeffizienzen quadrieren und mit
100 multiplizieren.
Der daraus resultierende Wert wird als
Bestimmtheitsmaß/Determinationskoeffizient
bezeichnet und gibt uns den gemeinsamen
Varianzanteil von x und y an:
B=rxy2.100
12
Pearson-Korrelation r
Beispiel für B
r=0,3
r=0,6
r=0,8
r=0,9
9% erklärte Varianz
36% erklärte Varianz
64% erklärte Varianz
81% erklärte Varianz
13
Spearmann-Korrelation R
Zus.hang zw. zwei rangskalierten Variablen
Berechnung erfolgt durch Rangreihen der Werte
Dabei werden allen vorkommenden Werten
Rangplätze zugeordnet. Der kleinste Wert
bekommt den Rangwert 1, der zweitkleinste 2
usw., der größte Wert erhält den Rangplatz n.
Um den Zusammenhang zwischen zwei
rangskalierten Variablen zu ermitteln, muss
man jede Variable für sich rangreihen. Es muss
dann für jede Versuchsperson die
Rangreihendifferenz gebildet werden: d
14
Spearmann-Korrelation R
Bspl.: 13 Personen wurden auf einer zehnstufigen Skala bzgl. ihrer
Ängstlichkeit eingeschätzt, dies sind die Rohdaten:
1 2 3 4 4 5 6 7 8 8 8 9 10
1 2 3 4,5 4,5 6 7 8 10 10 10 12 13 Rangplätze
Der kleinste Wert 1 hat den Rangplatz 1,
der zweitkleinste 2 den Rangplatz 2,
der drittkleinste hat Rangplatz 3,
der viertkleinste Wert 4 kommt zweimal vor, würde man Rang 4 und 5
vergeben würde dies das Bild verzerren, daher bekommen beide
den Mittelwert aus 4+5/2=4,5,
fortgesetzt wird die Reihe mit Rangplatz 6, den Wert 5 einnimmt,
Rangplatz 7 ist Wert 6,
Rangplatz 8 ist Wert 7,
Rangplatz 9, 10 und 11 ist 8 und zwar 3x (9+10+11/3=10) ist 10,
Rangplatz 12 ist 9,
Rangplatz 13 (=n) ist 10.
15
Kendall Tau τ
Zus.hang zw. zwei rangskalierten Variablen
Berechnung erfolgt durch Rangreihen der Werte
Voraussetzung hierfür ist, dass mindestens eine
der Variablen x oder y Rangskalenniveau hat.
xi und yi werden gerangreiht R(xi) und R(yi).
Für jede Rangzahl wird die Anzahl von
Rangzahlen (qi) von R (yi) ausgezählt, die
kleiner oder gleich sind und in der Rangordnung
hinter R (yi) stehen.
16
Partielle Korrelation
Korrelationen zwischen x und y ist durch eine
sogenannte Störvariable z verschmutzt.
Mittels Partieller Korrelation lässt sich dieser
Störeinfluss herausfiltern.
Bspl.
x…..Berühmtheit eines Chirurgen
y....Überlebenswahrscheinlichkeit eines Patienten
z……..Schwere der Krankheit
17
Signifikanzniveau sozialwiss.


p<0,05 Ergebnis ist signifikant
H1 gilt: Es gibt einen Zusammenhang
zwischen den berechneten Variablen.
p>0,05 Ergebnis ist nicht signifikant
H0 gilt: Es gibt keinen Zusammenhang
zwischen den berechneten Variablen.
95% Sicherheit, 5% Irrtumswahrscheinlichkeit
18
Signifikanzniveau Medizin


p<0,01 Ergebnis ist signifikant
H1 gilt: Es gibt einen Zusammenhang
zwischen den berechneten Variablen.
p>0,01 Ergebnis ist nicht signifikant
H0 gilt: Es gibt keinen Zusammenhang
zwischen den berechneten Variablen.
99% Sicherheit, 1% Irrtumswahrscheinlichkeit
19
KORRELATION
Übung
Tamara Katschnig
Vierfelderkorrelation
Beispiel 0
In einer Klasse von 10 SchülerInnen soll der Zusammenhang
von Englisch- und Deutschkenntnissen überprüft werden. Es
liegen folgende Daten vor: r=????
Deutsch gut
Deutsch
schlecht
Spaltensumme
Englisch
gut
5
1
Englisch Zeilensumme
schlecht
2
2
10=N
21
Pearsonkorrelation

Beispiel 1
5 Personen erreichten jeweils bei einem Test A xi
und bei einem Test B yi Punkte, die in
untenstehender Tabelle zu finden sind:
Zeichen Sie die zugehörige „Punktwolke“ und
interpretieren Sie den Korrelationskoeffizient r nach
Pearson von r=0,94 Berechnen Sie B=?
Drücken Sie in eigenen Worten aus, was der
berechnete Wert des Korrelationskoeffizienten
besagt.
Test A
2
1
9
5
3
Test B
1
2
6
4
2
22
Pearsonkorrelation
Beispiel 2
10 SchülerInnen erreichten jeweils bei einem Rechtschreibtest
xi und bei einem Lesetest yi Punkte, die in untenstehender
Tabelle zu finden sind:
Zeichen Sie die zugehörige „Punktwolke“ und interpretieren Sie
den Korrelationskoeffizient r nach Pearson r=0,988 B=?
Drücken Sie in eigenen Worten aus, was der berechnete Wert
des Korrelationskoeffizienten besagt.
xi
2
4
7
9
10
12
13
15
16
19
yi
3
4
9
12
12
14
16
17
18
20
23
Spearmann-Korrelation
Beispiel 3
Zwei KunstkritikerInnen bringen 12 Gemälde nach ihrem Wert in
eine Rangreihe (siehe nachstehende Tabelle).
Stimmen die Urteile der beiden KritikerInnen überein?
Interpretieren Sie die Rangkorrelation R nach Spearman von
R=0.83 Berechnen Sie B=??.
Drücken Sie in eigenen Worten aus, was der berechnete Wert
des Korrelationskoeffizienten besagt.
Gemälde
1 2
3
4
5
6 7 8 9
10 11 12
Kritikerin 1
8 7
3
11
4
1 5 6 10 2
12 9
Kritikerin 2
6 9
1
12
5
4 8 3 11 2
10 7
24
Kendall Tau-Korrelation
Beispiel 4
Zwei Personen bewerten neun Produkte derselben
Produktpalette, indem sie diese in eine Rangreihe
bringen müssen (siehe nachstehende Tabelle).
Es stellt sich nun die Frage, ob die beiden Personen
die Produkte in etwa gleichwertig einschätzen.
R=0,72; Berechnen und interpretieren Sie B=???
Produktnummer
1
2 3 4
5 6
7
8 9
Rangreihe Person 1
2
5 8 3
9 6
1
7 4
Rangreihe Person 2
1
6 7 4
8 5
2
9 3
25
Vierfelderkorrelation-Lösung
Beispiel 0
In einer Klasse von 10 SchülerInnen soll der Zusammenhang von
Englisch- und Deutschkenntnissen überprüft werden. Es liegen
folgende Daten vor:
rΦ= 0,36 B=12,9% Es besteht ein sehr geringer Zus.hang zw. Englisch
und Deutschkenntnissen
Deutsch gut
Deutsch
schlecht
Spaltensumme
Englisch
gut
5
1
Englisch Zeilensumme
schlecht
2
2
10=N
26
Pearsonkorrelation-Lösung
Beispiel 1
5 Personen erreichten jeweils bei einem Test
A xi und bei einem Test B yi Punkte, die in
untenstehender Tabelle zu finden sind:
Pearson von r=0,94 B=88,4%
Es besteht ein hoher Zus.hang zwischen Test
A und Test B.
Test A
2
1
9
5
3
Test B
1
2
6
4
2
27
Pearsonkorrelation-Lösung
Beispiel 2
10 SchülerInnen erreichten jeweils bei einem Rechtschreibtest
xi und bei einem Lesetest yi Punkte, die in untenstehender
Tabelle zu finden sind:
r=0,988 B= 97,6%
Es besteht ein hoher Zusammenhang
zwischen dem Rechtschreib- und dem
Lesetest.
xi
2
4
7
9
10
12
13
15
16
19
yi
3
4
9
12
12
14
16
17
18
20
28
Spearmann-Korrelation-Lösung
Beispiel 3
Zwei KunstkritikerInnen bringen 12 Gemälde nach ihrem Wert in
eine Rangreihe (siehe nachstehende Tabelle).
R=0,83 B=68,8%
Es besteht ein relativ hoher Zusammenhang
zwischen den Urteilen der KunstkritikerInnen bzw.
die beiden KunstkritikerInnen stimmen zu 68,8% (ca.
2/3) bei der Beurteilung der Gemälde überein.
Gemälde
1 2
3
4
5
6 7 8 9
10 11 12
Kritikerin 1
8 7
3
11
4
1 5 6 10 2
12 9
Kritikerin 2
6 9
1
12
5
4 8 3 11 2
10 7
29
Kendall Tau-Korrelation-Lösung
Beispiel 4
Zwei Personen bewerten neun Produkte derselben
Produktpalette, indem sie diese in eine Rangreihe
bringen müssen τ=0,72; B=51,8%
Es besteht ein hoher Zus.hang zwischen der
Einschätzung der beiden Personen bzw. die beiden
Personen schätzen die Produkte zu 51,8% oder die
Hälfte in etwa gleichwertig ein.
Produktnummer
1
2 3 4
5 6
7
8 9
Rangreihe Person 1
2
5 8 3
9 6
1
7 4
Rangreihe Person 2
1
6 7 4
8 5
2
9 3
30
Korrelation Bspl. SPSS
Cholesterin,
Ausgangswert
Cholesterin,
nach 1 Monat
Cholesterin,
Ausgangswert
Cholesterin,
nach 1 Monat
Korrelation nach
Pearson
1
,861
Signifikanz (2seitig)
,
,000
N
174
174
Korrelation nach
Pearson
,861
1
Signifikanz (2seitig)
,000
,
N
174
174
31

Spearmann-Korrelation R