Die t-Verteilung
(fortgesetzt)
Jonathan Harrington
shapiro.test(), var.test(), wilcox.test(), qqnorm()
t-test Durchführung
zwei Stichproben, x und y. Sind die Mittelwerte
von x und y voneinander signifikant
unterschiedlich?
pfad = "Das Verzeichnis, wo die Daten gespeichert ist"
mfdat = read.table(paste(pfad, "mfdur.txt", sep="/"))
x = mfdat[,1]
y = mfdat[,2]
x und y
Sind x und y normalverteilt?
shapiro.test(x)
shapiro.test(y)
nein
ja
Sind die Varianzen von x und y
voneinander signifikant
unterschiedlich?
var.test(x, y)
nein
ja
t.test(x,y)
wilcox.test(x, y)
t.test(x,y, var.equal=T)
shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.9866, p-value = 0.9037
Die Wahrscheinlichkeit, dass die
Werte normalverteilt sind.
Wenn p < 0.05 dann weicht die Stichprobe signifikant von
einer Normalverteilung ab, und der t-test soll nicht
eingesetzt werden.
qqnorm()
Je mehr die Werte von der geraden Linie abweichen, umso
unwahrscheinlicher ist es, dass die Werte einer
Normalverteilung folgen.
qqnorm(x)
qqnorm(y)
qqline(x)
qqline(x)
100 120 140
80
40
60
80
Sample Quantiles
100 120 140
Normal Q-Q Plot
60
Sample Quantiles
Normal Q-Q Plot
-2
-1
0
1
Theoretical Quantiles
shapiro.test(x)
p-value = 0.9037
2
-2
-1
0
1
2
Theoretical Quantiles
shapiro.test(y)
p-value = 0.08804
var.test()
prüft ob die Varianzen der beiden Stichproben
voneinander signifikant abweichen.
Um signifikante Unterschiede zwischen Varianzen
festzustellen, wird ein F-test und die F-Verteilung
verwendet – diese Verteilung ist das gleiche wie die
t-Verteilung hoch 2.
var(x)
[1] 428.9193
var(y)
[1] 516.3584
var(x)/var(y)
[1] 0.830662
var.test(x,y)
F test to compare two variances
data: x and y
F = 0.8307, num df = 40, denom df = 40, p-value = 0.5601
alternative hypothesis: true ratio of variances is not equal to
1
95 percent confidence interval:
0.4429731 1.5576553
sample estimates:
ratio of variances
0.830662
Der Unterschied zwischen den Varianzen ist nicht
signifikant (genauer: das Verhältnis zwischen den
Varianzen weicht nicht signifikant ab von 1).
F = 0.83, df=40, 40, p > 0.05
Wenn keine Normalverteilung
Wilcoxon Rank Sum and Signed Rank Tests (Mann-Whitney test)
wilcox.test(x, y)
Wilcoxon rank sum test with continuity correction
data: x and y
W = 1246, p-value = 0.0001727
alternative hypothesis: true location shift is not equal to 0
Der Unterschied zwischen x und z ist signifikant.
(Wilcoxon rank sum test, W = 1246, p < 0.001)
Normalverteilung, Varianzen sind unterschiedlich
t.test(x, y)
Welch Two Sample t-test
data: x and y
t = 3.6947, df = 79.321, p-value = 0.0004031
alternative hypothesis: true difference in means is not
equal to 0
95 percent confidence interval:
8.183973 27.297539
sample estimates:
mean of x mean of y
97.95751 80.21676
Der Unterschied zwischen x und y ist signifikant (t =
3.69, df = 79.3, p < 0.001)
…sonst t.test(x,y, var.equal=T)

ttest