Wiederholung und
Beispiele
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Biologische Variabilität
• In der belebten Natur gibt es viele Phänomene, die
im Einzelfall nicht vorhersehbar sind.
• Verschiedene Menschen und Tiere reagieren
verschieden, haben verschiedene Eigenschaften etc.
• Unter exakt gleichen Haltungsbedingungen werden
manche Tiere krank, manche bleiben gesund.
• Manche Individuen reagieren auf ein Medikament,
manche nicht.
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Biologische Variabilität (2)
Einerseits:
• Besonderer Reiz von Phänomenen in der belebten Natur
• Weiterentwicklung ohne natürliche Variabilität nicht
möglich
Andererseits:
• Erkenntnisse zu gewinnen ist wesentlich schwieriger
• Wirkungsmechanismen häufig nicht deterministisch
• Absolute Sicherheit bei Prognosen in Einzelfällen oft
unmöglich
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Modell für biologische Variabilität:
Wahrscheinlichkeitsrechnung
Aussagen der Form:
• „Die Heilungschance ist mit Medikament A
höher als mit Medikament B“
• „Nebenwirkungen des Medikaments treten in
1 von 1000 Fällen auf“
• „Die Herzfrequenz ist bei schweren
Leguanen im Durchschnitt höher“
• „Die Herzfrequenz von gesunden Leguanen
liegt mit einer Wahrscheinlichkeit von 99%
unter dem Wert x“
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Wichtige Rechenregeln für Wahrscheinlichkeiten
Gegenereignis: P(AC) = 1- P(A)
Additionssatz : P(A  B) = P(A) + P(B) - P(A  B)
P(A  B) = P(A) + P(B) - P(A  B)
Beispiel :
A
= {2,4,6}
B
= {4,5,6}
A B = {2,4,5,6}
A  B = {4,6}
„gerade“
„groß“
„groß oder gerade“
„ groß und gerade “
P(A B ) = 4/6
P(A) + P(B) - P(A  B) = 3/6+3/6-2/6
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Definition der bedingten Wahrscheinlichkeit
In dem Beispiel betrachten wir das Risiko gegeben
„schwerer Fall“: Das Risiko wird berechnet durch
Anzahl( schwer und nicht überlebt)
Anzahl( schwer)
Allgemein definieren wir die Wahrscheinlichkeit von
„Ereignis B gegeben A“
P( A  B)
P( B | A) :
P( A)
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Definition stochastische Unabhängigkeit
Zwei Ereignisse A und B heißen unabhängig, falls gilt:
P( B | A)  P( B)
P( A | B)  P( A)
P( A  B)  P( A)  P( B)
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Bedingte Wahrscheinlichkeiten
SZ vom 8.2.:
Krebshäufigkeit gestiegen
Aber: Alterspezifische Krebsraten gefallen
Hypothetisches Beispiel:
1960:
Jung: 2%
Alt : 10%
Anteil Jung und Alt jeweils 50%
Daraus Gesamtrate 0.5*2%+0.5*10% = 6%
2006:
Jung : 1%
Alt : 9%
Anteil Alt 2/3 Jung 1/3
Gesamt: 2/3*9% + 1/3*1% = 6.33%
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Fehlspezifikationswahrscheinlichkeiten
(bedingte) Klassifikationswahrscheinlichkeiten
Diagnose:
wahrer Status
Klassifikation positiv
negativ
positiv
negativ
Sensitivität
Empfindlichkeit
P(T+|K+)
Spezifität
Treffsicherheit
P(T-|K-)
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Medizinische Tests
1000Personen
10 Erkrankt
9 Test P
1 Test N
990Gesund
10 Test P
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
980 Test N
Alte Klausur
• Aufgabe 2
• Bei einer Krankheit sei bekannt, dass die
Prävalenz bei 10% liegt. Zur Diagnose wird
ein Test mit einer Sensitivität von 0.9 und
einer Spezifität von 0.8 benutzt.
• Wie groß ist die Wahrscheinlichkeit, dass ein
positiv getestetes Tier die Krankheit
tatsächlich hat.
• Wie groß ist die Wahrscheinlichkeit, dass ein
gesund getestetes Tier tatsächlich gesund
ist?
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Lösung
1000Tiere
100 Erkrankt
90 Test P
900Gesund
10 Test N 180 Test P
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
720 Test N
Binomialverteilung: Definition
Die Zufallsvariable der Summe aus n unabhängigen
n
0-1-Variablen X   X i , heißt binomial-verteilt mit
i 1
Parametern n und P, kurz X~Bin(n, P)
Es gilt
n  m
P( X  m)    P (1  P) nm
 m
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Schwankungsbereiche der Normalverteilung
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Der Median
Definition: Wert für den gilt
50% der Daten sind kleiner oder gleich med
50% der Daten sind größer oder gleich med
med =
n 1

(k )
x
falls
k

ganze Zahl


2
1
 ( x ( k )  x ( h 1) ) falls k  n ganze Zahl

2
2
x (1)  x ( n)
sind geordnete Werte
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Das Quantil (Perzentil)
Definition: Wert für den gilt
Anteil p der Daten sind kleiner oder gleich xp
Anteil 1-p der Daten sind größer oder gleich xp

(k )

 x falls np keine ganze Zahl und k kleinsteZahl  np

1 (k )
( h 1)

(
x

x
) falls k  np ganze Zahl

2

Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Das Histogramm
Darstellung der relativen Häufigkeiten durch Flächen
(Prinzip der Flächentreue)
Vorgehen:
1.
Aufteilung in Klassen (falls die Daten noch nicht gruppiert
sind)
2.
Bestimmung der relative Häufigkeiten
3.
Bestimmung der Höhen hi , so dass gilt:
bi  hi  fi wobei bi: Breite der Klasse i.
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Boxplot
Beispiel: Hämatokrit bei Mastenten
Maximum
75%-Quantil
Median
25%-Quantil
Ausreißer
Extremwerte
Minimum
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Boxplot
1.
2.
3.
x0.25 = Anfang der Schachtel (Box)
x0.75 = Ende der Schachtel
d = Länge der Schachtel
Der Median wird durch den Strich in der Box markiert
Zwei Linien („whiskers“) außerhalb der Box gehen bis zu xmin und
xmax.
Modifizierter Boxplot
Die Linien außerhalb der Schachtel werden nur bis zu xmin
bzw. xmax gezogen, falls xmin und xmax innerhalb des
Bereichs [zu,zo] der Zäune liegen.
zu = x0.25 +1.5d ,zo x= x0.75 +1.5d
Ansonsten gehen die Linien nur bis zum kleinsten bzw. größten Wert
innerhalb der Zäune, die außerhalb liegenden Werte werden individuell
eingezeichnet.
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Der Mittelwert (arithmetisches Mittel)
1 n
x   xi
n i 1
• bekanntestes Lagemaß
• instabil gegen extreme Werte
• geeignet für Intervallskalierte Daten
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007
Standardabweichung
2
Definition: S 
1
2
(
x

x
)
 i
n 1
S  S2
• „Mittlere Abweichung vom Mittelwert“
• Manchmal auch 1/n statt 1/(n-1)
• Intervallskala Voraussetzung
Vorlesung Biometrie für Studierende
der Veterinärmedizin 8.2.2007

Folien