Vorlesung Gesamtbanksteuerung
Mathematische Grundlagen II
Dr. Klaus Lukas
Carsten Neundorf
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
1
Agenda
•
•
•
•
•
•
•
•
Wiederholung stetige Renditen
deskriptive Statistik
Verteilungsparameter
Erwartsungswert und Varianz
Diskrete Zufallsvariable
Stetige Zufallsvariable
Die Normalverteilung
Schätzfunktionen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
2
Stetige Rendite
Sind Ss und St zwei Kurswerte eines Wertpapiers oder auch
Indexes, so ergibt sich die stetige Rendite als natürlicher
Logarithmus des Zuwachsverhältnisses:
St
rs ,t  ln  ln St  ln S s
Ss
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
3
Die Datenreihen
Im Verlaufe der Vorlesung sollen die eingeführten
Konzepte jeweils auch auf Echtdaten angewandt
werden.
Hierfür betrachten wir folgende Indizes:
Rentenindex REX
Aktienindex DAX
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
4
Agenda
•
•
•
•
•
•
•
•
Wiederholung stetige Renditen
deskriptive Statistik
Verteilungsparameter
Erwartsungswert und Varianz
Diskrete Zufallsvariable
Stetige Zufallsvariable
Die Normalverteilung
Schätzfunktionen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
5
Ziele der deskriptiven Statistik
Die deskriptive Statistik zielt darauf ab, eine
unüberschaubare Datenmenge durch möglichst wenige
jedoch noch aussagekräftige Zahlen zu charakterisieren.
Im Extremfall mittels lediglich einer Zahl.
Als erster Schritt, bevor irgendwelche Kennzahlen
berechnet werden, bietet es sich an, die Daten erstmal
graphisch darzustellen.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
6
-0,1
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
Jan 09
Jan 08
-0,2
-0,3
-0,4
0,3
0,2
0,1
0
-0,2
-0,3
7
Jan 09
Jan 08
Jan 07
Jan 06
Jan 05
Jan 04
Jan 03
Jan 02
Jan 01
Jan 00
Jan 99
Jan 98
Jan 97
Jan 96
Jan 95
Jan 94
-0,1
Jan 07
Renditen Renten
Jan 06
Jan 05
Jan 04
Jan 03
Jan 02
Jan 01
Jan 00
Jan 99
Jan 98
Jan 97
Jan 96
Jan 95
Jan 94
Graphische Zeitreihenanalyse
Renditen Aktien
0,3
0,2
0,1
0
Grundbegriffe der Statistik
• Als Grundgesamtheit G wird die Menge aller
statistischer Einheiten bezeichnet, über die man
Aussagen gewinnen will. Diese muss klar umgrenzt
sein.
• An den statistischen Einheiten werden interessante
Größen beobachtet, die sogenannten Merkmale X.
• Typischerweise wird man nicht alle Einheiten der
Grundgesamtheit in die Untersuchung einbeziehen,
sondern ein nach bestimmten Kriterien ausgewählte
Teilgesamtheit, die sogenannte Stichprobe vom
Umfang n.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
8
Grundbegriffe der Statistik
•Konkrete Werte eines Merkmals für eine bestimmte
statistische Einheit wird Ausprägungen des Merkmales
genannt. Abgekürzt mit x.
•Als absolute bzw. relative Häufigkeit einer Ausprägung
aj,j=1,...,k bezeichnet man die Anzahl bzw. den Anteil
von Werten der Stichprobe, die mit aj übereinstimmt.
Die absoluten Häufigkeiten werden mit Hj bezeichnet,
die relativen wir mit hj=Hj/n.
•Häufigkeitsfunktion h(x)
F ( x) 
h
a j x
j
wird als empirische Verteilung sfunktion bezeichnet
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
9
Häufigkeitsverteilung
Renditeverteilung Aktien und Renten
90
80
70
60
50
40
30
20
10
Häufigkeitsverteilung Aktienrenditen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
7,
0%
10
,0
%
13
,0
%
16
,0
%
19
,0
%
-2
9,
0%
-2
6,
0%
-2
3,
0%
-2
0,
0%
-1
7,
0%
-1
4,
0%
-1
1,
0%
-8
,0
%
-5
,0
%
-2
,0
%
1,
0%
4,
0%
0
Häufigkeitsverteilung Renten
10
Agenda
•
•
•
•
•
•
•
•
Wiederholung stetige Renditen
deskriptive Statistik
Verteilungsparameter
Erwartsungswert und Varianz
Diskrete Zufallsvariable
Stetige Zufallsvariable
Die Normalverteilung
Schätzfunktionen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
11
Lageparameter
Der bekannteste Lageparameter ist der
Durchschnittswert oder auch das arithmetische Mittel
1 n
x  *  xi
n i 1
Da jedem Merkmalswert das Gewicht 1/n zugeordnet
wird, kann es vorkommen, dass der Mittelwert mit
keinem beobachteten Wert übereinstimmt.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
12
Lageparameter
Ein weiterer Lageparameter, der auch in den
Beobachtungswerten enthalten ist, ist der Median.
Er ist durch die Eigenschaft definiert, dass mindestens
50% aller Werte kleiner oder gleich sind und mindestens
50% aller Werte auch größer oder gleich sind.
Um den Median zu ermitteln, müssen zuerst alle
Ausprägungen der Grösse nach sortiert werden.
Anschließend errechnet sich der Median wie folgt:
x Med  x  n 
 2  1
 
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
13
Lageparameter
Will man nicht den „mittleren“ Wert haben, sondern den
p-größten, so kann man die Formel wie folgt
abwandeln:
q p  x p*n 1
Dies wird das p-Quantil genannt. p ist hierbei immer als
%-Zahl anzusehen.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
14
Streuungsparameter
Unser Ziel ist es, mit möglichst wenigen Kennzahlen
eine große Datenmenge zu beschreiben.
Am Beispiel der Renditeverteilung der Aktien und der
Renten sehen wir aber, dass der Mittelwert die Daten
nicht ausreichend beschreibt, da er für beide
Datenreihen nahezu identisch bei 0,2% liegt, aber die
größten und kleinsten Werte der Aktien deutlich mehr
von der Mitte abweichen als die Werte der Renten.
Deshalb wird nun ein Maß für die „Streuung“
eingeführt.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
15
Streuungsparameter
Ein mögliches Maß für diese Streuung ist die mittlere
quadratische Abweichung s2, auch empirische Varianz
bezeichnet. Als Formel ausgedrückt.
n
1
s 2   ( xi  x ) 2
n i 1
Hieraus wird dann die Standardabweichung s abgeleitet,
indem aus s2 die Wurzel gezogen wird.
n
1
2
s  s2 
(
x

x
)
 i
n i 1
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
16
Variationskoeffizient
Führt man die beiden Kennzahlen Standardabweichung
und Mittelwert zusammen, so erhält man den
sogenannten Variationskoeffizient V.
s
V 
x
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
17
Agenda
•
•
•
•
•
•
•
•
Wiederholung stetige Renditen
deskriptive Statistik
Verteilungsparameter
Erwartsungswert und Varianz
Diskrete Zufallsvariable
Stetige Zufallsvariable
Die Normalverteilung
Schätzfunktionen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
18
Wahrscheinlichkeit und Zufallsereignis
Bisher haben wir untersucht, wie man gegebene
Datenmenge mit wenigen Kennzahlen möglichst einfach
beschreiben kann.
Ein weiterer Aspekt der Stochastik ist die Beantwortung
der Frage, welche Ergebnisse sind in der Zukunft
möglich und wie wahrscheinlich sind sie.
Damit haben wir schon einen wesentlichen Begriff
unbewusst verwendet, die Wahrscheinlichkeit.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
19
Wahrscheinlichkeit und Zufallsereignis
Die Wahrscheinlichkeit mathematisch exakt zu
definieren, ist nicht ganz einfach. Dazu müssen erst
noch zwei weitere Begriffe eingeführt werden.
Als Zufallsvorgang wird ein Geschehen bezeichnet, bei
dem aus einer gegebenen Situation heraus mehrere sich
gegenseitig ausschließende Folgesituationen möglich
sind und es unsicher ist, welche eintritt.
Alle möglichen Folgesituationen werden als
Ergebnismenge bezeichnet, eine konkrete Folgesituation
als Elementarereignis.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
20
Wahrscheinlichkeit und Zufallsereignis
Mit der Wahrscheinlichkeit eines Ereignisses A, kurz
p(A), wollen wir die Chance für das Eintreten des
Ereignisses beschreiben.
Mathematisch muss gelten:
1. p( A)  0 für jedes Ereignis A
2. p( sicheres Ereignis)  1
3.
p( A1  A2  A3  )  p( A1 )  p( A2 )  p( A3 )  
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
21
Wahrscheinlichkeit und Zufallsereignis
Wir definieren
p( A) 
Anzahl der für A günstigenFälle
Anzahl aller m öglichenFälle
und als Gegenwahrscheinlichkeit q(A)
q( A)  1  p( A)
die Wahrscheinlichkeit, dass A nicht eintritt.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
22
diskrete Zufallsvariable
Ordnet man den Ergebnissen eines Zufallsvorgangs
Zahlen (Realisationen) zu, so erhält man eine
Zufallsvariable.
Ein Beispiel: zweimal Würfel. Die möglichen
Ergebnisse bestehen aus den 36 Zahlenpaaren ω=(i,j),
1≤i,j≤6. Für die Variable X=„Summe der Augenzahlen“
erhält man zu jedem Ergebnis (i,j) den Wert x=i+j. X
wird dann zu einer Zufallsvariable mit der
Ergebnismenge {2,3,…,12}.
Es interessieren dann Ergebnisse wie
{X=4}=„Die Augenzahl ist 4“
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
23
diskrete Zufallsvariable
Dies lässt sich durch die ursprünglichen Ergebnisse (i,j)
ausdrücken. Es gilt
{X=4}={(1,3),(2,2),(3,1)}
Um die Wahrscheinlichkeit dieses Ereignisses zu
berechnen, führt man dies auch wieder auf die
ursprünglichen Ergebnisse zurück.
P( X  4)  P(1,3)  P(2,2)  P(3,1) 
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
3
1

36 12
24
diskrete Zufallsvariable
Eine Zufallsvariable X heißt diskret, falls sie nur endlich
oder abzählbar unendlich viele Werte x1,x2,…,xk,…
annehmen kann. Die Wahrscheinlichkeitsverteilung von
X ist gegeben durch die Wahrscheinlichkeiten:
P( X  xi )  pi , i  1,2,, k ,
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
25
Wahrscheinlichkeitsfunktion
Die Wahrscheinlichkeitsfunktion f(x) einer diskreten
Zufallsvariablen X ist für x definiert als
P( X  xi )  pi
f ( x)  
0,

x  xi {x1 , x2 ,, xk ,}
sonst
Durch die Wahrscheinlichkeitsverteilung bzw. –funktion
ist auch die Verteilungsfunktion F(x)=P(X≤x) gegeben.
F ( x)  P( X  x) 
 f (x )
i:xi  x
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
i
26
Lageparameter diskreter Zufallsvariablen
Ebenso, wie bei der Analyse von Kennzahlen, können
auch für diskrete Zufallsvariable Erwartungswert,
Varianz und Standardabweichung berechnet werden.
Der Erwartungswert errechnet sich mit Hilfe der
Wahrscheinlichkeitsverteilung wie folgt:
E( X )  x1 p1    xk pk     xi pi
i 1
und mit Hilfe der Wahrscheinlichkeitsfunktion f(x)
E ( X )  x1 f ( x1 )    xk f ( xk )     xi f ( xi )
i 1
Statt E(X) findet auch das Symbol μ Verwendung.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
27
Lageparameter diskreter Zufallsvariablen
Die Varianz einer diskreten Zufallsvariable ist
 2  Var ( X )  ( x1   ) 2 p1    ( xk   ) 2 pk  
  ( xi   ) 2 f ( xi )
i 1
Die Standardabweichung ist
  Var(X )
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
28
Lageparameter diskreter Zufallsvariablen
Erwartungswert
18,00%
eine Standardabweichung
16,00%
14,00%
12,00%
10,00%
8,00%
6,00%
4,00%
2,00%
0,00%
2
3
4
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
5
6
7
8
9
10
11
12
29
Agenda
•
•
•
•
•
•
•
•
Wiederholung stetige Renditen
deskriptive Statistik
Verteilungsparameter
Erwartsungswert und Varianz
Diskrete Zufallsvariable
Stetige Zufallsvariable
Die Normalverteilung
Schätzfunktionen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
30
stetige Zufallsvariablen
50,00%
45,00%
40,00%
35,00%
30,00%
25,00%
20,00%
15,00%
10,00%
5,00%
0,00%
-5,0%
-4,0%
-3,0%
-2,0%
-1,0%
0,0%
1,0%
2,0%
Häufigkeitsverteilung Renten
3,0%
4,0%
5,0%
In den bisherigen Untersuchungen haben
Zufallsvariablen untersucht, die eine feste Zahl von
Wahrscheinlichkeiten haben. Die Wahrscheinlichkeit,
dass ein Ereignis zwischen zwei Werten liegt, kann man
dann an der Fläche der Balken ablesen. Teilt man die
Balken feiner ein, kann man das immer noch an der
Fläche der Balken ablesen.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
31
stetige Zufallsvariablen
18,00%
16,00%
14,00%
12,00%
10,00%
8,00%
6,00%
4,00%
2,00%
-5
,0
0%
-4
,5
0%
-4
,0
0
-3 %
,5
0%
-3
,0
0
-2 %
,5
0%
-2
,0
0
-1 %
,5
0%
-1
,0
0
-0 %
,5
0%
0,
00
%
0,
50
%
1,
00
%
1,
50
%
2,
00
%
2,
50
%
3,
00
%
3,
50
%
4,
00
%
4,
50
%
5,
00
%
0,00%
Führt man diesen Prozess fort und lässt die Breite
immer mehr gegen null gehen, so nähert sich die Fläche
dem Integral unter der Funktion an.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
32
stetige Zufallsvariablen
Diese Überlegungen führen zur folgenden Definition
von stetigen Zufallsvariablen, wobei gleichzeitig die
Dichtefunktion f(x) definiert wird:
Eine Zufallsvariable X heißt stetig, wenn es eine
Funktion f(x)≥0 gibt, so dass für jedes Intervall [a,b]
b
P ( a  X  b)   f ( x ) dx
a
gilt. Die Funktion f(x) heißt Wahrscheinlichkeitsdichte
von X oder einfach nur Dichte.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
33
stetige Zufallsvariablen
Noch ein paar Eigenschaften:
P ( a  X  b)  P ( a  X  b)  P ( a  X  b)  P ( a  X  b)
und
P( X  x)  0
für alle x  

 f ( x)dx  1

Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
34
stetige Zufallsvariablen
Aus der Definition von Dichten erhält man für die
Verteilungsfunktion F(x)=P(X≤x)=P(-∞<X ≤x)
x
F ( x )  P( X  x ) 
 f (t )dt

d.h. F(x) ist die Stammfunktion der Dichte.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
35
Lageparameter stetiger Zufallsvariablen
Der Erwartungswert E(X) einer stetigen Zufallsvariable
X mit Dichte f(x) ist

  E ( X )   xf ( x) dx

Die Varianz Var(X) einer stetigen Zufallsvariable X mit
Dichte f(x) ist

 2  Var ( X )   ( x   ) 2 f ( x) dx.

  Var ( X )
wird Standardabweichung genannt.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
36
Median und Quantile
Für 0<p<1 ist das p-Quantil xp die Zahl auf der xAchse, für die
F(xp)=p
gilt. Der Median xmed ist das 50%-Quantil, es gilt als
F(xmed)=1/2.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
37
Agenda
•
•
•
•
•
•
•
•
Wiederholung stetige Renditen
deskriptive Statistik
Verteilungsparameter
Erwartsungswert und Varianz
Diskrete Zufallsvariable
Stetige Zufallsvariable
Die Normalverteilung
Schätzfunktionen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
38
Die Normalverteilung
Eine Zufallsvariable X heißt normalverteilt mit
Parametern µ und σ2>0, kurz XN(µ, σ2), wenn sie
die Dichte
 ( x   )2 
1
 , x  
f ( x) 
exp 
2
2
2


besitzt. Es gilt
Var(X)=σ2
E(X)=µ,
Speziell für µ=0, σ2=1 erhält man die
Standardnormalverteilung N(0,1) mit der Dichte
f ( x) 
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
 1 
exp  x 2 
2
 2 
1
39
Die Normalverteilung
Welche Eigenschaften hat diese Verteilung?
1. Sie ist symmetrisch zu µ, d.h. es gilt
f(µ-x)=f(µ+x)
2. Die Normalvertielung hat Glockenform mit dem
Maximum an der Stelle µ und den Wendepunkten bei
µσ.
3. Je größer σ, desto schneller fällt die Kurve gegen 0.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
40
Die Normalverteilung
Die Verteilungsfunktion lässt sich nicht analytisch
berechnen und durch bekannte Funktionen in
geschlossener Form schreiben. Deshalb muss F(x) durch
numerische Verfahren berechnet werden. Entsprechende
Tabellen sind in den Kalkulationsprogrammen
enthalten.
Wichtige Quantile für Standardnormalverteilung sind
ebenfalls in den Programmen vorberechnet und in
Tabellen hinterlegt.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
41
Die Normalverteilung
Zentrale Schwankungsintervalle
Für k=1 ist P(µ-σ≤X ≤ µ+σ)=68,27%
Für k=2 ist P(µ-2σ≤X ≤ µ+2σ)=95,45%
Für k=3 ist P(µ-3σ≤X ≤ µ+3σ)=99,73%
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
42
Agenda
•
•
•
•
•
•
•
•
Wiederholung stetige Renditen
deskriptive Statistik
Verteilungsparameter
Erwartsungswert und Varianz
Diskrete Zufallsvariable
Stetige Zufallsvariable
Die Normalverteilung
Schätzfunktionen
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
43
Parameterschätzung
Die Ziehung einer Stichprobe dient meistens dem
Zweck, Informationen über das Verhalten eines
Merkmales in der Grundgesamtheit zu gewinnen.
Dies ist mit einigen Unsicherheiten verbunden. Das
zugrunde gelegte Modell ist eben nur ein Modell und
die gemessenen Daten enthalten auch z.B. Messfehler.
Die in den Stichproben beobachteten Anteilswerte
liefern einen Schätzer für den wahren Anteil in der
Grundgesamtheit.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
44
Punktschätzung
Ziel der Punktschätzung ist es, einen möglichst genauen
Näherungswert eines Grundgesamtheitsparameters
anzugeben.
Man unterscheidet dabei zwei Fälle:
1. Kennwerte einer beliebigen, unbekannten Verteilung
2. spezifische Parameter eines angenommenen
Verteilungsmodells
Als Beispiel für den 2. Fall ist die Schätzung der
Parameter μ,σ2, wenn von einer Normalverteilung
N(μ,σ2) auszugehen ist.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
45
Punktschätzung
Eine Schätzfunktion für den Grundgesamtheitsparameter θ ist eine Funktion
T=g(X1,…,Xn)
der Stichprobenvariablen X1,…,Xn. Der aus den
Realisationen x1,…,xn resultierende numerische Wert
g(x1,…,xn)
ist der zugehörige Schätzwert.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
46
Punktschätzung
In der deskriptiven Statistik wurden Lage- und
Streuungsparameter der Stichprobe bestimmt. Hinter
diesen deskriptiven Parametern stehen Schätzfunktionen,
deren Argumente Zufallsvariablen sind. Die resultierenden
Realisationen dieser Schätzfunktionen entsprechen dann
direkt den deskriptiven Lage- bzw. Streuungsparametern.
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
47
Punktschätzung
1 n
X  g ( X 1 ,  X n )  i 1 X i
n
ist dann eine Schätzfunktion für den Erwartungswert
μ=E(X),
1 n
~2
S  g ( X 1 ,  X n )  i 1 X i
n
eine Schätzfunktion für die Varianz σ2=var(X).
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
48
Anwendungsbeispiel
18,00%
16,00%
14,00%
12,00%
10,00%
8,00%
6,00%
4,00%
2,00%
-5
,0
0%
-4
,5
0%
-4
,0
0
-3 %
,5
0%
-3
,0
0
-2 %
,5
0%
-2
,0
0
-1 %
,5
0%
-1
,0
0
-0 %
,5
0%
0,
00
%
0,
50
%
1,
00
%
1,
50
%
2,
00
%
2,
50
%
3,
00
%
3,
50
%
4,
00
%
4,
50
%
5,
00
%
0,00%
Vorlesung 04 – Mathematische Grundlagen II, 11.05.2009
49

Vorlesung Gesamtbanksteuerung Mathematische Grundlagen II Dr