Zeitreihenanalyse
WS 2004/2005
Michael Hauhs / Gunnar Lischeid
• Definition einer Zeitreihe, Eigenschaften
• Tests und Trenderkennung bei Zeitreihen
• Beispiele (ACF, Tests), Fouriertransformationen, Powerspektrum
• Zeitreihenmodellierung der ARMA-Klasse
• Modellierung von Zeitreihen mit langem Gedächtnis
• Kausalität, Transferfunktionen, multivariate Methoden
• Skalierung, (Multi-)Fraktale
• Komplexität und Information von Zeitreihen
• Wavelets
Modellierung von Zeitreihen
mit langem Gedächtnis
Problem der ARMA/ARIMA(p,q)-Modelle:
Autokorrelation fällt exponentiell für grosse Abstände
( k  p  q  d)
Beobachtete Zeitreihen haben aber oft ein langes Gedächtnis:
Wiederholung: Das Gedächtnis M einer Zeitreihe ergibt sich aus den
Autokorrelationskoeffizienten
M


k  
k
Langes Gedächtnis
M 
Z.B. wenn für grosse Abstände
  1 / k a mit 0  a  1
(algebraisches Abklingen)
Modellierung beliebig langreichweitiger Korrelationen:
Fractional Autoregressive Integrated Moving Average (FARIMA) Modelle
 ( B)d x(t )   ( B)(t ) mit d reell
x(t )
Beobachtungen,
Bx(ti )  x(ti 1 )
 (t )
unkorreliertes (Gaußsches) Rauschen
Rückwärtsschiebeoperator
 (B )
Autoregressives Polynom der Ordnung p
 (B )
Moving Average Polynom der Ordnung q
d  (1  B)d
Differenzenoperator
Reihenentwicklung:
d 
d (d  1) 2 d (d  1)(d  2) 3
 ( B)  (1  B)    ( B) k  1  dB 
B 
B  ...
2
6
k 0  k 

d
d
D.h. alle vorangegangenen Zeitpunkte tauchen auf (bis zum Abbruch)!
Verhalten von FARIMA(p,d,q)-Modellen
d 0
Normales ARMA-Modell,
kurzreichweitig
d  0 ganzzahlig
Normales ARIMA-Modell,
kurzreichweitig
d  -0.5
invertierbar
d  0.5
stationär
0  d  0.5
Langes Gedächtnis
Verhalten der Autokorrelation:
k  k 12d
d heißt Persistenz-Parameter (d=0 keine, d=0.5 maximale Persistenz)
Vorgehen bei der Konstruktion von FARIMA(p,d,q)Modellen an Beispielen
(Montanari et al., WRR 33, 1035-1044 (1997); WRR 36, 1249-1259 (2000))
• x(t): 51 Jahre tägliche Werte, 18748 Datenpunkte;
122 Jahre monatliche Werte, 1466 Datenpunkte
• Elimination von periodischen Instationaritäten:
Desaisonalisierung mit geeignetem Verfahren
• Berechnung der Autokorrelation für die desaisonalisierte Reihe
und Abschätzung der benötigten Terme für den Differenzenoperator
• Ggf. Transformation der Daten, um Normalverteilung zu
approximieren (Box-Cox-Transformation), nicht immer nötig
• Bestimmung einer ersten Schätzung für d (Hurst-Analyse)
• Wahl von p und q und Ermittlung der optimalen Koeffizienten
mit Maximum Likelihood-Verfahren
• Auswahl des besten Modells mit dem Akaike-Informations-Kriterium
• Untersuchung der Residuen (unkorreliertes Gaußsches
Rauschen?) mit dem Portmanteau-Test
• Simulation der Zeitreihe mit dem besten Modell und Vergleich
von Autokorrelation und Wahrscheinlichkeitsverteilung
• Falls erfolgreich: Abflussgenerator gefunden!
Beispiel: Lago Maggiore-Zufluss
Langreichweitige Autokorrelationen sind klar vorhanden.
Die Entwicklung des Differenzenoperators sollte ca. 100 Terme umfassen.
Die Portmanteau-Statistik zeigt: optimales Modell ist
FARIMA(1,0.38,1), genauer:
(1  0.11B)(1  B)0.38 x(t )  (1  0.23B)(t )
...aber auch, dass das Restrauschen nicht Gaußsch ist!
Das Restrauschen ist
nicht signifikant korreliert
Das Restrauschen ist nicht
mit einer Normalverteilung
verträglich
Die Simulationen mit dem
optimalen Modell
liefern AKFs und pdfs,
die die Beobachtungen
sehr gut widerspiegeln
Das Hurst-Phänomen
Beobachtung (Hurst 1951):
Der Wertebereich q oder die Höhe von Extremereignissen hängt von
der gewählten Zeitauflösung oder Aggregation k
wie eine Potenzfunktion ab:
qk
H
H: Hurst-Koeffizient (-Exponent)
Theoretische Rechnung: Bei Prozessen erster Ordnung
(Random Walk, ARIMA(0,1,0), Brownsche Bewegung) gilt
H  0.5
Beobachtung an Nil-Hochwässern (2000 Jahre):
H  0.79  0.04
D.h. die Extremereignisse wachsen sehr viel schneller an:
Persistenz
Das Nilometer bei
Kairo:
Längste
hydrologische
Zeitreihe der Welt:
621-1921 A.D.
aus: Sutcliffe and Parks (1999)
Nil-Abfluß
Nile runoff 1872 - 1996
Years
Beispiel Nil: Autokorrelation
Nil-Wahrscheinlichkeiten
Die R/S Methode zur Hurst Statistik
k
Yk   X (ti )
Teilsummen
i 1
1 nk
X ( n, k ) 
X (ti )
k i n 1
_

Fenstermittel
i
D(n, i, k )  Yni  Yn  (Ynk  Yn )
k
R(n, k )  max D(n, i, k )  min D(n, i, k )
0i k
0i k
S ( n, k ) 
1
k

n k
Abweichungen vom linearen
Verhalten
Bereichsstatistik
_
2
(
X
(
t
)

X
(
n
,
k
))
i
i  n 1
q( n, k )  R ( n, k ) / S ( n, k )
Standardabweichung im Fenster
Mandelbrots Test Statistik
Man plottet log q gegen log k und bestimmt die Steigung H
Eigenschaften des Hurst-Exponenten
• Klassifikation von Prozessen:
• Persistenz (H > 0.5),
• Anti-Persistenz (H < 0.5),
• Brownsches Rauschen (H = 0.5)
• Regen meistens in der Nähe von H=0.5
• Typischer Abflusswert (Weltmittel) : H=0.73
(Nil ist ein Extremfall)
• Theoretischer Zusammenhang mit dem Persistenzparameter:
d=H-0.5 (manchmal nicht gut erfüllt, s. später)
• Prinzipielles Problem:
Langsame Instationaritäten (sehr lange Mittelwertdrifts), die durch
Trendtests nicht erkannt werden, führen zu H>0.5 genau wie
"echte" Persistenz
Hurst-Koeffizienten Nil (Hurst 1951)
0,9
0,85
0,8
0,75
0,7
0,65
0,6
641-740
741-840
841-940
941-1041
1042-1142
1143-1242
1243-1344
1345-1445
1446-1741
1741-1866
1867-1946
Lehstenbach Hurst-Statistik
2,5
Abfluss, H=0.84
2
Regen, H=0.63
log q
1,5
1
0,5
0
0,5
1
2
1,5
log k
2,5
3
Steinkreuz Hurst Statistik
3.9
Abfluss, H=0.96
3.4
Regen, H=0.68
2.9
2.4
log q
1.9
1.4
0.9
0.4
-0.1
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
log k
Im Regensignal ist ein endliches Gedächtnis (Abflachen) zu erkennen
3
Hurst-Exponenten von Flüssen (weltweit)
0.9
Hurst-Exponent
0.85
Amper
Loisach
Donau
0.8
Ammer
Isar
0.75
0.7
0.65
Ort
Paar

Modellierung von Zeitreihen mit langem Gedächtnis