Beispiel 5.2: Einen weiteren Anwendungsfall der Diskriminanzanalyse stellt die Konjunkturanalyse dar. Hier bestehen die Gruppen z.B. aus den beiden Konjunkturphasen
 Aufschwung,
 Abschwung.
Mit Hilfe der Diskriminanzanalyse lässt sich beispielsweise untersuchen, ob z.B. die
metrisch skalierten Variablen „Investitionen“, „Konsum“ und „Zins“ einen Einfluss auf
die Konjunkturphase haben und ob eine dieser Merkmalsvariablen vielleicht nur von
untergeordneter Bedeutung ist. Darüber hinaus kann für ein Prognosejahr ein Aufschwung oder ein Abschwung aufgrund der Merkmalsvariablen vorhergesagt werden. In diesem Fall sind allerdings die Ausprägungen der Merkmalsvariablen für eine
neue Zeiteinheit z.B. ein Jahr zuvor zu prognostizieren.

Die Idee der Diskriminanzanalyse lässt sich anhand des bereits in den beiden Beispielen vorkommenden Zwei-Gruppen-Falls für zwei Merkmalsvariablen X1 und X2
veranschaulichen. Wie man aus der Grafik erkennt lassen sich die beiden bestehenden Gruppen durch keines der beiden Merkmalen X1 oder X2 separat trennen. Die
große Überlappung der Verteilungen der Objekte aus den Gruppen 1 und 2 auf
der x1- und x2-Achse fällt unmittelbar ins Auge. Die Wahl eines Trennwertes auf der
x1- oder x2-Achse etwa zwischen den beiden Gruppenmittelwerte x11 und x 21 oder
x12 und x22 würde hier zu keiner akzeptablen Lösung führen.
3
Abbildung 5.1: Streudiagramm im Zwei-Gruppen-Fall
X2
Gruppenmittelwerte:
xgj : Mittelwert des j-ten Merkmals in
der g-ten Gruppe
x11 und x 21: Gruppenmittelwerte des
Merkmals X1
x12 und x 22 : Gruppenmittelwerte
des Merkmals X2
x12
x 22
x 11
x 21
X1
Erläuterung:
............ idealtypische Häufigkeitsverteilung der Gruppe 1 
______
idealtypische Häufigkeitsverteilung der Gruppe 2 

Gruppenzentroid (Gruppenschwerpunkt)
4
In der vorstehenden Grafik sind aber zwei deutlich getrennte Gruppen erkennbar.
Ihre Trennung gelingt aber nur durch eine Kombination der beiden Merkmale X1 und
X2. Eine Linearkombination der beiden Merkmale X1 und X2, die die beiden vorhandenen Gruppen optimal trennt nennt man Diskriminanzfunktion.
(5.1) D  a0  a1  X1  a2  X2
Die Koeffizienten a0, a1 und a2 heißen Diskriminanzkoeffizienten (=Diskriminanzgewichte). Die durch die Diskriminanzfunktion gegebene Diskriminanzachse d ist in
der nachstehenden Grafik eingezeichnet worden.
5
Abbildung 5.2: Geometrische Idee der Diskriminanzanalyse
de
X2
n
e
Tr
ng
a
er
Erläuterung:
............ idealtypische Häufigkeitsverteilung der Gruppe 1 
______ idealtypische Häufigkeitsverteilung der Gruppe 2 

Gruppenzentroid
(Gruppenschwerpunkt)
d1
d2
X1
isk
D
in
rim
an
ch
za
se
6
d
Die Lage der Objekte auf der Diskriminanzachse erhalten wir durch eine orthogonale Projektion, d.h. rechtwinklige Verbindung, der Objektpunkte auf diese Achse.
Auf diese Weise werden die sog. Diskriminanzwerte
d1, d2, ... , dn
der Objekte bestimmt. Mathematisch ergeben sie sich, indem wir die Beobachtungswerte xi1 und xi2 der i-ten Untersuchungseinheit in die Diskriminanzfunktion (5.1) einsetzen:
di  a0  a1  xi1  a2  xi2.
Mit Gleichung (5.2) können vorzugsweise Diskriminanzwerte neuer, d.h. bisher noch
nicht klassifizierter Untersuchungseinheiten berechnet werden. Für Objekte, deren
Gruppenzugehörigkeit bekannt ist, empfiehlt sich dagegen eine Dreifachindizierung
der Beobachtungswerte (x-Werte) und eine Doppelindizierung der Diskriminanzwerte
(d-Werte):
xgij: Beobachtungswerte des i-ten Objekts in der g-ten Gruppe beim Merkmal Xj,
dgi: Diskriminanzwert des i-ten Objekts in der g-ten Gruppe.
(5.2)
Die Berechnung der Diskriminanzwerte für gruppierte Untersuchungseinheiten erfolgt dann unter Verwendung der Gleichung
(5.3) dgi  a0  a1  xgi1  a2  xgi2.
Liegen n1 Objekte in der 1. Gruppe und n2 Objekte in der 2. Gruppe erhält man mit
(5.3) folgende Diskriminanzwerte:
7
Gruppe 1: d11, d12,..., d1n1,
Gruppe 2: d21, d22,..., d2n2 .
Durch Probieren könnten wir grafisch auf der Diskriminanzachse eine Trennlinie ermitteln, die die beiden Gruppen optimal voneinander trennt, d.h. zu einer minimalen
Überlappung der beiden Gruppen führt. Der Trennpunkt dc (= Schnittpunkt mit der
Diskriminananzachse) liegt zwischen den beiden Gruppenmittelwerten d1 und d2
der Diskriminanzvariablen D:
1 ng
(5.4) dg 
, g=1,2,
 dgi
ng i1
Genauer ist dc durch das gewogene arithmetische Mittel der beiden Gruppenmittelwerte d1 und d2 gegeben:
(5.5) dc  d 
n1  d1  n2  d2
n1  n2
Obwohl sich in unserer Grafik keine Überlappung der beiden Gruppen ergibt, ist dieser Fall jedoch keineswegs typisch. Allgemein haben wir eine Diskriminanzfunktion
zu ermitteln, mit der ein kritischer Diskriminanzwert (= Schnittpunkt der Trenngeraden mit der Diskriminanzachse) berechnet werden kann, der die vorliegenden
Gruppen optimal trennt.
In der folgenden Abbildung werden die analytischen Aspekte der Diskrimination
und Klassifikation im Rahmen der Diskriminanzanalyse für den Zwei-Gruppen-Fall
8
übersichtlich wiedergegeben.
Abbildung 5.3: Analytische Idee der Diskriminanzanalyse (Zwei-Gruppen-Fall)
Gruppenvariable
Diskriminanzvariable
Merkmalsvariablen
1
a0
geschätzte Gruppen zugehörigkeit g,
mit g Î {1,2}:
di < dc
Þ i Î1
und
di > dc
Þ iÎ2
a1
xi1
M
dc
di
aj
xij
Größenvergleich
der beiden Werte
am
M
xim
Erläuterung:
aj:
Diskriminanzkoeffizient der j-ten Merkmalsvariablen
di:
i-te Ausprägung der Diskriminanzvariablen D
9
dc:
kritischer Diskriminanzwert (Trennwert)
x:
Ausprägung der j-ten Merkmalsvariablen bei der i-ten Untersuchungseinheit
5.2 Lineare Diskriminanzanalyse
Die auf den Statistiker R.A. Fisher zurückgehende lineare Diskriminanzanalyse ist
die am häufigsten angewandte Art der Diskriminanzanalyse. Wir zeigen sie methodisch anhand des Zwei-Gruppen-Falls auf, lassen dabei jedoch allgemein m Merkmalsvariablen zu. In Verallgemeinerung von (5.2) und (5.3) gehen wir daher von
der Diskriminanzfunktion
(5.6) di  a0  a1  xi1  a2  xi2    am  xim
für neu zu klassifizierende Objekte und
(5.7) dgi  a0  a1  xgi1  a2  xgi2    am  xgim
für bereits klassifizierte Objekte aus.
Wie lassen sich nun die Diskriminanzkoeffizienten a0 und aj (j=1,…,m) bestimmen,
wenn das Ziel einer möglichst guten Trennung der Gruppen verfolgt werden soll?
Eine optimale Trennung zeichnet sich dadurch aus, dass
1. die Gruppenmittelwerte auf der Diskriminanzachse, d1 und d2 , so weit wie möglich auseinander liegen,
2. die Diskriminanzwerte dgi innerhalb der beiden Gruppen möglichst eng um ihren
Gruppenmittelwerte auf der Diskriminanzachse, dg , streuen.
10
Abbildung 5.4: Streuung zwischen und innerhalb der Gruppen
schmal
schmal
d1
d
breit
d2
d
Stichprobenelemente der Gruppe 1
Stichprobenelemente der Gruppe 2
Die Erhöhung der Trennschärfe mit einer Vergrößerung der Distanz d1 - d2 zwischen
den Gruppenmittelwerten (= Streuung zwischen den Gruppen) geht unmittelbar
aus der oben stehenden Grafik hervor. Gleichzeitig dürfte aber auch klar sein, dass
die Trennung umso besser ist, je geringer die Diskriminanzwerte innerhalb der Gruppen streuen (= Streuung innerhalb der Gruppen), da sich dadurch der Überlap11
pungsbereich verrringert.
Das Ziel einer optimalen Trennung können wir somit erreichen, wenn wir das Diskriminanzkriterium
Streuung zwischen den Gruppen
λ
Streuung innerhalb den Gruppen
unter Verwendung eines geeigneten Lösungsalgorithmus maximieren. Hierbei messen wir nur die Streuung zwischen den Gruppen nicht durch die Distanz d1 - d2 zwischen den beiden Gruppenmittelwerten, sondern gleichwertig durch die Abstände
der beiden Gruppenmittelwerten d1 und d2 vom Gesamtmittelwert
2 ng
1
(5.8) d 
   dgi
n1  n2 g1i1
auf der Diskriminanzachse.
Streuung zwischen den Gruppen:
(5.9) Bd   ng dg - d 2
2
g1
Streuung innerhalb der Gruppen:
2 ng
(5.10) Wd    dgi - dg 2
g1i1
12
Maximierung des Diskriminanzkriteriums:
 ng  dg - d 
2
(5.11)
λ
Bd

Wd
g1
2 ng
2
  dg i - dg 
 Max!
2
g1 i1
Das Diskriminanzkrierium  ist im Hinblick auf die Diskriminanzkoeffizienten a0,
a1, …, am zu maximieren, d.h. die Diskriminanzkoeffizienten sind so zu bestimmen,
dass das Verhältnis aus der Streuung zwischen den Gruppen (Bd) und der Streuung
innerhalb der Gruppen (Wd) maximal wird.
Bei der Lösung des Optimierungsproblems und der sich anschließenden Datenauswertung lässt vorteilhaft von der Matrizenrechnung Gebrauch machen. Zunächst
einmal schreiben wir die Diskriminanzfunktion in Matrixform:
(5.12) d = a0 + X·a
mit
 d1 
 a1 
a0 
 x11 x12
d 
a 
a 
x
2
2
0
21 x 22
d   , a   , a0   , X  
M
M
 M 
M
 M
 
 
 

d
a
a
n
m
0
 
 
 
 xn1 xn2
 x1m 
 x 2m 
.

M 

 xnm 
13
Die nxm-Beobachtungsmatrix X enthält die bei den Untersuchungseinheiten beobachteten Werte der Merkmalsvariablen. Wir erhalten den Mittelwertvektor d,
d 
 
d
d   ,
M
 
d 
der Diskriminanzvariablen D, indem wir die Beobachtungsmatrix X in (5.12) durch die
Mittelwertmatrix X ersetzen,
 x1 x 2
x x
1
2
X 
nxm  M
M

 x1 x 2
 xm 
 xm 
,
 M 

 xm 
in deren j-ter Spalte die Mittelwerte der Merkmalsvariablen Xj stehen:
(5.13) d  a0  X  a.
Formuliert man die Streuungen zwischen und innerhalb der Gruppen, Bd und Wd, in
Matrixschreibweise, lassen sich durch Matrizenmanipulationen hierfür die Ausdrücke
(5.14) Bd  a '  B  a
und
14
(5.15) Wd  a '  W  a
gewinnen.
Die beiden Matrizen B und W sind Streuungsmatrizen aus der sich die totale Streuungsmatrix T vom Typ mxm, die bei m=2 Merkmalsvariablen durch
 t11
T
t 21
G  2ng

  (x gi1 - x1)2

t12  
g1 i1

t 22  G 2ng
   (x gi2 - x 2 )(x gi1 - x1)
 g1i1

(x
x
)(x
x
)
  gi1 1 gi2
2 
g1 i1

n
g
G 2

  (x gi2 - x 2 )2

g1 i1

G 2ng
gegeben ist, zusammensetzt:
(5.16)
T
Totale Streuungsmatrix
=
B
+
W
Streuungsmatrix zwi- Streuungsmatrix inschen den Gruppen
nerhalb der Gruppen
B ist die Streuungsmatrix zwischen den Gruppen. Bei m=2 Merkmalsvariablen
hat die die Gestalt
G 2

 ng  (x g1 - x1)2

B  G 2 g1
  ng  (x g2 - x 2 )(x g1 - x1)
 g1
G2

 ng  (x g1 - x1)(x g2 - x 2 
g1
.
G 2

 ng  (x g2 - x 2 )2

g1
15
W ist die Streuungsmatrix innerhalb der Gruppen. Bei m=2 Merkmalsvariablen ist
sie von der Form


G 2 ng
G 2 ng
2

  (x gi1 - x g1)
  (x gi1 - x g1)(x gi2 - x g2 )


g 1 i 1
g 1 i 1
W

G 2 ng
G 2 ng
2
   (x

  (x gi2 - x g2 )
gi2 - x g2 )(x gi1 - x g1)
 g 1 i 1

g 1 i 1


xgij ist der Beobachtungswert der i-ten Untersuchungseinheit der Gruppe g bei der
Variablen Xj. Zur Berechnung des Gesamtmittels einer Variablen Xj werden alle
Merkmalswerte dieser Variablen hinzugezogen,
G2ng
1
xj 
   xgij,
n1  n2 g1i1
während man zur Bestimmung der Gruppenmittel nur die Merkmalswerte einer
Gruppe benötigt:
1 ng
x gj 
  x gij.
ng i1
Mit (5.14) und (5.15) lässt sich das Maximierungsproblem (5.11) in der Form
(5.11’)
λ
Bd
a'B  a

 Max!
Wd a'W  a
formulieren. Gesucht wird der Vektor der Diskriminanzkoeffizienten, a, der das
Diskriminanzkriterium  maximiert.
16
Beispiel 5.3: Die Käufer der Marke A eines Produkts bilden die Gruppe 1 (n1=16)
und die Käufer der Marke B die Gruppe 2 (n2=14). Als Merkmalvariablen, mit denen
die beiden Gruppen zu trennen und neue Käufer zu klassifizieren sind, werden das
Einkommen (X1) und das Alter (X2) herangezogen:
Gruppe 1 (g=1)
Gruppe 2 (g=2)
i
Eink. (X1)
Alter (X2)
i
Eink. (X1)
Alter (X2)
1
28
37
1
26
20
2
23
25
2
41
27
3
25
40
3
34
34
4
37
30
4
27
35
5
33
45
5
42
43
6
32
38
6
30
22
7
23
35
7
39
32
8
30
32
8
35
30
9
30
42
9
44
35
10
33
27
10
34
22
11
35
40
11
37
41
12
23
31
12
26
27
13
39
45
13
29
25
14
36
34
14
33
37
15
40
38
16
22
20
17
 Gesamtmittel der beiden Merkmale X1 und X2:
1 G2ng
1
1
x1 
(28  23  ...  33) 
966  32,2
  xgi1 
n1  n2 g1i1
16  14
30
1 G2ng
1
1
x2 
(37  25  ...  37) 
989  32,967
  xgi2 
n1  n2 g1i1
16  14
30
 Gruppenmittel der beiden Merkmale X1 und X2:
Einkommen (X1)
Alter (X2)
Marke A (Gruppe 1)
x11  30,563
x12  34,938
Marke B (Gruppe 2)
x21  34,071
x22  30,714
Mittelwert des Merkmal X1 in Gruppe 1:
1 n116
1
1
x11 
489  30,563
 x1i1  (28  23  ...  22) 
n1 i1
16
16
 Berechnung der Streuungsmatrix B zwischen den Gruppen:
G 2
b11   ng  (x g1 - x1)2  n1  (x11 - x1)2  n2  (x 21 - x1)2
g1
 16  (30,56 - 32,2)2  14  (34,07 - 32,2)2  91,99
18
G 2
b22   ng  (x g2 - x 2 )2  n1  (x12 - x 2 )2  n2  (x 22 - x 2 )2
g1
 16  (34,94 - 32,97)2  14  (30,71 - 32,97)2  133,60
G 2
b12  b21   ng  (x g1 - x1)(x g2 - x 2 )
g1
 n1  (x11 - x1)(x12 - x 2 )  n2  (x 21 - x 2 )(x 22 - x 2 )
 16  (30,56 - 32,2)(34,9 4 - 32,97)
 14  (34,07 - 32,2)(30,7 1 - 32,97)  -110,86
- 110,86
b11 b12   91,99
B
  - 110,86 133,60 
b
b
 21 22  

 Berechnung der totalen Streuungsmatrix T:
G  2 ng
t11    (x gi1 - x1 ) 2
g 1 i 1
 (28 - 32,2)2  (23 - 32,2)2  ...  (33 - 32,2)2  1106,80
G  2 ng
t 22    (x gi2 - x 2 ) 2
g 1 i 1
 (37 - 32,97)2  (25 - 32,97)2  ...  (37 - 32,97)2  1566,97
19
G  2ng
t12  t 21    (x gi1 - x1)(x gi2 - x 2 )  (28 - 32,2)(37 - 32,97)
g1 i1
 (23 - 32,2)(25 - 32,97)  ...  (33 - 32,2)(37 - 32,97)  489,20
 t11 t12  1106,80 489,20 
T
   489,20 1566,97
t
t
21
22

 

 Berechnung der Streuungsmatrix W innerhalb den Gruppen:
489,20 - ( -110,86)
 w11 w12   1106,80 - 91,99
W
  489,20 - ( -110,86) 1566,97 - 133,60 
w
w
22  
 21

1014,81 600,06 


 600,06 1433,37

Die Lösung des Maximierungsproblems (5.11’) führt zu der Matrixgleichung
(5.17)
B  a  -   W  a   0,
aus dem wir nach Ausklammern von a
(5.18)
B -   W   a  0
erhalten. Sofern die Streuungsmatrix innerhalb der Gruppen, W, nicht singulär ist,
kann ihre Inverse gebildet werden.
20
Wird (5.18) von links mit W-1 multipliziert, erhält man das Gleichungssystem
(5.19)
W -1  B -   I  a  0,
dessen Lösung des Gleichungssystems ein aus der Faktorenanalyse bereits bekanntes Eigenwertproblem darstellt. Wir suchen den größten Eigenwert  der Matrix W-1B und den zugehörigen Eigenvektor a. Um eine nicht-triviale Lösung (a  0)
zu erhalten, muss die Matrix ( W -1  B -   I) singulär sein, so dass der Eigenwert 
aus der charakteristischen Gleichung
(5.20) W-1  B -   I  0
zu bestimmen ist. Setzt man danach den größten Eigenwert  in das Gleichungssystem (5.19) ein, lässt sich der zugehörige Eigenvektor a bestimmen. In der Regel wird
man einen Eigenvektor auf 1 normieren:
m
2  1.
(5.21) a'a   a2j  a12  a22  ...  am
j1
Die Komponenten des Eigenvektors a lassen sich in unserem Modell der Diskriminanzanalyse als Diskriminanzkoeffizienten interpretieren. Allerdings sind sie noch
nicht in der Form normiert, wie wir sie für die Diskriminanzanalyse benötigen. Aus
diesem Grund bezeichnen wir die Koeffizienten aj als unnormierte (rohe) Diskriminanzkoeffizienten.
21
Die Diskriminanzkoeffizienten sollen hier dagegen derart normiert werden, dass die
gemeinsame (gepoolte) Varianz der Diskriminanzvariablen (s2d )pool gleich eins wird.
Diese Normierung hat sich durchgesetzt, um eine besser zu interpretierende Diskriminanzfunktionen zu erhalten. Es soll also gelten:
(5.22)
 
pool !
2
sd
1
Die gepoolte Varianz der Diskriminanzvariablen entspricht dabei dem gewogenen
arithmetischen Mittel der gruppenspezifischen Varianzen und lässt sich damit durch
!
1
 Wd  1,
n -G
!
Þ Wd  n - G,
(5.23)
!
Þ ~
a ' W  ~
a n - G
darstellen.
a j können aus jedem beliebigen LösungsDie normierten Diskriminanzkoeffizienten ~
vektor a über die proportionale Transformation
a  γa
(5.24) ~
gewonnen werden.
22
Gesucht wird also die Proportionalitätskonstante γ. Gleichung (5.24) wird nun in
Gleichung (5.23) eingesetzt und nach γ aufgelöst:
!
  a ' W   a  n -G
2
!
a'  W  a n -G
mm m1
1
m


Skalar
(5.25)
 
n -G
a ' W  a
Also berechnen sich die normierten Diskriminanzkoeffizienten über
(5.26)
~
a
n-G
 a.
a ' W  a
Wie (5.24) und (5.26) zeigen, wird zur Ermittlung der normierten Diskriminanzkoeffizienten lediglich ein beliebiger Lösungsvektor a mit einem konstanten Faktor  multipliziert. Die Normierung der Koeffizienten aj hat folglich keinen Einfluss auf die Lage
der Diskriminanzachse. Lediglich die Skalierung der d-Werte wird verändert.
Das konstante Glied a0 hat keinen Einfluss auf die Streuung der Diskriminanzwerte.
Es bewirkt lediglich eine Skalenverschiebung der Diskriminanzwerte.
23
Die Konstante a0 der Diskriminanzfunktion wird nun derart bestimmt, dass der Gesamtmittelwert der Diskriminanzwerte gleich null wird:
!
d  0
n 1 n 1
!
a0  X  ~
a 0
(5.27)
a0  - X  ~
a
Das hat zum einen zur Folge, dass der kritische Diskriminanzwert dc null wird. In Verbindung mit den normierten Diskriminanzkoeffizienten ~
a j (j =1,…,m) erhält man durch
die so ermittelte Konstante a0 zum anderen normierte Diskriminanzwerte mit dem
Mittelwert null und der gepoolten Varianz von eins. Die Diskriminanzwerte wer-den
jetzt in Einheiten der Standardabweichung von den Gruppenzentroiden gemes-sen.
Die normierte Diskriminanzfunktion lautet damit:
(5.28)
d  a0  X  ~
a.
24
Beispiel 5.4: Für die beiden Käufergruppen liegen die Streuungsmatrizen zwischen
und innerhalb der Gruppen, B und W, vor. Gesucht ist als erstes der größte Eigenwert  der Matrix W-1B. Hierzu bilden wir die Inverse der Streuungsmatrix innerhalb
der Gruppen,
 0,00130958 - 0,00054824
W -1  
,

- 0,00054824 0,00092717 
womit sich nach Postmultiplikation mit B die Produktmatrix
- 110,86
 0,00130958 - 0,00054824  91,99
W -1B  

 

- 0,00054824 0,00092717  - 110,86 133,60 
 0,1812 - 0,2183


- 0,1532 0,1846 
ergibt.
 Ermittlung der Eigenwerte der Matrix W-1B
0,1812 - 
- 0,2183
- 0,1532
0,1846 - 
 0,0334 - 0,1812   - 0,1846  
 2
!
- 0,0334  0
 2 - 0,3658    0    ( - 0,3658)  0
Größter Eigenwert:  = 0,3658 ( = 0 ist irrelevant)
25
 Ermittlung der Eigenvektoren (unnormierte Diskriminanzkoeffizienten)
aus dem Gleichungssystem (W-1B-·I)·a = 0:
0    a1  0
  0,1812 - 0,2183 0,3658
 
      



0,3658  a2  0
 - 0,1532 0,1846   0
- 0,1846 - 0,2183  a1  0
- 0,1532 - 0,1812   a   0

  2  
(1) -0,1846·a1 – 0,2183·a2 = 0
(2) -0,1532·a1 – 0,1812·a2 = 0
Die Gleichungen (1) und (2) sind linear abhängig: Gleichung (2) erhält man nach
Division durch den Faktor 1,2005 (gerundet) aus Gleichung (1).
Wir setzen a2 in einer vorläufigen Lösung gleich 1: a2 = 1. Eingesetzt in Gleichung
(1) ergibt sich damit
-0,1846·a1 – 0,2183·(a2=1) = 0
-0,1846·a1 = 0,2183
a1 = 0,2183/(-0,1846) = -1,1826.
Einen normierten Eigenvektor a erhält man durch die Normierungsbedingung
(3)
a 'a
m2
  a2j  a12  a22  1 (Normierung auf 1).
j1
26
Da sich in der vorläufigen Lösung
a12  a22  (-1,1826)2  12  2,3985
ergibt, sind die berechneten Koeffizienten noch durch
2,3985  1,5487 zu dividieren:
a1 = -1,1826/1,5487 = -0,7636
a2 = 1/1,5487 = 0,6457.
Der mit dem Eigenwert =0,3658 korrespondierende - auf eins normierte – Eigenvektor (unnormierte, d.h. rohe Diskriminanzkoeffizienten) lautet daher
a1  -0,7636 
a
.

 a2  0,6457 
Probe:
a'  a  a12  a22  (-0,7636)2  0,64572  0,5831 0,4169  1
Hinweis: Unnormierte (rohe) Diskriminanzkoeffizienten bedeutet hier, dass einfach die Koeffizienten des Eigenvektors übernommen werden, die in einem Folgeschritt in ganz bestimmter Form zu normieren sind.
27
 Normierung der Diskriminanzkoeffizienten
(Normierung der gepoolten Varianz der Diskriminanzwerte auf 1)
Berechnung der quadratischen Form a’Wa:
~
a    a mit
mx2
a' Wa
mx2
 
n-2
30 - 2

 0,2165
a' Wa
597,6063
600,06  - 0,7636


 600,06 1433,37  0,6457 
- 0,7636
 - 387,4502 467,3212
 597,6063

 0,6457 
 - 0,7636

0,6457
1014,81
Damit erhalten wir die normierten Diskriminanzkoeffizienten
~1  0,2165  (a1 . -0,7636)  -0,1653
a
~2  0,2165  (a1  0,6457)  0,1398
a
Der Vektor der normierten Diskriminanzkoeffizienten lautet
a  -0,1653
~
~
a   ~1
.
a

0
,
1398
 2

28
Das konstante Glied a0 wird wie folgt bestimmt:
32,2 32,967
0,714
32,2 32,967 - 0,1653
0,714


~


a0  - X  a  - 



30 x 2 2 x1
M   0,1398   M 
 M
30 x1




32,2 32,967
0,714
(Gesamtmittel der Diskriminanzwerte wird dadurch auf 0 gesetzt)
Normierte Diskriminanzfunktion (
d  0, spool
1
d
D  0,714 - 0,1653  X1  0,1398  X2
Diskriminanzwerte:
Objekt 1 (aus Grp. 1):
d11 = 0,714 – 0,1653·x111 + 0,1398·x112
= 0,714 – 0,1653·28 + 0,1398·37 = 1,2582
Objekt 2 (aus Grp. 1):
d12 =0,714 – 0,1653·x121 + 0,1398·x122
= 0,714 – 0,1653·23 + 0,1398·25 = 0,4071
Objekt 1 (aus Grp. 2):
d21 = 0,714 – 0,1653·x211 + 0,1398·x212
= 0,714 – 0,1653·26 + 0,1398·20 = -0,7878
29
Gruppenmittelwerte auf der Diskriminanzachse:
Gruppe 1:
d1  0,714 - 0,1653  ( x11  30,563)  0,1398  ( x12  34,938)  0,5463
Gruppe 2:
d2  0,714 - 0,1653  ( x11  34,071)  0,1398  ( x12  30,714)  -0,6241
Trennwert (auf Diskriminanzachse):
dc  d 
n1  d1  n2  d2 16  0,5769  14  ( -0,6241)

0
n1  n2
30
Gruppe 1:
- durch positive Diskriminanzwerte gekennzeichnet
- hohes Alter -> pos. Diskriminanzkoeff. des Alters
- niedriges Einkommen -> neg. Diskriminanzkoeff. des Einkommens
Gruppe 2:
- durch negative Diskriminanzwerte gekennzeichnet
- niedriges Alter -> pos. Diskriminanzkoeff. des Alters
- hohes Einkommen -> neg. Diskriminanzkoeff. des Einkommens

30
 Standardisierte Diskriminanzkoeffizienten
Die normierten Diskriminanzkoeffizienten werden durch Maßeinheiten
und Streuungen der Merkmalsvariablen beeinflusst. Zur Ermittlung der
Bedeutungsrangfolge der Merkmalsvariablen ist die Ausschaltungen
dieser Dimensionen vorteilhaft, was durch eine Standardisierung der
Diskriminanzkoeffizienten erfolgt.
Standardisierte Diskriminanzkoeffizienten:
(5.29)
a *j  ~
a j  spool
j
mit (5.30)
1
w1jj/ 2
n-2
spool

j
in Matrixschreibweise:
(5.31)
a *
2 x1
1
diag ( W )1 / 2  ~
a
n-2
Relative Bedeutung der einzelnen Variablen Xj:auf Grundlage der
standard. Diskriminanzkoeffizienten:
(5.32)

PTj   a *j

* 
 a k   100%
k 1

m
31
Beispiel 5.5:
1/ 2
Diagonalmatrix diag (W )
:
1/ 2
diag ( W )
 w1 / 2
  11
 0
0   1014,81

1/ 2  
0
w 22  
0
 31,856083
0


 
0
37,859873
1433,37  
Gepoolte Standardabweichungen der Merkmalsvariablen:
1
1
s1pool 
w111/ 2 
31,856083  6,0202
n-2
30 - 2
1
1
1/ 2
spool

w

37,859873  7,1548
22
2
n-2
30 - 2
Standardisierte Diskriminanzkoeffizienten:
a*  ~
a  spool  -0,1653  6,0202  0,9951
1
1 1
a *2  ~
a2  spool
 0,1398  7,1548  1,0002
2
Vektor der standard. Diskr.koeff.:
a *  -0,9951 Einkommen
a*   1

*
 a 2  1,0002  Alter
Bedeutungsrangfolge aufgrund der standard. Diskriminanzkoeff.:
2 * 
 *
PT1   a1  a k   100%  [0,9951 /( 0,9951  1,0002)]  100%  49,9%
k 1


2 * 
 *
PT2   a 2  a k   100%  [1,0002 /( 0,9951  1,0002)]  100%  50,1%
k 1



32
 Strukturkoeffizienten
Korrelationen zwischen Merkmalsvariablen und der Diskriminanzvariablen
(berücksichtigen Korrelationen zwischen den Merkmalvariablen)
(5.33)
pool
rdx

j
 
sdpool
x
j
2 pool
sj

1 G ng
  x i j - x g j  d i - dg
n - G g 1 i 1

 
2 pool
sd

 
2 pool
sj



 
2 pool
sd
Berechnung des Vektors der Strukturkoeffizienten ( rdx):
(5.34)
pool
rdx

m1
1
 diag W -1 / 2  W  ~
a


 mm m1
n
G



mm
Skalar
Relative Bedeutung der Variablen Xj auf Grundlage der Strukturkoeffizienten:
(5.35)
 pool
PTj   rdx
 k
pool 
r
 dx   100%
k 
k 1
m
33
Beispiel 5.6:
Vektor der Strukturkoeffizienten:
1
pool
rdx

 diag W -1 / 2  W  ~
a





n
-
G
22 21



21
Skalar

22
 1014,81
0  1014,81 600,06  - 0,1653
1


   0,1398 
30 - 2 
600
,
06
1433
,
37
0
1433,37 
 

6,0202 3,5598 - 0,1653 - 0,4975 Einkommen






 2,9953 7,1548  0,1398   0,5051  Alter
Bedeutungsrangfolge aufgrund der Strukturkoeffizienten.:
2 pool 
 pool

PT1   rd,x
 rd,x   100%  [0,4975 /( 0,4975  0,5051)]  100%  49,6%
1
k 
k 1

2 pool 
 pool
PT2   rd,x
 rd,x   100%  [0,5051 /( 0,4975  0,5051)]  100%  50,4%
2
k 
k 1

34

Multivariate 14 (Diskriminanzanalyse1)