Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Projektplanung
Dr. G. Lischeid
Gunnar.Lischeid@bayceer.uni-bayreuth.de http://www.bayceer.uni-bayreuth.de/mod/
Backhaus, K., Erichson, B., Plinke, W., Weiber, R. (2003): Multivariate Auflage, Springer, ISBN 3-540-00491-2 ISBN 3-540-56200-1
Bortz, J. (1993): Statistik fr Sozialwissenschaftler. 4. Auflage, Springer, Wackernagel, H. (1998): Multivariate Geostatistics. 2. Auflage, Springer
Statistik - Zielrichtungen
1. Deskriptiv - Beschreibung (der Verteilung) eines Datensatzes
2. Konfirmativ - Testen von Hypothesen (Zusammenhngen) 3. Explorativ - Suche nach Strukturen (Zusammenhngen)
Datentypen
1. Nominal skaliert 2. Ordinal skaliert 3. Intervall-skaliert - Zugehrigkeit zu einer Gruppe (Name) - Rangfolge (Ordnung) - Abstnde der Zahlenwerte proportional der Abstnde der Merkmalsausprgung
Hufigkeit
95,5%
Verteilungen
Normalverteilung: Approximaton der Binomialverteilung fr groe Stichproben fr eine normalverteilte Zufallsgre z (mit = 0 und = 1) gilt:
Verteilungen
Normalverteilung 2-Verteilung
t-Verteilung
F-Verteilung:
F (n , n ) =
t-Verteilung:
t =
mit
n n2
n n
F-Verteilung:
2-Verteilung:
Schiefe, Exzess
AM: Mo: Md: Arithmtisches Mittel Modalwert Median
(Bortz 1993)
Momente (I)
k-tes Moment der Variablen x: (= Moment k-ter Ordnung)
( x, A) = E[( x A) k ] k
A=0
A = 0; k = 1 : = E ( x)
A = E (x)
A = ; k = 2 :
= E(x )
Momente (II)
fr z =
x E ( x)
(z-Transformation):
Varianz:
var( x) =
Korrelation:
r=
(Produkt-Moment-Korrelation, Pearson-Korrelation)
Kovarianz:
cov( x, y ) =
n
cov( x, y ) s s
(x
(x x)
(x x) (x x)
n x) ( y y)
Exzess:
3=
3=
Schiefe:
z
n
3 (= Kurtosis, Wlbung)
( x, A) =
E[( x A) ]
z-Transformation
z-Transformation
Unterschiedliche Wertebereiche fr unterschiedliche Parameter => unterschiedliche Gewichtung in der multivariaten Analyse, die nur vom Wertebereich (Einheit!) abhngig ist => Notwendigkeit der Normierung => analog zur Korrelation: 1. Normierung auf Mittelwert = 0, d.h.: Substraktion des Mittelwertes
x x y y 1 n s s
s s
1 n
r=
cov( x, y ) s s
( x x ) ( y y)
Produkt-Moment-Korrelation
Moment:
( x, A) =
E[( x A) ]
( x, A) =
Nichtlineare Korrelation
Spearman-Rangkorrelationskoeffizient: (Di: Rangplatzdifferenzen)
Kendall's :
r =
2 ( Ko Di) n (n 1)
r = 1
n n
6 D
1. zentrales Moment:
( x, x ) =
E[( x x ) ]
95,5%
Irrtumswahrscheinlichkeit p
-Fehler: "Irrtumswahrscheinlichkeit" p = Wahrscheinlichkeit, einen bestimmten Wert zu beobachten, wenn tatschlich die H0 gilt: p(beobachteten Wert | H0 = wahr) = bedingte Wahrscheinlichkeit -Fehler: p(beobachteten Wert | H1 = wahr)
=> quantitativ nur zu bestimmen, wenn die Verteilung der Werte gem der H1-Hypothese priori bekannt ist
=> dies ist aber i.d.R. nicht mglich entsprechend fr Test auf Normalverteilung: alternative Verteilung msste definiert werden
10
Irrtumswahrscheinlichkeit p
Die "Irrtumswahrscheinlichkeit" p p(beobachteter Wert | H0 = wahr)
Unterscheide:
1 - p(H0)
p(beobachteter Wert)
p(H0 = wahr)
11
12
Box-Cox Transformation
Ziel: Korrektur der Schiefe, so dass die transformierten Daten eine Normalverteilung aufweisen
transformierte Daten
x 1 T ( x) = T ( x ) = ln x
fr fr
>0 =0
10 8 6 4 2 0 -2 0 2 4 6
=1.5
1:1 =1 =0.5 =0
10
ursprngliche Daten
Box-Cox Transformation
(http://www.itl.nist.gov/div898/handbook/eda/section3/eda336.htm)
13
Aufgabe: Datentransformation
Ersetzen Sie die Eintrge "< Bestimmungsgrenze" durch sinnvolle nummerische Werte.
berrpfen Sie die einzelnen Parameter auf Normalverteilung, und fhren anschlieend die transformierten Daten auf Normalverteilung.
14