Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3. Anlisis Bivariado
Ricardo anculef Alegra Universidad Tcnica Federico Santa Mara
Estadstica Descriptiva
Objetivo
Obtener informacin desde una muestra, que permita entender o formular hiptesis acerca del fenmeno que se estudia. Tipos de Anlisis:
Describir cmo se comporta una variable Describir cmo una variable (digamos explicativa) afecta el comportamiento de a otra (digamos dependiente) Describir cmo interaccionan varias variables
Estadstica Descriptiva
Objetivo
Obtener informacin desde una muestra, que permita entender o formular hiptesis acerca del fenmeno que se estudia. Tipos de Anlisis:
Anlisis Univariado Anlisis Bivariado Anlisis Multivariado
Estadstica Descriptiva
Ejemplos de Anlisis Bivariado
Estadstica Descriptiva
Ejemplos de Anlisis Bivariado
Hipotesis Preliminar que Gua el Anlisis: La probabilidad de muerte del feto en un embarazo se ve influenciada (aumenta) con el nivel de estrs de la madre. Posible experimento. 1. Tomamos una muestra de casos clnicos. 2. Separamos la muestra en dos grupos: (A) madres con estrs y (B) madres sin estrs. 3.Medimos la frecuencia de muertes en cada grupo 4.Comparamos ambas frecuencias.
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Lo anterior es un ejemplo de Anlisis Estratificado: Se divide una muestra de acuerdo al valor de una variable que llamaremos variable estratificadora X. Se estudia el comportamiento de otra variable de inters Y en cada subgrupo o estrato. Se da cuenta de cmo cambia el comportamiento de Y al cambiar de estrato X.
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
El anlisis estratificado pretende mostrar cmo cambia una variable (Y) cuando cambia otra (X). En el estudio con las embarazadas: Estratificadora (X): Presencia o ausencia de estrs. Dependiente (Y): Presencia o no de muerte fetal. Se determina cmo cambia el promedio de Y (tasa de muerte) cuando cambiamos de estrato.
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Qu tal si la hiptesis fuera?: La probabilidad de muerte fetal depende del nmero de sueo de la madre en el perodo de gestacin. Cmo estratificamos la muestra? El problema es que la variable explicativa (X=horas de sueo) es ahora continua.
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Idea: Si la variable explicativa es continua, definir categoras de valores posibles y separar la muestra de acuerdo a ellas. Cmo determinar las categoras?: juicio o conocimiento previo: estrato econmico, partido poltico, niveles normales/anormales. criterio estadstico: como el utilizado construir histogramas (organizar por clases).
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo: En la muestra se registraron las siguientes horas de sueo promedio durante los ltimos 6 meses de gestacin: 8.0, 8.5, 11.0, 6.5, 7.2, 6.2, 10.0, 10.5, 9.2, 9.5, 6.0, 7.2, 6.9, 6.4, 12.5, 10.8 con k = 3 R = 12.5 6.0 = 6.5 1 A = (R + 1) / 3 = 2.5 2
3 Grup o Lmites 5.5 - 8.0 8.0 - 10.5 10.5 13.0 Marc a 6.75 9.25 11.7 5
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Una vez que ya hemos estratificado con algn criterio:
E2
E1
qu medimos?
Em
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Una vez que ya hemos estratificado con algn criterio: qu medimos?: frecuencias. Cuntas observaciones caen en cada estrato?: frecuencias absolutas (n1 , n2 , , nm) relativas (p1 , p2 , , pm ) Estas ltimas dan el peso del estrato en la muestra total
p1 p2 pm
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Una vez que ya hemos estratificado con algn criterio: qu medimos?: tendencia. Cul es la tendencia en cada estrato?: media, mediana, etc.
X1
X2
Xm
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Una vez que ya hemos estratificado con algn criterio: qu medimos?: dispersin. Cul es la dispersin en cada estrato?: varianza, IQR
V1 V2
Vm
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Una vez que ya hemos estratificado y analizado el comportamiento de la variables por estrato, es til presentar las estadsticas de manera grfica, e.g. box-plots.
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Box-plots por cada estrato
E1
E2
E3
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Una forma de medir el efecto de la variable presuntamente explicativa (X) sobre la explicada (Y) es el Anlisis de Varianza. Idea: si la presunta variable estratificadora X explica bien la otra variable Y, sta ltima no debiera ser muy variable con X constante en comparacin con el cambio observado al cambiar X
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Anlisis de Varianza: Varianza Intra-Estratos: dentro de los grupos.m
phVh
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Anlisis de Varianza: Varianza Inter-Estratos: entre los grupos. Varianza explicada por la variable estratificadora
p (Y
h=1 h
Y)
Y = phYn
h=1
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Anlisis de Varianza: Varianza Inter-Estratos: entre los grupos. Varianza explicada por la variable estratificadora
p (Y
h=1 h
Y)
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Anlisis de Varianza: Varianza Muestral Total:
1 2 VT = (Yi Y ) n I
m h=1
V T =V intra+ V inter
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Anlisis de Varianza: Cuociente de Varianza Explicada: VT / Vinter Medida de la calidad de la variable estratificadora X como variable explicativa para Y Para todo lo anterior necesitamos que Y sea continua, pero X puede ser continua o discreta, numrica o cualitativa.
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
Consideremos la siguiente hiptesis de estudio: Caminar ayuda a mantener un ndice de grasa corporal adecuado.
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza: Para validar la hiptesis se tom una muestra de 16 hombres, encuestndolos acerca del nmero de horas caminadas a la semana y midiendo su % de grasa corporal. La muestra es la siguiente:
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
horas (H) % grasa (G) 4 1.5 5 1 4.2 6 2.5 7 18.9 24.8 17.5 26.2 18.2 18.4 21.4 17.4 horas (H) % grasa (G) 2 6.5 0.5 0.9 3 5 4 3.5 22.5 18.0 27.2 25.5 20.8 21.8 22.6 21.0
G = 21 .3875 VT = 9.7898
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
Decidimos estratificar la muestra de acuerdo al nmero de horas caminadas, considerano 3 clases para el conjunto de valores de esta variable: clase Lmites frecuencia R = (7-0.5) = 6.5 A = (R + 1)/3 = 2.5 1 (0, 2.5] 0.3750 2 3 (2.5, 5] (5, 7.5] 0.4375 0.1875
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
Estratificamos por cada clase de valores para la variable horas caminadas generandose 3 Estrato 3 submuestras Estrato 2 Estrato 1
1.5 1 2.5 2 0.5 0.9 24.8 26.2 21.4 22.5 27.2 25.5 4 5 4.2 3 5 4 3.5 18.9 17.5 18.2 20.8 21.8 22.6 21.0 6 7 6.5 18.4 17.4 18.0
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
Medimos las medias y las varianzas por estrato: clase lmites frecuenc media varianz ia a 1 2 3 (0, 2.5] 0.3750 (2.5, 5] 0.4375 (5, 7.5] 0.1875 24.60 20.11 17.93 4.1367 3.1784 0.1689
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
Calculamos las varianzas intra e inter
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
Calculamos las varianzas intra e inter
G = 21 .3875
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Ejemplo de Anlisis de Varianza:
Corroboramos la descomposicin propuesta:
Vintra = 2.9735
Vinter = 6.8255
% de varianza explicada (fraccin del cambio en el ndice de grasa que explica o predice el nmero de horas caminadas) Hay una Vinter/ VT = 0.6966 ( 70 %) relacin bien significativa
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Es valida la relacin entre las varianzas cuando estas se calculan normalizando la suma de cuadrados por n-1 en vez de n?
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Inferencial justificaremos porqu es ms til y correcto comparar las sumas 2 de cuadrados Suma sobre las observacione S = (Y Y )
T
Sintra = (Yi Yk )
k=1 iEk 2
del estrato k
2
Sinter = nk (Yk Y )
k=1
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Sintra n- m
De acuerdo al valor de F podemos aseverar que la variable estratificadora induce cambios en la otra variable con una significancia estadstica
..... .....
..... .....
..... .....
..... .....
nr
Total n1 n2 ni
nr n
_ =n
ni = n j =
n
j= 1
ij
i= 1
Frecuencias Independientes de la clases Bj a la r que estn asociadas: suma declase los valores Frecuencia Absoluta de la Bj; j=de 1, nij la fila i-sima
,2, ... ,s
Frecuencias Independiente de las clases Ai a la que estn asociadas: suma de los valores de la columna j-sima
Total f1 f2 fi
fr f
f i = fj =
f
j= 1 r i= 1
ij
ij
fi / j =
ij
n j
ij
f j
fj / i =
nij
ni
fij
fi
o C: X
l aS
Medio Alto
om us no C: X
l aS
Medio Alto
m us no C: X
l aS
Medio Alto
m us no C: X
l aS
Medio Alto
m us no C: X
l aS
Medio Alto
X: Bajo X: Medio
X: Alto
fi / 1 = fi / 2 = = fi / s i
fj / 1 = fj / 2 = = fj / r j
fi / 1 = fi / 2 = = fi / s = fi
fi / j = fi i, j
Similarmente, si Y es fj / i = de fj X i, j independiente
Demostracin?
fi / j =
nij n j
fij f j
fi = fi / 1 f1 + fi / 2 f2 + + fi / s f s
fij = fi f j
fij
Demostracin
fi / j =
nij
n j
f j
fij = fi / j f j = fi f j
i, j
fj / i =
fij
fi
fij
fij
= f j
i, j
f j
d(fi / 1 , fi / 2) = fi / 1 fi / 2
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Histogramas por clase
Clase 1 (Y)
Frecuencias Relativas
X: Clase 1
X: Clase 2
X: Clase 3
X: Clase 4
Estadstica Descriptiva
Anlisis de Muestras Estratificadas
Histogramas por clase (apilados)
0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
X: Clase 1
X: Clase 2
X: Clase 3
X: Clase 4