Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teorico-Chi2 08
Teorico-Chi2 08
2
• OBJETIVOS
– Describir situaciones donde es adecuado la
utilización de la prueba de Chi Cuadrado (2)
– Formular Hipótesis para diferentes situaciones.
– Calcular la Prueba de Chi Cuadrado e
interpretar los resultados.
– Evaluación de muestras Independientes.
CARACTERÍSTICAS
DE LA DISTRIBUCIÓN DE 2
2 es siempre positivo porque es una suma de
cuadrados.
• Varia desde 0 a (no tiene valores negativos)
• Familia de distribuciones que dependen de 1
parámetro (gl=grados de libertad)
• Media de la Distribución = gl
• Varianza de la Distribución=2gl
• La distribución tiene sesgo positivo y cuando los gl
aumentan se aproxima a la distribución normal
• Moda = gl-2 para gl2 y 0 para gl=1
gl=2
gl=3
gl=4
gl=5
0 2 Chi2 6 8
PRUEBAS DE 2
• BONDAD DE AJUSTE
– Se utiliza para la comparación de la distribución de una muestra
con alguna distribución teórica que se supone describe a la
población de la cual se extrajo.
• INDEPENDENCIA
– La Ho indica que 2 variables o criterios de clasificación son
independientes cuando se aplican a un conjunto de individuos
(unidades de observación)
– Totales Marginales Aleatorios
• HOMOGENEIDAD
– Se extraen Muestras Independientes de varias poblaciones y se
prueban para ver si son homogéneas con respecto a algún criterio
de clasificación.
– Un conjunto de Totales Marginales Son Fijos mientras que los otros
marginales son Aleatorios.
PRUEBAS DE 2
Bondad de Ajuste
• Uni-Dimesional
– Se basa en la Distribución de Probabilidad
Multinomial.
Propiedades de la Distribución de
Probabilidad Multinomial
• El experimento consiste en n ensayos idénticos.
• Hay k posibles resultados de cada ensayo.
• La probabilidad de k resultados son p1, p2, ...... pk y
se mantienen constantes de ensayo en ensayo
donde p1 + p2 + ...... + pk = 1
• Los ensayos son independientes.
• La variable aleatoria de interés son los conteos n1,
n2, ...... nk en cada una de la k categorías.
Prueba de Bondad de Ajuste
Se trata de probar si los datos de una muestra tomada difieren de
cierta distribución predeterminada.
Los n datos tomados deben estar divididos en categorías
Categoría 1 2 3 … K
Frecuencia Obs1 Obs2 Obs3 Obsk n
observada
Clases fo Xi z Pz P fe
330-344 3 337 -1,61 0,055 0,055 1,9 0,610
345-359 3 352 -0,97 0,166 0,111 3,9 0,204
360-374 4 367 -0,33 0,371 0,205 7,2 1,398
375-389 12 382 0,30 0,618 0,247 8,7 1,296
390-404 7 397 0,94 0,826 0,209 7,3 0,012
405-419 4 412 1,58 0,943 0,117 4,1 0,001
420-434 2 427 2,21 0,986 0,043 1,5 0,158
35 2 3,679
Clases fo Xi P fe
330-344 3 337 1/7 5,0 0,800
345-359 3 352 1/7 5,0 0,800
360-374 4 367 1/7 5,0 0,200
375-389 12 382 1/7 5,0 9,800
390-404 7 397 1/7 5,0 0,800
405-419 4 412 1/7 5,0 0,200
420-434 2 427 1/7 5,0 1,800
35 2 14,400
gl k 1 N º parametros _ estimados
gl=6
Tablas de Contingencia
• INDEPENDENCIA
– Experimento multinomial con clasificación con 2 criterios (2
factores). Los datos se pueden resumir en una tabla de 2 vías
(dimensiones). (Ejemplo número de animales enfermos por
condición corporal).
– La Ho indica que 2 variables o criterios de clasificación son
independientes cuando se aplican a un conjunto de individuos
(unidades de observación)
– Totales Marginales Aleatorios
• HOMOGENEIDAD
– Se extraen Muestras Independientes de varias poblaciones y se
prueban para ver si son homogéneas con respecto a algún criterio
de clasificación. (Ejemplo prevalencia de enfermos por región)
– Un conjunto de Totales Marginales Son Fijos mientras que los
otros marginales son Aleatorios.
La prueba de Independencia se efectúa para
probar si hay asociación entre las variables
categóricas A y B
2 2
cal 1
Tablas de Contingencia
VARIABLE DE CLASIFICACIÓN COLUMNAS
1 2 3 .......... c Total
C
L
1 O11 O12 O13 .......... O1c r1
V
A
S
2 O21 O22 O23 .......... O2c r2
A
R
I
F
F
I
3 O31 O32 O33 .......... O3c r3
I
A
I
C
L
A
. . . . . . .
B
L
A S . . . . . . .
C
E
I r Or1 Or2 Or3 .......... Orc rr
Ó
N Total c1 c2 c3 .......... cc n
r c (Oij Eij ) 2 c j ri
2
Eij gl (r 1) (c 1)
i 1 j 1 Eij n
PRUEBA DE INDEPENDENCIA
IU NIU Total
C 34 757 791
NC 7 2427 2434
Total 41 3184 3225
• ¿Pruebe a un nivel de significación de 0.05 si estas variables
están asociadas?
2
c2 ij
O
n
Eij
gl ( filas 1)(columnas 1)
Prueba de Homogeneidad
• A los efectos de probar la protección de 2 vacunas
contra los abortos producidos por una enfermedad
X se seleccionaron 3 lotes de 150 vacas cada uno
de un establecimiento con la enfermedad. Esto
lotes fueron vacunados con: Lote 1 = Placebo,
Lote 2 = Vacuna 1 y Lote 3 = Vacuna 2. En el
primer lote hubo 20 abortos en el "lote 2" 10
abortos y en el "lote 3" 5 abortos.