Está en la página 1de 34

Prueba  2 Cuadrado

MACHICAO BEJAR NILTON

niltonmachiber@yahoo.com
Están relacionados los hábitos de lectura con el sexo
del lector?

¿Están relacionadas las calificaciones obtenidas con


el número de faltas?

¿Es independiente la opinión sobre la política


exterior de la política partidista?

¿Es independiente el sexo de una persona de su


preferencia en colores?

¿Está relacionado el sexo con tener una educación


universitaria?
¿Son independientes el tamaño de una familia
y el nivel de educación de los padres?

¿Está relacionado el desempleo con el


incremento de la criminalidad?

¿El precio está asociado con la calidad de un


producto electrodoméstico?

¿El estado nutricional esta asociado con el


desempeño académico?

¿Están relacionadas las enfermedades del


corazón con el tabaquismo?
Objetivo
El objetivo general de este tópico es que se
comprenda las dos técnicas estadísticas
empleadas para analizar datos categóricos,
con lo cual podrá:
• Analizar datos usando la prueba de Ji
cuadrado de independencia
• Comprender la prueba ji cuadrado de
bondad de ajuste y cómo usarla
• Usar la prueba Ji cuadrado para
homogeneidad ( no se abordará)
PRUEBA CHI CUADRADO

DOS VARIABLES
UNA VARIABLE

PRUEBA DE BONDAD PRUEBA DE PRUEBA DE


DE AJUSTE
INDEPENDENCIA HOMOGENEIDAD
Prueba de Independencia,

Se usa para analizar la frecuencia de dos


variables con categorías múltiples para
determinar si las dos variables son
independientes o no.

Por ejemplo:
¿El tipo de refresco preferido por un
consumidor es independiente de su grupo
etáreo?
¿El estado nutricional esta asociado con el
desempeño académico?
¿determinar si la región geográfica es
independiente del tipo de inversión
financiera?

La prueba Chi cuadrado de independencia


es particularmente útil para analizar datos
de variables cualitativas.
Los datos de variables cualitativa o categóricas representan
atributos o categorías y se organizan en tablas llamadas
tablas de contingencia o tablas de clasificación cruzada.

Tabla de contingencia
Una Tabla de contingencia con r filas y c columnas tiene la
siguiente forma:
Donde:

Oi j : es el número de sujetos que tienen las características


Ai y Bj a la vez.
Ri : (i = 1,…,r) es la suma de la i-ésima fila de la tabla.
Es decir, es el total de sujetos que poseen la
característica Ai.
Cj :(j = 1,…,c) es la suma de la j-ésima columna de la
tabla. Es decir, es el total de sujetos que poseen la
característica Bj.
n : representa el total de observaciones tomadas.
La pregunta es:
¿Existirá o no relación entre las variables A y
B?, es decir, si A y B son o no independientes.

Formulación de hipótesis:

Hipótesis nula (H0) : Las variables X e Y son


independientes, ( X e Y no están relacionadas)

Hipótesis alternativa (H1) : Las variables X e Y no son


independientes, (X e Y están relacionadas)
Pruebas de Independencia
La estadistica Ji-Cuadrado esta dado por:
r c (O ij  E ij ) 2
2   
i 1 j1 E ij

donde
Oij : es la frecuencia observada de la celda que está en la
fila i, columna j,
Ri * C j
Eij 
n
es la frecuencia esperada de la

celda (i, j).


La frecuencia esperada es aquella que debe
ocurrir para que la hipótesis nula sea
aceptada.

La prueba estadística se distribuye como una


Ji-Cuadrado con (r-1)*(c-1) grados de libertad.

La hipótesis Nula se rechaza si ,  2


calc   2
1

o equivalentemente si el “p-value” es menor


que  (prefijado)
Ejemplo:
Se toma una muestra aleatoria de 2200 familias y se les clasifica
en una tabla de doble entrada según su nivel de ingresos (alto,
medio o bajo) y el tipo de colegio a la que envían sus hijos. La
siguiente tabla muestra los resultados obtenidos:

TIPO DE COLEGIO TOTAL


INGRESOS PRIVADO PÚBLICO
Alto 506 494 1000
Medio 438 162 600
Bajo 215 385 600
TOTAL 1159 1041 2200

¿A un nivel de significancia del 1% hay razón para creer que


el ingreso y el tipo de colegio no son variables
independientes?
Solución:
Las hipótesis a plantearse son las siguientes:
Ho: No hay relación entre el ingreso y el tipo de colegio
H1: Si hay relación entre el ingreso y el tipo de colegio.
Rows: fila Columns: columna

1 2 All Pearson Chi-Square = 169.429,


DF = 2, P-Value = 0.000
1 506 494 1000 Likelihood Ratio Chi-Square 174.511, DF
526.8 473.2 1000.0
= 2, P-Value = 0.000
2 438 162 600
316.1 283.9 600.0 Interpretación: Como el “P-value” es
menor que 0.01 se puede concluir que
3 215 385 600 hay relación entre el nivel de ingreso y el
316.1 283.9 600.0
tipo de colegio.
All 1159 1041 2200
1159.0 1041.0 2200.0
Tablas de Contingencia en
MINITAB

Se usa la opción Tables del


menú STAT, ésta a su vez tiene
un submenú que contiene las
opciones Cross Tabulation and
Chi Square.

Esta opción se usa en dos


situaciones:
La primera de ellas es cuando
los datos están dados
en dos columnas, o sea como si
hubiesen sido las contestaciones
a dos preguntas de un
cuestionario.
La segunda situación donde Cross
Tabulation es usada para hacer el
análisis de Ji-cuadrado, es cuando
los datos ya están resumidos en
tablas con filas y
Columnas. En este caso, para que
MINITAB pueda hacer el análisis
se deben entrar los datos en 3
columnas.
En una columna deben ir las
frecuencias observadas en cada
celda de la tabla y en las otras dos
columnas deben ir los valores de las
variables en filas y columnas que
permitan identificar a qué celda le
corresponde la frecuencia absoluta
entrada.
Prueba de Bondad de Ajuste
Los procedimientos de prueba de hipótesis que se han
presentado an capítulos anteriores están diseñados para
problemas en los que se conoce la población o o
distribución de probabilidad, y la hipótesis involucra los
parámetros de la distribución.
A menudo se encuentra otra clase de hipótesis: no se sabe
cuál es la distribución de la población, y se desea probar la
hipótesis de que una distribución en particular será un
modelo satisfactorio de la población.
Por ejemplo:
Probar la hipótesis de que la población tiene
comportamiento normal, Poisson,.exponencial etc.
Ejemplo
Se propone que el número de defectos en las
tarjetas de circuito impreso sigue una
distribución Poisson con parámetro 0.75. En
una muestra aleatoria de 60 tarjetas de circuito
impreso se observa el número de defectos. Los
resultados obtenidos son los siguientes:
Nº defectos 0 1 2 3
Frecuencia 32 15 9 4

Use la prueba Ji cuadrado de bondad de ajuste y


alfa = 0.05 para determinar si esta distribución es
de Poisson.
Solución: (Cálculos previo)

1er paso:
Calcular las probabilidades para cada una de
las categorías dadas de acuerdo al modelo
Poisson:


e  x
P( X  x)  x  0,1,2....
x!
0.75 0
e 0.75
P ( X  0)   0.472
0!
 0.75 1
e 0.75
p1  P( X  1)   0.354
1!
 0.75 2
e 0.75
p 2  P ( X  2)   0.133
2!
p3  P( X  3)  1   P( X  0)  P( X  1)  P( X  2)
p3  P( X  3)  0.041
2do paso:
Las frecuencias esperadas se calculan
multiplicando el tamaño de la muestra n=60
por las probabilidades pi halladas en el paso
anterior, es decir: Ei = n*pi
Frecuencia
Nº defectos Probabilidad esperada
0 0.472 28.32
1 0.354 21.24
2 0.133 7.98
>=3 0.041 2.46
3er paso:
Como la frecuencia esperada de la última
categoría es menor a 5, se combinan las dos
últimas casillas, quedando de la forma
siguiente:

Frecuencia Frecuencia
Nº defectos observada esperada
0 32 28.32
1 15 21.24
>= 2 13 10.44
Siguiendo los pasos de la prueba de hipótesis:

H0 : La forma de la distribución del número de


defectos es Poisson.
H1 : La forma de la distribución del número de
defectos no es Poisson.
  0.05
r
(Oi  Ei ) 2
Estadístico de prueba: 2  
i 1 Ei
Valor Crítico

 2
1,1  2
1, 1 0.05  2
1, 0.95  3.84

Cálculos

(32  28. 32) 2


(15  21.24) 2
(13  10.44) 2
 calc
2
    2.94
28.32 21.24 10.44
Decisión:
Como  calc
2
 2.94   tabla  3.84
2

No rechazamos H0 , es decir, la variable número


de defectos tiene la distribución Poisson
Ejemplo (hacerlo)
En el cuadro siguiente se presenta la distribución
de frecuencia del número de defectos
encontrados en el análisis de los últimos 200
artículos producidos en un proceso de
producción. Usando un nivel de confianza del 5%
se desea verificar mediante una prueba chi
cuadrado si dichos valores proceden de una
distribución de Poisson con una media de3.5
defectos por artículo.
Ejemplo:

La Dra. Bertha Keneth, presidenta de la Institución Las


Gaviotas, recopilo información acerca de los sueldos
anuales de los profesores de tiempo completo en 160
institutos superiores. Utilizando Minitab, ella encontró
que el pago medio laboral era de 54.03 y que la
desviación estándar era de 13.76. La distribución de
frecuencias para estos sueldos por año se muestra en
cuadro adjunto:
¿coinciden las frecuencias observadas y las
frecuencias esperadas, en base a la distribución
normal?
Número de
Sueldo
colegios
< 30 4
30 40 20
40 50 41
50 60 44
60 70 29
70 80 16
>= 80 6
Total 160

Solución: (Cálculos previo)


1er paso: estandarizar

P(a*  X  b*)  P(a  Z  b)  P( Z  b)  P( Z  a)


 30  54.03 
P( X  30)  P Z    P( Z  1.75)  0.0401
 13.76 

 30  54.03 40  54.03 
P(30  X  40)  P Z 
 13.76 13.76 
P(1.75  Z  1.02)  0.1138

 40  54.03 50  54.03 
P(40  X  50)  P Z 
 13.76 13.76 
P(1.02  Z  0.29)  0.2320
 50  54.03 60  54.03 
P(50  X  60)  P Z 
 13.76 13.76 
P(0.29  Z  0.43)  0.2805

 60  54.03 70  54.03 
P (60  X  70)  P Z 
 13.76 13.76 
P (0.43  Z  1.16)  0.2106

 70  54.03 80  54.03 
P(70  X  80)  P Z 
 13.76 13.76 
P(1.16  Z  1.89)  0.0936
 80  54.03 
P( X  80)  P Z    P ( Z  1.89)
 13.76 
 1  P( Z  1.89)  0.0294

2do paso:
Las frecuencias esperadas se calculan
multiplicando el tamaño de la muestra n=60
por las probabilidades pi halladas en el paso
anterior, es decir: Ei = n*pi
Siguiendo los pasos de la prueba de hipótesis:

H0 : Los sueldos se distribuye en forma normal


H1 : Los sueldos no se distribuyen como una normal

  0.05
r
(Oi  Ei ) 2
Estadístico de prueba: 2  
i 1 Ei
Valor Crítico
 2
7  2 1,1  2
4 , 1 0.05  2
4 , 0.95  9.488

Calculo de estadístico
( 4  6.416) 2
( 20  18.208) 2
( 6  4.704) 2
 calc
2
   .....   2.59
6.416 18.208 4.704
Decisión:
Como  2
 2.59   2
 9.48
calc tabla

No rechazamos H0 , es decir, la variable sueldo


tiene comportamiento normal.

También podría gustarte