Está en la página 1de 6

Estadı́stica Inferencial

PRUEBAS DE CHI-CUADRADO

Logro de sesión
Al finalizar la sesión el estudiante aplica la distribución Chi-cuadrado en las pruebas de bondad
de ajuste y pruebas de independencia.

Pruebas con la distribución Chi-cuadrado


Las pruebas que consisten en sacar conclusiones directamente de las observaciones muestrales,
sin requerir supuestos acerca del tipo de distribución de la población de la que proviene, se denom-
inan pruebas no paramétricas y son empleados con datos medidos en escala nominal u ordinal. Se
utiliza la distribución Chi-cuadrado para contrastar este tipo de pruebas.

1. Prueba de bondad de ajuste


Esta prueba consiste en determinar si una muestra aleatoria procede de una población con
una determinada distribución de probabilidad (puede referirse a la distribución Uniforme, a la
Binomial, a la Poisson o a la Normal, etc)

1. Hipótesis: Plantear las siguientes hipótesis:


H0 : La distribución de frecuencias de la muestra concuerda con la distribución teórica
propuesta.(No hay diferencias entre valores observados y esperados)
H1 : La distribución de frecuencias de la muestra no concuerda con la distribución teórica
propuesta. (Si hay diferencias entre valores observados y esperados)

2. Nivel de significación: Seleccionar un nivel de significación α.

3. Estadı́stica de prueba:

n
X (Oi − ei )2
χ2c = ∼ χ2(k−1)
i=1
ei
Donde:
k : Número de categorı́as.
Oi : Frecuencias observadas.
ei : Frecuencias esperadas.

4. Región crı́tica:

UTP sede Arequipa Guı́a N◦ 16


Estadı́stica Inferencial

5. Calculo del estadı́stica de prueba: Calcular el valor de χ2c .


6. Conclusión: Tomar la decisión de aceptar o rechazar H0 .

2. Prueba de independencia
La prueba de independencia consiste en determinar si existe alguna relación entre dos variables
cualitativas, cuyos resultados son presentados en tablas de contingencia. Una tabla de contingencia
de r filas y c columnas, contiene en cada entrada o celda la frecuencia observada de la muestra que
corresponde a dos variables clasificadas por categorı́as.

Variable B
Categorı́as B1 B2 . . . Bc Totales
A1 O11 O12 . . . O1c O1.
A2 O21 O22 . . . O2c O2.
Variable A .. .. .. .. .. ..
. . . . . .
Ar Or1 Or2 ... Orc Or.
Totales O,1 O,2 O.c n
Cuadro 1: Tabla de contingencia.

1. Hipótesis: Plantear las siguientes hipótesis:


H0 : Existe independencia entre dos variables cualitativas.
H1 : No existe independencia entre dos variables cualitativas.
2. Nivel de significación: Seleccionar un nivel de significación α.
3. Estadı́stica de prueba:
La estadı́stica de prueba es dada por:
c X r
X (Oij − eij )2
χ2c = ∼ χ2((r−1)(c−1))
j=1 i=1
eij

Donde:
Oij : Frecuencias observadas.
eij : Frecuencias esperadas.

(Total de fila) (Total de columna)


eij =
Gran total
Las frecuencias observadas y esperadas son obtenidas de la siguiente tabla de contingencia:

UTP sede Arequipa Guı́a N◦ 16


Estadı́stica Inferencial

Variable B
Categorı́as B1 B2 ... Bc Totales
A1 O11 (e11 ) O12 (e12 ) . . . O1c (e1c ) O1.
A2 O21 (e21 ) O22 (e22 ) . . . O2c (e2c ) O2.
Variable A .. .. .. .. .. ..
. . . . . .
Ar Or1 (er1 ) Or2 (er2 ) . . . Orc (erc ) Or.
Totales O,1 O,2 O.c n

4. Región crı́tica:

5. Calculo del estadı́stica de prueba: Calcular el valor de χ2c .

6. Conclusión: Tomar la decisión de aceptar o rechazar H0 .

EJERCICIOS EXPLICATIVOS
1. El gerente de una planta industrial pretende determinar si el número de empleados que asis-
ten al consultorio médico de la planta se encuentra distribuido, en forma equitativa, durante
los cinco dı́as de trabajo de la semana. Con base en una muestra aleatoria de cuatro semanas
completas de trabajo, se observó el siguiente número de consultas por dı́a:

Dı́as Número de consultas


Lunes 49
Martes 35
Miércoles 32
Jueves 39
Viernes 45

A un nivel de significación del 5 %, ¿existe alguna razón para creer que el número de em-
pleados que asisten al consultorio médico, no se encuentra distribuido en forma equitativa
durante los dı́as de trabajo de la semana?

UTP sede Arequipa Guı́a N◦ 16


Estadı́stica Inferencial

2. Una agencia de publicidad desea saber si el género de los consumidores es independiente


de sus preferencias de cuatro marcas de café. La respuesta determinará si se debe diseñar
diferentes anuncios dirigidos a los hombres y otros diferentes para las mujeres. Los resultados
obtenidos de la encuesta realizada a 139 personas fue:

Marca A Marca B Marca C Marca D


Hombre 18 25 15 12
Mujer 32 15 10 12

¿Cuál será la decisión que tomará la agencia?, realice la prueba con un nivel de significancia
del 5 %.

UTP sede Arequipa Guı́a N◦ 16


Estadı́stica Inferencial

EJERCICIOS ADICIONALES
1. Se lanza 180 veces un dado obteniéndose los siguientes resultados:

Resultado Frecuencia
1 28
2 36
3 36
4 30
5 27
6 23

A un nivel de significación del 1 %, ¿es posible concluir que el dado no esta cargado?

2. En un hospital, el número de nacimientos observados para cada mes de cierto año, fueron los
siguientes:

Ene Feb Mar Abr May Jun Jul Ago Sept Oct Nov Dic
95 105 95 105 90 95 105 110 105 100 95 100

A un nivel de significación del 1 %, ¿existe alguna razón para creer que el número de nacimien-
tos no se encuentra distribuido en forma uniforme durante todos los meses de año?

3. En un experimento para estudiar la dependencia de la hipertensión de los hábitos de fumar,


se tomaron los siguientes datos de 180 individuos:

No fumadores Fumadores moderados Fumadores empedernidos


Con hipertensión 21 36 30
Sin hipertensión 48 26 19

Pruebe la hipótesis de que la presencia o ausencia de hipertensión es independiente de los


hábitos de fumar. Utilice un nivel de significancia de 0.05.

4. A una muestra de empleados en una planta quı́mica grande se le pidió indicar una preferencia
por uno de tres planes de pensión. Los resultados aparecen en la siguiente tabla. ¿Existe una
relación entre el plan de pensión seleccionado y la clasificación del trabajo de los empleados?

Clase de trabajo Plan A Plan B Plan C


Supervisor 10 13 29
De oficina 19 80 19
Obrero 81 57 22

TAREA DOMICILIARIA
1. Bubba’s Fish and Pasta es una cadena de restaurantes ubicados a lo largo de la costa del
Golfo de Florida. Bubba, el propietario, desea añadir filete a su menú. Antes de hacerlo,
decide contratar a Magnolia Research, para que lleve a cabo una encuesta entre personas
adultas para saber cuál es su platillo favorito cuando comen fuera de casa. Magnolia selec-
cionó una muestra de 120 adultos y les pidió que indicaran su comida favorita cuando salen

UTP sede Arequipa Guı́a N◦ 16


Estadı́stica Inferencial

a cenar. Los resultados se reportan en la siguiente tabla. ¿Es razonable concluir que no hay
preferencia entre los cuatro platillos? Use un nivel de significancia del 5 %.

Plato favorito Frecuencia


Pollo 32
Pescado 24
Carne 35
Pasta 29
Total 120

2. Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con
el grado de estrés de los trabajadores. Para lo cual se elige una muestra aleatoria de 300
trabajadores y se clasifican en la tabla siguiente:

Grado de estrés
Tipo de trabajo I II III
De oficina 42 24 30
Terreno 54 78 22

Probar la hipótesis de que el tipo de trabajo afecta el grado de estrés del trabajador con un
nivel de significación de 5 %.

UTP sede Arequipa Guı́a N◦ 16

También podría gustarte