Está en la página 1de 12

UNIVERSIDAD NACIONAL POLITECNICA

UNIDAD III Parte 3

PRUEBA CHI CUADRADO DE INDPENDENCIA O DE CONTINGENCIA

La prueba de hipótesis chi-cuadrada, es importante para probar la independencia de dos


variables obtenidas de dos muestras de observaciones.

La hipótesis se plantea de la siguiente forma:

H0 = La categoría A y la categoría B son independientes.


H1 = La categoría A y la categoría B son dependientes

Ejemplo para ilustrar la prueba de independencia

Se considera la prueba de independencia realizada por la empresa Alber’s. Esta empresa


produce y distribuye tres tipos de cerveza: ligera, clara y oscura. Al analizar los
segmentos de mercado de las tres cervezas, el grupo de investigación del área de
mercadeo de la empresa se preguntó si las preferencias de los consumidores por
estos tipos de cerveza diferían entre hombres y mujeres.

En caso de que las preferencias fueran independientes del género del consumidor,
iniciarían una campaña publicitaria para todas las cervezas de Alber’s. Pero, si las
preferencias por los distintos tipos de cerveza dependían del género del consumidor, la
empresa ajustaría sus promociones a los mercados.

Para determinar si la preferencia por un tipo de cerveza (ligera, clara u oscura) era
independiente del género del consumidor (hombre o mujer) se usó una prueba de
independencia.

La hipótesis para esta prueba de independencia se plantea de la siguiente forma:

H0: La preferencia por un tipo de cerveza es independiente del género del consumidor.

H1: La preferencia por un tipo de cerveza no es independiente del género del


consumidor.

La población investigada se define como: Todos los consumidores de cerveza, hombres


y mujeres, de esta población se toma una muestra y a cada individuo seleccionado en la
muestra se le pide que indique cuál de las tres cervezas Alber’s prefiere.

Las respuestas que brindan los consumidores son todas las posibles combinaciones de
cerveza preferida por género, en otras palabras, todas las probables contingencias, por
lo que a la prueba de independencia se le puede llamar también como prueba de tabla
de contingencia.

1
UNIVERSIDAD NACIONAL POLITECNICA

Continuando con el ejemplo del estudio de la cerveza Albers.

Se va a suponer que la muestra tomada seleccionada de forma aleatoria es de n = 150


consumidores de cerveza, cada individuo de la muestra tiene que probar los tres tipos
de cerveza y después se le pide que indique cuál prefiere o cuál es su primera elección.

Lo anterior indica que cada individuo de la muestra pertenecerá a una de las seis celdas
de la siguiente tabla de contingencia que se detalla abajo.

TABLA DE CONTINGENCIA DE CERVEZA PREFERIDA Y GÉNERO DEL CONSUMIDOR


Cerveza preferida
Género
Ligera Clara Oscura

Hombre celda (1,1) celda (1,2) celda (1,3)

Mujer celda (2,1) celda (2,2) celda (2,3)

La tabla presenta Todas las posibles combinaciones de cerveza preferida y el género

Un consumidor hombre entrevistado que prefiere la cerveza ligera, celda (1,1)


Un consumidor hombre entrevistado que prefiere la cerveza clara, celda (1, 2)
Un consumidor hombre entrevistado que prefiere la cerveza oscura, celda (1, 3)
Un consumidor mujer entrevistada que prefiere la cerveza ligera, celda (2,1)
Un consumidor mujer entrevistada que prefiere la cerveza clara, celda (2, 2)
Un consumidor mujer entrevistada que prefiere la cerveza oscura, celda (2,3)

En la tabla siguiente se presentan los resultados de las respuestas obtenidas en el


estudio. Las que se obtienen contando las frecuencias correspondientes a cada celda o
categoría.
Resultados de la muestra
Tabla de contingencia
Tipo de cerveza que prefieren hombres y mujeres

(Frecuencias observadas)
Cerveza preferida
Genero
Ligera Clara Oscura Total
Hombre 20 40 20 80
Mujer 30 30 10 70
Total 50 70 30 150

Los datos de la tabla anterior son las frecuencias observadas en la muestra de


consumidores para cada una de las seis categorías.

Con los datos de las frecuencias observada de la tabla de contingencia, se observa que,
de las 150 personas de la muestra, 20 hombres prefirieron la cerveza ligera, 40 hombres
2
UNIVERSIDAD NACIONAL POLITECNICA

prefirieron la cerveza clara, 20 hombres prefirieron la cerveza oscura, etcétera.

La prueba chi-cuadrada o de independencia, se utiliza para probar si existe diferencia


significativa entre las frecuencias observadas y las esperadas.

El primer paso para poder realizar la prueba Chi cuadrado de independencia, es calcular
las frecuencias esperadas.

• Calculo de las frecuencias esperadas

Se define eij, como la frecuencia esperada en la fila ( i ) columna ( j ) de la tabla de


contingencia.

Las frecuencias esperadas en una tabla de contingencia se deben de calcular con la


siguiente formula.

(total de fila i) × (total de columna j)


Frecuencias esperadas = eij,= Total de la muestra

Continuando con el ejemplo de la empresa Albers, bajo el supuesto de independencia


entre cerveza preferida y género del consumidor.

Se aplica la fórmula para los consumidores hombres que prefieren cerveza oscura, se
encuentra que la frecuencia esperada, es la siguiente

(80) × (30)
e13, = = 16.
150
Los resultados de todas las frecuencias esperadas para el ejemplo se presentan en la
siguiente tabla,

Frecuencia esperada de: Preferencia del tipo de cerveza según el genero


Cerveza preferida
Genero
Ligera Clara Oscura Total

Hombre 26.67 37.33 16.00 80

Mujer 23.33 32.67 14.00 70

Total 50 70 30 150
Utilice la fórmula de cálculo de frecuencias esperadas para verificar las otras
frecuencias esperadas que se presentan en la tabla.

3
UNIVERSIDAD NACIONAL POLITECNICA

En un segundo paso, se debe realizar el cálculo del estadístico Chi cuadrado Xc2

Calculo del estadístico Chi cuadrado Xc2


Consiste en comparar las frecuencias esperadas con las frecuencias observadas de la
tabla de contingencia.
El cálculo del estadístico Chi cuadrado, se basa en las frecuencias observadas y
esperadas, se calcula con la siguiente formula.

𝑘 2
(f0− fe )
Xc2 = ∑
𝑖=1 fe
Los símbolos fo , representa la frecuencia observada y f𝑒 es la frecuencia esperada.

2
La región de rechazo será: X c2 > X α,gl
Donde gl = grados de libertad = (Filas – 1) × (Columnas – 1)

Calculo del estadístico Chi cuadrado Xc2


Para probar si la Preferencia de un tipo de cerveza es independiente del género del
consumidor
Cuadrado
de la
diferencia
dividido
Frecuencia
Cerveza Frecuencia entre la
observada Diferencia Cuadrado de la diferencia
Genero Preferida esperada frecuencia
fo , f𝑒 (f0− fe ) (f0− fe )2 esperada
(f0− fe )2
fe

Hombre Ligera 20 26.67 -6.67 44.44 1.67


Hombre Clara 40 37.33 2.67 7.11 0.19
Hombre Oscura 20 16.00 4.00 16.00 1.00
Mujer Ligera 30 23.33 6.67 44.44 1.90
Mujer Clara 30 32.67 -2.67 7.11 0.22
Mujer Oscura 10 14.00 -4.00 16.00 1.14
Total 150 𝑘 (f0− fe )2 6.12
Xc2 = ∑
𝑖=1 fe

4
UNIVERSIDAD NACIONAL POLITECNICA

Como se observa, el valor del estadístico de prueba es X c2 = 6.12.

Es lo mismo
(f f ) 2
Xc2 = ∑𝑘𝑖=1 0− e =
f e

(20.00− 26.67)2 (40.00− 37.33)2 (20.00− 16.00)2 (30.00− 23.33)2 (30.00− 32.67)2
+ + + +
26.67 37.33 16.00 23.33 32.67
(10.00− 14.00)2
+ =
14.00

1.67 + 0.19 + 1.00 + 1.90 + 0.22 + 1.14 = 6.12

El número de grados de libertad para la distribución chi-cuadrada adecuada se obtiene


realizando el siguiente calculo:

Se multiplica el número de filas menos 1 por el número de columnas menos 1

gl = (número de filas - 1) × (número de columnas - 1)

En el caso del ejemplo como se tienen dos filas y tres columnas, los grados de libertad
son:
gl = (2 - 1) × (3 - 1) = 2.

En el ejemplo se va a utilizar α = 0.05

• Rechazo de Ho (prueba de independencia)

En la prueba de independencia se rechaza H0 si el valor del estadístico de prueba


cumple que:

2
X c2 > X α,gl

Xc2 = 6.12
2
Xα,gl = 5.99

6.12 > 5.99

En el ejemplo a un nivel de α = 0.05, la conclusión es que se rechaza la hipótesis nula


y se concluye que la preferencia por una cerveza no es independiente del género del
consumidor
5
UNIVERSIDAD NACIONAL POLITECNICA

La prueba de independencia es una prueba de la cola superior.

Rechazo

Ejemplo:

Comprobar si hay independencia entre las microempresas que llevan una contabilidad
formal y que iniciaron su actividad con un financiamiento externo en relación a las
microempresas que llevan una contabilidad formal y que iniciaron su actividad con
ahorros personales dada la siguiente información:

Tipo de microempresa Personal Externo Total


Informal 465 302 767
Formal 624 557 1181
Total 1089 859 1948
Utilice un nivel de confianza del 95%.

Solución:

1.- H0 = Microempresas con contabilidad formal y que su inicio fue gracias a


financiamiento externo, es independiente de las microempresas con
contabilidad formal y que su inicio fue con ahorros personales.

H1 = Microempresas con contabilidad formal y que su inicio fue gracias a


financiamiento externo, son dependiente de las microempresas con
contabilidad formal y que su inicio fue con ahorros personales.

2.- Nivel de significancia: =0.05.


3.- Región de Rechazo:

6
UNIVERSIDAD NACIONAL POLITECNICA

4.- Cálculo de los valores esperados.

(767)∗(1089) (767)∗(859)
e11= =. 428.8 e12= =. 338.2
1948 1948

(1181)∗(1089) (1181)∗(859)
e21= =. 660.2 e22= =. 520.8
1948 1948

En el siguiente cuadro se pueden ver los valores observados y los esperados.


Personal Externo Total

Informal 465 / (428.8) 302 / (338.2) 767

Formal 624 / (660.2) 557 / (520.8) 1181

Total 1089 859 1948

X c2 = 11.43
6. Decisión: Se rechaza la hipótesis nula. Por lo tanto, las microempresas con
contabilidad formal y cuyo inicio fue gracias a financiamiento externo dependiente de
las microempresas con contabilidad formal cuyo inicio fueron ahorros personales.

7
UNIVERSIDAD NACIONAL POLITECNICA

Ejercicios

1. En un estudio para determinar la opinión de la población respecto al programa de


privatización en empresas públicas.

Se tomaron muestras aleatorias de tamaño 164, 325, 255 y 56 ciudadanos, de los


departamentos de Managua, León, Matagalpa y Costa Caribe respectivamente. Los
resultados se muestran en el siguiente cuadro:

Opinión
Departamento
Favorable Desfavorable No Opina Total
Managua 85 23 56 164
León 153 44 128 325
Matagalpa 128 26 101 255
Costa caribe 34 7 15 56
Total 400 100 300 800

Realice la prueba respectiva. Use =0.05 Para probar si existe independencia entre el
departamento de origen y el tipo de opinión.

2. El departamento de mercadotecnia de la empresa Colgate, quiere determinar si el


sabor de una nueva pasta dental para adultos, que piensan lanzar al mercado influirá
en las ventas.

A 150 adultos se les da a probar uno de los nuevos sabores y se les pide su opinión
después de utilizar el producto durante un mes. ¿Existe una preferencia de la pasta
dental por el sabor?

Sabores
Preferencia
Menta Yerbabuena Simple (sin sabor)
Gustó 20 26 41
No gustó 30 24 9
Utilice un nivel de confianza del 99%.

8
UNIVERSIDAD NACIONAL POLITECNICA

3. Se pidió a una muestra de empleados de la Empresa “Coca-Cola en Managua, que


indicara su preferencia por uno de tres planes de pensión o retiro.

Los resultados se presentan en la tabla siguiente ¿Parece haber una relación entre
el plan de pensión seleccionado y la clasificación del trabajo de los empleados? A
nivel de significancia de 0.01.

Plan de Retiro
Clase de Trabajos
Plan A Plan B Plan C
Supervisor 10 13 29
Oficinista 19 80 19
Operario 81 57 22

4. Una encuesta para evaluar la política educativa del Ministerio del ramo se llevó a
cabo con 218 padres de familia de tres estratos sociales A, B y C de una pequeña
comunidad. Ante la pregunta ¿esta Ud. de acuerdo con la política educativa del
Ministerio?, se obtuvieron los siguientes resultados:

Estrato socioeconómico
Respuestas Total
A B C
Si 22 24 20 66
No 50 42 60 152
Total 72 66 80 218

Realice la prueba de chi cuadrado para probar si hay independencia entre el estrato
socioeconómico y la respuesta sobre la política educativa, utilice. Use = 0.05

5. Los agentes vendedores de la tienda de electrodomésticos “BBB”, realizaron de


forma aleatoria 200 visitas a personas del municipio de Managua, con el objetivo de
aplicar una pequeña encuesta para realizar un sondeo acerca del interés de compra
de electrodomésticos.

A cada persona se le entrega un catálogo con las diversas ofertas navideñas


obteniendo los siguientes resultados:

Sin interés de Algo de interés de Interés de


Tipo de trabajo
compra. compra compra
Ama de casa 15 13 12
Profesor (a) 20 19 21
Contador. 7 7 6
Ingeniero en sistema 28 21 31
Utilice la significancia del 1% para determinar que si existe dependencia entre el tipo de
trabajo y el interés de compra de algún electrodoméstico en la tienda BBB.
9
UNIVERSIDAD NACIONAL POLITECNICA

Realice la prueba de chi cuadrado para probar si hay independencia entre el estrato
socioeconómico y la respuesta sobre la política educativa, utilice. Use = 0.05

6. Se desea analizar si los estudiantes de universidades privadas preferentemente son


de los estratos económicos altos del país. Para ello, se ha tomado la siguiente
muestra:

Grupos socioeconómicos
Universidades
Alto Medio alto Medio bajo Bajo
Publica 13 17 4 3
Privada 38 19 2 2

Utilice un nivel de significancia del 1% para determinar si existe independencia


entre el tipo de universidad y el grupo socioeconómico.

7. Se realizo un estudio de mercado para conocer el tipo de regalo que compran las
personas para el día de “Las madres” en un nuevo centro comercial de Cuautitlán
Izcalli, obteniéndose los siguientes datos:

Grupos socioeconómicos
Genero
Ropa Perfume Joya Flores
Masculino 28 42 52 58
Femenino 37 78 40 31

Realice la prueba de hipótesis de independencia para probar si hay independencia


entre el género y el tipo de regalo, utilice α = 0.01.

8. El gerente de una pizzería recaba información sobre las ventas del último mes y la
resumió en la siguiente tabla:

Realice la prueba de hipótesis de independencia para probar si hay independencia


entre el tipo de pizza y las ventas según día de la semana, utilice α = 0.05.

10
UNIVERSIDAD NACIONAL POLITECNICA

TABLA DE LA DISTRIBUCION CHI- CUADRADO


Valores críticos de la Chi-cuadrado. -

Para una combinación particular de grados de libertad en el numerador y en el denominador, las


entradas representan los valores críticos de la Chi-cuadrado, correspondientes a un área de
extremo superior especificado de .

Grados de AREAS DE EXTREMOS SUPERIOR ()


Libertad
0.25 0.10 0.05 0.025 0.01 0.005
1 1.323 2.706 3.841 5.024 6.635 7.879
2 2.773 4.605 5.991 7.378 9.210 10.597
3 4.108 6.251 7.815 9.348 11.345 12.838
4 5.385 7.779 9.488 11.143 13.277 14.860
5 6.626 9.236 11.071 12.833 15.086 16.750
6 7.841 10.645 12.592 14.449 16.812 18.548
7 9.037 12.017 14.067 16.013 18.475 20.278
8 10.219 13.362 15507 17.535 20.090 21.955
9 11.389 14.684 16.919 19.023 21.666 23.589
10 12.549 15.987 18.307 20.483 23.209 25.188
11 13.701 17.275 19.675 21.920 24.725 26.757
12 14.845 18.549 21.026 23.337 26.217 28.299
13 15.984 19.812 22.362 24.736 27.688 29.819
14 17.117 21.064 23.685 26.119 29.141 31.319
15 18.245 22.307 24.996 27.488 30.578 32.801
16 19.369 23.542 26.296 28.845 32.000 34.267
17 20.489 24.769 27.587 30.191 33.409 35.718
18 21.605 25.989 28.869 31.526 34.805 37.156
19 22.718 27.204 30.144 32.852 36.191 38.582
20 23.828 28.412 31.410 34.170 37.566 39.997
21 24.935 29.615 32.671 35.479 38.832 41.401
22 26.039 30.813 33.924 36.781 40.289 42.796
23 27.141 32.007 35.172 38.076 41.638 44.181
24 28.241 33.196 36.415 39.364 42.980 45.559
25 29.339 34.382 37.652 40.646 44.314 46928
26 30.435 35.563 38.885 41.923 45.642 48.290
27 31.528 36.741 40.113 43.194 46.963 49.645
28 32.620 37.916 41.337 44.461 48.278 50.993
29 33.711 39.087 42.557 45.722 49.588 52.336
30 34.800 40.256 43.773 46.979 50.892 53.672

11
UNIVERSIDAD NACIONAL POLITECNICA

Para un número mayor de grados de libertad se puede utilizar la expresión

Z =  2 x² -  2 (df) - 1 y se puede obtener el área de extremo superior resultante a


partir de la tabla correspondiente a la distribución normal estandarizada.-

12

También podría gustarte