Está en la página 1de 26

Prueba Chi cuadrado para la

independencia
Módulo 11

2020- 1

Videoconferencia 12
Tema: Prueba Chi cuadrado para la independencia

ÍNDICE

Temario

Introducción al tema

Desarrollo del contenido (subtemas)

Conclusiones

Consultas
Tema: Prueba Chi cuadrado para la independencia

TEMARIO

1. Introducción

2. Prueba Chi cuadrado

3. Prueba de Independencia

4. Prueba de Homogeneidad de sub poblaciones.

5. Ejemplos

6. Conclusiones

7. Consultas
LOGRO DEL MÓDULO:
Tema: Prueba Chi cuadrado para la independencia

Introducción

Realización de una Prueba de


inferencia, donde se homogeneidad de
Para ello,
Prueba de hipótesis desea estudiar si la subpoblaciones
que determina si dos realizaremos
asociación encontrada
variables cualitativas un contraste
entre dos variables en
nominales están una muestra tomada al de hipótesis. Prueba de
relacionadas o no. azar de una población independencia
mayor podría extenderse
a la población de donde
se tomaron los datos.
Tema: Prueba Chi cuadrado para la independencia

Prueba Chi – cuadrado ( )


Con este estadístico se obtiene una medida de diferencia entre las
frecuencias esperadas y las frecuencias observadas.

2
( f − f )
X =∑
2 o e
fe
𝑓 𝑜= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
𝑓 𝑒= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜

Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las
variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje
de influencia de una variable sobre la otra o la variable que causa la influencia
Tema: Prueba Chi cuadrado para la independencia

Tabla de contingencia
 Es una tabla de frecuencia simple de dos vías (bidireccional), sus filas (r) y sus
columnas(c) se usan para resumir y anotar los resultados de datos recolectados de dos
variables.
 Los grados de libertad (v) de un estadístico calculado sobre un conjunto datos se refieren
al número de datos independientes que se necesitan en su cálculo, menos el número de
restricciones que emparejan a las observaciones y el estadístico.

𝑣=(𝑐 − 1)(𝑟 −1)


𝑔 . 𝑙 . =(𝑛 ° 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 − 1 )(𝑛° 𝑓𝑖𝑙𝑎𝑠 − 1 )

Variable B
Variable A Total
1 2 3 ••• k
1 O11 O12 O13   O1k n1•
2 O21 O22 O23   O2k n2•
3 O31 O32 O33   O3k n3•
•••         •••  
j Oj1 Oj2 Oj3 ••• Ojk nj•
Total n•1 n•2 n•3 ••• n•k n
Tema: Prueba Chi cuadrado para la independencia

Prueba de Independencia

Se debe usar la prueba Chi-


cuadrado para poner a prueba
si existe o no una relación
entre las variables.
Prueba de
independencia
Los datos se refieren a dos
de dos
variables cualitativas
variables
nominales.

Cada variable tiene dos


o más categorías.
Tema: Prueba Chi cuadrado para la independencia

Prueba de Independencia

Una agencia de publicidad


desea saber si el género de
los consumidores es
independiente de sus
preferencias de cuatro
marcas de café.

Una empresa multinacional


desea conocer si existen
diferencias significativas entre
sus trabajadores en distintos
países en el grado de
satisfacción en el trabajo
Tema: Prueba Chi cuadrado para la independencia

Prueba de Independencia

Pasos para realizar la prueba de hipótesis de independencia de variables.

1.Plantear la hipótesis
• H0: Las variables son independientes (no están asociadas o relacionadas)
• H1: Las variables no son independientes (están asociadas o relacionadas)
2. Fijar nivel de significación: α

3. Estadístico de prueba 𝜒2
4. Región crítica y regla de decisión

Si se rechaza H0
Si H0

5. Decisión y conclusión
Tema: Prueba Chi cuadrado para la independencia

Pasos para realiza la prueba de hipótesis con Megastat o SPSS

1 2 3 4 5
Formulación de Fijar el nivel de Estadístico Valor sig. Decisión y
Hipótesis: Ho y H1 significación: . de Prueba conclusió
n
Una investigadora de seguridad de tránsito
observó 500 vehículos en una señal de alto
en un vecindario suburbano y registró:

 El tipo de vehículo (auto, camioneta, camión de carga)


 El comportamiento del conductor frente a la señal de alto
(alto total, casi detenido, no respeta la señal)

Conducta en la señal de alto


Avanza sin No respeta Total
Detenido
motor la señal
Sedán 183 107 60 350
Tipo de Camioneta 54 27 19 100
vehículo Camión de
14 20 16 50
carga
Total 251 154 95 500

Con un nivel de significancia de 0.05, ¿puede haber alguna relación entre el comportamiento
del conductor y el tipo de vehículo que conduce?
SOLUCIÓN EN
MEGASTAT
Pasos:
1ro Plantear la hipótesis:
H0 : La conducta del conductor y el tipo de vehículos son independientes.
H1 : La conducta del conductor y el tipo de vehículos no son independientes.

2do Nivel de significancia: a = 0.05, N.C. = 95%

3ro Estadístico de Prueba: X2

4to Regla de decisión:


Si p value ≤ a se rechaza Ho b) Complementos – MegaStat – Chi
Si p value > a se acepta Ho
Square

En Excel:
a) Ingresar los datos del
cuadro sin totales
Seleccionar el
Finalmente
rango de
OK
datos

Activar
valores
Activar
esperados.
Prueba Chi -
Cuadrado

5to Decisión:
Como 0.01444 < 0.05 se rechaza Ho, es decir
con un nivel de confianza del 95% existe
evidencia estadística para decir que la
conducta del conductor y el tipo de vehículos
no son independientes, es decir están
relacionadas.
Tema: Prueba Chi cuadrado para la independencia
Ejemplo 1
 En una empresa de baterías para automóviles, el gerente tiene la sospecha que la antigüedad del
automóvil esta relacionada con el tipo de falla que presentan en la batería del automóvil.
 Para poder verificar su sospecha, elije al azar una muestra de clientes y registra el tipo de falla y la
antigüedad del automóvil.
 Si confirma la sospecha, el gerente decidirá implementar programas preventivos direccionados
según la antigüedad del auto. Los resultados se muestran en la siguiente tabla:

ANTIGUEDAD
FALLA Nuevos Medianos Antiguos
Menos de 3 años De 3 a 5 años Mas de 5 años
Sulfatación 7 40 16
Voltaje 14 16 15
Descarga 16 36 40

Con un nivel de significación del 1%, ¿ El gerente debe implementar los programas preventivos
direccionados?
Tema: Prueba Chi cuadrado para la independencia
Analizando Resultados en
SPSS
Tema: Prueba Chi cuadrado para la independencia
Analizando Resultados en
Falla Nuevos Medianos Antiguos Megastat
Sulfatación 7 40 16
Voltaje 14 16 15
Descarga 16 36 40

Chi-square Contingency Table Test for Independence

Nuevos Medianos Antiguos Total


Sulfatación Observed 7 40 16 63
Expected 11.66 28.98 22.37 63.00
Voltaje Observed 14 16 15 45
Expected 8.33 20.70 15.98 45.00
Descarga Observed 16 36 40 92
Expected 17.02 42.32 32.66 92.00
Total Observed 37 92 71 200
Expected 37.00 92.00 71.00 200.00

15.51 chi-square
4 df
.0038 p-value
Tema: Prueba Chi cuadrado para la independencia

Prueba de Homogeneidad de Subpoblaciones

Esta prueba permite analizar si la distribución de probabilidades de una variable es la


misma en r poblaciones.
Como en el método anterior, para esta prueba los datos muestrales se registran en (r *c)
celdas de una tabla de contingencia de orden (r *c).
Tema: Prueba Chi cuadrado para la independencia

Prueba de Homogeneidad de Subpoblaciones analizado con


valor p
Pasos para realizar la prueba de hipótesis de Homogeneidad de subpoblaciones.
1.Plantear la hipótesis
• H0: La distribución de los sujetos de la población (variable nominal) es homogénea en las c
subpoblaciones.
• H1: La distribución de los sujetos de la población (variable nominal) no es homogénea en las c
subpoblaciones.
2. Fijar nivel de significación: α

3. Estadístico de prueba 𝜒2
4. Región crítica y regla de decisión

Si se rechaza H0
Si H0

5. Decisión y conclusión
Tema: Prueba Chi cuadrado para la independencia

Pasos para realiza la prueba de hipótesis de homogeneidad con Megastat o SPSS

1 2 3 4 5
Formulación de Fijar el nivel de Estadístico Valor sig. Decisión y
Hipótesis: Ho y H1 significación: . de Prueba conclusió
n
Tema: Prueba Chi cuadrado para la independencia
Ejemplo 2
El gerente de la empresa MOTORES S.A. desea determinar si la percepción de los clientes es similar entre
los diferentes clientes de las principales marcas de automóviles que atiende la empresa. Para probarlo
toma una muestra al azar de 1500 automóviles. La siguiente tablas corresponde a los datos que se
obtuvieron de la muestra:

IMAGEN
MARCA
Pésima Mala Buena Excelente
Toyota 40 178 192 40
Nissan 43 145 171 41
Honda 38 157 131 41
Mitsubishi 29 101 125 28

Con un nivel de significación del 5% ¿La imagen de la empresa se distribuye de forma homogénea entre los
clientes de las diferentes marcas de vehículos? 
Tema: Prueba Chi cuadrado para la independencia
Analizando Resultados en
SPSS
Tema: Prueba Chi cuadrado para la independencia
Analizando Resultados en
Megastat
  Pésima Mala Buena Excelente
Toyota 40 178 192 40
Nissan 43 145 171 41
Honda 38 157 131 41
Mitsubishi 29 101 125 28

Pésima Mala Buena Excelente Total


Toyota Observed 40 178 192 40 450
Expected 45.00 174.30 185.70 45.00 450.00
Nissan Observed 43 145 171 41 400
Expected 40.00 154.93 165.07 40.00 400.00
Honda Observed 38 157 131 41 367
Expected 36.70 142.15 151.45 36.70 367.00
Mitsubishi Observed 29 101 125 28 283
Expected 28.30 109.62 116.78 28.30 283.00
Total Observed 150 581 619 150 1500
Expected 150.00 581.00 619.00 150.00 1500.00

8.64 chi-square
9 df
.4711 p-value
Tema: Distribuciones de Probabilidad Continua

CONCLUSIONES

1. Con el estadístico Chi-cuadrado se obtiene una medida de diferencia


entre las frecuencias esperadas y las frecuencias observadas.

2. La prueba de independencia se usa para variables cualitativas.

3. En la prueba de independencia y homogeneidad de sub poblaciones, el


interés es saber si dos variables están estadísticamente relacionadas.
Tema: Distribuciones de Probabilidad Continua

CONSULTAS

Realiza consultas a través del


chat o solicita al docente
activar el micrófono para
participar.
Prueba Chi cuadrado para la
independencia
Módulo 11

Material producido por:


Universidad Privada del Norte

@ 2019 | Universidad Privada del Norte

También podría gustarte