Está en la página 1de 15

PRUEBA DE HIPÓTESIS

CHI-CUADRADA COMO UNA PRUEBA DE INDEPENDENCIA

Descripción de la distribución Chi-cuadrada


Si la hipótesis nula es verdadera, entonces la distribución de muestreo de la
estadística Chi-cuadrada, χ2 , puede aproximarse bastante bien mediante la curva
continua conocida como distribución Chi-cuadrada.

Existe una distribución Chi-cuadrada cada número distintos de grados de libertad.


PRUEBAS DE BONDAD DE AJUSTE

PRUEBA CHI-CUADRADA

Para probar estadísticamente la hipótesis de que un conjunto de datos observados


de k clases de una muestra no difieren significativamente de aquellas que se
esperan de las k clases de la distribución esperada específica, podemos considerar
la prueba de “bondad de ajuste” Chi-cuadrada.

La discrepancia que existe entre una frecuencia observada y una esperada, es


proporcionada por el estimador χ2 :

(𝑓𝑜 – 𝑓𝑒 )2
χ2 =∑
𝑓𝑒
Donde
K : Número de clases o intervalos de una muestra.
fo : Frecuencia observada de una clase de la muestra.
fe : Frecuencia esperada de una clase de la distribución esperada específica.
Σ: Suma de todas las k diferencias al cuadrado dividido entre la frecuencia
esperada.

 Si χ2 = 0, entonces las frecuencias observadas y teórica concuerdan.


 Si χ2 > 0, entonces debemos comparar nuestro valor calculado contra los
valores tabulados de χ2 para determinar si podemos esperar dicha variación
a partir de causas aleatorias.
 El valor de χ2 no puede ser negativo.
Cálculo de los grados de libertad
El estimador estadístico se tabula en grados de libertad. Los grados de libertad
están dados por v = k-1-m, donde:

k: número de clases o intervalos, y


m: datos empíricos o de muestra de los parámetros de la población necesarios
para calcular las frecuencias esperadas.

Planteamiento de hipótesis nula e hipótesis alternativa

Ho: No existe diferencia significativa entre la distribución de frecuencias


observadas y las obtenidas con la distribución de frecuencias esperadas
específicas.
H1: Existe diferencia significativa entre la distribución de frecuencias observadas
y las obtenidas con la distribución de frecuencias esperadas específicas.
PRUEBA CHI-CUADRADA PARA PROPORCIONES
(Muestras independientes)

Para un problema donde existen individuos que residen en diferentes ciudades: A,


B, C, y D. Y se quiere comparar una característica evaluada con un método actual,
con respecto a un nuevo método propuesto, siempre que no sean las mismas
muestras:

Paso 1: Tabla de contingencia


A partir de la tabla de contingencia (tabla con la información) con r renglones y c
columnas se obtiene la tabla de proporciones.

Paso 2: Hipótesis nula e hipótesis alternativa


a) Para dos proporciones:

Se plantean las hipótesis nula y alternativa:

PA: Proporción de individuos de la ciudad A que prefieren el método actual


PB: Proporción de individuos de la ciudad B que prefieren el método actual

H0: PA = PB
H1: PA ≠ PB

b) Para más de dos proporciones:

Se plantean las hipótesis nula y alternativa:

PA: Proporción de individuos de la ciudad A que prefieren el método actual


PB: Proporción de individuos de la ciudad B que prefieren el método actual
PC: Proporción de individuos de la ciudad C que prefieren el método actual
PD: Proporción de individuos de la ciudad D que prefieren el método actual
H0: PA = PB = PC = PD
H1: PA, PB, PC, y PD no son todas iguales

Paso 3: Cálculo de valores críticos


Para un nivel de significancia: α=0.05

Si la tabla de contingencia tiene r renglones y c columnas, el número adecuado de


grados de libertad es:

gl = (r – 1)(c – 1)

Ejemplo:
Si r = 2 y c= 6
gl = (2 – 1)(6 – 1) = 5

Para α=0.05, el valor crítico es: χ2 = 11.1


Paso 4: Estadístico de prueba
Cálculo de la estadística Chi-cuadrada con las especificaciones dadas, a partir de
una tabla de contingencia.

2
(𝑓𝑜 – 𝑓𝑒 )2
χ =∑
𝑓𝑒

Paso 5: Consideraciones para la conclusión


Si según esta hipótesis el valor calculado de χ2 es mayor que el valor crítico o
tabulado a un nivel significancia de α, y con los grados de libertad adecuados,
podríamos llegar a la conclusión de que las frecuencias observadas difieren
significativamente de las esperadas en ese nivel de confianza, y rechazaríamos Ho.

PRECAUCIONES PARA EL USO DE LA PRUEBA CHI-CUADRADO

Al usar la prueba de bondad de ajuste χ2, debe considerar lo siguiente:

1. Usar conteos de números o frecuencias reales.


2. Las frecuencias esperadas de una tabla de contingencia debe ser de 5 o
más. Si no es así debe agruparse o combinarse las celdas adyacentes con
el fin obtener una frecuencia con 5 o más.

TABLA DE CONTINGENCIAS CON DOS RENGLONES


A las tablas 1 y 5 se conocen como tablas de contingencia.
Ejemplo 1: De la Compañía Nacional de Cuidado de la Salud
Suponga que en cuatro regiones la Compañía Nacional de Cuidado de la Salud,
muestrea las actitudes de los empleados de sus hospitales dependen del examen
de desempeño en el trabajo. A los trabajadores se les da a escoger entre el método
actual (dos exámenes al año) y nuevo método propuesto (exámenes cada
trimestre). La tabla adjunta se conoce como tabla de contingencia:

Paso 1
TABLA 1 TABLA DE CONTINGENCIA
Respuesta de Noreste Sureste Central Costa Total
muestra
concerniente a Número de empleados
los programas que prefieren el método 68 75 57 79 279
de evaluación actual
de los
Número de empleados
empleados de
los hospitales que prefieren el nuevo 32 45 33 31 141
de la Compañía método
Nacional de Total de empleados
Cuidado a la
Salud
muestreados de cada 100 120 90 110 420
región

Se calculan las proporciones (frecuencias esperadas de empleados)

279
Ejemplo: Para la celda 1_1: × 68 = 66.43
420
141
Ejemplo: Para la celda 2_1: × 32 = 33.57
420

TABLA 2
Proporción de Noreste Sureste Central Costa
empleados
muestreados en Proporción estimada de
cada una de las empleados que
regiones, que
66.43 79.72 59.79 73.07
prefieren el método
se esperan que
actual
prefirieron los
dos métodos de Proporción estimada de
evaluación empleados que
33.57 40.28 30.21 36.93
prefieren el nuevo
método
Se comparan las frecuencias observadas y esperadas

TABLA 3
Comparación Noreste Sureste Central Costa
de las
FRECUENCIA DE
frecuencias
observada y PREFERENCIA DEL MÉTODO
esperada de ACTUAL
trabajadores Frecuencia observada 68 75 57 79
muestreados
Frecuencia esperada 66.43 79.82 59.79 73.07
FRECUENCIA DE
PREFERENCIA DEL NUEVO
MÉTODO
Frecuencia observada 32 45 33 31
Frecuencia esperada 33.57 40.28 30.21 36.93

Cálculo de la estadística Chi-cuadrada a partir de la tabla anterior:

TABLA 4

fo fe (fo- fe)2 (fo- fe)2/ fe


68 66.43 2.46 0.0370
75 79.72 22.28 0.2795
57 59.79 7.78 0.1301
79 73.07 35.16 0.4812
32 33.57 2.46 0.0733
45 40.28 22.28 0.5531
33 30.21 7.78 0.2575
31 36.93 35.16 0.9521
χ2 =2.7638

Paso 2: Se plantean las hipótesis nula y alternativa:

Pn: Proporción de empleados en el noreste que prefieren el presente plan


Ps: Proporción de empleados en el sudeste que prefieren el presente plan
Pc: Proporción de empleados de la región central que prefieren el presente plan
Pw: Proporción de empleados de la región de la costa que prefieren el presente
plan
H0: las evaluaciones del desempeño es independiente de la región en que se labore.
H1: las evaluaciones del desempeño dependen de la región en que se labore.

H0: Pn = Ps = Pc = Pw
H1: Pn, Ps, Pc y Pw no son todas iguales

Paso 3: Se calculan los valores críticos

Cálculo de los grados de libertad:


r = 2 y c= 4
gl = (2 – 1)(4 – 1) = 3

Para el nivel de significancia: α = 0.10, el valor crítico es: χ2 = 6.251


Paso 4: Estadístico de prueba

2
(𝑓𝑜 – 𝑓𝑒 )2
χ =∑ = 𝟐. 𝟕𝟔𝟑𝟖
𝑓𝑒

Paso 5: Consideraciones para la conclusión


Como el valor χ2 = 2.7638 cae dentro de la región de aceptación, se acepta la
hipótesis nula, de que no existe diferencia entre las actitudes con respecto a la
evaluación del trabajo en las cuatro regiones geográficas. En otras palabras, se
concluye que la actitud acerca de las evaluaciones del desempeño es independiente
de la región en que se labore.

TABLAS DE CONTINGENCIA CON MAS DE DOS RENGLONES

Ejemplo 2: De la compañía Nacional General Aseguradora de

Salud
El presidente de la compañía Nacional General Aseguradora de Salud, se opone al
Seguro de Salubridad Nacional. Asegura que sería muy costoso de implantar, en
particular debido a que la existencia de este sistema, entre otras cosas, tendería a
fomentar en la gente permanecer más tiempo en los hospitales. El presidente tiene
la creencia de que la hospitalización depende del tipo de Seguro de Salud que
tengan las personas. Le pide al especialista en estadística de la empresa, que
verifique el asunto. El especialista recogió datos de 660 hospitalizaciones y la
información la resumió en la tabla 5.

En esta tabla se dan las frecuencias observadas en las nueve diferentes


hospitalizaciones y el tipo de seguro.
Paso 1

TABLA 5

Datos de Días en el hospital Total


hospitalizaciones Menor de 5 De 5 a 10 Mayor de 10
clasificadas Fracción de Menor a 25% 40 75 65 180
según el tipo de costos Del 25 a 50% 30 45 75 150
cobertura del cubierto Mayor a 50% 40 100 190 330
seguro y el por el
tiempo de seguro
110 220 330 660
estancia

Cálculo de las frecuencias esperadas y la Chi-cuadrado a partir de los datos:

Sean:
A: es el evento de que una estancia corresponda a alguien cuyo seguro cubre
menos del 25% de los costos, y,
B: Es el evento de que una estancia dure menos de cinco días

La proporción esperada (probabilidad) de la primera celda es:


180 110 1
P(A). P(B) = 𝑥 =
660 660 22

Por tanto la frecuencia esperada en la primera celda es:

1
𝑥660 = 30
22
TABLA 6

fo fe (fo- fe)2 (fo- fe)2/ fe


1 1 40 30=180x110/660 100 3.333
1 2 75 60=180x220/660 225 3.750
1 3 65 90=180x330/660 625 6.944
2 1 30 25=150x110/660 25 1.000
2 2 45 50=150x220/660 25 0.500
2 3 75 75=150x330/660 0 0.000
3 1 40 55=330x110/660 225 4.091
3 2 100 110=330x220/660 100 0.909
3 3 190 165=330x330/660 625 3.788
𝟐
𝛘 =24.315

Paso 2

Ho: El tiempo de estancia en el hospital y el tiempo de seguro son independientes


H1: El tiempo de estancia en el hospital depende del tiempo de seguro

Paso 3: Se calculan los valores críticos


Nivel de significancia: α = 0.01

Cálculo de los grados de libertad:


r = 3 y c= 3
gl = (3 – 1)(3 – 1) = 4

Para el nivel de significancia: α = 0.01, el valor crítico es: χ2 = 13.28


Paso 4: Estadístico de prueba

2
(𝑓𝑜 – 𝑓𝑒 )2
χ =∑ = 𝟐𝟒. 𝟑𝟏𝟓
𝑓𝑒

Paso 5: Conclusión
El valor Chi-cuadrado 24.315 que se calculó no se encuentra dentro de la región de
aceptación. Así el especialista debe rechazar la hipótesis nula e informar al
presidente de la empresa que la evidencia refuerza su creencia de que la duración
de las hospitalizaciones y la cobertura de los seguros son dependientes entre sí.
GRUPO DE EJERCICIOS
1. Un asesor financiero está interesado en las diferencias de estructura del
capital con respecto a compañías de distintos tamaños dentro de una cierta
industria. El asesor investiga un grupo de empresas con activos de diferentes
cantidades y las organiza en tres grupos. Cada compañía queda clasificada de
acuerdo a sí su débito total es mayor que la cantidad de acciones ordinarias de los
accionistas, o si es menor que éstas. Los resultados de las investigaciones son:

TABLA 7

Tamaño del activo de la


compañía (miles de dólares)
TOTAL
<500 500-2000 >2000

Deuda menor que


cantidad de acciones 8 10 8 25

Deuda mayor que


cantidad de acciones 10 18 9 37

TOTAL 18 28 17 62

a) Desarrolle una tabla de frecuencias observadas y esperadas para este


problema.
b) Calcule el valor Chi-cuadrado de la muestra.
c) Establezca la hipótesis nula y alternativa.
d) Si el nivel de significancia es de 0.10, ¿El tamaño de los tres grupos de
empresa tiene la misma estructura de capital?

2. Un editor de periódicos que trata de determinar con precisión las


características del mercado de su periódico, se pregunta si la costumbre de la gente
de la comunidad está relacionada con el nivel educativo de los lectores. Se aplica
una encuesta a los adultos referente al nivel educativo y a la frecuencia con que
leen el periódico. Los resultados se muestran en la siguiente tabla:
TABLA 8
NIVEL EDUCATIVO
FRECUENCIA CON Profesional No termninó
LA QUE LEE Pasante de
o de Preparatoria la TOTAL
licenciatura
posgrado preparatoria
Nunca 10 17 11 21 59
Algunas veces 12 23 8 5 48
Mañana o tarde 35 38 16 7 96
Ambas ediciones 28 19 6 13 66
TOTAL 85 97 41 46 269

a) Desarrolle una tabla de frecuencias observadas y esperadas para este


problema.
b) Calcule el valor Chi-cuadrado de la muestra.
c) Establezca la hipótesis nula y alternativa.
d) Si el nivel de significancia es de 0.10, ¿la frecuencia con que se lee el
periódico en la comunidad difiere (depende) de acuerdo con el nivel
educativo de los lectores?

También podría gustarte