Está en la página 1de 6

DISTRIBUCIÓN JI-CUADRADO

Una de las herramientas no paramétricas más útiles es la prueba ji-cuadrado. Al igual que
la distribución t, la distribución ji-cuadrado es toda una familia de distribuciones. Existe
una distribución ji-cuadrado para cada grado libertad. Las dos aplicaciones más comunes
de la distribución ji-cuadrado son las pruebas de bondad de ajuste y las pruebas de
independencia.
Características de la distribución ji-cuadrado
a) Los valores de ji cuadrada nunca son negativos. Esta característica se debe a que
la diferencia entre fo y fe se eleva al cuadrado, es decir (fo - fe)2.
b) Existe una familia de distribuciones de ji cuadrada. Hay una distribución de ji
cuadrada para 1 grado de libertad, otra para 2, otra para 3 grados de libertad, etc.
En este tipo de problema, el número de grados de libertad se determina mediante
k - 1, donde k es el número de categorías. Por lo tanto, la forma de la distribución
ji cuadrada no depende del tamaño de la muestra, sino del número de categorías.
Por ejemplo, si clasifica a 200 empleados de una aerolínea en una de tres
categorías: personal de vuelo, apoyo terrestre y personal administrativo, tendría
k - 1 = 3 - 1 = 2 grados de libertad.
c) La distribución ji cuadrada tiene un sesgo positivo. Sin embargo, a medida que
aumenta el número de grados de libertad, la distribución comienza a aproximarse
a la distribución normal.

Estadístico de prueba ji-cuadrado.


El estadístico de prueba que sigue la distribución ji cuadrada, es designado como x2.

Con k - 1 grados de libertad, donde:


 k es el número de categorías.
 fo es la frecuencia observada en una categoría particular.
 fe es la frecuencia esperada en una categoría particular.
PRUEBA DE BONDAD DE AJUSTE: FRECUENCIAS ESPERADAS IGUALES
La prueba de bondad de ajuste es una de las pruebas estadísticas de uso más común. Es
particularmente útil porque requiere sólo un nivel nominal de medición. Por ello es
posible llevar a cabo una prueba de hipótesis con datos que han sido clasificados en
grupos. La primera ilustración de esta prueba supone el caso en que las frecuencias
esperadas de las celdas son iguales. Como su nombre lo indica, el propósito de la prueba
de bondad de ajuste es comparar una distribución observada con una distribución
esperada. Un ejemplo describirá la situación de una prueba de hipótesis.
Ejemplo
Bubba’s Fish and Pasta es una cadena de restaurantes ubicados a lo largo de la costa del
Golfo de Florida. Bubba, el propietario, desea añadir filete a su menú. Antes de hacerlo,
decide contratar a Magnolia Research, LLC, para que lleve a cabo una encuesta entre
personas adultas para saber cuál es su platillo favorito cuando comen fuera de casa.
Magnolia seleccionó una muestra de 120 adultos y les pidió que indicaran su comida
favorita cuando salen a cenar. Los resultados se reportan en la siguiente tabla.

¿Es razonable concluir que no hay preferencia entre los cuatro platillos?
Solución Si no existe diferencia entre la popularidad de los cuatro platillos, se podría
esperar que las frecuencias observadas fueran iguales, o casi iguales. Para decirlo de otro
modo, se esperaría que el mismo número de adultos indicara que prefiere pollo o pescado.
Así, cualquier discrepancia entre las frecuencias observadas y esperadas se atribuye al
azar, o a un error de muestreo.
Nivel de medición en este problema
Observe que cuando se selecciona a una persona, sólo se le puede clasificar en una de las
categorías de platillos preferidos. No se obtiene ningún tipo de lectura o medición. La
“medida” o “clasificación” se basa en el platillo seleccionado. Además, no existe un orden
natural entre los platillos. No se supone que alguno de los platillos sea mejor que otro.
Por lo pronto, la escala nominal es apropiada. Si los platillos son igualmente populares,
se esperaría que 30 adultos eligieran cada uno de ellos.
¿Por qué es esto?
Si hay 120 adultos en la muestra, y cuatro categorías, lo esperado sería que una cuarta
parte de los encuestados elegirían cada platillo. Por lo tanto, la frecuencia esperada de
cada categoría o celda sería 30, calculada mediante 120/4, asumiendo que no existe
preferencia por ninguno de los platillos. ¿Se debe al azar esta diferencia entre los números
de veces que cada platillo es seleccionado, o se debe concluir que los platillos no tienen
el mismo grado de popularidad?

PASOS PARA REALIZAR PRUEBA DE HIPÓTESIS


Paso 1: Formule las hipótesis nula y alternativa
La hipótesis nula, H0, es que no hay diferencia entre el conjunto de frecuencias observadas
y el conjunto de frecuencias esperadas.
En otras palabras, que cualquier diferencia entre los dos conjuntos de frecuencias se puede
atribuir al error de muestreo.
La hipótesis alternativa, H1, es que hay una diferencia entre los conjuntos observado y
esperado de frecuencias.
Si se rechaza la hipótesis nula y se acepta la hipótesis alternativa, se concluye que las
preferencias no se distribuyen de igual forma entre las cuatro categorías (celdas).
H0: No hay diferencia entre las proporciones de adultos que eligen cada platillo.
H1: Existe diferencia entre las proporciones de adultos que eligen cada platillo.

Paso 2: Seleccione el nivel de significancia


Seleccione el nivel de significancia 0.05. La probabilidad de que rechace la hipótesis nula
verdadera es 0.05.
Paso 3: Seleccione el estadístico de prueba
El estadístico de prueba sigue la distribución ji cuadrada, designada como 𝑥 2 .
Estadístico de prueba: ji cuadrada
(𝒇𝒐 − 𝒇𝒆 )𝟐
𝒙𝟐 = ∑ [ ]
𝒇𝒆

Paso 4: Formule la regla de decisión.


La distribución ji cuadrada en realidad es una familia de distribuciones. Cada distribución
tiene una forma un poco diferente, según el número de grados de libertad. El número de
grados de libertad en este tipo de problema se encuentra mediante k - 1, donde k es el
número de categorías.
En este problema en particular hay cuatro. Como hay cuatro categorías, hay:
k - 1 = 4 - 1 = 3 grados de libertad
Como se observó, una categoría se denomina celda, por lo que hay cuatro celdas. El valor
crítico para 3 grados de libertad y el nivel de significancia 0.05 se encuentran en el
apéndice B.3. El valor crítico es 7.815, determinado al ubicar 3 grados de libertad en el
margen izquierdo, y luego, por la horizontal (a la derecha), y leyendo el valor crítico en
la columna 0.05.

La regla de decisión es rechazar H0 si el valor calculado de ji cuadrada es mayor que


7.815. Si es menor o igual a 7.815, no se rechaza H0. En la gráfica

La regla de decisión indica que si hay diferencias grandes entre las frecuencias observada
y esperada, lo que genera una x2 calculada mayor que 7.815, se debe rechazar la hipótesis
nula.
Sin embargo, si las diferencias entre fo y fe son pequeñas, el valor x2 calculado será 7.815
o menor, por lo que la hipótesis nula no se debe rechazar.
El razonamiento es que es probable que esas pequeñas diferencias entre las frecuencias
observada y esperada se deban a la casualidad.
Hay que tomar en cuenta que las 120 observaciones son una muestra de la población.
Paso 5: Calcule el valor de ji cuadrada y tome una decisión
De los 120 adultos que integraban la muestra, 32 indicaron que su platillo favorito era el
pollo.
Los siguientes son los cálculos de la ji cuadrada:
Columna 1:
Determinar las diferencias entre cada fo y fe. Es decir, fo - fe. La suma de estas diferencias
es cero.
Columna 2:
Elevar al cuadrado la diferencia entre cada frecuencia observada y esperada, es decir:
(𝑓𝑜 − 𝑓𝑒 )2
Columna 3:
Dividir el resultado de cada observación entre la frecuencia esperada. Es decir
Finalmente, sume estos valores.
El resultado es el valor de 𝑥 2 , que es 2.20.

La 𝑥 2 calculada de 2.20 no está en la región de rechazo, es menor que el valor crítico de


7.815. Por lo tanto, la decisión es no rechazar la hipótesis nula. Se concluye que las
diferencias entre las frecuencias observada y esperada podrían deberse al azar. Esto
significa que no hay preferencia entre los cuatro platillos.

CONCLUSIONES
 Ji Cuadrada es una distribución de datos discretos, que es función de la densidad
poblacional y cuyos valores varían desde cero hasta infinito positivo.
 A diferencia de la distribución Normal o la de t (Test de Student o de t), la función
se aproxima asintóticamente al eje horizontal sólo en la cola derecha de la curva
y NO en ambas colas.
 Como en la distribución de t, no hay solo una distribución de Chi cuadrado ?²sino
que existe una distribución para cada número de grados de libertad (?).Las curvas
son en forma de “jota invertida” al principio, pero más o menos acercándose a la
simetría para los grados de libertad superiores.

RECOMENDACIONES
 Determinar correctamente la frecuencia esperada del ejercicio, puesto que es
indispensable conocer su valor para realizar las operaciones para encontrar la
respuesta de 𝑥 2 .
Bibliografía
LLC, M. (2019). Obtenido de https://support.minitab.com/es-mx/minitab/19/help-and-how-
to/statistics/basic-statistics/supporting-topics/basics/what-is-a-test-
statistic/#targetText=Un%20estad%C3%ADstico%20de%20prueba%20es,puede%20rec
hazar%20la%20hip%C3%B3tesis%20nula.

También podría gustarte