Está en la página 1de 28

DISTRIBUCIÓN CHI

CUADRADA

Maria Camila Cerón - 2024193


Santiago Delgado - 1943694
Danny Santiago Erazo - 2180011
¿Qué es?

La distribución chi cuadrado de pearson, es una distribución probabilística continua que nos permite
reconocer la asociación entre dos variables categóricas, es decir, si existe o no dependencia estadística entre
ellas.

Estas variables categóricas pueden ser dicotómicas o politómicas. Las variables dicotómicas son aquellas que
poseen únicamente dos valores en su variación.En cambio, las variables politómicas son aquellas que poseen
más de dos valores en su variación.

Las pruebas Chi-cuadrado se utilizan para probar hipótesis referidas a los patrones de comportamiento de
frecuencias relacionadas con variables ya sean cuantitativas o cualitativas.
Propiedades
Tipos de prueba de chi cuadrado

Existen diferentes tipos de pruebas de Chi-Cuadrado:

01 Prueba de bondad de ajuste

02 Prueba de independencia

03 Prueba de homogeneidad
Prueba de bondad de ajuste

La prueba de bondad de ajuste Chi-cuadrado se utiliza para comparar una muestra recogida
aleatoriamente que contiene una única variable categórica con una población mayor.

Esta prueba nos da una manera de decidir si los datos se ajustan lo bastante bien a nuestra idea o
debemos revisar.

Ejemplo:

Tenemos bolsas de caramelos con cinco sabores distintos cada una. Las bolsas deben tener el mismo
número de caramelos de cada sabor. La idea que queremos comprobar es que la proporción de
sabores por bolsa es la misma.
Prueba de independencia

La prueba de independencia de Chi-Cuadrado busca una asociación entre dos variables categóricas o
nominales dentro de la misma población.

En esta, tenemos la noción de que ambas no están relacionadas. Esta prueba nos da una forma de
decidir si esta noción es plausible o no.

Ejemplo:
Tenemos dos escuelas de baile que quieren calificar el nivel de sus alumnos en amateur, medio o
profesional. La idea o hipótesis que queremos comprobar es si influye el tipo de escuela de baile en
el nivel de los alumnos.
¿Cómo se calcula?

1. Definir la hipótesis nula.


2. Decidir el error que está dispuesto a asumir de llegar a una conclusión errónea (Por lo general
este dato es dado por el evaluador o aquel que está realizando el estudio).
3. Calcular los grados de libertad
4. Se calcula el chi cuadrado (observado y teórico).
5. Se compara los resultados y se da una conclusión.

fo= Frecuencia de valor observado

ft= Frecuencia de valor esperado


Calcular ft y los grados de libertad

Para calcular los eventos o frecuencias esperadas para cada una de las frecuencias
observadas se realiza la siguiente operación

Para poder calcular el chi cuadrado teórico, tenemos que hallar los grados de libertad.
Teniendo a ft se procede a hallar el chi cuadrado observado.
Luego, en la tabla de distribución de chi cuadrado se procede a hallar el chi cuadrado teórico.

cuando ya se tienen ambos valores se procede a compararlos y concluir

Si el chi cuadrado observado es menor al chi Si el chi cuadrado observado es mayor al chi
cuadrado teórico (que se halla con la tabla), cuadrado teórico (que se halla con la tabla),
entonces la hipótesis nula se acepta. entonces la hipótesis nula se rechaza.
Ejemplo

La siguiente tabla refleja la cantidad de estudiantes, según la calificación obtenida en


matemáticas en dos universidades.

¿Influye el tipo de universidad en la calificación obtenida?

Margen de error: 5%
Ho: No influye el tipo de universidad en las calificaciones
Ha: Si influye el tipo de universidad en las calificaciones

Se calcula todos las frecuencias Luego, se calcula el chi cuadrado observado


esperadas ft

Grados de libertad
Para hallar el chi cuadrado teórico se usa la tabla de distribución de chi cuadrado
(Para encontrar un valor mayor o igual a chi cuadrado)

http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf
Debido a que el chi cuadrado observado es mayor al chi cuadrado teórico, podemos concluir que no hay
suficiente evidencia para decir que el tipo de universidad influye en las calificaciones
Chi-Cuadrado en R
Ejemplo: Hay 15 hombres y 19 mujeres en un aula de clase. Como ven en los datos, no nos interesa cada
dato como independiente, sino como su frecuencia de la clase o categoría dada, en este caso es el género
(hombres y mujeres). El valor observado es 15 y 19. Para el cálculo del valor esperado se obtiene de
(15+19)/2=17. Resumiendo la información queda de la siguiente manera:

En R resulta muy fácil el cálculo de chi-cuadrado, tanto para su estadístico como valores esperados:
Los grados de libertad son calculados a partir de n-1 (número de categorías menos uno). Si está interesado en
obtener el valor crítico tabulado de chi-cuadrado, al 95% con un grado de libertad se escribe:

Los valores esperados son calculados por:


El test estadístico de chi-cuadrado puede encontrarse en la literatura también como bondad de ajuste. El test
de bondad de ajuste, se le denomina así, cuando los objetos pertenecen a una matriz de datos. Otros nombres
que suele darse es tabla de contingencia, y es cuando los datos están arreglados en filas y columnas. La
expresión de una matriz se realiza con el comando “matrix”.
Test de bondad de ajuste en R
Para realizar el test de chi-cuadrado de bondad de ajuste lo aplicamos con “chisq.test(x)”, de un vector “x”
cualquiera:

Como se observa los resultados de la prueba, da no significativa (p=0,7328). Así mismo, observamos un
“Warning”, esto es debido a que posiblemente los valores esperados sean menores a cinco, o la proporción
supera al 20% de las celdas, con valores observados inferiores a cinco. Cuando esto sucede es recomendable
utilizar un test de independencia denominado Fisher test. Los grados de libertad para una matriz o tabla de
contingencia en chi-cuadrado son calculados de C-1 * F-1 (columnas menos uno X filas menos uno).
Test de independencia (prueba de Fisher)

Es una prueba de significación estadística, utilizadas en el análisis de tablas de contingencia cuando los
tamaños de las muestras son pequeños (y frecuencias esperadas menores a 5).

Podemos, adicionalmente, aumentar el poder de la prueba, aumentando el número de réplicas o


permutaciones. El test de Fisher también es recomendado para tablas de contingencia 2x2, donde los valores
esperados son menores a cinco. La prueba exacta de Fisher se basa en el modelo de la distribución
hipergeométrica, para estimar la probabilidad de obtener las frecuencias observadas en la tabla.
Si usted quiere el valor de chi-cuadrado, aún para muestras pequeñas (valores esperados menores a cinco),
puede calcularlo de la siguiente manera:
Como estamos trabajando una matriz de datos, es posible calcular las proporciones que corresponden los
datos, tanto para las columnas como para las filas.

Esta tabla resulta útil para darnos las frecuencias de los valores en términos de porcentaje, y nos resulta fácil
a la hora de la interpretación de una variable. La variable [1][3], tiene un porcentaje de ocurrencia de 5,1%.
La variable [2][4], tiene un porcentaje de ocurrencia del 13,6%, y así sucesivamente. Recuerde que para dar
un resultado con cierto número de decimales puede utilizar la opción de “options(digits=3)” para tres
decimales.
Así mismo podemos visualizar si estamos interesados en la proporción de los datos respecto las filas:

O de otra forma alternativa, la proporción de los datos respecto a las columnas:

Estos últimos dos cálculos solo resultan, cuando los datos están hechos bajo una matriz.
En ocasiones es posible que nuestros datos se encuentren dentro de una matriz compleja. Aprenderemos a
cómo sintetizar o extraer solo parte de esa información:
Observe que la base que contiene los datos se llama survey, y para seleccionar una porción de los datos se
utiliza el comando de $.
Formas gráficas para los test de independencia, tablas
de contingencia o chi-cuadrado
Plot de mosaico: Un gráfico de mosaico despliega información para examinar la relación entre dos o más
variables categóricas.
Bar plot: El barplot describe las frecuencias de todas las observaciones de las variables categóricas.
Otra forma de presentar es ajustando las categorías en orden separado, dependiendo de cuál es el interés en la
forma de cómo presentar sus resultados:
FIN,
GRACIAS.

También podría gustarte