Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CUADRADA
La distribución chi cuadrado de pearson, es una distribución probabilística continua que nos permite
reconocer la asociación entre dos variables categóricas, es decir, si existe o no dependencia estadística entre
ellas.
Estas variables categóricas pueden ser dicotómicas o politómicas. Las variables dicotómicas son aquellas que
poseen únicamente dos valores en su variación.En cambio, las variables politómicas son aquellas que poseen
más de dos valores en su variación.
Las pruebas Chi-cuadrado se utilizan para probar hipótesis referidas a los patrones de comportamiento de
frecuencias relacionadas con variables ya sean cuantitativas o cualitativas.
Propiedades
Tipos de prueba de chi cuadrado
02 Prueba de independencia
03 Prueba de homogeneidad
Prueba de bondad de ajuste
La prueba de bondad de ajuste Chi-cuadrado se utiliza para comparar una muestra recogida
aleatoriamente que contiene una única variable categórica con una población mayor.
Esta prueba nos da una manera de decidir si los datos se ajustan lo bastante bien a nuestra idea o
debemos revisar.
Ejemplo:
Tenemos bolsas de caramelos con cinco sabores distintos cada una. Las bolsas deben tener el mismo
número de caramelos de cada sabor. La idea que queremos comprobar es que la proporción de
sabores por bolsa es la misma.
Prueba de independencia
La prueba de independencia de Chi-Cuadrado busca una asociación entre dos variables categóricas o
nominales dentro de la misma población.
En esta, tenemos la noción de que ambas no están relacionadas. Esta prueba nos da una forma de
decidir si esta noción es plausible o no.
Ejemplo:
Tenemos dos escuelas de baile que quieren calificar el nivel de sus alumnos en amateur, medio o
profesional. La idea o hipótesis que queremos comprobar es si influye el tipo de escuela de baile en
el nivel de los alumnos.
¿Cómo se calcula?
Para calcular los eventos o frecuencias esperadas para cada una de las frecuencias
observadas se realiza la siguiente operación
Para poder calcular el chi cuadrado teórico, tenemos que hallar los grados de libertad.
Teniendo a ft se procede a hallar el chi cuadrado observado.
Luego, en la tabla de distribución de chi cuadrado se procede a hallar el chi cuadrado teórico.
Si el chi cuadrado observado es menor al chi Si el chi cuadrado observado es mayor al chi
cuadrado teórico (que se halla con la tabla), cuadrado teórico (que se halla con la tabla),
entonces la hipótesis nula se acepta. entonces la hipótesis nula se rechaza.
Ejemplo
Margen de error: 5%
Ho: No influye el tipo de universidad en las calificaciones
Ha: Si influye el tipo de universidad en las calificaciones
Grados de libertad
Para hallar el chi cuadrado teórico se usa la tabla de distribución de chi cuadrado
(Para encontrar un valor mayor o igual a chi cuadrado)
http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf
Debido a que el chi cuadrado observado es mayor al chi cuadrado teórico, podemos concluir que no hay
suficiente evidencia para decir que el tipo de universidad influye en las calificaciones
Chi-Cuadrado en R
Ejemplo: Hay 15 hombres y 19 mujeres en un aula de clase. Como ven en los datos, no nos interesa cada
dato como independiente, sino como su frecuencia de la clase o categoría dada, en este caso es el género
(hombres y mujeres). El valor observado es 15 y 19. Para el cálculo del valor esperado se obtiene de
(15+19)/2=17. Resumiendo la información queda de la siguiente manera:
En R resulta muy fácil el cálculo de chi-cuadrado, tanto para su estadístico como valores esperados:
Los grados de libertad son calculados a partir de n-1 (número de categorías menos uno). Si está interesado en
obtener el valor crítico tabulado de chi-cuadrado, al 95% con un grado de libertad se escribe:
Como se observa los resultados de la prueba, da no significativa (p=0,7328). Así mismo, observamos un
“Warning”, esto es debido a que posiblemente los valores esperados sean menores a cinco, o la proporción
supera al 20% de las celdas, con valores observados inferiores a cinco. Cuando esto sucede es recomendable
utilizar un test de independencia denominado Fisher test. Los grados de libertad para una matriz o tabla de
contingencia en chi-cuadrado son calculados de C-1 * F-1 (columnas menos uno X filas menos uno).
Test de independencia (prueba de Fisher)
Es una prueba de significación estadística, utilizadas en el análisis de tablas de contingencia cuando los
tamaños de las muestras son pequeños (y frecuencias esperadas menores a 5).
Esta tabla resulta útil para darnos las frecuencias de los valores en términos de porcentaje, y nos resulta fácil
a la hora de la interpretación de una variable. La variable [1][3], tiene un porcentaje de ocurrencia de 5,1%.
La variable [2][4], tiene un porcentaje de ocurrencia del 13,6%, y así sucesivamente. Recuerde que para dar
un resultado con cierto número de decimales puede utilizar la opción de “options(digits=3)” para tres
decimales.
Así mismo podemos visualizar si estamos interesados en la proporción de los datos respecto las filas:
Estos últimos dos cálculos solo resultan, cuando los datos están hechos bajo una matriz.
En ocasiones es posible que nuestros datos se encuentren dentro de una matriz compleja. Aprenderemos a
cómo sintetizar o extraer solo parte de esa información:
Observe que la base que contiene los datos se llama survey, y para seleccionar una porción de los datos se
utiliza el comando de $.
Formas gráficas para los test de independencia, tablas
de contingencia o chi-cuadrado
Plot de mosaico: Un gráfico de mosaico despliega información para examinar la relación entre dos o más
variables categóricas.
Bar plot: El barplot describe las frecuencias de todas las observaciones de las variables categóricas.
Otra forma de presentar es ajustando las categorías en orden separado, dependiendo de cuál es el interés en la
forma de cómo presentar sus resultados:
FIN,
GRACIAS.