Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bondad de ajuste
Objetivo: aprender a organizar data en categorías y usar tablas de
contingencia mediante el uso de Chi-cuadrado para interpretar y toma de
decisiones
Se realiza para ver si una variable categórica (nominal u ordinal) se comporta
de la misma forma que nates lo hacia
Tabla de contingencia: valores observados vs esperados
Planteamiento de hipótesis
Hipótesis nula (Ho): los datos observados = los datos esperados
o La presencia de las personas del año 80 es igual al de las preferencias
de las personas del año 2022
Hipótesis alternante (Ha): los datos observados <> los datos esperados
Pasos en R
Contarle a R los datos que tenemos respetando el orden de los datos A-A,B-
B,C-C,D-D
o Las probabilidades o datos antiguos
o Los datos reales
o Los datos esperados suma de los datos reales* probabilidades
Utilizar el chisq.test
o Chisq.test(datos reales, probabilidades)
o Para las probabilidades se pone p=
o X-squared: es el valor del estadístico
o Df: grados de libertad, el total de categorías de la variable menos 1
o P-valor: valor usado para probar la hipótesis
o Alfa: margen de error asumir 0.05
Pruebas de independencia
Objetivo: aprender a organizar data en categorías y tablas de contingencia
mediante el uso de chi-cuadrado para la interpretación y toma de decisiones
Se necesitan DOS variables categóricas, cualitativas NO METRICAS
o Si te dicen de 18-24 no es una variable métrica, si dices de 18 a 24
años si es métrica
Uso: saber si el comportamiento de determinado objeto, circunstancia,
momento (variable categórica) depende de otra cosa (variable categórica) o es
independiente
Se usará las tablas de contingencia para comparar la distribución y si hay
inclinación por un dato
también se puede evaluar la dependencia entre variables métricas usando el
coeficiente de correlación de Pearson
Planteamiento de hipótesis
Hipótesis nula (Ho): hay independencia, relación o dependencia entre la
variable categórica 1 y la variable categórica 2
Hipótesis alternante (Ha): hay dependencia entre la variable categórica 1 y la
variable categórica 2
Ejemplos
o La compra de productos saludables depende de la profesión de las
personas
o La elección de la marca del celular depende del grupo de edad al que
uno pertenezca
Pasos en R
Opción 1: si SI te dan la data
Importamos la data
Identificamos las columnas que usaremos
o X= nombre del archivo Excel $ encabezado X
o Y=nombre del archivo Excel $ encabezado Y
Armamos la tabla de contingencia
o Tabla.frec = table (x,y)
Utilizamos la función chisq.test
o chisq.test(Tabla.frec)