Está en la página 1de 3

TABLAS DE CONTINGENCIA

 Se usan datos de una muestra aleatoria


 Se usa en las pruebas de independencia para ver si dos características son
independientes y para bondad de ajuste es el cambio de distribución entre las
variables
 Una tabla de contingencia es la forma más común de resumir datos categóricos
cualitativos
 Es utilizada en pruebas de independencia
 Estudia el nivel de asociación entre dos variables
 Es utilizada en diversos campos de investigación

Bondad de ajuste
 Objetivo: aprender a organizar data en categorías y usar tablas de
contingencia mediante el uso de Chi-cuadrado para interpretar y toma de
decisiones
 Se realiza para ver si una variable categórica (nominal u ordinal) se comporta
de la misma forma que nates lo hacia
 Tabla de contingencia: valores observados vs esperados
Planteamiento de hipótesis
 Hipótesis nula (Ho): los datos observados = los datos esperados
o La presencia de las personas del año 80 es igual al de las preferencias
de las personas del año 2022
 Hipótesis alternante (Ha): los datos observados <> los datos esperados
Pasos en R
 Contarle a R los datos que tenemos respetando el orden de los datos A-A,B-
B,C-C,D-D
o Las probabilidades o datos antiguos
o Los datos reales
o Los datos esperados  suma de los datos reales* probabilidades
 Utilizar el chisq.test
o Chisq.test(datos reales, probabilidades)
o Para las probabilidades se pone p=
o X-squared: es el valor del estadístico
o Df: grados de libertad, el total de categorías de la variable menos 1
o P-valor: valor usado para probar la hipótesis
o Alfa: margen de error asumir 0.05

p-valor<alfa Aceptamos hipótesis alternante(ha)


Rechazamos la hipótesis nula (ho)
p-valor>alfa Aceptamos la hipótesis nula (ho)
Rechazamos hipótesis alterna (ha)
 Comparamos el p-valor y alfa para dar alguna respuesta
o Como mi p valor es mejor al alfa, puedo concluir que han ha habido un
cambio en la manera en cómo los clientes pagan sus compras en las
tiendas según los datos recogidos por American Banks Asociation

Pruebas de independencia
 Objetivo: aprender a organizar data en categorías y tablas de contingencia
mediante el uso de chi-cuadrado para la interpretación y toma de decisiones
 Se necesitan DOS variables categóricas, cualitativas NO METRICAS
o Si te dicen de 18-24 no es una variable métrica, si dices de 18 a 24
años si es métrica
 Uso: saber si el comportamiento de determinado objeto, circunstancia,
momento (variable categórica) depende de otra cosa (variable categórica) o es
independiente
 Se usará las tablas de contingencia para comparar la distribución y si hay
inclinación por un dato
 también se puede evaluar la dependencia entre variables métricas usando el
coeficiente de correlación de Pearson
Planteamiento de hipótesis
 Hipótesis nula (Ho): hay independencia, relación o dependencia entre la
variable categórica 1 y la variable categórica 2
 Hipótesis alternante (Ha): hay dependencia entre la variable categórica 1 y la
variable categórica 2
 Ejemplos
o La compra de productos saludables depende de la profesión de las
personas
o La elección de la marca del celular depende del grupo de edad al que
uno pertenezca
Pasos en R
Opción 1: si SI te dan la data
 Importamos la data
 Identificamos las columnas que usaremos
o X= nombre del archivo Excel $ encabezado X
o Y=nombre del archivo Excel $ encabezado Y
 Armamos la tabla de contingencia
o Tabla.frec = table (x,y)
 Utilizamos la función chisq.test
o chisq.test(Tabla.frec)

Opción 2: si No te dan la data


 Le contamos a R los datos
o Nombre 1 = c(#,#,#,#)
o Nombre 2 = c(#,#,#,#)
 Armamos la tabla de contingencia
o Tabla frec. = cbind(nombre 1, Nombre 2)
 Utilizamos la función chisq.test
o chisq.test(Tabla.frec)

También podría gustarte