Está en la página 1de 24

Modelos Log-lineales en

tablas de contingencia
MLG
Agenda

1 2 3 4 5
Introducción Objetivos Áreas de Escala de Resumen
principales crecimiento tiempo

2 Título de la presentación 20XX


Introducción
Habitualmente, se suelen estudiar las tablas de contingencia calculando
estadísticos del tipo Chi-cuadrado para contrastar independencia entre las
variables. Cuando hay más variables involucradas.

• Una posibilidad es repetir el análisis por parejas para las distintas sub-
tablas y determinar las interacciones o asociaciones entre las variables.
• Otra posibilidad es aplicar modelos log–lineales, que son un caso
particular de los GLM para datos distribuidos como una distribución
multinomial o como una Poisson.

3 Título de la presentación 20XX


Los modelos log–lineales se usan para analizar la relación entre dos, tres o más
variables categóricas en una tabla de contingencia. Todas las variables que se analizan
se consideran como variables respuesta, es decir, no se hace distinción entre variables
independientes y dependientes. Es por ello que en estos modelos solo se estudia
asociación entre las variables.

Los modelos se representan mediante las frecuencias esperadas y se tienen en


cuenta las asociaciones o interacciones entre las variables. Los patrones de
asociación entre las variables pueden describirse en términos de los odds y las
razones de odds.

4 Título de la presentación 20XX


Un poco de historia
Hasta los años 60 las tablas de contingencia de 2x2 eran analizadas calculando
estadísticos tipo χ2 para testear independencia. Cuando las tablas
involucraban más variables se solía repetir este análisis para subtablas para
determinar las interacciones o asociaciones entre variables.

A partir de los 70 con los trabajos de Goodman y la difusión de estos en los


libros como Bishop, Finberg y Holland (1975) y Haberman(q975) hubo un
cambio sustancial en el tratamiento de estos problemas, y en particular con
la inclusión de los Modelos Loglineales.

5 Título de la presentación 20XX


Modelos para Tablas
Bidimensionales
Modelo Saturado en tablas bidimensionales

El Modelo Saturado o Completo es aquel que tiene todos los posibles efectos principales y
todas las posibles combinaciones de las variables seleccionadas que lo componen.
Se supone un Modelo pesado y complejo, ya que supone un número inmanejable de
ecuaciones, por lo que usualmente no es el modelo más deseable.
Modelos para Tablas
Bidimensionales
Modelo de Independencia en tablas bidimensionales

Bajo el supuesto de independencia, los modelos lineales generalizados logarítmicos identifican


los datos como los recuentos de N células en lugar de las clasificaciones individuales de los n
sujetos.

Debido a que la fórmula que expresa la independencia es multiplicativa:

El modelo Loglineal de independencia que requiere de restricciones como:


Modelo de Independencia
Para la interpretación de parámetros es relevante tratar las variables asimétricamente. Para
tablas de I x 2, en la fila i el logit es igual a:

El término final no depende de i, es decir:

En cada fila, las probabilidades de respuesta en la columna I son iguales a:

Cuando se presenta la equiprobabilidad en cada fila:


Modelos para Tablas
Tipos de Independencia en tablas tridimensionales
• Tridimensionales
Independencia Mutua
Cuando las tres variables tienen independencia mutua. El Modelo Loglineal queda expresado de la
siguiente forma:

• Independencia Conjunta
Es cuando la variable Y es conjuntamente independiente de X y Z. Es una independencia
bidireccional entre Y y la nueva variable compuesta. El modelo queda expresado:

De la misma forma, puede ocurrir que X es conjuntamente independiente de Y y Z, o Z


podría ser conjuntamente independiente de X e Y.
Modelos para Tablas
Tipos de Independencia
• Tridimensionales
Independencia Condicional
Las variables categóricas X e Y son condicionalmente independientes, dado Z, cuando la
independencia se cumple para cada tabla parcial dentro de la cual Z esta fijo. El modelo queda
planteado de la siguiente forma:

Esta condición es más débil que la Independencia Mutua o Conjunta. La Independencia


Mutua implica que Y es conjuntamente independiente de X y Z, lo que a su vez implica
que X e Y son condicionalmente independientes.
Modelos para Tablas
Tridimensionales
Asociación Homogénea e Interacción de tres factores
Un modelo para tres pares de variables condicionalmente dependiente está dada por la
siguiente forma:

Al exponenciar la ecuación, se obtendrá que para el modelo las razones de probabilidad


condicionales entres dos variables son idénticas en cada categoría de la tercera variable,
es decir, cada par de variables tiene una asociación homogénea, el cual se le denomina
Modelo Loglineal de Asociación Homogénea, el cual para tablas tridimensionales está
dada por:
Aplicación
• Se tiene una muestra de personas en donde se les ha preguntado si creían en la vida
después de la muerte. El número de personas que respondía sí fue 1339 de entre 1639 de
raza blanca, 260 de entre 315 de raza de color y 88 de 110 clasificadas como otros.

• Se usa un modelo log-lineal de independencia sobre la correspondiente tabla 3 × 2 y


• se fija un nivel de los efectos en 0.

12 Título de la presentación 20XX


13 Título de la presentación 20XX
• Se obtiene que

• Por tanto, el odds de la creencia en la vida


después de la muerte es de:
exp(1,4985) = 4,475 para cada raza.

14 Título de la presentación 20XX


Modelo Saturado
Modelo Saturado:

El modelo incluye la asociación entre X e Y

El caso de independencia se tiene que:


En tablas 2×2 existe una relación directa entre el logaritmo de la razón de odds y
los parámetros de asociación

Si las razones de odds valen 1 y X e Y son independientes.


15 Título de la presentación 20XX
Cada uno de los términos o
coeficientes representa un
incremento o decremento en el
valor del logaritmo de los
recuentos predichos. Así, si es
igual a 1.696, se puede afirmar
que el factor raza blanca
incrementa el logaritmo de los
recuentos en 1.696 cuando el
resto de factores permanece
constante.

A partir de los p-valores se


observa que ninguna de las
interacciones es significativa y
que el mejor modelo es el de
independencia.

16 Título de la presentación 20XX


Aplicación
Tablas Bidimiensionales
Dada una encuesta aplicad a una cadena de comida rápida se realizó una
muestra de 60 observaciones, donde se pregunta a cada encuestado si lleva un
orden de alimentación, respondiendo, Si, A veces o No, también se padecen de
alguna enfermedad como hipertensión, diabetes u otro, o simplemente no
padecen enfermedad. Las observaciones se resumen en la siguiente tabla:
Aplicación
• Modelo de Independencia

Ajuste del Modelo:


Aplicación
• Modelo Saturado

Ajuste del Modelo:


Aplicación
En la tabla, se observa que el modelo se ajusta perfectamente.
Aplicación
Este Modelo Saturado sirve para comparar si el Modelo de Independencia se ajusta
bien, utilizando otro parámetro aparte del modelo nulo, el cual se comprueba
mediante el análisis de devianzas.

Se puede observar que tanto el valor de la devianza como los grados de libertad son
similares al entregado en el resumen anterior, por lo tanto, la conclusión es la misma y
el modelo de independencia ajusta tan bien como el modelo saturado.
Aplicación
El Modelo de Independencia queda expresado:

Los coeficientes estimados son:


Aplicación
Interpretación de coeficientes:

La posibilidad de que el encuestado no lleve un orden diario de alimentación es


4,67 mayor que un encuestado que presente a veces un orden de alimentación.

La probabilidad de que un encuestado no presente problemas de salud es 33% menor


que un encuestado presente diabetes.
Gracias
MLG

También podría gustarte