Documentos de Académico
Documentos de Profesional
Documentos de Cultura
E. P. DE INGENIERÍA
ESTADÍSTICA E INFORMÁTICA
REGRESIÓN MULTINOMIAL
Docente: Ing. Alcides RAMOS CALCINA, Mtr.
“CAIMANES”
Los datos del archivo gator.txt corresponden a 219 caimanes capturados en cuatro lagos de Florida. La variable
respuesta es el tipo de comida encontrada en estómago de los caimanes y tiene 5 categorías:
- Como se puede ver las variables a factor son: size, gender y lake.
• Ahora revisaremos las frecuencias de las categorías de la variable “food”.
Tenemos 219 caimanes capturados en cuatro lagos de Florida, donde se puede observar
que 13 comieron bird, 94 comieron fish, 61comieron invert, 19 en other y 19 en rep.
b) Interprete los coeficientes
• Modelo 1:
• Estimación de OR
Entonces, el logaritmo de la razón de ventaja de estar en la categoría 1, 2, 3, 4 respecto
a la categoría de referencia 0, es:
� 1 = 𝑒𝑒 𝛽𝛽11 = 𝑒𝑒 −0.55517 = 0.5739730
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de fish tienden a ver consumido 57.39 veces.
� 2 = 𝑒𝑒 𝛽𝛽12 = 𝑒𝑒 −1.50408 = 0.2222212
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de invert tienden a ver consumido 22.22 veces.
� 3 = 𝑒𝑒 𝛽𝛽13 = 𝑒𝑒 −0.84949 = 0.4276301
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de other tienden a ver consumido 42.76 veces.
� 4 = 𝑒𝑒 𝛽𝛽14 = 𝑒𝑒 0.30319 = 1.3541773
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de rep tienden a ver consumido 135.41 veces.
- Ahora estimanos el OR en R
Se observa que los βis no pude tomar el valor de cero, en ninguna ecuación, por tanto, podemos decir que
la variable size es estadísticamente significativa.
• Test de la razón de verosimilitud
Al momento de estimar los coeficientes, no se tiene los p-valor para los coeficientes, si queremos saber si
la variable explicativa es significativa, utilizamos el test de la razón de verosimilitud, en esta comparamos
el modelo nulo con el modelo que si tiene la variable:
El valor de probabilidad asociado al estadístico Chi-cuadra Pr(chi) = 0.004400846 < 0.05, entonces
rechazamos la hipótesis nula de que β1= 0. Es decir, que la variable food es estadísticamente
significativa.
• Modelo 2:
Estimación del modelo
Como se analizo anteriormente, nos interesa interpretar aquellos betas que son distintos de cero. Y puede pasar
que alguno de ellos sea significativo pero otros no, por consiguiente solicitemos la estimemos el intervalo de
confianza para los parámetros.
Esto quiere decir que cuando se compara el ultimo año vs nunca, de gender = 0 a gender = 1 no hay evidencias
estadísticamente significativas.