Está en la página 1de 7

Práctica 2

E. P. DE INGENIERÍA
ESTADÍSTICA E INFORMÁTICA

REGRESIÓN MULTINOMIAL
Docente: Ing. Alcides RAMOS CALCINA, Mtr.

“CAIMANES”

Los datos del archivo gator.txt corresponden a 219 caimanes capturados en cuatro lagos de Florida. La variable
respuesta es el tipo de comida encontrada en estómago de los caimanes y tiene 5 categorías:

Nombre de la variable Categorías


food Comida encontrada en el estómago:
- fish (pescado)
- invert (invertebrados)
- rep (Reptiles) - bird (Pájaros)
- other (Otros)

Las variables explicativas son:

Nombre de la variable Categorías


size Tamaño:
- < 2.3 (≤ 2.3 m)
- > 2.3 (> 2.3 m)
gender Sexo:
- m (macho)
- f (hembra)
lake El lago donde se capturaron:
- Hancock
- Oklawaha
- Traord
- George
Se pide:
a) Seleccione las variables que influyen en el contenido del estómago y plantee su modelo.
• Indicaremos a R que esa variable no es numérica, que es categórica, con la
función factor.

- Como se puede ver las variables a factor son: size, gender y lake.
• Ahora revisaremos las frecuencias de las categorías de la variable “food”.

Tenemos 219 caimanes capturados en cuatro lagos de Florida, donde se puede observar
que 13 comieron bird, 94 comieron fish, 61comieron invert, 19 en other y 19 en rep.
b) Interprete los coeficientes

• Modelo 1:

Se tiene los dos modelos logísticos correspondientes a la comparación de cada categoría


con la referencia:
𝑃𝑃(𝑌𝑌 = 1)
log � � = 2.28239 + (−0.55517)𝑠𝑠𝑖𝑖𝑖𝑖𝑖𝑖
𝑃𝑃(𝑌𝑌 = 0)
𝑃𝑃(𝑌𝑌 = 2)
log � � = 2.19724 + (−1.50408)𝑠𝑠𝑖𝑖𝑖𝑖𝑖𝑖
𝑃𝑃(𝑌𝑌 = 0)
𝑃𝑃(𝑌𝑌 = 3)
log � � = 1.33502 + (−0.84949)𝑠𝑠𝑖𝑖𝑖𝑖𝑖𝑖
𝑃𝑃(𝑌𝑌 = 0)
𝑃𝑃(𝑌𝑌 = 4)
log � � = 0.18231 + (0.30319)𝑠𝑠𝑖𝑖𝑖𝑖𝑖𝑖
𝑃𝑃(𝑌𝑌 = 0)

• Estimación de OR
Entonces, el logaritmo de la razón de ventaja de estar en la categoría 1, 2, 3, 4 respecto
a la categoría de referencia 0, es:
� 1 = 𝑒𝑒 𝛽𝛽11 = 𝑒𝑒 −0.55517 = 0.5739730
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de fish tienden a ver consumido 57.39 veces.
� 2 = 𝑒𝑒 𝛽𝛽12 = 𝑒𝑒 −1.50408 = 0.2222212
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de invert tienden a ver consumido 22.22 veces.
� 3 = 𝑒𝑒 𝛽𝛽13 = 𝑒𝑒 −0.84949 = 0.4276301
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de other tienden a ver consumido 42.76 veces.
� 4 = 𝑒𝑒 𝛽𝛽14 = 𝑒𝑒 0.30319 = 1.3541773
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de rep tienden a ver consumido 135.41 veces.
- Ahora estimanos el OR en R

c) Valide el modelo a través de las pruebas correspondientes


• Validación del modelo
En cuanto a la validación del modelo, el test de Wall es equivalente al intervalo de
confianza que podemos calcular para el parámetro βis.
Si se calcula un intervalo de confianza al 95% para los parámetros, ¿qué tendríamos que
mirar para saber si son estadísticamente significativo? Que el cero esté en el intervalo.

El intervalo de confianza para las categorías es:


Para β11:
𝐼𝐼𝐼𝐼: 𝑃𝑃[−0.55517 − (1.96)(0.6063279) ≤ 𝛽𝛽11 ≤ −0.55517 + (1.96)(0.6063279)] = 0.95
𝐼𝐼𝐼𝐼: 𝑃𝑃[−1.743554 ≤ 𝛽𝛽11 ≤ 0.6332079] = 0.95
Para β12:
𝐼𝐼𝐼𝐼: 𝑃𝑃[−1.50408 − (1.96)(0.6400978) ≤ 𝛽𝛽12 ≤ −1.50408 + (1.96)(0.6400978)] = 0.95
𝐼𝐼𝐼𝐼: 𝑃𝑃[−2.758651 ≤ 𝛽𝛽12 ≤ −0.2495135] = 0.95
Para β13:
𝐼𝐼𝐼𝐼: 𝑃𝑃[−0.84949 − (1.96)(0.6742082) ≤ 𝛽𝛽13 ≤ −0.84949 + (1.96)(0.6742082)] = 0.95
𝐼𝐼𝐼𝐼: 𝑃𝑃[−2.1709205 ≤ 𝛽𝛽13 ≤ 0.471927] = 0.95
Para β14:
𝐼𝐼𝐼𝐼: 𝑃𝑃[0.30319 − (1.96)(0.7540538) ≤ 𝛽𝛽14 ≤ 0.30319(1.96)(0.7540538)] = 0.95
𝐼𝐼𝐼𝐼: 𝑃𝑃[−1.174724 ≤ 𝛽𝛽14 ≤ 1.781112] = 0.95

Se observa que los βis no pude tomar el valor de cero, en ninguna ecuación, por tanto, podemos decir que
la variable size es estadísticamente significativa.
• Test de la razón de verosimilitud
Al momento de estimar los coeficientes, no se tiene los p-valor para los coeficientes, si queremos saber si
la variable explicativa es significativa, utilizamos el test de la razón de verosimilitud, en esta comparamos
el modelo nulo con el modelo que si tiene la variable:

El valor de probabilidad asociado al estadístico Chi-cuadra Pr(chi) = 0.004400846 < 0.05, entonces
rechazamos la hipótesis nula de que β1= 0. Es decir, que la variable food es estadísticamente
significativa.
• Modelo 2:
Estimación del modelo

- Los cuatro modelos logísticos correspondientes son:


𝑃𝑃(𝑌𝑌 = 1)
log � � = 1.76355 + (0.36809)𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠
𝑃𝑃(𝑌𝑌 = 0)
𝑃𝑃(𝑌𝑌 = 2)
log � � = 1.54041 + (0.10209)𝑠𝑠𝑖𝑖𝑖𝑖𝑖𝑖
𝑃𝑃(𝑌𝑌 = 0)
𝑃𝑃(𝑌𝑌 = 3)
log � � = 0.84726 + (0.09720)𝑠𝑠𝑖𝑖𝑖𝑖𝑖𝑖
𝑃𝑃(𝑌𝑌 = 0)
𝑃𝑃(𝑌𝑌 = 4)
log � � = −0.00003 + (0.61909)𝑠𝑠𝑖𝑖𝑖𝑖𝑖𝑖
𝑃𝑃(𝑌𝑌 = 0)
- Estimación OR
Entonces, el logaritmo de la razón de ventaja de estar en la categoría 1, 2, 3, 4 respecto
a la categoría de referencia 0, es:
� 1 = 𝑒𝑒 𝛽𝛽11 = 𝑒𝑒 0.36809 = 1.444969
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de fish tienden a ver consumido 144.49 veces.
� 2 = 𝑒𝑒 𝛽𝛽12 = 𝑒𝑒 0.10209 = 1.010262
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de invert tienden a ver consumido 101.1
veces.
� 3 = 𝑒𝑒 𝛽𝛽13 = 𝑒𝑒 0.09720 = 1.102089
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de other tienden a ver consumido 110.2
veces.
� 4 = 𝑒𝑒 𝛽𝛽14 = 𝑒𝑒 0.61909 = 1.857253
𝑂𝑂𝑂𝑂
Los alimentos que consumen los caimanes de rep tienden a ver consumido 185.72 veces.
- En R se tiene

Como se analizo anteriormente, nos interesa interpretar aquellos betas que son distintos de cero. Y puede pasar
que alguno de ellos sea significativo pero otros no, por consiguiente solicitemos la estimemos el intervalo de
confianza para los parámetros.

Esto quiere decir que cuando se compara el ultimo año vs nunca, de gender = 0 a gender = 1 no hay evidencias
estadísticamente significativas.

d) Realice predicciones necesarias


Presentado por NELYDA AYDE CONDORI CONDORI

FINESI - Ing. Alcides Ramos Calcina, Mtr.

También podría gustarte