Está en la página 1de 7

Mtro.

Iván Argüello

REGRESIÓN DE POISSON:
Modelo de 3 variables y depuración de modelo.
Datos de daños de aviones. Tenemos una matriz de datos con 3 variables
independientes en las cuales se analizaran y eliminarán en un modelo con
ajuste de Poisson como distribución.
y x1 x2 x3
0 0 4 91.50
1 0 4 84.00
0 0 4 76.50
0 0 5 69.00
0 0 5 61.50
0 0 5 80.00
1 0 6 72.50
0 0 6 65.00
2 0 6 57.50
1 0 7 50.00
1 0 7 103.00
1 0 7 95.50
1 0 8 88.00
1 0 8 80.50
2 0 8 73.00
3 1 7 116.10
1 1 7 100.60
1 1 7 85.00
1 1 10 69.40
2 1 10 53.90
0 1 10 112.30
1 1 12 96.70
1 1 12 81.10
2 1 12 65.60
5 1 8 50.00
1 1 8 120.00
1 1 8 104.40
5 1 14 88.90
5 1 14 73.70
7 1 14 57.80

Realice el análisis de regresión de Poisson y determine que variables son


significativas. Depure el modelo e indique si el factible con los resultados.
Solución:
Mtro. Iván Argüello

Vamos a hacer el empleo del paquete SPSS con el comando modelos lineales
generalizados de la familia log-lineal de Poisson (recuentos).

Con SPSS:
Para el modelo completo x1, x2, x3 tenemos:
XBondad de ajuste
Valor gl Valor/gl
Desvianza 24.756 26 0.952
Desvianza escalada 24.756 26
Chi-cuadrado de Pearson 23.016 26 0.885

Chi-cuadrado de Pearson 23.016 26


escalado
Log verosimilitud -40.226

Criterio de información de 88.452


Akaike (AIC)

AIC corregido para 90.052


muestras finitas (AICC)

Criterio de información 94.057


bayesiano (BIC)

AIC consistente (CAIC) 98.057


   

La prueba de bondad de ajuste nos da


varios estadísticos que nos indican la
mejora o idoneidad del modelo, como el
criterio Akaike, AIC y el bayesiano,
BIC, sin mucho detalle su
interpretación se basa en “cuanto menor
su valor es mejor”; las deducciones
matemáticas de estos criterios
completos están fuera del alcance de
esta compilación.XContrastes de los efectos del
modelo
Mtro. Iván Argüello

Chi-
cuadrado
Origen de Wald gl Sig.
(Intersección) 0.002 1 0.963
x2 5.597 1 0.018
x1 1.078 1 0.299
x3 3.031 1 0.082

Con la prueba de contrastes de chi2 para x2 fue la que indico significancia


estadística (p=0.018).
Por tanto el modelo puede depurarse o hacer una selección de pasos hacia
atrás, y solo mantener la variable x2, por tanto se procede a eliminar x1 y x3.
Modelo con x2:XBondad de ajuste
Valor gl Valor/gl
Desvianza 28.214 28 1.008
Desvianza escalada 28.214 28  
Chi-cuadrado de Pearson 29.299 28 1.046
Chi-cuadrado de Pearson 29.299 28
escalado  
Log verosimilitud -41.955    
Criterio de información 87.910
de Akaike (AIC)    
AIC corregido para 88.354
muestras finitas (AICC)    
Criterio de información 90.712
bayesiano (BIC)    

AIC consistente (CAIC) 92.712


   

El modelo con la variable x2 indicó valores de los criterios AIC y BIC lo que
hace valido el modelo depurado.
XContrastes de los efectos del modelo
Origen
Chi- gl Sig.
cuadrado
Mtro. Iván Argüello

de Wald
(Intersección 9.981 1 0.002
)
x2 22.759 1 0.000

El estadístico, de Chi2 de Wald resultó altamente significativo p<0.0001 para


x2, por tanto se tiene la tabla de coeficiente:
XEstimaciones de los parámetros
Intervalo de confianza
de Wald 95% Contraste de hipótesis
Chi-
cuadrado
Parámetro B Típ. Error Inferior Superior de Wald gl Sig.
(Intersección -1.562 0.494 -2.530 -0.593 9.981 1 0.002
)
x2 0.220 0.046 0.129 0.310 22.759 1 0.000
(Escala) 1            

La tabla indica los intervalos de confianza (1-α)100% , la ecuación final para


la falla de aviones es:
y=e−1.562+0.220 x 2

La razón de momios es:


¿=e 0.220=1.24

Esto indica que por cada sitio en que daño a un avión, la carga de bombas
incrementa un 24%.
Resultados con NCSS:
Este programa ofrece una potente sección de análisis para regresiones de
GLM, de la cual se muestran una impresión parcial del resultado:
Mtro. Iván Argüello

La devianza fue de 28.21 con 28 grados de libertad y un valor AIC


relativamente pequeño según los criterios estandarizados. El valor pseudo R2
es similar al coeficiente de determinación de la regresión paramétrica lineal, la
cual explica un 44.6 % del modelo completo.
Los valores chi2 de Pearson y G-Test no rechazaron Ho (p-valores>0.05), por
tanto el modelo el adecuado.

Podemos ver que los coeficientes por NCSS son los mismos que con el
programa SPSS.

Con Minitab tenemos:


Poisson Regression Analysis: y versus x1, x2, x3

Method

Link function Natural log


Rows used 30

Deviance Table

Source DF Adj Dev Adj Mean Chi-Square P-Value


Regression 3 26.250 8.7501 26.25 0.000
x1 1 1.070 1.0703 1.07 0.301
x2 1 5.798 5.7979 5.80 0.016
x3 1 3.053 3.0529 3.05 0.081
Error 26 24.756 0.9522
Total 29 51.007

Model Summary
Mtro. Iván Argüello

Deviance Deviance
R-Sq R-Sq(adj) AIC
51.46% 45.58% 88.45

Coefficients

Term Coef SE Coef VIF


Constant -0.212 0.861
x1 0.511 0.492 2.04
x2 0.1585 0.0670 2.06
x3 -0.01428 0.00820 1.05

Regression Equation

y = exp(Y')

Y' = -0.212 + 0.511 x1 + 0.1585 x2 - 0.01428 x3


La bondad de ajuste es buena:
Goodness-of-Fit Tests

Test DF Estimate Mean Chi-Square P-Value


Deviance 26 24.75629 0.95216 24.76 0.533
Pearson 26 23.01621 0.88524 23.02 0.632

Con el comando de eliminación hacia atrás de Minitab otenemos el modelo


similar a los otros programas y se llega a un mejor modelo.

Poisson Regression Analysis: y versus x1, x2, x3

Method

Link function Natural log


Rows used 30

Backward Elimination of Terms

α to remove = 0.1

Deviance Table

Source DF Adj Dev Adj Mean Chi-Square P-Value


Regression 1 22.79 22.793 22.79 0.000
x2 1 22.79 22.793 22.79 0.000
Error 28 28.21 1.008
Total 29 51.01

Model Summary
Mtro. Iván Argüello

Deviance Deviance
R-Sq R-Sq(adj) AIC
44.69% 42.73% 87.91

Coefficients

Term Coef SE Coef VIF


Constant -1.562 0.494
x2 0.2197 0.0460 1.00

Regression Equation

y = exp(Y')

Y' = -1.562 + 0.2197 x2

Goodness-of-Fit Tests

Test DF Estimate Mean Chi-Square P-Value


Deviance 28 28.21351 1.00763 28.21 0.453
Pearson 28 29.29861 1.04638 29.30 0.398

También podría gustarte