Regresión Poisson

STATGRAPHICS – Rev.
4/25/2007
Regresión Poisson
Resumen
El procedimiento Regresión Poisson está diseñado para ajustar un modelo de regresión en el
cual la variable dependiente Y consiste de conteos. El modelo de regresión ajustado relaciona Y
con una o más variables predictoras X, que pueden ser cuantitativas o categóricas. El
procedimiento ajusta un modelo usando máxima verosimilitud o mínimos cuadrados ponderados.
La selección de variables por pasos es una opción. Se realizan pruebas de razón de verosimilitud
para probar la significancia de los coeficientes del modelo. El modelo ajustado puede graficarse
y generarse predicciones a partir del mismo. Se identifican y grafican residuos atípicos.
StatFolio de Ejemplo: Poisson reg.sgp
Datos de Ejemplo:
El archivo mines.sf6 contiene un grupo de datos tomados de Myers (1990) que describen el
número de lesiones que ocurren en los campos de carbón en West Virginia. Los datos consisten
de n = 44 observaciones de diferentes minas. A continuación se muestra una porción de los
datos:
Fractures Thickness Extraction Height Years

(fracturas) (grosor) (extracción) (altura) (años)
2 50 70 52 1
1 230 65 42 6
0 125 70 45 1
4 75 65 68 0.5
1 70 65 53 0.5
2 65 70 46 3
0 65 60 62 1
0 350 60 54 0.5
4 350 90 54 0.5
4 160 80 38 0
… … … … …
La variable dependiente es Fractures (fracturas), que tabula el número de lesiones en cada mina.
Las otras 4 columnas son variables predictoras potenciales que cuantifican diversos atributos de
cada mina.
© 2006 by StatPoint, Inc. Regresión Poisson - 1

STATGRAPHICS – Rev. 4/25/2007
Ingreso de Datos
La caja de diálogo del ingreso de datos solicita información sobre las variables de entrada:
• Variable Dependiente: variable numérica que contiene los n valores de la variable

dependiente yi. Y debe consistir de conteos enteros no negativos.
• (Tamaños de Muestra): tamaño de muestra opcional ti correspondiente a cada cuenta. Si no

se especifica, todos los ti se igualan a 1.
• Factores Cuantitativos: columnas numéricas que contienen los valores de cualesquiera

factores cuantitativos a ser incluidos en el modelo.
• Factores Categóricos: columnas numéricas o no numéricas que contienen los niveles de

cualesquiera factores a ser incluidos en el modelo.
• Selección: selección de un subgrupo de datos.

Modelo Estadístico
El modelo estadístico asumido para los datos es que los valores de la variable dependiente Y
siguen una distribución Poisson de la forma
e − λiti (λi t i )
p(Yi ) = (1)
Yi !
donde λi es el parámetro de la tasa Poisson en los valores de las variables predictoras

correspondientes a la i-ésima observación. Se supone además que la tasa se relaciona con las
variables predictoras a través de una función de enlace log-lineal de la forma
log(λ ) = β 0 + β 1 X 1 + β 2 X 2 + ... + β k X k (2)
Resumen del Análisis

El Resumen del Análisis presenta una tabla que muestra el modelo estimado y las pruebas de
significancia para los coeficientes del modelo. A continuación se muestra una salida típica:
Regresión de Poisson - Fractures
Variable dependiente: Fractures
Factores:
Thickness
Extraction
Height
Years
Modelo Estimado de Regresión (Máxima Verosimilitud)

Error Razón de Momios
Parámetro Estimado Estandar Estimada
CONSTANTE -3.59309 1.02567
Thickness -0.00140659 0.000835807 0.998594
Extraction 0.0623458 0.012286 1.06433
Height -0.00208034 0.00506612 0.997922
Years -0.0308135 0.0162647 0.969656
Análisis de Desviación
Fuente Desviación Gl Valor-P
Modelo 37.1277 4 0.0000
Residuo 37.856 39 0.5220
Total (corr.) 74.9837 43
Porcentaje de desviación explicado por el modelo = 49.5143
Porcentaje ajustado = 36.1781
Pruebas de Razón de Verosimilitud

Factor Chi-Cuadrada Gl Valor-P
Thickness 3.16654 1 0.0752
Extraction 31.9511 1 0.0000
Height 0.174671 1 0.6760
Years 3.89444 1 0.0484
Análisis de Residuos
Estimación Validación
n 44
CME 4.15055
MAE 0.986136
MAPE
ME -0.0604684
MPE

La salida incluye:
• Resumen de los Datos: un resumen de los datos que fueron ingresados.
• Modelo Estimado de Regresión: estimaciones de los coeficientes del modelo de regresión,

con errores estándar y las Razones de Momios. Las razones de momios se calculan a partir de
los coeficientes del modelo β̂ j por medio de
razón de momios = exp β̂ j ( ) (3)
La razón de momios representa el incremento porcentual en el momio de los eventos por

unidad de incremento en X.
• Análisis de Desviación: descomposición de la desviación de los datos en un componente

explicado (Modelo) y un componente no explicado (Residuo). La Desviación compara la
función de verosimilitud de un modelo con el valor más grande que puede alcanzar la
función de verosimilitud, de tal forma que un modelo perfecto tendría una desviación igual a
0. Hay tres renglones en la tabla:
1. Total (corr.) – la desviación de un modelo que contiene únicamente un término

constante, δ(β0).
2. Residuo – la desviación que queda después de haber ajustado el modelo.
3. Modelo – la reducción en la desviación debida a las variables predictoras,

δ(β1,β2,…,βk|β0), igual a la diferencia entre los otros dos componentes.
El Valor de P para el Modelo prueba si el añadir las variables predictoras reduce

significativamente la desviación comparada con un modelo que contiene sólo un término
constante. Un Valor de P pequeño (menor de 0.05 si se trabaja con un nivel de significancia
del 5%) indica que el modelo ha reducido significativamente la desviación y es así útil para
predecir a Y. El Valor de P para el término Residuo prueba si hay una falta de ajuste
significativa, i.e., si puede haber un modelo mejor. Un Valor de P pequeño indica que una
desviación significativa queda aún en los residuos, así que puede haber un mejor modelo.
• Porcentaje de Desviación – el porcentaje de desviación explicada por el modelo, calculada

por medio de
δ (β 1 , β 2 ,..., β k | β 0 )
R2 = (4)
δ (β 0 )
Es similar a una estadística R cuadrada en regresión múltiple, en que va de 0% a 100%.

También se calcula una desviación ajustada con
δ (β 1 , β 2 ,..., β k | β 0 ) − 2 p
2
Radj = (5)
δ (β 0 )

donde p es igual al número de coeficientes en el modelo ajustado, incluyendo al término

constante. Es semejante a la estadística R-cuadrada ajustada en que compensa el número de
variables en el modelo.
• Pruebas de Razón de Verosimilitud – una prueba de significancia para cada efecto en el

modelo ajustado. Estas pruebas comparan la función de verosimilitud del modelo completo
con la del modelo en el cual sólo el efecto indicado ha sido removido. Valores de P pequeños
indican que el modelo ha mejorado significativamente por el efecto correspondiente.
• Análisis de Residuos – si un subgrupo de filas en la hoja de datos ha sido excluido del

análisis usando el campo Seleccionar en la caja de diálogo de ingreso de datos, el modelo
ajustado se usa para hacer predicciones de los valores de Y para estas filas. Esta tabla muestra
estadísticas sobre los errores de predicción, definidos por
ei = y i − λ̂i t i (6)
Se incluyen el cuadrado medio del error (CME), el error absoluto medio (MAEA), el error
porcentual absoluto medio (MAPE), el error medio (ME), y el error porcentual medio (MPE).
Estas estadísticas de validación pueden ser comparadas con las estadísticas del modelo
ajustado para determinar qué tan bien el modelo predice las observaciones fuera de los datos
usados para ajustarlo.
El modelo ajustado para los datos del ejemplo es
λˆ = exp(− 3.593 − 0.001407Thickness + 0.06235Extraction − 0.002080 Height − 0.03081Years)
La regresión explica alrededor del 49.5% de la desviación de un modelo con sólo una constante.
El valor de P para un par de variables está por arriba 0.05, indicando que podrían ser removidos
razonablemente del modelo.

Opciones de Análisis
• Modelo: orden del modelo a ser ajustado. Los modelos de primer orden incluyen solo efectos
principales. Los modelos de segundo orden incluyen efectos cuadráticos para los factores
cuantitativos e interacciones de dos factores entre todas las variables.
• Incluir Constante: Si no se marca esta opción, el término constante β0 será omitido del
modelo.
• Ajustar: especifica si todas las variables independientes especificadas en caja de diálogo del
ingreso de datos deben ser incluidas en el modelo final, o si se debe aplicar una selección por
pasos de las variables. La selección por pasos intenta encontrar un modelo parsimonioso que
contenga sólo variables significativas estadísticamente. Un ajuste por Selección Hacia
Adelante comienza sin variables en el modelo. Un ajuste por Selección Hacia Atrás comienza
con todas las variables en el modelo.
• P-para-Introducir - En un ajuste por pasos, las variables entrarán al modelo en un paso

dado si sus valores de P son menores o iguales al valor especificado de P-para-Introducir.
• P-para-Eliminar - En un ajuste por pasos, las variables serán removidas del modelo en un
paso dado si sus valores de P son mayores que el valor especificado de P-para-Eliminar.
• Pasos Max.: máximo número de pasos permitidos cuando se lleva a cabo un ajuste por
pasos.
• Mostrar: si se muestran los resultados en cada paso cuando se lleva a cabo un ajuste por
pasos.
• Excluir: Presione este botón para excluir efectos del modelo. Se mostrará una caja de
diálogo:

Haga doble clic sobre un efecto para moverlo del campo Incluir al campo Excluir o para
regresarlo.
Ejemplo: Ajuste por Pasos hacia Atrás de un Modelo de Segundo Orden

Para encontrar un predictor parsimonioso pero útil para el número de Fractures (fracturas), se
consideró un modelo de segundo orden. Este modelo agrega términos adicionales que involucran
efectos cuadráticos tales como Thickness2 (grosor2) e interacciones entre cada par de variables,
representadas por productos cruzados tales como Thickness*Extraction (grosor*extracción). Para
evitar que el modelo tuviera muchos términos no significativos, se empleó un enfoque por pasos.
Dos enfoques de ese tipo están disponibles:
• Selección hacia adelante – Comienza con un modelo con sólo un término constante
y mete una variable a la vez con base en su significancia estadística si entrara al
modelo actual. En cada paso, el algoritmo pone en el modelo la variable que tendría
la mayor significancia estadística si entrara. Siempre que la variable más significativa
tenga un valor de P menor o igual al especificado en la caja de diálogo Opciones del
Análisis, será introducida al modelo. Cuando ninguna variable tenga un valor de P lo
suficientemente pequeño, se detiene la selección de variables. Además, las variables
introducidas al modelo al principio del procedimiento pueden ser removidas después
si su valor de P cae dentro del criterio P-para-Eliminar.
• Selección hacia atrás – Comienza con un modelo con todas las variables
especificadas en la caja de diálogo del ingreso de datos y quita una variable a la vez
con base en su significancia estadística en el modelo actual. En cada paso, el
algoritmo saca del modelo la variable que es la menos significativa estadísticamente.
Si la variable menos significativa tiene un valor de P mayor al especificado en la caja
de diálogo Opciones del Análisis, será removida del modelo. Cuando todas las
variables restantes tengan valores pequeños de P, se detiene el procedimiento.
Además, las variables removidas del modelo al principio del procedimiento pueden
ser reintroducidas después si su valor de P alcanza el criterio P-para-Introducir.

La salida a continuación muestra el resultado de un ajuste por pasos hacia atrás:
Selección de factores por etapas

Método: selección hacia atrás
P-para-introducir: 0.05
P-para-eliminar: 0.05
Paso 0:
14 factores en el modelo. 29 g.l. para el error.
Porcentaje de desviación explicada = 68.75% Porcentaje ajustado = 28.74%
Paso 1:
Eliminando factor Years with P-para-eliminar = 0.931068
Paso 2:
Eliminando factor Height*Height with P-para-eliminar = 0.667761
Paso 3:
Eliminando factor Thickness*Thickness with P-para-eliminar = 0.785169
Paso 4:
Eliminando factor Thickness*Years with P-para-eliminar = 0.847819
Paso 5:
Eliminando factor Extraction*Years with P-para-eliminar = 0.688459
Paso 6:
Eliminando factor Height with P-para-eliminar = 0.529659
Paso 7:
Eliminando factor Extraction*Height with P-para-eliminar = 0.957829
Paso 8:
Eliminando factor Years*Years with P-para-eliminar = 0.402248
Paso 9:
Eliminando factor Thickness*Height with P-para-eliminar = 0.39377
Paso 10:
Eliminando factor Height*Years with P-para-eliminar = 0.0852434
Modelo final seleccionado.
El algoritmo comenzó con 14 efectos. Después de 10 pasos, el número de efectos in el modelo se

ha reducido a 4. A continuación de muestra un resumen del modelo final:
Regresión de Poisson - Fractures

Variable dependiente: Fractures
Factores:
Thickness
Extraction
Height
Years
Modelo Estimado de Regresión (Máxima Verosimilitud)

Error Razón de Momios
Parámetro Estimado Estandar Estimada
CONSTANTE -30.0347 10.7768
Thickness -0.02653 0.0119429 0.973819
Extraction 0.796051 0.278408 2.21677
Thickness*Extraction 0.000294308 0.000136244 1.00029
Extraction^2 -0.00501156 0.0017943 0.995001
Análisis de Desviación
Fuente Desviación Gl Valor-P
Modelo 46.2986 4 0.0000
Residuo 28.6851 39 0.8874
Total (corr.) 74.9837 43
Porcentaje de desviación explicado por el modelo = 61.7449

Porcentaje ajustado = 48.4087
Pruebas de Razón de Verosimilitud

Factor Chi-Cuadrada Gl Valor-P
Thickness 5.68063 1 0.0172
Extraction 9.76634 1 0.0018
Thickness*Extraction 5.23687 1 0.0221
Extraction^2 9.15297 1 0.0025
El modelo final involucra sólo 2 variables: Thickness y Extraction. Contiene efectos principales
para ambas variables, una interacción entre las 2 variables, y un efecto cuadrático para
Extraction. El porcentaje de desviación explicada por el modelo ha aumentado a
aproximadamente 61.7%.
Gráfica del Modelo Ajustado

La Gráfica del Modelo Ajustado muestra la tasa media estimada λˆ ( X ) versus cualquier variable
predictora, manteniendo constantes las otras variables.

Gráfica del Modelo Ajustado

con intervalos de confianza del 95.0%
5
Extraction=75.9318
4 Height=56.6364
Fractures Years=7.15909
3
0
0 200 400 600 800 1000
Thickness
Se incluyen en el gráfico los límites de confianza para λ(X).
Opciones de Ventana
• Factor: selecciona el factor a graficar en el eje horizontal.
• Bajo y Alto: especifica el rango de valores para el factor seleccionado.

• Mantener: valores en los que se mantendrán fijos los factores no seleccionados.
• Nivel de Confianza: porcentaje usado para los límites de confianza. Poner en 0 para omitir
los límites.
• Siguiente y Atrás: usado para mostrar otros factores cuando hay presentes más de 16.
La tasa estimada de fracturas disminuye de una alta de casi 4.5 a una baja de casi 0 conforme el
grosor (Thickness) de la mina aumenta, en Extraction = 75, Height = 50, y Years = 7.
Observados Versus Predichos

El gráfico Observados versus Predichos muestra los valores observados de Y en el eje vertical y
los valores medios predichos λ̂i t i en el eje horizontal.
Gráfica de Fractures
4
observado
0
0 1 2 3 4 5
predicho
Si el modelo ajusta bien, los puntos deben estar esparcidos aleatoriamente alrededor de la línea
diagonal.
Predicciones
El modelo de regresión ajustado puede usarse para predecir el resultado de nuevas muestras
cuyas variables predictoras son dadas. Por ejemplo, suponga que se desea una predicción para
una mina con Thickness = 100, Extraction = 70, Height = 50, y Years = 10. Se puede agregar una
nueva columna a la hoja de datos con estos valores para las variables predictoras, pero se dejaría
en blanco la entrada para Fractures. Entonces la ventana Predicciones presentaría:
Predicciones para Fractures
Observado Ajustado LC Inferior 95.0% LC Superior 95.0%

Fila para Predicción para Predicción
45 1.24396 0.846319 1.82844
La tabla muestra el valor ajustado λ̂i t i , junto con intervalos de confianza aproximados del 95%.

Opciones de Ventana
• Mostrar: muestra Todos los Valores (predicciones para todas las filas en la hoja de datos), o
Sólo Pronósticos (predicciones para las filas con valores faltantes para Y).
• Nivel de Confianza: porcentaje usado para los intervalos de confianza.
Intervalos de Confianza
La ventana Intervalos de Confianza muestra el error de estimación potencial asociado con cada
coeficiente en el modelo, así como para las razones de tasas.
Intervalos de confianza del 95.0% para los estimados de los coeficientes

Error
Parámetro Estimado Estándar Límite Inferior Límite Superior
CONSTANTE -3.59309 1.02567 -5.60336 -1.58282
Thickness -0.00140659 0.000835807 -0.00304474 0.000231567
Extraction 0.0623458 0.012286 0.0382655 0.086426
Height -0.00208034 0.00506612 -0.0120098 0.00784909
Years -0.0308135 0.0162647 -0.0626918 0.00106482
Intervalos de confianza del 95.0% para la razón de tasas

Parámetro Estimado Límite Inferior Límite Superior
Thickness 0.998594 0.99696 1.00023
Extraction 1.06433 1.03901 1.09027
Height 0.997922 0.988062 1.00788
Years 0.969656 0.939233 1.00107
Opciones de Ventana
• Nivel de Confianza: nivel porcentual para los intervalos de confianza.

Matriz de Correlación
La Matriz de Correlación muestra estimaciones de la correlación entre los coeficientes
estimados.
Matriz de correlación para los coeficientes estimados

CONSTANTE Thickness Extraction Height Years
CONSTANTE 1.0000 0.1136 -0.9574 -0.3001 0.1207
Thickness 0.1136 1.0000 -0.1719 -0.1968 -0.0934
Extraction -0.9574 -0.1719 1.0000 0.0674 -0.1758
Height -0.3001 -0.1968 0.0674 1.0000 -0.1201
Years 0.1207 -0.0934 -0.1758 -0.1201 1.0000
Esta tabla puede ser útil para determinar que tan bien se han separado unos de otros los efectos
de las variables independientes.
Residuos Atípicos
Una vez que el modelo ha sido ajustado, es útil estudiar los residuos para determinar si existe
algún valor atípico que debiera ser removido de los datos. La ventana Residuos Atípicos lista
todas las observaciones que tienen residuos grandes atípicos.
Residuos Atípicos para Fractures

Y Residuo Residuo de
Fila Y Predicha Residuo Pearson Desviación
4 4.0 1.21777 2.78223 2.52 1.99
29 5.0 1.58135 3.41865 2.72 2.16
La tabla muestra:
• Fila – el número de fila en la hoja de datos.
• Y – el valor observado de Y.
• Y Predicha – el valor ajustado λ̂i t i .
• Residuo – la diferencia entre los valores observado y predico, definido por
ei = y i − λ̂i t i (7)
• Residuo de Pearson – un residuo estandarizado en el cual cada residuo es divido entre

una estimación de su error estándar:
ei
ri = (8)
λ̂i t i
• Residuo de Desviación – un residuo que mide la contribución de cada observación a la

desviación de los residuos:

⎧⎪ ⎛ y ⎞ ⎫
d i = sgn(ri ) 2⎨ y i ln⎜ i ⎟ − y i + λˆi t i ⎪⎬ (9)
⎪⎩ ⎜ λˆ t ⎟ ⎪⎭
⎝ ii ⎠
La suma de los residuos de desviación cuadrados es igual a la desviación en el renglón de

Residuos en la tabla del análisis de desviación.
La tabla incluye todas las filas para las cuales el valor absoluto del residual de Pearson es mayor
que 2.0. El presente ejemplo muestra 2 residuos que exceden 2.5, ninguno de los cuales excede
de 3.0.
Gráficas de Residuos
Al igual que con todos los modelos estadísticos, es una buena práctica examinar los residuos. El
procedimiento Regresión Poisson incluye varios tipos de gráficas de residuos, dependiendo de
las Opciones de Ventana.
Diagrama de Dispersión versus Valor Predicho

Este gráfico es útil para visualizar si la variabilidad de los residuos es constante o depende de las
variables predictoras.
Gráfica de Residuos
2.8
Residuos de desviación
1.8
0.8
-0.2
-1.2
-2.2
0 1 2 3 4 5
predicho Fractures
Autocorrelaciones entre Residuos

Este gráfico calcula la autocorrelación entre residuos como una función del número de filas entre
ellos en la hoja de datos.

Autocorrelaciones Residuales para Fractures
0.6
autocorrelación
0.2
-0.2
-0.6
-1
0 2 4 6 8 10 12
retraso
Esto sólo es relevante si los datos se colectaron secuencialmente. Cualquier barra extendiéndose
más allá de los límites de probabilidad indicaría dependencia significativa entre residuos
separados por el retraso indicado.
Opciones de Ventana
• Graficar: el tipo de residuos a graficar:
1. Residuos – los valores observados menos los ajustados.

2. Residuos Pearson – los residuos divididos entre sus errores estándar estimados.
3. Residuos de Desviación – residuos escalados de tal forma que la suma de sus
cuadrados es igual a la desviación de los residuos.

• Tipo: el tipo del gráfico a crear. Se usa un Diagrama de Dispersión para probar curvatura. Se
emplea una Gráfica de Probabilidad Normal para determinar si los residuos del modelo
provienen de una distribución normal (no se espera normalidad en este procedimiento). Se
usa una Función de Autocorrelación para probar dependencia entre residuos consecutivos.
• Graficar versus: para un Diagrama de Dispersión, la cantidad a graficar en el eje horizontal.
• Número de Retrasos: para una Función de Autocorrelación, el máximo número de retrasos.

Para grupos pequeños de datos, el número de retrasos graficados puede ser menor que este
valor.
• Nivel de Confianza: para una Función de Autocorrelación, el nivel usado para crear los
límites de probabilidad.
Puntos Influyentes
Cuando se ajusta un modelo de regresión, no todas las observaciones tienen la misma influencia
en la estimación de los parámetros del modelo ajustado. Aquellos con valores atípicos de las
variables independientes tienden a tener mayor influencia que los otros. La ventana Puntos
Influyentes presenta cualquier observación que tenga gran influencia en el modelo ajustado:
Puntos Influyentes para Fractures

Fila Leverage
25 0.437161
30 0.367098
Leverage promedio de un solo punto = 0.113636
La tabla muestra todos las observaciones con leverage alto. El punto leverage es una estadística
que mide cuán distante está una observación de la media de las n observaciones en el espacio de
las variables independientes. Entre más grande el leverage, mayor el impacto del punto en los
valore ajustados ŷ. Los puntos son colocados en la lista si el leverage es mayor de tres veces el
de un punto promedio
La observación con el punto leverage mayor en los datos de la muestra es la fila #25, aunque es
sólo alrededor de 4 veces el punto leverage promedio.
Salvar Resultados
Se pueden salvar en la hoja de datos los siguientes resultados:
1. Valores Predichos – los valores ajustados λ̂i t i correspondientes a cada fila de la hoja de
datos.
2. Límites Inferiores – los límites inferiores de confianza para λ̂i t i .
3. Límites Superiores – los límites superiores de confianza para λ̂i t i .
4. Residuos – los residuos ordinarios.
5. Residuos Pearson – los residuos estandarizados de Pearson.
6. Residuos de Desviación – los residuos de desviación.
7. Leverages – los puntos niveladores para cada fila.

Cálculos
Sea λi = la tasa estimada en los valores de las variables predictoras en la fila i.
Función de Verosimilitud
L=∏
n
[λi t i ]y i
exp(− λi t i )
(10)
i =1 yi !
Desviación
L( βˆ )
δ ( βˆ ) = (11)
y i i exp(− y i )
n y
∏i =1 yi !
Punto Leverage
{
hi = diag X i′( X ′WX ) X i wi
−1
} (12)
p
h= (13)
n

Regresión Poisson

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Regresión Poisson

Cargado por

Copyright:

Formatos disponibles

STATGRAPHICS – Rev.

StatFolio de Ejemplo: Poisson reg.sgp

Fractures Thickness Extraction Height Years

© 2006 by StatPoint, Inc. Regresión Poisson - 1

• Variable Dependiente: variable numérica que contiene los n valores de la variable

• (Tamaños de Muestra): tamaño de muestra opcional ti correspondiente a cada cuenta. Si no

• Factores Cuantitativos: columnas numéricas que contienen los valores de cualesquiera

• Factores Categóricos: columnas numéricas o no numéricas que contienen los niveles de

• Selección: selección de un subgrupo de datos.

© 2006 by StatPoint, Inc. Regresión Poisson - 2

donde λi es el parámetro de la tasa Poisson en los valores de las variables predictoras

log(λ ) = β 0 + β 1 X 1 + β 2 X 2 + ... + β k X k (2)

Resumen del Análisis

Modelo Estimado de Regresión (Máxima Verosimilitud)

Pruebas de Razón de Verosimilitud

© 2006 by StatPoint, Inc. Regresión Poisson - 3

• Resumen de los Datos: un resumen de los datos que fueron ingresados.

• Modelo Estimado de Regresión: estimaciones de los coeficientes del modelo de regresión,

razón de momios = exp β̂ j ( ) (3)

La razón de momios representa el incremento porcentual en el momio de los eventos por

• Análisis de Desviación: descomposición de la desviación de los datos en un componente

1. Total (corr.) – la desviación de un modelo que contiene únicamente un término

2. Residuo – la desviación que queda después de haber ajustado el modelo.

3. Modelo – la reducción en la desviación debida a las variables predictoras,

El Valor de P para el Modelo prueba si el añadir las variables predictoras reduce

• Porcentaje de Desviación – el porcentaje de desviación explicada por el modelo, calculada

Es similar a una estadística R cuadrada en regresión múltiple, en que va de 0% a 100%.

© 2006 by StatPoint, Inc. Regresión Poisson - 4

donde p es igual al número de coeficientes en el modelo ajustado, incluyendo al término

• Pruebas de Razón de Verosimilitud – una prueba de significancia para cada efecto en el

• Análisis de Residuos – si un subgrupo de filas en la hoja de datos ha sido excluido del

El modelo ajustado para los datos del ejemplo es

λˆ = exp(− 3.593 − 0.001407Thickness + 0.06235Extraction − 0.002080 Height − 0.03081Years)

© 2006 by StatPoint, Inc. Regresión Poisson - 5

• P-para-Introducir - En un ajuste por pasos, las variables entrarán al modelo en un paso

© 2006 by StatPoint, Inc. Regresión Poisson - 6

Ejemplo: Ajuste por Pasos hacia Atrás de un Modelo de Segundo Orden

© 2006 by StatPoint, Inc. Regresión Poisson - 8

Selección de factores por etapas

Modelo final seleccionado.

El algoritmo comenzó con 14 efectos. Después de 10 pasos, el número de efectos in el modelo se

Regresión de Poisson - Fractures

Modelo Estimado de Regresión (Máxima Verosimilitud)

Porcentaje de desviación explicado por el modelo = 61.7449

Pruebas de Razón de Verosimilitud

Gráfica del Modelo Ajustado

© 2006 by StatPoint, Inc. Regresión Poisson - 10

Gráfica del Modelo Ajustado

Se incluyen en el gráfico los límites de confianza para λ(X).

• Factor: selecciona el factor a graficar en el eje horizontal.

• Bajo y Alto: especifica el rango de valores para el factor seleccionado.

© 2006 by StatPoint, Inc. Regresión Poisson - 11

Observados Versus Predichos

Predicciones para Fractures

Observado Ajustado LC Inferior 95.0% LC Superior 95.0%

© 2006 by StatPoint, Inc. Regresión Poisson - 12

• Nivel de Confianza: porcentaje usado para los intervalos de confianza.

Intervalos de confianza del 95.0% para los estimados de los coeficientes

Intervalos de confianza del 95.0% para la razón de tasas

• Nivel de Confianza: nivel porcentual para los intervalos de confianza.

© 2006 by StatPoint, Inc. Regresión Poisson - 13

Matriz de correlación para los coeficientes estimados

Residuos Atípicos para Fractures

• Fila – el número de fila en la hoja de datos.