Está en la página 1de 18

STATGRAPHICS – Rev.

4/25/2007

Regresión Poisson

Resumen
El procedimiento Regresión Poisson está diseñado para ajustar un modelo de regresión en el
cual la variable dependiente Y consiste de conteos. El modelo de regresión ajustado relaciona Y
con una o más variables predictoras X, que pueden ser cuantitativas o categóricas. El
procedimiento ajusta un modelo usando máxima verosimilitud o mínimos cuadrados ponderados.
La selección de variables por pasos es una opción. Se realizan pruebas de razón de verosimilitud
para probar la significancia de los coeficientes del modelo. El modelo ajustado puede graficarse
y generarse predicciones a partir del mismo. Se identifican y grafican residuos atípicos.

StatFolio de Ejemplo: Poisson reg.sgp

Datos de Ejemplo:
El archivo mines.sf6 contiene un grupo de datos tomados de Myers (1990) que describen el
número de lesiones que ocurren en los campos de carbón en West Virginia. Los datos consisten
de n = 44 observaciones de diferentes minas. A continuación se muestra una porción de los
datos:

Fractures Thickness Extraction Height Years


(fracturas) (grosor) (extracción) (altura) (años)
2 50 70 52 1
1 230 65 42 6
0 125 70 45 1
4 75 65 68 0.5
1 70 65 53 0.5
2 65 70 46 3
0 65 60 62 1
0 350 60 54 0.5
4 350 90 54 0.5
4 160 80 38 0
… … … … …

La variable dependiente es Fractures (fracturas), que tabula el número de lesiones en cada mina.
Las otras 4 columnas son variables predictoras potenciales que cuantifican diversos atributos de
cada mina.

© 2006 by StatPoint, Inc. Regresión Poisson - 1


STATGRAPHICS – Rev. 4/25/2007
Ingreso de Datos
La caja de diálogo del ingreso de datos solicita información sobre las variables de entrada:

• Variable Dependiente: variable numérica que contiene los n valores de la variable


dependiente yi. Y debe consistir de conteos enteros no negativos.

• (Tamaños de Muestra): tamaño de muestra opcional ti correspondiente a cada cuenta. Si no


se especifica, todos los ti se igualan a 1.

• Factores Cuantitativos: columnas numéricas que contienen los valores de cualesquiera


factores cuantitativos a ser incluidos en el modelo.

• Factores Categóricos: columnas numéricas o no numéricas que contienen los niveles de


cualesquiera factores a ser incluidos en el modelo.

• Selección: selección de un subgrupo de datos.

© 2006 by StatPoint, Inc. Regresión Poisson - 2


STATGRAPHICS – Rev. 4/25/2007
Modelo Estadístico
El modelo estadístico asumido para los datos es que los valores de la variable dependiente Y
siguen una distribución Poisson de la forma

e − λiti (λi t i )
p(Yi ) = (1)
Yi !

donde λi es el parámetro de la tasa Poisson en los valores de las variables predictoras


correspondientes a la i-ésima observación. Se supone además que la tasa se relaciona con las
variables predictoras a través de una función de enlace log-lineal de la forma

log(λ ) = β 0 + β 1 X 1 + β 2 X 2 + ... + β k X k (2)

Resumen del Análisis


El Resumen del Análisis presenta una tabla que muestra el modelo estimado y las pruebas de
significancia para los coeficientes del modelo. A continuación se muestra una salida típica:
Regresión de Poisson - Fractures
Variable dependiente: Fractures
Factores:
Thickness
Extraction
Height
Years

Modelo Estimado de Regresión (Máxima Verosimilitud)


Error Razón de Momios
Parámetro Estimado Estandar Estimada
CONSTANTE -3.59309 1.02567
Thickness -0.00140659 0.000835807 0.998594
Extraction 0.0623458 0.012286 1.06433
Height -0.00208034 0.00506612 0.997922
Years -0.0308135 0.0162647 0.969656

Análisis de Desviación
Fuente Desviación Gl Valor-P
Modelo 37.1277 4 0.0000
Residuo 37.856 39 0.5220
Total (corr.) 74.9837 43
Porcentaje de desviación explicado por el modelo = 49.5143
Porcentaje ajustado = 36.1781

Pruebas de Razón de Verosimilitud


Factor Chi-Cuadrada Gl Valor-P
Thickness 3.16654 1 0.0752
Extraction 31.9511 1 0.0000
Height 0.174671 1 0.6760
Years 3.89444 1 0.0484

Análisis de Residuos
Estimación Validación
n 44
CME 4.15055
MAE 0.986136
MAPE
ME -0.0604684
MPE

© 2006 by StatPoint, Inc. Regresión Poisson - 3


STATGRAPHICS – Rev. 4/25/2007

La salida incluye:

• Resumen de los Datos: un resumen de los datos que fueron ingresados.

• Modelo Estimado de Regresión: estimaciones de los coeficientes del modelo de regresión,


con errores estándar y las Razones de Momios. Las razones de momios se calculan a partir de
los coeficientes del modelo β̂ j por medio de

razón de momios = exp β̂ j ( ) (3)

La razón de momios representa el incremento porcentual en el momio de los eventos por


unidad de incremento en X.

• Análisis de Desviación: descomposición de la desviación de los datos en un componente


explicado (Modelo) y un componente no explicado (Residuo). La Desviación compara la
función de verosimilitud de un modelo con el valor más grande que puede alcanzar la
función de verosimilitud, de tal forma que un modelo perfecto tendría una desviación igual a
0. Hay tres renglones en la tabla:

1. Total (corr.) – la desviación de un modelo que contiene únicamente un término


constante, δ(β0).

2. Residuo – la desviación que queda después de haber ajustado el modelo.

3. Modelo – la reducción en la desviación debida a las variables predictoras,


δ(β1,β2,…,βk|β0), igual a la diferencia entre los otros dos componentes.

El Valor de P para el Modelo prueba si el añadir las variables predictoras reduce


significativamente la desviación comparada con un modelo que contiene sólo un término
constante. Un Valor de P pequeño (menor de 0.05 si se trabaja con un nivel de significancia
del 5%) indica que el modelo ha reducido significativamente la desviación y es así útil para
predecir a Y. El Valor de P para el término Residuo prueba si hay una falta de ajuste
significativa, i.e., si puede haber un modelo mejor. Un Valor de P pequeño indica que una
desviación significativa queda aún en los residuos, así que puede haber un mejor modelo.

• Porcentaje de Desviación – el porcentaje de desviación explicada por el modelo, calculada


por medio de

δ (β 1 , β 2 ,..., β k | β 0 )
R2 = (4)
δ (β 0 )

Es similar a una estadística R cuadrada en regresión múltiple, en que va de 0% a 100%.


También se calcula una desviación ajustada con

δ (β 1 , β 2 ,..., β k | β 0 ) − 2 p
2
Radj = (5)
δ (β 0 )

© 2006 by StatPoint, Inc. Regresión Poisson - 4


STATGRAPHICS – Rev. 4/25/2007

donde p es igual al número de coeficientes en el modelo ajustado, incluyendo al término


constante. Es semejante a la estadística R-cuadrada ajustada en que compensa el número de
variables en el modelo.

• Pruebas de Razón de Verosimilitud – una prueba de significancia para cada efecto en el


modelo ajustado. Estas pruebas comparan la función de verosimilitud del modelo completo
con la del modelo en el cual sólo el efecto indicado ha sido removido. Valores de P pequeños
indican que el modelo ha mejorado significativamente por el efecto correspondiente.

• Análisis de Residuos – si un subgrupo de filas en la hoja de datos ha sido excluido del


análisis usando el campo Seleccionar en la caja de diálogo de ingreso de datos, el modelo
ajustado se usa para hacer predicciones de los valores de Y para estas filas. Esta tabla muestra
estadísticas sobre los errores de predicción, definidos por

ei = y i − λ̂i t i (6)

Se incluyen el cuadrado medio del error (CME), el error absoluto medio (MAEA), el error
porcentual absoluto medio (MAPE), el error medio (ME), y el error porcentual medio (MPE).
Estas estadísticas de validación pueden ser comparadas con las estadísticas del modelo
ajustado para determinar qué tan bien el modelo predice las observaciones fuera de los datos
usados para ajustarlo.

El modelo ajustado para los datos del ejemplo es

λˆ = exp(− 3.593 − 0.001407Thickness + 0.06235Extraction − 0.002080 Height − 0.03081Years)

La regresión explica alrededor del 49.5% de la desviación de un modelo con sólo una constante.
El valor de P para un par de variables está por arriba 0.05, indicando que podrían ser removidos
razonablemente del modelo.

© 2006 by StatPoint, Inc. Regresión Poisson - 5


STATGRAPHICS – Rev. 4/25/2007
Opciones de Análisis

• Modelo: orden del modelo a ser ajustado. Los modelos de primer orden incluyen solo efectos
principales. Los modelos de segundo orden incluyen efectos cuadráticos para los factores
cuantitativos e interacciones de dos factores entre todas las variables.

• Incluir Constante: Si no se marca esta opción, el término constante β0 será omitido del
modelo.

• Ajustar: especifica si todas las variables independientes especificadas en caja de diálogo del
ingreso de datos deben ser incluidas en el modelo final, o si se debe aplicar una selección por
pasos de las variables. La selección por pasos intenta encontrar un modelo parsimonioso que
contenga sólo variables significativas estadísticamente. Un ajuste por Selección Hacia
Adelante comienza sin variables en el modelo. Un ajuste por Selección Hacia Atrás comienza
con todas las variables en el modelo.

• P-para-Introducir - En un ajuste por pasos, las variables entrarán al modelo en un paso


dado si sus valores de P son menores o iguales al valor especificado de P-para-Introducir.

• P-para-Eliminar - En un ajuste por pasos, las variables serán removidas del modelo en un
paso dado si sus valores de P son mayores que el valor especificado de P-para-Eliminar.

• Pasos Max.: máximo número de pasos permitidos cuando se lleva a cabo un ajuste por
pasos.

• Mostrar: si se muestran los resultados en cada paso cuando se lleva a cabo un ajuste por
pasos.

• Excluir: Presione este botón para excluir efectos del modelo. Se mostrará una caja de
diálogo:

© 2006 by StatPoint, Inc. Regresión Poisson - 6


STATGRAPHICS – Rev. 4/25/2007

Haga doble clic sobre un efecto para moverlo del campo Incluir al campo Excluir o para
regresarlo.

Ejemplo: Ajuste por Pasos hacia Atrás de un Modelo de Segundo Orden


Para encontrar un predictor parsimonioso pero útil para el número de Fractures (fracturas), se
consideró un modelo de segundo orden. Este modelo agrega términos adicionales que involucran
efectos cuadráticos tales como Thickness2 (grosor2) e interacciones entre cada par de variables,
representadas por productos cruzados tales como Thickness*Extraction (grosor*extracción). Para
evitar que el modelo tuviera muchos términos no significativos, se empleó un enfoque por pasos.
Dos enfoques de ese tipo están disponibles:

• Selección hacia adelante – Comienza con un modelo con sólo un término constante
y mete una variable a la vez con base en su significancia estadística si entrara al
modelo actual. En cada paso, el algoritmo pone en el modelo la variable que tendría
la mayor significancia estadística si entrara. Siempre que la variable más significativa
tenga un valor de P menor o igual al especificado en la caja de diálogo Opciones del
Análisis, será introducida al modelo. Cuando ninguna variable tenga un valor de P lo
suficientemente pequeño, se detiene la selección de variables. Además, las variables
introducidas al modelo al principio del procedimiento pueden ser removidas después
si su valor de P cae dentro del criterio P-para-Eliminar.

• Selección hacia atrás – Comienza con un modelo con todas las variables
especificadas en la caja de diálogo del ingreso de datos y quita una variable a la vez
con base en su significancia estadística en el modelo actual. En cada paso, el
algoritmo saca del modelo la variable que es la menos significativa estadísticamente.
Si la variable menos significativa tiene un valor de P mayor al especificado en la caja
de diálogo Opciones del Análisis, será removida del modelo. Cuando todas las
variables restantes tengan valores pequeños de P, se detiene el procedimiento.
Además, las variables removidas del modelo al principio del procedimiento pueden
ser reintroducidas después si su valor de P alcanza el criterio P-para-Introducir.
© 2006 by StatPoint, Inc. Regresión Poisson - 7
STATGRAPHICS – Rev. 4/25/2007

© 2006 by StatPoint, Inc. Regresión Poisson - 8


STATGRAPHICS – Rev. 4/25/2007
La salida a continuación muestra el resultado de un ajuste por pasos hacia atrás:

Selección de factores por etapas


Método: selección hacia atrás
P-para-introducir: 0.05
P-para-eliminar: 0.05

Paso 0:
14 factores en el modelo. 29 g.l. para el error.
Porcentaje de desviación explicada = 68.75% Porcentaje ajustado = 28.74%

Paso 1:
Eliminando factor Years with P-para-eliminar = 0.931068
13 factores en el modelo. 30 g.l. para el error.
Porcentaje de desviación explicada = 68.74% Porcentaje ajustado = 31.40%

Paso 2:
Eliminando factor Height*Height with P-para-eliminar = 0.667761
12 factores en el modelo. 31 g.l. para el error.
Porcentaje de desviación explicada = 68.49% Porcentaje ajustado = 33.82%

Paso 3:
Eliminando factor Thickness*Thickness with P-para-eliminar = 0.785169
11 factores en el modelo. 32 g.l. para el error.
Porcentaje de desviación explicada = 68.39% Porcentaje ajustado = 36.39%

Paso 4:
Eliminando factor Thickness*Years with P-para-eliminar = 0.847819
10 factores en el modelo. 33 g.l. para el error.
Porcentaje de desviación explicada = 68.35% Porcentaje ajustado = 39.01%

Paso 5:
Eliminando factor Extraction*Years with P-para-eliminar = 0.688459
9 factores en el modelo. 34 g.l. para el error.
Porcentaje de desviación explicada = 68.13% Porcentaje ajustado = 41.46%

Paso 6:
Eliminando factor Height with P-para-eliminar = 0.529659
8 factores en el modelo. 35 g.l. para el error.
Porcentaje de desviación explicada = 67.60% Porcentaje ajustado = 43.60%

Paso 7:
Eliminando factor Extraction*Height with P-para-eliminar = 0.957829
7 factores en el modelo. 36 g.l. para el error.
Porcentaje de desviación explicada = 67.60% Porcentaje ajustado = 46.26%

Paso 8:
Eliminando factor Years*Years with P-para-eliminar = 0.402248
6 factores en el modelo. 37 g.l. para el error.
Porcentaje de desviación explicada = 66.66% Porcentaje ajustado = 47.99%

Paso 9:
Eliminando factor Thickness*Height with P-para-eliminar = 0.39377
5 factores en el modelo. 38 g.l. para el error.
Porcentaje de desviación explicada = 65.69% Porcentaje ajustado = 49.69%

Paso 10:
Eliminando factor Height*Years with P-para-eliminar = 0.0852434
4 factores en el modelo. 39 g.l. para el error.
Porcentaje de desviación explicada = 61.74% Porcentaje ajustado = 48.41%

Modelo final seleccionado.

El algoritmo comenzó con 14 efectos. Después de 10 pasos, el número de efectos in el modelo se


ha reducido a 4. A continuación de muestra un resumen del modelo final:
© 2006 by StatPoint, Inc. Regresión Poisson - 9
STATGRAPHICS – Rev. 4/25/2007

Regresión de Poisson - Fractures


Variable dependiente: Fractures
Factores:
Thickness
Extraction
Height
Years

Modelo Estimado de Regresión (Máxima Verosimilitud)


Error Razón de Momios
Parámetro Estimado Estandar Estimada
CONSTANTE -30.0347 10.7768
Thickness -0.02653 0.0119429 0.973819
Extraction 0.796051 0.278408 2.21677
Thickness*Extraction 0.000294308 0.000136244 1.00029
Extraction^2 -0.00501156 0.0017943 0.995001

Análisis de Desviación
Fuente Desviación Gl Valor-P
Modelo 46.2986 4 0.0000
Residuo 28.6851 39 0.8874
Total (corr.) 74.9837 43

Porcentaje de desviación explicado por el modelo = 61.7449


Porcentaje ajustado = 48.4087

Pruebas de Razón de Verosimilitud


Factor Chi-Cuadrada Gl Valor-P
Thickness 5.68063 1 0.0172
Extraction 9.76634 1 0.0018
Thickness*Extraction 5.23687 1 0.0221
Extraction^2 9.15297 1 0.0025

El modelo final involucra sólo 2 variables: Thickness y Extraction. Contiene efectos principales
para ambas variables, una interacción entre las 2 variables, y un efecto cuadrático para
Extraction. El porcentaje de desviación explicada por el modelo ha aumentado a
aproximadamente 61.7%.

Gráfica del Modelo Ajustado


La Gráfica del Modelo Ajustado muestra la tasa media estimada λˆ ( X ) versus cualquier variable
predictora, manteniendo constantes las otras variables.

© 2006 by StatPoint, Inc. Regresión Poisson - 10


STATGRAPHICS – Rev. 4/25/2007

Gráfica del Modelo Ajustado


con intervalos de confianza del 95.0%
5
Extraction=75.9318
4 Height=56.6364
Fractures Years=7.15909
3

0
0 200 400 600 800 1000
Thickness

Se incluyen en el gráfico los límites de confianza para λ(X).

Opciones de Ventana

• Factor: selecciona el factor a graficar en el eje horizontal.

• Bajo y Alto: especifica el rango de valores para el factor seleccionado.

© 2006 by StatPoint, Inc. Regresión Poisson - 11


STATGRAPHICS – Rev. 4/25/2007
• Mantener: valores en los que se mantendrán fijos los factores no seleccionados.

• Nivel de Confianza: porcentaje usado para los límites de confianza. Poner en 0 para omitir
los límites.

• Siguiente y Atrás: usado para mostrar otros factores cuando hay presentes más de 16.

La tasa estimada de fracturas disminuye de una alta de casi 4.5 a una baja de casi 0 conforme el
grosor (Thickness) de la mina aumenta, en Extraction = 75, Height = 50, y Years = 7.

Observados Versus Predichos


El gráfico Observados versus Predichos muestra los valores observados de Y en el eje vertical y
los valores medios predichos λ̂i t i en el eje horizontal.

Gráfica de Fractures

4
observado

0
0 1 2 3 4 5
predicho

Si el modelo ajusta bien, los puntos deben estar esparcidos aleatoriamente alrededor de la línea
diagonal.

Predicciones
El modelo de regresión ajustado puede usarse para predecir el resultado de nuevas muestras
cuyas variables predictoras son dadas. Por ejemplo, suponga que se desea una predicción para
una mina con Thickness = 100, Extraction = 70, Height = 50, y Years = 10. Se puede agregar una
nueva columna a la hoja de datos con estos valores para las variables predictoras, pero se dejaría
en blanco la entrada para Fractures. Entonces la ventana Predicciones presentaría:

Predicciones para Fractures

Observado Ajustado LC Inferior 95.0% LC Superior 95.0%


Fila para Predicción para Predicción
45 1.24396 0.846319 1.82844

La tabla muestra el valor ajustado λ̂i t i , junto con intervalos de confianza aproximados del 95%.

© 2006 by StatPoint, Inc. Regresión Poisson - 12


STATGRAPHICS – Rev. 4/25/2007
Opciones de Ventana

• Mostrar: muestra Todos los Valores (predicciones para todas las filas en la hoja de datos), o
Sólo Pronósticos (predicciones para las filas con valores faltantes para Y).

• Nivel de Confianza: porcentaje usado para los intervalos de confianza.

Intervalos de Confianza
La ventana Intervalos de Confianza muestra el error de estimación potencial asociado con cada
coeficiente en el modelo, así como para las razones de tasas.

Intervalos de confianza del 95.0% para los estimados de los coeficientes


Error
Parámetro Estimado Estándar Límite Inferior Límite Superior
CONSTANTE -3.59309 1.02567 -5.60336 -1.58282
Thickness -0.00140659 0.000835807 -0.00304474 0.000231567
Extraction 0.0623458 0.012286 0.0382655 0.086426
Height -0.00208034 0.00506612 -0.0120098 0.00784909
Years -0.0308135 0.0162647 -0.0626918 0.00106482

Intervalos de confianza del 95.0% para la razón de tasas


Parámetro Estimado Límite Inferior Límite Superior
Thickness 0.998594 0.99696 1.00023
Extraction 1.06433 1.03901 1.09027
Height 0.997922 0.988062 1.00788
Years 0.969656 0.939233 1.00107

Opciones de Ventana

• Nivel de Confianza: nivel porcentual para los intervalos de confianza.

© 2006 by StatPoint, Inc. Regresión Poisson - 13


STATGRAPHICS – Rev. 4/25/2007
Matriz de Correlación
La Matriz de Correlación muestra estimaciones de la correlación entre los coeficientes
estimados.

Matriz de correlación para los coeficientes estimados


CONSTANTE Thickness Extraction Height Years
CONSTANTE 1.0000 0.1136 -0.9574 -0.3001 0.1207
Thickness 0.1136 1.0000 -0.1719 -0.1968 -0.0934
Extraction -0.9574 -0.1719 1.0000 0.0674 -0.1758
Height -0.3001 -0.1968 0.0674 1.0000 -0.1201
Years 0.1207 -0.0934 -0.1758 -0.1201 1.0000

Esta tabla puede ser útil para determinar que tan bien se han separado unos de otros los efectos
de las variables independientes.

Residuos Atípicos
Una vez que el modelo ha sido ajustado, es útil estudiar los residuos para determinar si existe
algún valor atípico que debiera ser removido de los datos. La ventana Residuos Atípicos lista
todas las observaciones que tienen residuos grandes atípicos.

Residuos Atípicos para Fractures


Y Residuo Residuo de
Fila Y Predicha Residuo Pearson Desviación
4 4.0 1.21777 2.78223 2.52 1.99
29 5.0 1.58135 3.41865 2.72 2.16

La tabla muestra:

• Fila – el número de fila en la hoja de datos.

• Y – el valor observado de Y.

• Y Predicha – el valor ajustado λ̂i t i .

• Residuo – la diferencia entre los valores observado y predico, definido por

ei = y i − λ̂i t i (7)

• Residuo de Pearson – un residuo estandarizado en el cual cada residuo es divido entre


una estimación de su error estándar:

ei
ri = (8)
λ̂i t i

• Residuo de Desviación – un residuo que mide la contribución de cada observación a la


desviación de los residuos:

© 2006 by StatPoint, Inc. Regresión Poisson - 14


STATGRAPHICS – Rev. 4/25/2007
⎧⎪ ⎛ y ⎞ ⎫
d i = sgn(ri ) 2⎨ y i ln⎜ i ⎟ − y i + λˆi t i ⎪⎬ (9)
⎪⎩ ⎜ λˆ t ⎟ ⎪⎭
⎝ ii ⎠

La suma de los residuos de desviación cuadrados es igual a la desviación en el renglón de


Residuos en la tabla del análisis de desviación.

La tabla incluye todas las filas para las cuales el valor absoluto del residual de Pearson es mayor
que 2.0. El presente ejemplo muestra 2 residuos que exceden 2.5, ninguno de los cuales excede
de 3.0.

Gráficas de Residuos
Al igual que con todos los modelos estadísticos, es una buena práctica examinar los residuos. El
procedimiento Regresión Poisson incluye varios tipos de gráficas de residuos, dependiendo de
las Opciones de Ventana.

Diagrama de Dispersión versus Valor Predicho


Este gráfico es útil para visualizar si la variabilidad de los residuos es constante o depende de las
variables predictoras.

Gráfica de Residuos

2.8
Residuos de desviación

1.8

0.8

-0.2

-1.2

-2.2
0 1 2 3 4 5
predicho Fractures

Autocorrelaciones entre Residuos


Este gráfico calcula la autocorrelación entre residuos como una función del número de filas entre
ellos en la hoja de datos.

© 2006 by StatPoint, Inc. Regresión Poisson - 15


STATGRAPHICS – Rev. 4/25/2007

Autocorrelaciones Residuales para Fractures

0.6
autocorrelación

0.2

-0.2

-0.6

-1
0 2 4 6 8 10 12
retraso

Esto sólo es relevante si los datos se colectaron secuencialmente. Cualquier barra extendiéndose
más allá de los límites de probabilidad indicaría dependencia significativa entre residuos
separados por el retraso indicado.

Opciones de Ventana

• Graficar: el tipo de residuos a graficar:

1. Residuos – los valores observados menos los ajustados.


2. Residuos Pearson – los residuos divididos entre sus errores estándar estimados.
3. Residuos de Desviación – residuos escalados de tal forma que la suma de sus
cuadrados es igual a la desviación de los residuos.

© 2006 by StatPoint, Inc. Regresión Poisson - 16


STATGRAPHICS – Rev. 4/25/2007
• Tipo: el tipo del gráfico a crear. Se usa un Diagrama de Dispersión para probar curvatura. Se
emplea una Gráfica de Probabilidad Normal para determinar si los residuos del modelo
provienen de una distribución normal (no se espera normalidad en este procedimiento). Se
usa una Función de Autocorrelación para probar dependencia entre residuos consecutivos.

• Graficar versus: para un Diagrama de Dispersión, la cantidad a graficar en el eje horizontal.

• Número de Retrasos: para una Función de Autocorrelación, el máximo número de retrasos.


Para grupos pequeños de datos, el número de retrasos graficados puede ser menor que este
valor.

• Nivel de Confianza: para una Función de Autocorrelación, el nivel usado para crear los
límites de probabilidad.

Puntos Influyentes
Cuando se ajusta un modelo de regresión, no todas las observaciones tienen la misma influencia
en la estimación de los parámetros del modelo ajustado. Aquellos con valores atípicos de las
variables independientes tienden a tener mayor influencia que los otros. La ventana Puntos
Influyentes presenta cualquier observación que tenga gran influencia en el modelo ajustado:

Puntos Influyentes para Fractures


Fila Leverage
25 0.437161
30 0.367098
Leverage promedio de un solo punto = 0.113636

La tabla muestra todos las observaciones con leverage alto. El punto leverage es una estadística
que mide cuán distante está una observación de la media de las n observaciones en el espacio de
las variables independientes. Entre más grande el leverage, mayor el impacto del punto en los
valore ajustados ŷ. Los puntos son colocados en la lista si el leverage es mayor de tres veces el
de un punto promedio

La observación con el punto leverage mayor en los datos de la muestra es la fila #25, aunque es
sólo alrededor de 4 veces el punto leverage promedio.

Salvar Resultados
Se pueden salvar en la hoja de datos los siguientes resultados:

1. Valores Predichos – los valores ajustados λ̂i t i correspondientes a cada fila de la hoja de
datos.
2. Límites Inferiores – los límites inferiores de confianza para λ̂i t i .
3. Límites Superiores – los límites superiores de confianza para λ̂i t i .
4. Residuos – los residuos ordinarios.
5. Residuos Pearson – los residuos estandarizados de Pearson.
6. Residuos de Desviación – los residuos de desviación.
7. Leverages – los puntos niveladores para cada fila.

© 2006 by StatPoint, Inc. Regresión Poisson - 17


STATGRAPHICS – Rev. 4/25/2007

Cálculos
Sea λi = la tasa estimada en los valores de las variables predictoras en la fila i.

Función de Verosimilitud

L=∏
n
[λi t i ]y i
exp(− λi t i )
(10)
i =1 yi !

Desviación

L( βˆ )
δ ( βˆ ) = (11)
y i i exp(− y i )
n y

∏i =1 yi !

Punto Leverage

{
hi = diag X i′( X ′WX ) X i wi
−1
} (12)

p
h= (13)
n

© 2006 by StatPoint, Inc. Regresión Poisson - 18

También podría gustarte