Documentos de Académico
Documentos de Profesional
Documentos de Cultura
nemos antes en el Modelo Lineal clásico, extraño, pero no es más que una versión
justificando así la ubicación del primero. elegante del mismo procedimiento. Así lo
Seguimos con una comparación entre señalan McCullagh y Nelder (1989)
ambos, Modelo Lineal y Modelo Lineal cuando afirman que la construcción de
Generalizado, terminando con la presen- modelos requiere de una mezcla de arte y
tación de un caso particular de MLG: un conocimientos por parte del investigador.
ejemplo de regresión de Poisson emple- Este proceso se conoce en ciencia como
ando el software R. modelado matemático o modelización
matemática, y cuando los fenómenos a
Ahora bien, para hablar del Modelo explicar son probabilísticos, antes que
Lineal Generalizado debemos explicar determinísticos (como sucede frecuente-
antes el marco natural en el que se desa- mente en las ciencias del comporta-
rrolla, el modelado estadístico, un miento, sociales y de la educación),
entorno que, a diferencia de las aplica- hablamos de modelado estadístico o esto-
ciones más tradicionales centradas en el cástico [1].
contraste de hipótesis y en las pruebas de
significación (ver López-González, 2003), En un sentido amplio, un modelo pre-
se establece a partir de la década de los tende explicar la variación de una res-
60 atendiendo a la estimación de paráme- puesta a partir de la relación conjunta de
tros y a la comparación y ajuste de dos fuentes de variabilidad, una de
modelos de probabilidad a los datos empí- carácter determinista y otra aleatoria, lo
ricos (Ato y López-García, 1996, 80; y Ato que responde a la expresión:
y Vallejo, 2007, 40).
Respuesta = componente sistemático +
Modelado estadístico componente aleatorio.
El empleo de modelos es un proceso
consustancial al ser humano. Para com- Judd y McClelland (1989, 1) toman la
prender lo que sucede a nuestro alre- expresión anterior como: DATOS = MO-
año LXIX, nº 248, enero-abril 2011, 59-80
matriz, la matriz hat (ver López-Gon- tamos en el próximo apartado con una
zález, 1994). En el MLG sucede que el variable de respuesta de recuento, el
componente aleatorio no sigue necesaria- valor esperado µ sólo puede tomar valores
mente una distribución normal sino que enteros iguales o superiores a cero, mien-
utiliza cualquier distribución de la tras que el predictor lineal ŋi puede
familia exponencial y, en consecuencia, adoptar cualquier valor entre – ∞ y + ∞.
las distribuciones de los valores pronosti- Esto hace que el valor esperado y el pre-
cados del criterio no serán normales nece- dictor lineal tengan diferentes escalas de
sariamente (en Wood, 2006, 61 y en medida, precisamente por mediar entre
Faraway, 2006, 120 pueden consultarse ellos dicha función de enlace que termina
las distintas distribuciones de la familia transformando el valor de recuento espe-
exponencial). rado a la escala del predictor lineal:
g( µi ) = ŋi. La inversa de la función de
(c) Las distribuciones condicionadas enlace (o función de transformación) rea-
de los valores pronosticados de la variable liza el proceso contrario, y al ser aplicada
de respuesta en el ML deben ser homos- al resultado del predictor lineal ŋi (que
cedásticas, y ello es posible siempre que se halla en una escala de – ∞ y + ∞) se
esta condición se cumpla en el compo- obtiene el valor esperado, µ que se
nente aleatorio. Como en el MLG los encuentra en la escala de la variable de
errores pueden seguir cualquier distribu- respuesta (Ato y cols., 2005, 8):
ción de la familia exponencial, resulta µi = g–1(ß0 + ß0Xi).
que para la distribución de los errores la
homoscedasticidad no es imprescindible. Regresión de Poisson con R
La regresión de Poisson es el modelo
(d) Las diferencias expresadas hasta más básico adecuado para variables de
ahora obligan a estimar los parámetros respuesta de recuento (Long, 1997, 217),
de un MLG con un método de ajuste dis- aunque existen también otras opciones
tinto al procedimiento de mínimos cua- dentro del Modelo Lineal Generalizado
año LXIX, nº 248, enero-abril 2011, 59-80
drados que se emplea en el ML: el método que pueden adaptarse bien, como el
de máxima verosimilitud (que también modelo de regresión binomial negativa revista española de pedagogía
puede ser aplicado en el ML). (ver Hilbe, 2007), el modelo de regresión
truncada y los modelos de conteo modifi-
Destacamos en el Modelo Lineal cados a cero.
Generalizado, por tanto, el protagonismo
de ese tercer elemento que relaciona los Inicialmente la distribución de
componentes aleatorio y sistemático, es Poisson comenzó a aplicarse en el estudio
decir, el valor esperado y el valor predicho de conductas criminales, pero ya desde
por el modelo: nos referimos a la función finales del siglo pasado pasó a ser un
de enlace g( µ) (un estudio detallado de la modelo frecuente en ámbitos como la bio-
naturaleza de la función de enlace se estadística, la econometría y el marketing
encuentra en Krzanowski, 1998, 168). (Cameron y Tribedi, 1998, 94), así como
Así, por ejemplo, para el caso que presen- en diversas áreas aplicadas: criminología,
67
Emelina LÓPEZ-GONZÁLEZ y Marcos RUIZ-SOLER
flictos o faltas de disciplina que han que- función se encuentra dentro del MLG, así
dado registrados en los centros durante que podemos especificar el siguiente
revista española de pedagogía
un periodo de trece años, desde 1990 a modelo: log(µi) = log(y ) + δXi = ß0 + ß1Xi).
68
Análisis de datos con el Modelo Lineal Generalizado. Una aplicación con R
69
Emelina LÓPEZ-GONZÁLEZ y Marcos RUIZ-SOLER
70
Análisis de datos con el Modelo Lineal Generalizado. Una aplicación con R
el modelo 1 -m1-, de forma que: – 0,02135Xi2 ) año LXIX, nº 248, enero-abril 2011, 59-80
revista española de pedagogía
log(µi) = ß0 + ß1Xi + ß2Xi2 Al evaluar el nuevo modelo m1 se
aprecian cambios importantes en el Grá-
µi = exp (ß0 + ß1Xi + ß2Xi2). fico 3: los residuos manifiestan ahora una
tendencia a la media en el gráfico de resi-
Siguiendo los resultados de la Tabla 5 duos frente a pronósticos, luego la condi-
sustituimos en las expresiones anteriores ción de independencia de los errores
los coeficientes, quedando ahora los parece cumplirse. Igualmente, la disper-
modelos aditivo y multiplicativo del sión vertical de los residuos es razonable-
modelo 1 en términos muestrales del mente pequeña y la influencia del caso 13
siguiente modo: se ha reducido. Los resultados de la Tabla
5 reflejan que el modelo m1 se ajusta
log(mi) = 1,9014 + 0,5566 Xi – 0,02135 Xi2 mejor a los datos: la discrepancia residual
71
Emelina LÓPEZ-GONZÁLEZ y Marcos RUIZ-SOLER
72
Actividades Evaluación del desempeño docente
73
Emelina LÓPEZ-GONZÁLEZ y Marcos RUIZ-SOLER
se ajusta mejor al número de Conflictos Dm0 – Dm1 (Tabla 6). ∆D sigue una distri-
observados que el modelo m0. bución asintótica Chi cuadrado y evalúa
si la inclusión de los términos del modelo
Esta conclusión puede reforzarse m1 reduce significativamente el valor de
empleando el test de la razón de verosimi- discrepancia con respecto al modelo m0.
litud generalizado (Faraway, 2006, 120) Como se obtiene un valor de p mínimo
que compara las discrepancias que se pro- (Tabla 6) se puede afirmar que, efectiva-
ducen en ambos modelos, tal que: ∆D = mente, m1 tiene una influencia significa-
TABLA 6: Resultados del test de razón de verosimilitudes entre m0 y m1
de transformar los valores de los paráme- 3), las características de una variable de
tros para obtener su valor en la escala ori- respuesta de recuento son tales que si
ginal de la variable de respuesta, habría para su ajuste se emplea un Modelo
que estimar sus intervalos de confianza y Lineal con función de enlace identidad,
ser interpretados en términos de efectos las estimaciones resultantes son inefi-
simples (particularmente en caso de exis- cientes, inconsistentes y sesgadas,
tencia de interacción), finalizando con el aunque, y esto es lo delicado, pueden ser
cálculo del intervalo de predicción de los de magnitud y significación similares a
valores de la variable de respuesta. las obtenidas por la regresión de Poisson.
No podemos eludir, por tanto, el exten-
Siguiendo con nuestro objetivo de dido e incorrecto uso del ML clásico en el
animar al empleo del MLG en las situa- ámbito de las ciencias humanas en
74
Análisis de datos con el Modelo Lineal Generalizado. Una aplicación con R
(Tabla 8). El gráfico de residuos frente a media, con lo que no se cumple la inde-
valores ajustados refleja de nuevo una pendencia de los errores, como también
falta de ajuste de los residuos a la ocurría con el modelo m0 (Grafico 7).
76
Análisis de datos con el Modelo Lineal Generalizado. Una aplicación con R
77
Emelina LÓPEZ-GONZÁLEZ y Marcos RUIZ-SOLER
Dirección para la correspondencia: Emelina López CAMERON, A. y TRIVEDI, P. (1998) Regression Analysis of
González. Departamento de Métodos de Investigación e Count Data (Cambridge, Cambridge University Press).
Innovación Educativa. Facultad de Ciencias de la
Educación. Campus de Teatinos. 29071 Málaga. E-mail: CRAWLEY, M. J. (2007) The R Book (Chichester, Wiley &
emelopez@uma.es Sons, Ltd).
78
Análisis de datos con el Modelo Lineal Generalizado. Una aplicación con R
DRAPER, N. y SMITH, H. (1998) Applied Regression Analysis LÓPEZ-GONZÁLEZ, E.; RUIZ-SOLER, M. y PELEGRINA, M.
(3 ed.) (New York, Wiley). (2002) Estimación de parámetros en el Modelo Lineal
General y en los Modelos Lineales Generalizados. Dife-
DOBSON, A. J. y BARNETT, A. (2008) An Introduction to Gene- rencias e interpretación, Metodología de las Ciencias
ralized Linear Models (3ª ed.) (Boca Raton, FL., del Comportamiento, vol. especial, pp. 341-345.
Chapman and Hall/CRC).
LOSILLA, J. L.; NAVARRO, J. B.; PALMER, A.; RODRIGO, M. y
FARAWAY, J. J. (2004) Linear Models with R (Boca Raton, FL., ATO, M. (2005) Del contraste de hipótesis al modelado
Chapman & Hall/CRC). estadístico (Girona, EAP).
FARAWAY, J. J. (2006) Extending the Linear Model with R. Gene- LUNNENBORG, C. E. (1994) Modelling Experimental and
ralized Linear, Mixed Effects and Nonparametric Regres- Observational Data (California, Duxbury).
sion Models (Boca Raton, FL., Chapman & Hall/CRC).
MAXWELL, S. E. y DELANEY, H. D. (2004) Designing Experi-
FOX, J. (1997) Applied Regression Analysis, Linear Models ments and Analyzing Data. A Model Comparison Pers-
and Related Methods (Thousand Oaks, Sage). pective (2ª ed.) (Hillsdale, Lawrence Erlbaum Associates).
FOX, J. (2002) An R and S-PLUS Companion to Applied McCLELLAND, G. H. (1997) Optimal Design in Psychological
Regression (Thousand Oaks, Sage). Research, Psychological Methods, 2:1, pp. 3-19.
HILBE, J. M. (2007) Negative Binomial Regression (Cam- MCCULLAGH, P. y NELDER, J. (1989) Generalized Linear
bridge, Cambridge University Press). Models (2 ed.) (London, Chapman & Hall).
HOCKING, R. R. (1985) The Analysis of Linear Models (Mon- NELDER, J. y WEDDERBURN, R. (1972) Generalized Linear
terey, CA, Brooks/Cole). Models, Journal of the Royal Statistical Society (A), 135,
pp. 370-384.
HORTON, R. L. (1985) The General Linear Model: Data
Analysis in the Social and Behavioural Sciences. NETER, J.; KUTNER, M. H.; NACHTSHEIM, C. J. y WAS-
(Reprinted. Malabar, FL., Robert E. Krieger). SERMAN, W. (1996) Applied Linear Statistical Models
(4ª ed.) (Chicago, Irwin).
HUTCHESON, G. y SOFRONIOU, N. (1999). The Multivariate
Social Scientist: Introductory Statistics Using Genera- PEDHAZUR, E. J. (1997) Multiple Regression in Behavioural
lized Linear Models (London, Sage). Research: Explanation and Prediction (3ª ed.) (New
York, Holt, Rinehart & Winston).
JUDD, C. M. y McCLELLAND, G. H. (1989) Data Analysis. A
79
Emelina LÓPEZ-GONZÁLEZ y Marcos RUIZ-SOLER
VAN DER GEER, J. P. (1993) Multivariate Analysis of Catego- Poisson, modelado estadístico, R.
rical Data: Applications (Newbury Park, CA, Sage).
Summary:
VENABLES, W. N. y RIPLEY, B. D. (2003) Modern Applied Sta-
tistics with S (4ª ed.) (New York, Springer-Verlag). Data analysis from the Generalized
WEISBERG, S. (2005) Applied Linear Regression (3 ed.) (New
Linear Model approach: an applica-
tion using R
To use mathematical models in order
York, Wiley).
80