Documentos de Académico
Documentos de Profesional
Documentos de Cultura
IBM SPSS Advanced Statistics
IBM SPSS Advanced Statistics
Nota: Antes de utilizar esta informacin y el producto que admite, lea la informacin general
en Avisos el p. 174.
Esta edicin se aplica a IBM SPSS Statistics 21 y a todas las versiones y modificaciones
posteriores hasta que se indique lo contrario en nuevas ediciones.
Capturas de pantalla de productos de Adobe reimpresas con permiso de Adobe Systems
Incorporated.
Capturas de pantalla de productos de Microsoft reimpresas con permiso de Microsoft Corporation.
Materiales bajo licencia: Propiedad de IBM
Copyright IBM Corporation 1989, 2012.
Derechos restringidos para los usuarios del gobierno de Estados Unidos: Uso, duplicacin o
revelacin restringidos por GSA ADP Schedule Contract con IBM Corp.
Prefacio
IBM SPSS Statistics es un sistema global para el anlisis de datos. El mdulo adicional
opcional Estadsticas avanzadas proporciona las tcnicas de anlisis adicionales que se describen
en este manual. El mdulo adicional Estadsticas avanzadas se debe utilizar con el sistema bsico
de SPSS Statistics y est completamente integrado en dicho sistema.
Asistencia tcnica
El servicio de asistencia tcnica est a disposicin de todos los clientes de mantenimiento. Los
clientes podrn ponerse en contacto con este servicio de asistencia tcnica si desean recibir ayuda
sobre la utilizacin de los productos de IBM Corp. o sobre la instalacin en alguno de los entornos
de hardware admitidos. Para contactar con el servicio de asistencia tcnica, visite el sitio Web de
IBM Corp. en http://www.ibm.com/support. Tenga a mano su identificacin, la de su organizacin
y su contrato de asistencia cuando solicite ayuda.
iii
Cursos de preparacin
IBM Corp. ofrece cursos de preparacin, tanto pblicos como in situ. Todos los
cursos incluyen talleres prcticos. Los cursos tendrn lugar peridicamente en
las principales ciudades. Si desea ms informacin sobre estos seminarios, visite
http://www.ibm.com/software/analytics/spss/training.
iv
Contenido
1
15
30
36
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
40
41
41
42
49
72
vi
99
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
..
..
..
118
119
120
121
122
123
125
126
127
127
129
vii
133
139
12 Tablas de mortalidad
145
150
viii
156
163
Apndices
A Esquemas de codificacin de variables categricas
165
Desviacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Helmert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Diferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Polinmico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Repetido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Indicador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
B Estructuras de covarianza
170
C Avisos
174
ndice
177
ix
Captulo
MLG Multivariado ampla el modelo lineal general que proporciona MLG Univariado al
permitir varias variables dependientes. Una extensin adicional, GLM Medidas repetidas,
permite las medidas repetidas de varias variables dependientes.
Los modelos mixtos lineales amplan el modelo lineal general de manera que los datos puedan
presentar variabilidad correlacionada y no constante. El modelo lineal mixto proporciona, por
tanto, la flexibilidad necesaria para modelar no slo las medias sino tambin las varianzas y
covarianzas de los datos.
Los modelos lineales generalizados (GZLM) relajan el supuesto de normalidad del trmino
de error y slo requieren que la variable dependiente est relacionada linealmente con los
predictores mediante una transformacin o funcin de enlace. Las ecuaciones de estimacin
generalizada (GEE) ampla GZLM para permitir medidas repetidas.
El anlisis loglineal logit le permite ajustar modelos loglineales para analizar la relacin
existente entre una variable dependiente categrica y uno o ms predictores categricos.
Captulo
brillo y opacidad. Se prueban dos tasas de extrusin y dos cantidades diferentes de aditivo y se
miden las tres propiedades para cada combinacin de tasa de extrusin y cantidad de aditivo. El
fabricante deduce que la tasa de extrusin y la cantidad de aditivo producen individualmente
resultados significativos, pero que la interaccin de los dos factores no es significativa.
Copyright IBM Corporation 1989, 2012.
3
Anlisis MLG multivariante
Mtodos. Las sumas de cuadrados de Tipo I, Tipo II, Tipo III y Tipo IV pueden emplearse para
(interaccin).
Datos. Las variables dependientes deben ser cuantitativas. Los factores son categricos y pueden
tener valores numricos o valores de cadena. Las covariables son variables cuantitativas que
estn relacionadas con la variable dependiente.
Supuestos. Para las variables dependientes, los datos son una muestra aleatoria de vectores de una
de realizar un anlisis de varianza. Para una variable dependiente nica, utilice MLG Factorial
General. Si ha medido las mismas variables dependientes en varias ocasiones para cada sujeto,
utilice MLG Medidas repetidas.
Para obtener un anlisis de varianza MLG multivariante
E Seleccione en los mens:
Analizar > Modelo lineal general > Multivariante...
4
Captulo 2
Figura 2-1
Cuadro de dilogo Multivariante
5
Anlisis MLG multivariante
Especificar modelo. Un modelo factorial completo contiene todos los efectos principales del
factor, todos los efectos principales de las covariables y todas las interacciones factor por factor.
No contiene interacciones de covariable. Seleccione Personalizado para especificar slo un
subconjunto de interacciones o para especificar interacciones factor por covariable. Indique todos
los trminos que desee incluir en el modelo.
Factores y Covariables.Muestra una lista de los factores y las covariables.
Modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar Personalizado,
puede elegir los efectos principales y las interacciones que sean de inters para el anlisis.
Suma de cuadrados Determina el mtodo para calcular las sumas de cuadrados. Para los modelos
equilibrados y no equilibrados sin casillas perdidas, el mtodo ms utilizado para la suma de
cuadrados es el Tipo III.
Incluir la interseccin en el modelo. La interseccin se incluye normalmente en el modelo. Si
supone que los datos pasan por el origen, puede excluir la interseccin.
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
Suma de cuadrados
Para el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y
es el tipo por defecto.
Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica de la suma
de cuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El
mtodo Tipo I para la obtencin de sumas de cuadrados se utiliza normalmente para:
6
Captulo 2
Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro
del segundo efecto especificado, el segundo efecto especificado est anidado dentro del
tercero, y as sucesivamente. Esta forma de anidamiento solamente puede especificarse
utilizando la sintaxis.
Tipo II. Este mtodo calcula cada suma de cuadrados del modelo considerando slo los efectos
pertinentes. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el
que se est examinando. El mtodo Tipo II para la obtencin de sumas de cuadrados se utiliza
normalmente para:
Tipo III. Es el mtodo por defecto. Este mtodo calcula las sumas de cuadrados de un efecto
del diseo como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo
contenga y ortogonales a cualquier efecto (si existe) que lo contenga. Las sumas de cuadrados de
Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre
que la forma general de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados
se suele considerar de gran utilidad para un modelo no equilibrado sin casillas perdidas. En un
diseo factorial sin casillas perdidas, este mtodo equivale a la tcnica de cuadrados ponderados
de las medias de Yates. El mtodo Tipo III para la obtencin de sumas de cuadrados se utiliza
normalmente para:
Tipo IV. Este mtodo est diseado para una situacin en la que hay casillas perdidas. Para
cualquier efecto F en el diseo, si F no est contenida en cualquier otro efecto, entonces Tipo IV =
Tipo III = Tipo II. Cuando F est contenida en otros efectos, el Tipo IV distribuye equitativamente
los contrastes que se realizan entre los parmetros en F a todos los efectos de nivel superior. El
mtodo Tipo IV para la obtencin de sumas de cuadrados se utiliza normalmente para:
7
Anlisis MLG multivariante
Los contrastes se utilizan para comprobar si los niveles de un efecto son significativamente
diferentes unos de otros. Puede especificar un contraste para cada factor del modelo. Los
contrastes representan las combinaciones lineales de los parmetros.
El contraste de hiptesis se basa en la hiptesis nula LBM = 0, donde L es la matriz de
coeficientes de contraste, M es la matriz identidad (que tiene una dimensin igual al nmero de
variables dependientes) y B es el vector de parmetros. Cuando se especifica un contraste, se crea
una matriz L de modo que las columnas correspondientes al factor coincidan con el contraste. El
resto de las columnas se corrigen para que la matriz L sea estimable.
Se ofrecen la prueba univariada que utiliza los estadsticos F y los intervalos de confianza
simultneos de tipo Bonferroni, basados en la distribucin t de Student para las diferencias de
contraste en todas las variables dependientes. Tambin se ofrecen las pruebas multivariadas que
utilizan los criterios de la traza de Pillai, la lambda de Wilks, la traza de Hotelling y la mayor
raz de Roy.
Los contrastes disponibles son de desviacin, simples, de diferencias, de Helmert, repetidos y
polinmicos. En los contrastes de desviacin y los contrastes simples, es posible determinar que
la categora de referencia sea la primera o la ltima categora.
Tipos de contrastes
Desviacin. Compara la media de cada nivel (excepto una categora de referencia) con la media de
todos los niveles (media global). Los niveles del factor pueden colocarse en cualquier orden.
Simple. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de
contraste resulta til cuando existe un grupo de control. Puede seleccionar la primera o la ltima
categora como referencia.
Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles
niveles siguientes.
8
Captulo 2
Repetidas. Compara la media de cada nivel (excepto el ltimo) con la media del nivel siguiente.
Polinmico. Compara el efecto lineal, cuadrtico, cbico, etc. El primer grado de libertad contiene
el efecto lineal a travs de todas las categoras; el segundo grado de libertad, el efecto cuadrtico, y
as sucesivamente. Estos contrastes se utilizan a menudo para estimar las tendencias polinmicas.
Los grficos de perfil (grficos de interaccin) sirven para comparar las medias marginales en el
modelo. Un grfico de perfil es un grfico de lneas en el que cada punto indica la media marginal
estimada de una variable dependiente (corregida respecto a las covariables) en un nivel de un
factor. Los niveles de un segundo factor se pueden utilizar para generar lneas diferentes. Cada
nivel en un tercer factor se puede utilizar para crear un grfico diferente. Todos los factores estn
disponibles para los grficos. Los grficos de perfil se crean para cada variable dependiente.
Un grfico de perfil de un factor muestra si las medias marginales estimadas aumentan o
disminuyen a travs de los niveles. Para dos o ms factores, las lneas paralelas indican que no
existe interaccin entre los factores, lo que significa que puede investigar los niveles de un nico
factor. Las lneas no paralelas indican una interaccin.
Figura 2-5
Grfico no paralelo (izquierda) y grfico paralelo (derecha)
9
Anlisis MLG multivariante
Despus de especificar un grfico mediante la seleccin de los factores del eje horizontal y, de
manera opcional, los factores para distintas lneas y grficos, el grfico deber aadirse a la
lista de grficos.
Pruebas de comparaciones mltiples post hoc Una vez que se ha determinado que existen
diferencias entre las medias, las pruebas de rango post hoc y las comparaciones mltiples por
parejas permiten determinar qu medias difieren. Las comparaciones se realizan sobre valores sin
corregir. Las pruebas post hoc se realizan por separado para cada variable dependiente.
Las pruebas de diferencia honestamente significativa de Tukey y de Bonferroni son pruebas de
comparacin mltiple muy utilizadas. La prueba de Bonferroni, basada en el estadstico t de
Student, corrige el nivel de significacin observado por el hecho de que se realizan comparaciones
mltiples. La prueba t de Sidak tambin corrige el nivel de significacin y da lugar a lmites ms
estrechos que los de Bonferroni. La prueba de diferencia honestamente significativa de Tukey
utiliza el estadstico del rango estudentizado para realizar todas las comparaciones por pares entre
los grupos y establece la tasa de error por experimento como la tasa de error para el conjunto de
todas las comparaciones por pares. Cuando se contrasta un gran nmero de pares de medias, la
prueba de la diferencia honestamente significativa de Tukey es ms potente que la prueba de
Bonferroni. Para un nmero reducido de pares, Bonferroni es ms potente.
GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de
Tukey, pero se utiliza el mdulo mximo estudentizado. La prueba de Tukey suele ser ms
potente. La prueba de comparacin por parejas de Gabriel tambin utiliza el mdulo mximo
estudentizado y es generalmente ms potente que la GT2 de Hochberg cuando los tamaos de las
10
Captulo 2
casillas son desiguales. La prueba de Gabriel se puede convertir en liberal cuando los tamaos de
las casillas varan mucho.
La prueba t de comparacin mltiple por parejas de Dunnett compara un conjunto de
tratamientos con una media de control simple. La ltima categora es la categora de control por
defecto. Si lo desea, puede seleccionar la primera categora. Asimismo, puede elegir una prueba
unilateral o bilateral. Para comprobar que la media de cualquier nivel del factor (excepto la
categora de control) no es igual a la de la categora de control, utilice una prueba bilateral. Para
contrastar si la media en cualquier nivel del factor es menor que la de la categora de control,
seleccione < Control. Asimismo, para contrastar si la media en cualquier nivel del factor es mayor
que la de la categora de control, seleccione > Control.
Ryan, Einot, Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos mltiples por
pasos. Los procedimientos mltiples por pasos (por tamao de las distancias) contrastan en
primer lugar si todas las medias son iguales. Si no son iguales, se contrasta la igualdad en los
subconjuntos de medias. R-E-G-W F se basa en una prueba F y R-E-G-W Q se basa en un rango
estudentizado. Estas pruebas son ms potentes que la prueba de rangos mltiples de Duncan
y Student-Newman-Keuls (que tambin son procedimientos mltiples por pasos), pero no se
recomiendan para tamaos de casillas desiguales.
Cuando las varianzas son desiguales, utilice T2 de Tamhane (prueba conservadora de
comparacin por parejas basada en una prueba t), T3 de Dunnett (prueba de comparacin
por parejas basada en el mdulo mximo estudentizado), prueba de comparacin por
parejasGames-Howell (a veces liberal), o C de Dunnett (prueba de comparacin por parejas
basada en el rango estudentizado).
La prueba de rango mltiple de Duncan, Student-Newman-Keuls (S-N-K) y b de Tukey
son pruebas de rango que asignan rangos a medias de grupo y calculan un valor de rango. Estas
pruebas no se utilizan con la misma frecuencia que las pruebas anteriormente mencionadas.
La prueba t de Waller-Duncan utiliza la aproximacin bayesiana. Esta prueba de rango
emplea la media armnica del tamao muestral cuando los tamaos muestrales no son iguales.
El nivel de significacin de la prueba de Scheff est diseado para permitir todas las
combinaciones lineales posibles de las medias de grupo que se van a contrastar, no slo las
comparaciones por parejas disponibles en esta funcin. El resultado es que la prueba de Scheff
es normalmente ms conservadora que otras pruebas, lo que significa que se precisa una mayor
diferencia entre las medias para la significacin.
La prueba de comparacin mltiple por parejas de la diferencia menos significativa (DMS)
es equivalente a varias pruebas t individuales entre todos los pares de grupos. La desventaja
de esta prueba es que no se realiza ningn intento de corregir el nivel crtico para realizar las
comparaciones mltiples.
Pruebas mostradas. Se proporcionan comparaciones por parejas para DMS, Sidak, Bonferroni,
Games-Howell, T2 y T3 de Tamhane, C de Dunnett y T3 de Dunnett. Tambin se facilitan
subconjuntos homogneos para S-N-K, b de Tukey, Duncan, R-E-G-W F, R-E-G-W Q y Waller.
La prueba de la diferencia honestamente significativa de Tukey, la GT2 de Hochberg, la prueba de
Gabriel y la prueba de Scheff son pruebas de comparaciones mltiples y pruebas de rango.
11
Anlisis MLG multivariante
MLG: Guardar
Figura 2-7
Cuadro de dilogo Guardar
Es posible guardar los valores pronosticados por el modelo, los residuos y las medidas
relacionadas como variables nuevas en el Editor de datos. Muchas de estas variables se pueden
utilizar para examinar supuestos sobre los datos. Si desea almacenar los valores para utilizarlos en
otra sesin de IBM SPSS Statistics, gurdelos en el archivo de datos actual.
Valores pronosticados. Son los valores que predice el modelo para cada caso.
Error tpico. Estimacin de la desviacin tpica del valor promedio de la variable dependiente
para los casos que tengan los mismos valores en las variables independientes.
Diagnsticos. Son medidas para identificar casos con combinaciones poco usuales de valores para
los casos y las variables independientes que puedan tener un gran impacto en el modelo.
Distancia de Cook. Una medida de cunto cambiaran los residuos de todos los casos si un
caso particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de
Cook grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin
har variar substancialmente los coeficientes.
12
Captulo 2
Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados,
que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen
una media de 0 y una desviacin tpica de 1.
Mtodo de Student. Residuo dividido por una estimacin de su desviacin tpica que vara
de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables
independientes respecto a las medias en las variables independientes.
Eliminados. Residuo para un caso cuando ste se excluye del clculo de los coeficientes de
de los parmetros del modelo en un nuevo conjunto de datos de la sesin actual o un archivo
de datos externo de SPSS Statistics. Asimismo, para cada variable dependiente habr una fila
de estimaciones de los parmetros, una fila de valores de significacin para los estadsticos t
correspondientes a las estimaciones de los parmetros y una fila de grados de libertad de los
residuos. En un modelo multivariante, existen filas similares para cada variable dependiente. Si lo
desea, puede usar este archivo matricial en otros procedimientos que lean archivos matriciales.
13
Anlisis MLG multivariante
Este cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se calculan utilizando
un modelo de efectos fijos.
Medias marginales estimadas. Seleccione los factores e interacciones para los que desee obtener
estimaciones de las medias marginales de la poblacin en las casillas. Estas medias se corrigen
respecto a las covariables, si las hay. Las interacciones slo estn disponibles si se ha especificado
un modelo personalizado.
Comparar los efectos principales. Proporciona comparaciones por parejas no corregidas entre
las medias marginales estimadas para cualquier efecto principal del modelo, tanto para los
factores inter-sujetos como para los intra-sujetos. Este elemento slo se encuentra disponible
si los efectos principales estn seleccionados en la lista Mostrar las medias para.
(DMS), Bonferroni o Sidak para los intervalos de confianza y la significacin. Este elemento
slo estar disponible si se selecciona Comparar los efectos principales.
Mostrar. Seleccione Estadsticos descriptivos para generar medias observadas, desviaciones tpicas
y frecuencias para cada variable dependiente en todas las casillas. La opcin Estimaciones del
tamao del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimacin de
parmetros. El estadstico eta cuadrado describe la proporcin de variabilidad total atribuible a un
factor. Seleccione Potencia observada para obtener la potencia de la prueba cuando la hiptesis
alternativa se ha establecido basndose en el valor observado. Seleccione Estimaciones de los
parmetros para generar las estimaciones de los parmetros, los errores tpicos, las pruebas t, los
intervalos de confianza y la potencia observada para cada prueba. Se pueden mostrar Matrices
SCPC de error y de hiptesis y la Matriz SCPC residual ms la prueba de esfericidad de Bartlett de
la matriz de covarianzas residual.
Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene
para cada variable dependiente en todas las combinaciones de nivel de los factores inter-sujetos
slo para factores inter-sujetos. Asimismo, las pruebas de homogeneidad incluyen la prueba M de
Box sobre la homogeneidad de las matrices de covarianza de las variables dependientes a lo largo
de todas las combinaciones de niveles de los factores inter-sujetos. Las opciones de diagramas
de dispersin por nivel y grfico de los residuos son tiles para comprobar los supuestos sobre
los datos. Estos elementos no estarn activado si no hay factores. Seleccione Grficos de los
residuos para generar un grfico de los residuos observados respecto a los pronosticados respecto
a los tipificados para cada variable dependiente. Estos grficos son tiles para investigar el
supuesto de varianzas iguales. Seleccione la Prueba de falta de ajuste para comprobar si el modelo
puede describir de forma adecuada la relacin entre la variable dependiente y las variables
independientes. La funcin estimable general permite construir pruebas de hiptesis personales
basadas en la funcin estimable general. Las filas en las matrices de coeficientes de contraste son
combinaciones lineales de la funcin estimable general.
Nivel de significacin. Puede que le interese corregir el nivel de significacin usado en las pruebas
post hoc y el nivel de confianza empleado para construir intervalos de confianza. El valor
especificado tambin se utiliza para calcular la potencia observada para la prueba. Si especifica
un nivel de significacin, el cuadro de dilogo mostrar el nivel asociado de los intervalos de
confianza.
14
Captulo 2
Especificar contrastes de los efectos respecto a una combinacin lineal de efectos o un valor
(utilizando el subcomando TEST).
Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING).
Construir una matrizL, una matriz M o una matriz K (utilizando los subcomandos LMATRIX,
MMATRIX o KMATRIX).
Especificar trminos de error para las comparaciones post hoc (utilizando el subcomando
POSTHOC).
Calcular medias marginales estimadas para cualquier factor o interaccin entre los factores
en la lista de factores (utilizando el subcomando EMMEANS).
Captulo
15
16
Captulo 3
cuatro niveles para cada uno de los cuatro ensayos. Se descubre que el efecto de los ensayos es
significativo, mientras que la interaccin ensayo-ansiedad no es significativa.
Mtodos. Las sumas de cuadrados de Tipo I, Tipo II, Tipo III y Tipo IV pueden emplearse para
(interaccin).
Datos. Las variables dependientes deben ser cuantitativas. Los factores inter-sujetos dividen la
muestra en subgrupos discretos, como hombre y mujer. Estos factores son categricos y pueden
tener valores numricos o valores de cadena. Los factores intra-sujetos se definen en el cuadro de
dilogo MLG Medidas repetidas: Definir factores. Las covariables son variables cuantitativas
que estn relacionadas con la variable dependiente. Para un anlisis de medidas repetidas, las
covariables debern permanecer constantes en cada nivel de la variable intra-sujetos.
El archivo de datos debe contener un conjunto de variables para cada grupo de medidas
tomadas a los sujetos. El conjunto tiene una variable para cada repeticin de la medida dentro del
grupo. Se define un factor intra-sujetos para el grupo con el nmero de niveles igual al nmero de
repeticiones. Por ejemplo, se podran tomar medidas del peso en das diferentes. Si las medidas de
esa misma propiedad se han tomado durante cinco das, el factor intra-sujetos podra especificarse
como da con cinco niveles.
Para mltiples factores intra-sujetos, el nmero de medidas de cada sujeto es igual al producto
del nmero de niveles de cada factor. Por ejemplo, si las mediciones se tomaran en tres momentos
diferentes del da durante cuatro das, el nmero total de medidas sera 12 para cada sujeto. Los
factores intra-sujetos podran especificarse como da(4) y mediciones(3).
Supuestos. Un anlisis de medidas repetidas se puede enfocar de dos formas: univariado y
multivariado.
El enfoque univariado (tambin conocido como el mtodo de modelo mixto o split-plot)
considera las variables dependientes como respuestas a los niveles de los factores intra-sujetos.
Las medidas en un sujeto deben ser una muestra de una distribucin normal multivariada y las
matrices de varianzas-covarianzas son las mismas en todas las casillas formadas por los efectos
inter-sujetos. Se realizan ciertos supuestos sobre la matriz de varianzas-covarianzas de las
variables dependientes. La validez del estadstico F utilizado en el enfoque univariado puede
garantizarse si la matriz de varianzas-covarianzas es de forma circular (Huynh y Mandeville,
1979).
Para contrastar este supuesto se puede utilizar la prueba de esfericidad de Mauchly, que realiza
una prueba de esfericidad sobre la matriz de varianzas-covarianzas de la variable dependiente
transformada y ortonormalizada. La prueba de Mauchly aparece automticamente en el anlisis
17
MLG Medidas repetidas
de medidas repetidas. En las muestras de tamao reducido, esta prueba no resulta muy potente.
En las de gran tamao, la prueba puede ser significativa incluso si es pequeo el impacto de
la desviacin en los resultados. Si la significacin de la prueba es grande, se puede asumir la
hiptesis de esfericidad. Sin embargo, si la significacin es pequea y parece que se ha violado el
supuesto de esfericidad, se puede realizar una correccin en los grados de libertad del numerador
y del denominador para validar el estadstico F univariado. Se encuentran disponibles tres
estimaciones para dicha correccin, denominada psilon, en el procedimiento MLG Medidas
repetidas. Los grados de libertad tanto del numerador como del denominador deben multiplicarse
por psilon y la significacin del cociente F debe evaluarse con los nuevos grados de libertad.
El enfoque multivariado considera que las medidas de un sujeto son una muestra de una
distribucin normal multivariada y las matrices de varianzas-covarianzas son las mismas en
todas las casillas formadas por los efectos inter-sujetos. Para contrastar si las matrices de
varianzas-covarianzas de todas las casillas son las mismas, se puede utilizar la prueba M de Box.
Procedimientos relacionados. Utilice el procedimiento Explorar para examinar los datos antes de
realizar un anlisis de varianza. Si no existen medidas repetidas para cada sujeto, utilice MLG
Univariante o MLG Multivariante. Si slo existen dos medidas para cada sujeto (por ejemplo, un
pre-test y un post-test) y no hay factores inter-sujetos, puede utilizar el procedimiento Prueba T
para muestras relacionadas.
Obtencin de MLG Medidas repetidas
E Elija en los mens:
Analizar > Modelo lineal general > Medidas repetidas...
Figura 3-1
Cuadro de dilogo MLG Medidas repetidas: Definir factores
18
Captulo 3
E Repita estos pasos para cada factor intra-sujetos.
E Seleccione en la lista una variable dependiente que corresponda a cada combinacin de factores
19
MLG Medidas repetidas
Para utilizar Medidas repetidas, deber definir los datos correctamente. Los factores
intra-sujetos deben definirse en este cuadro de dilogo. Observe que estos factores no son las
variables existentes en sus datos, sino los factores que deber definir aqu.
Ejemplo. En un estudio sobre la prdida de peso, suponga que se mide cada semana el peso de
varias personas durante cinco semanas. En el archivo de datos, cada persona es un sujeto o caso.
Los pesos de las distintas semanas se registran en las variables peso1, peso2, etc. El sexo de
cada persona se registra en otra variable. Los pesos, medidos repetidamente para cada sujeto,
se pueden agrupar definiendo un factor intra-sujetos. Este factor podra denominarse semana,
definido con cinco niveles. En el cuadro de dilogo principal, las variables peso1, ..., peso5 se
utilizan para asignar los cinco niveles de semana. La variable del archivo de datos que agrupa
a hombres y mujeres (sexo) puede especificarse como un factor inter-sujetos, para estudiar las
diferencias entre hombres y mujeres.
Medidas. Si los sujetos se comparan en ms de una medida cada vez, defina las medidas. Por
ejemplo, se podra medir el ritmo de la respiracin y el pulso para cada sujeto todos los das
durante una semana. El nombre de las medidas no existen como un nombre de variables en
el propio archivo de datos sino se define aqu. Un modelo con ms de una medida a veces se
denomina modelo doblemente multivariado de medidas repetidas.
20
Captulo 3
Especificar modelo. Un modelo factorial completo contiene todos los efectos principales del
factor, todos los efectos principales de las covariables y todas las interacciones factor por factor.
No contiene interacciones de covariable. Seleccione Personalizado para especificar slo un
subconjunto de interacciones o para especificar interacciones factor por covariable. Indique todos
los trminos que desee incluir en el modelo.
Inter-sujetos. Muestra una lista de los factores inter-sujetos y las covariables.
Modelo. El modelo depende de la naturaleza de los datos. Tras elegir Personalizado, puede
seleccionar los efectos y las interacciones intra-sujetos y los efectos y las interacciones
inter-sujetos que sean de inters para el anlisis.
Suma de cuadrados Determina el mtodo de clculo de las sumas de cuadrados para el modelo
inter-sujetos. Para los modelos inter-sujetos equilibrados y no equilibrados sin casillas perdidas, el
mtodo ms utilizado para la suma de cuadrados es el Tipo III.
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
Suma de cuadrados
Para el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y
es el tipo por defecto.
Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica de la suma
de cuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El
mtodo Tipo I para la obtencin de sumas de cuadrados se utiliza normalmente para:
Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro
del segundo efecto especificado, el segundo efecto especificado est anidado dentro del
tercero, y as sucesivamente. Esta forma de anidamiento solamente puede especificarse
utilizando la sintaxis.
21
MLG Medidas repetidas
Tipo II. Este mtodo calcula cada suma de cuadrados del modelo considerando slo los efectos
pertinentes. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el
que se est examinando. El mtodo Tipo II para la obtencin de sumas de cuadrados se utiliza
normalmente para:
Tipo III. Es el mtodo por defecto. Este mtodo calcula las sumas de cuadrados de un efecto
del diseo como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo
contenga y ortogonales a cualquier efecto (si existe) que lo contenga. Las sumas de cuadrados de
Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre
que la forma general de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados
se suele considerar de gran utilidad para un modelo no equilibrado sin casillas perdidas. En un
diseo factorial sin casillas perdidas, este mtodo equivale a la tcnica de cuadrados ponderados
de las medias de Yates. El mtodo Tipo III para la obtencin de sumas de cuadrados se utiliza
normalmente para:
Tipo IV. Este mtodo est diseado para una situacin en la que hay casillas perdidas. Para
cualquier efecto F en el diseo, si F no est contenida en cualquier otro efecto, entonces Tipo IV =
Tipo III = Tipo II. Cuando F est contenida en otros efectos, el Tipo IV distribuye equitativamente
los contrastes que se realizan entre los parmetros en F a todos los efectos de nivel superior. El
mtodo Tipo IV para la obtencin de sumas de cuadrados se utiliza normalmente para:
22
Captulo 3
Los contrastes se utilizan para contrastar las diferencias entre los niveles de un factor inter-sujetos.
Puede especificar un contraste para cada factor inter-sujetos del modelo. Los contrastes
representan las combinaciones lineales de los parmetros.
El contraste de hiptesis se basa en la hiptesis nula LBM = 0, donde L es la matriz
de coeficientes de contraste, B es el vector de parmetros y M es la matriz promedio que
corresponde a la transformacin promedio para la variable dependiente. Puede mostrar esta
matriz de transformacin seleccionando la opcin Matriz de transformacin en el cuadro de dilogo
Medidas repetidas: Opciones. Por ejemplo, si existen cuatro variables dependientes, un factor
intra-sujetos de cuatro niveles y se utilizan contrastes polinmicos (valor por defecto) para los
factores intra-sujetos, la matriz M ser (0,5 0,5 0,5 0,5). Cuando se especifica un contraste, se
crea una matriz L de modo que las columnas correspondientes al factor inter-sujetos coincidan
con el contraste. El resto de las columnas se corrigen para que la matriz L sea estimable.
Los contrastes disponibles son de desviacin, simples, de diferencias, de Helmert, repetidos y
polinmicos. En los contrastes de desviacin y los contrastes simples, es posible determinar que
la categora de referencia sea la primera o la ltima categora.
Deber seleccionar un contraste que no sea Ninguno para factores intra-sujetos.
Tipos de contrastes
Desviacin. Compara la media de cada nivel (excepto una categora de referencia) con la media de
todos los niveles (media global). Los niveles del factor pueden colocarse en cualquier orden.
Simple. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de
contraste resulta til cuando existe un grupo de control. Puede seleccionar la primera o la ltima
categora como referencia.
Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles
niveles siguientes.
Repetidas. Compara la media de cada nivel (excepto el ltimo) con la media del nivel siguiente.
Polinmico. Compara el efecto lineal, cuadrtico, cbico, etc. El primer grado de libertad contiene
el efecto lineal a travs de todas las categoras; el segundo grado de libertad, el efecto cuadrtico, y
as sucesivamente. Estos contrastes se utilizan a menudo para estimar las tendencias polinmicas.
23
MLG Medidas repetidas
Los grficos de perfil (grficos de interaccin) sirven para comparar las medias marginales en el
modelo. Un grfico de perfil es un grfico de lneas en el que cada punto indica la media marginal
estimada de una variable dependiente (corregida respecto a las covariables) en un nivel de un
factor. Los niveles de un segundo factor se pueden utilizar para generar lneas diferentes. Cada
nivel en un tercer factor se puede utilizar para crear un grfico diferente. Todos los factores estn
disponibles para los grficos. Los grficos de perfil se crean para cada variable dependiente. Es
posible utilizar tanto los factores inter-sujetos como los intra-sujetos en los grficos de perfil.
Un grfico de perfil de un factor muestra si las medias marginales estimadas aumentan o
disminuyen a travs de los niveles. Para dos o ms factores, las lneas paralelas indican que no
existe interaccin entre los factores, lo que significa que puede investigar los niveles de un nico
factor. Las lneas no paralelas indican una interaccin.
Figura 3-6
Grfico no paralelo (izquierda) y grfico paralelo (derecha)
Despus de especificar un grfico mediante la seleccin de los factores del eje horizontal y, de
manera opcional, los factores para distintas lneas y grficos, el grfico deber aadirse a la
lista de grficos.
24
Captulo 3
Pruebas de comparaciones mltiples post hoc Una vez que se ha determinado que existen
diferencias entre las medias, las pruebas de rango post hoc y las comparaciones mltiples por
parejas permiten determinar qu medias difieren. Las comparaciones se realizan sobre valores sin
corregir. Estas pruebas no estn disponibles si no existen factores inter-sujetos y las pruebas de
comparacin mltiple post hoc se realizan para la media a travs de los niveles de los factores
intra-sujetos.
Las pruebas de diferencia honestamente significativa de Tukey y de Bonferroni son pruebas de
comparacin mltiple muy utilizadas. La prueba de Bonferroni, basada en el estadstico t de
Student, corrige el nivel de significacin observado por el hecho de que se realizan comparaciones
mltiples. La prueba t de Sidak tambin corrige el nivel de significacin y da lugar a lmites ms
estrechos que los de Bonferroni. La prueba de diferencia honestamente significativa de Tukey
utiliza el estadstico del rango estudentizado para realizar todas las comparaciones por pares entre
los grupos y establece la tasa de error por experimento como la tasa de error para el conjunto de
todas las comparaciones por pares. Cuando se contrasta un gran nmero de pares de medias, la
prueba de la diferencia honestamente significativa de Tukey es ms potente que la prueba de
Bonferroni. Para un nmero reducido de pares, Bonferroni es ms potente.
GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de
Tukey, pero se utiliza el mdulo mximo estudentizado. La prueba de Tukey suele ser ms
potente. La prueba de comparacin por parejas de Gabriel tambin utiliza el mdulo mximo
estudentizado y es generalmente ms potente que la GT2 de Hochberg cuando los tamaos de las
casillas son desiguales. La prueba de Gabriel se puede convertir en liberal cuando los tamaos de
las casillas varan mucho.
25
MLG Medidas repetidas
26
Captulo 3
Es posible guardar los valores pronosticados por el modelo, los residuos y las medidas
relacionadas como variables nuevas en el Editor de datos. Muchas de estas variables se pueden
utilizar para examinar supuestos sobre los datos. Si desea almacenar los valores para utilizarlos en
otra sesin de IBM SPSS Statistics, gurdelos en el archivo de datos actual.
Valores pronosticados. Son los valores que predice el modelo para cada caso.
Error tpico. Estimacin de la desviacin tpica del valor promedio de la variable dependiente
para los casos que tengan los mismos valores en las variables independientes.
Diagnsticos. Son medidas para identificar casos con combinaciones poco usuales de valores para
los casos y las variables independientes que puedan tener un gran impacto en el modelo. Las
opciones disponibles incluyen la distancia de Cook y los valores de influencia no centrados.
Distancia de Cook. Una medida de cunto cambiaran los residuos de todos los casos si un
caso particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de
Cook grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin
har variar substancialmente los coeficientes.
27
MLG Medidas repetidas
Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados,
que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen
una media de 0 y una desviacin tpica de 1.
Mtodo de Student. Residuo dividido por una estimacin de su desviacin tpica que vara
de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables
independientes respecto a las medias en las variables independientes.
Eliminados. Residuo para un caso cuando ste se excluye del clculo de los coeficientes de
28
Captulo 3
Este cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se calculan utilizando
un modelo de efectos fijos.
Medias marginales estimadas. Seleccione los factores e interacciones para los que desee obtener
estimaciones de las medias marginales de la poblacin en las casillas. Estas medias se corrigen
respecto a las covariables, si las hay. Se pueden seleccionar tanto factores intra-sujetos como
inter-sujetos.
Comparar los efectos principales. Proporciona comparaciones por parejas no corregidas entre
las medias marginales estimadas para cualquier efecto principal del modelo, tanto para los
factores inter-sujetos como para los intra-sujetos. Este elemento slo se encuentra disponible
si los efectos principales estn seleccionados en la lista Mostrar las medias para.
(DMS), Bonferroni o Sidak para los intervalos de confianza y la significacin. Este elemento
slo estar disponible si se selecciona Comparar los efectos principales.
Mostrar. Seleccione Estadsticos descriptivos para generar medias observadas, desviaciones tpicas
y frecuencias para cada variable dependiente en todas las casillas. La opcin Estimaciones del
tamao del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimacin de
parmetros. El estadstico eta cuadrado describe la proporcin de variabilidad total atribuible a un
factor. Seleccione Potencia observada para obtener la potencia de la prueba cuando la hiptesis
alternativa se ha establecido basndose en el valor observado. Seleccione Estimaciones de los
parmetros para generar las estimaciones de los parmetros, los errores tpicos, las pruebas t, los
intervalos de confianza y la potencia observada para cada prueba. Se pueden mostrar Matrices
SCPC de error y de hiptesis y la Matriz SCPC residual ms la prueba de esfericidad de Bartlett de
la matriz de covarianzas residual.
Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene
para cada variable dependiente en todas las combinaciones de nivel de los factores inter-sujetos
slo para factores inter-sujetos. Asimismo, las pruebas de homogeneidad incluyen la prueba M de
Box sobre la homogeneidad de las matrices de covarianza de las variables dependientes a lo largo
de todas las combinaciones de niveles de los factores inter-sujetos. Las opciones de diagramas
de dispersin por nivel y grfico de los residuos son tiles para comprobar los supuestos sobre
los datos. Estos elementos no estarn activado si no hay factores. Seleccione Grficos de los
residuos para generar un grfico de los residuos observados respecto a los pronosticados respecto
a los tipificados para cada variable dependiente. Estos grficos son tiles para investigar el
supuesto de varianzas iguales. Seleccione la Prueba de falta de ajuste para comprobar si el modelo
puede describir de forma adecuada la relacin entre la variable dependiente y las variables
independientes. La funcin estimable general permite construir pruebas de hiptesis personales
basadas en la funcin estimable general. Las filas en las matrices de coeficientes de contraste son
combinaciones lineales de la funcin estimable general.
Nivel de significacin. Puede que le interese corregir el nivel de significacin usado en las pruebas
post hoc y el nivel de confianza empleado para construir intervalos de confianza. El valor
especificado tambin se utiliza para calcular la potencia observada para la prueba. Si especifica
un nivel de significacin, el cuadro de dilogo mostrar el nivel asociado de los intervalos de
confianza.
29
MLG Medidas repetidas
Especificar contrastes de los efectos respecto a una combinacin lineal de efectos o un valor
(utilizando el subcomando TEST).
Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING).
Construir una matrizL, una matriz M o una matriz K (utilizando los subcomandos LMATRIX,
MMATRIX y KMATRIX).
Especificar trminos de error para las comparaciones post hoc (utilizando el subcomando
POSTHOC).
Calcular medias marginales estimadas para cualquier factor o interaccin entre los factores
en la lista de factores (utilizando el subcomando EMMEANS).
Captulo
Anlisis de componentes de la
varianza
diferentes despus de un mes. La variable camada es un factor aleatorio con seis niveles. Las seis
camadas estudiadas son una muestra aleatoria de una amplia poblacin de camadas de cerdos. El
investigador deduce que la varianza del aumento de peso se puede atribuir a la diferencia entre las
camadas ms que a la diferencia entre los cerdos de una misma camada.
Datos. La variable dependiente es cuantitativa. Los factores son categricos; pueden tener valores
numricos o valores de cadena de hasta ocho caracteres. Pueden tener valores numricos o valores
de cadena de hasta ocho bytes. Al menos uno de los factores debe ser aleatorio. Es decir, los
niveles del factor deben ser una muestra aleatoria de los posibles niveles. Las covariables son
variables cuantitativas que estn relacionadas con la variable dependiente.
Supuestos. Todos los mtodos suponen que los parmetros del modelo para un efecto aleatorio
tienen de media cero y varianzas constantes finitas y no estn correlacionados mutuamente. Los
parmetros del modelo para diferentes efectos aleatorios son tambin independientes.
El trmino residual tambin tiene una media de cero y una varianza constante finita. No tiene
correlacin con respecto a los parmetros del modelo de cualquier efecto aleatorio. Se asume que
los trminos residuales de diferentes observaciones no estn correlacionados.
Basndose en estos supuestos, las observaciones del mismo nivel de un factor aleatorio estn
correlacionadas. Este hecho distingue un modelo de componentes de la varianza a partir de
un modelo lineal general.
Copyright IBM Corporation 1989, 2012.
30
31
Anlisis de componentes de la varianza
realizar el anlisis de componentes de la varianza. Para contrastar hiptesis, utilice MLG Factorial
general, MLG Multivariado y MLG Medidas repetidas.
Para obtener un anlisis de las componentes de la varianza
E En los mens, seleccione:
Analizar > Modelo lineal general > Componentes de la varianza...
Figura 4-1
Cuadro de dilogo Componentes de la varianza
32
Captulo 4
Especificar modelo. Un modelo factorial completo contiene todos los efectos principales del
factor, todos los efectos principales de las covariables y todas las interacciones factor por factor.
No contiene interacciones de covariable. Seleccione Personalizado para especificar slo un
subconjunto de interacciones o para especificar interacciones factor por covariable. Indique todos
los trminos que desee incluir en el modelo.
Factores y covariables. Muestra una lista de los factores y las covariables.
Modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar Personalizado,
puede elegir los efectos principales y las interacciones que sean de inters para el anlisis. El
modelo debe contener un factor aleatorio.
Incluir la interseccin en el modelo. Normalmente se incluye la interseccin en el modelo. Si
supone que los datos pasan por el origen, puede excluir la interseccin.
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
33
Anlisis de componentes de la varianza
Todas de 4. Crea todas las interacciones cudruples posibles de las variables seleccionadas.
Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.
Mtodo. Puede seleccionar uno de los cuatro mtodos para estimar las componentes de la varianza.
EMNCI (estimador mnimo no cuadrtico insesgado) produce estimaciones que son invariables
con respecto a los efectos fijos. Si los datos se distribuyen normalmente y las estimaciones
son correctas, este mtodo produce la varianza inferior entre todos los estimadores insesgados.
Puede seleccionar un mtodo para las ponderaciones previas de los efectos aleatorios.
ANOVA (anlisis de varianza) calcula las estimaciones insesgadas utilizando las sumas de
cuadrados de Tipo I o Tipo III para cada efecto. El mtodo ANOVA a veces produce
estimaciones de varianza negativas, que pueden indicar un modelo errneo, un mtodo de
estimacin inadecuado o la necesidad de ms datos.
Mxima verosimilitud (MV) genera estimaciones que sern lo ms coherente posible con los
datos observados realmente, utilizando iteraciones. Estas estimaciones pueden estar sesgadas.
Este mtodo es asintticamente normal. Las estimaciones MV y MVR son invariables a la
traslacin. Este mtodo no tiene en cuenta los grados de libertad utilizados para estimar
los efectos fijos.
Las estimaciones de mxima verosimilitud restringida (MVR) reducen las estimaciones ANOVA
para muchos (si no todos) los casos de datos equilibrados. Puesto que este mtodo se corrige
respecto a los efectos fijos, deber dar errores tpicos menores que el mtodo MV. Este mtodo
tiene en consideracin los grados de libertad utilizados para estimar los efectos fijos.
Previas de los efectos aleatorios. Uniforme implica que todos los efectos aleatorios y el trmino
residual tienen un impacto igual en las observaciones. El esquema Cero equivale a asumir
varianzas de efecto aleatorio cero. Slo se encuentra disponible para el mtodo EMNCI.
34
Captulo 4
Suma de cuadrados Las sumas de cuadrados de Tipo I se utilizan para el modelo jerrquico, el cual
es empleado con frecuencia en las obras sobre componentes de la varianza. Si selecciona Tipo III,
que es el valor por defecto en MLG, las estimaciones de la varianza podrn utilizarse en MLG
Factorial general para contrastar hiptesis con sumas de cuadrados de Tipo III. Slo se encuentra
disponible para el mtodo ANOVA.
Criterios. Puede especificar el criterio de convergencia y el nmero mximo de iteraciones. Slo
se encuentra disponible para los mtodos MV o MVR.
Mostrar. Para el mtodo ANOVA, puede seleccionar mostrar sumas de cuadrados y medias
cuadrticas esperadas. Si selecciona el mtodo de Mxima verosimilitud o el de Mxima verosimilitud
restringida, puede mostrar una historia de las iteraciones.
de cuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El
mtodo Tipo I para la obtencin de sumas de cuadrados se utiliza normalmente para:
Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro
del segundo efecto especificado, el segundo efecto especificado est anidado dentro del
tercero, y as sucesivamente. Esta forma de anidamiento solamente puede especificarse
utilizando la sintaxis.
Tipo III. Es el mtodo por defecto. Este mtodo calcula las sumas de cuadrados de un efecto del
diseo como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo contenga
y ortogonales a cualquier efecto (si existe) que lo contenga. Las sumas de cuadrados de Tipo III
tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre que la
forma general de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados se
considera a menudo til para un modelo no equilibrado sin casillas perdidas. En un diseo factorial
sin casillas perdidas, este mtodo equivale a la tcnica de cuadrados ponderados de las medias de
Yates. El mtodo Tipo III para la obtencin de sumas de cuadrados se utiliza normalmente para:
35
Anlisis de componentes de la varianza
Se pueden guardar algunos resultados de este procedimiento en un nuevo archivo de datos IBM
SPSS Statistics.
Estimaciones de las componentes de la varianza. Guarda las estimaciones de las componentes de
la varianza y las etiquetas de estimacin en un archivo de datos o conjunto de datos. Se puede
utilizar para calcular ms estadsticos o en otros anlisis de los procedimientos MLG. Por ejemplo,
se pueden usar para calcular intervalos de confianza o para contrastar hiptesis.
Covariacin de las componentes. Guarda una matriz varianza-covarianza o una matriz de
correlaciones en un archivo de datos o conjunto de datos. Slo est disponible si se han
especificado los mtodos de mxima verosimilitud o mxima verosimilitud restringida.
Destino de los valores creados. Permite especificar un nombre para un conjunto de datos o para un
archivo externo que contenga las estimaciones de las componentes de la varianza y/o la matriz.
Los conjuntos de datos estn disponibles para su uso posterior durante la misma sesin, pero no se
guardarn como archivos a menos que se hayan guardado explcitamente antes de que finalice la
sesin. El nombre de un conjunto de datos debe cumplir las normas de denominacin de variables.
Se puede utilizar el comando MATRIX para extraer los datos que necesite del archivo de datos y
despus calcular los intervalos de confianza o realizar pruebas.
Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING).
Captulo
El procedimiento Modelos lineales mixtos ampla el modelo lineal general de manera que los
datos puedan presentar variabilidad corelacionada y no constante. El modelo lineal mixto
proporciona, por tanto, la flexibilidad necesaria para modelar no slo las medias sino tambin las
varianzas y covarianzas de los datos.
El procedimiento Modelos lineales mixtos es asimismo una herramienta flexible para ajustar
otros modelos que puedan ser formulados como modelos lineales mixtos. Dichos modelos
incluyen los modelos multinivel, los modelos lineales jerrquicos y los modelos con coeficientes
aleatorios.
Ejemplo. Una cadena de tiendas de comestibles est interesada en los efectos de varios vales en el
gasto de los clientes. Se toma una muestra aleatoria de los clientes habituales para observar el
gasto de cada cliente durante 10 semanas. Cada semana se enva por correo un vale distinto a los
clientes. Los modelos lineales mixtos se utilizan para estimar el efecto de los distintos vales en el
gasto, a la vez que se corrige respecto a la correlacin debida a las observaciones repetidas de
cada sujeto durante las 10 semanas.
Mtodos. Estimacin de mxima verosimilitud (MV) y mxima verosimilitud restringida (MVR).
Estadsticos. Estadsticos descriptivos: tamaos de las muestras, medias y desviaciones tpicas
de la variable dependiente y las covariables para cada combinacin de niveles de los factores.
Informacin de los niveles del factor: valores ordenados de los niveles de cada factor y las
frecuencias correspondientes. Asimismo, las estimaciones de los parmetros y los intervalos de
confianza para los efectos fijos y las pruebas de Wald y los intervalos de confianza para los
parmetros de las matrices de covarianzas. Pueden emplearse las sumas de cuadrados de Tipo I y
Tipo III para evaluar diferentes hiptesis. Tipo III es el valor por defecto.
Datos. La variable dependiente debe ser cuantitativa. Los factores deben ser categricos y pueden
tener valores numricos o valores de cadena. Las covariables y la variable de ponderacin deben
ser cuantitativas. Las variables de sujetos y repetidas pueden ser de cualquier tipo.
Supuestos. Se supone que la variable dependiente est relacionada linealmente con los factores
fijos, los factores aleatorios y las covariables. Los efectos fijos modelan la media de la variable
dependiente. Los efectos aleatorios modelan la estructura de las covarianzas de la variable
dependiente. Los efectos aleatorios mltiples se consideran independientes entre s y se calculan
por separado las matrices de covarianzas de cada uno de ellos; sin embargo, se puede establecer
una correlacin entre los trminos del modelo especificados para el mismo efecto aleatorio. Las
medidas repetidas modelan la estructura de las covarianzas de los residuos. Se asume adems
que la variable dependiente procede de una distribucin normal.
Procedimientos relacionados. Use el procedimiento Explorar para examinar los datos antes
36
37
Modelos lineales mixtos
38
Captulo 5
Figura 5-2
Cuadro de dilogo Modelos lineales mixtos
otros sujetos. Por ejemplo, en un estudio mdico, las lecturas de la presin sangunea de un
paciente se pueden considerar independientes de las lecturas de otros pacientes. La definicin
de los sujetos es particularmente importante cuando se dan medidas repetidas para cada sujeto
y desea modelar la correlacin entre estas observaciones. Por ejemplo, cabe esperar que estn
correlacionadas las lecturas de la presin sangunea de un nico paciente en una serie de visitas
consecutivas al mdico.
Los sujetos se pueden definir adems mediante la combinacin de los niveles de los factores de
mltiples variables; por ejemplo, puede especificar el Sexo y la Categora de edad como variables
de sujetos para modelar la creencia de que los hombres de ms de 65 aos son similares entre s,
pero independientes de los hombres de menos de 65 aos y de las mujeres.
Todas las variables especificadas en la lista Sujetos se usan con el fin de definir los sujetos para
la estructura de la covarianza residual. Puede usar todas o algunas de las variables que definen los
sujetos para la estructura de la covarianza de los efectos aleatorios.
39
Modelos lineales mixtos
Repetidas. Las variables especificadas en esta lista se usan para identificar las observaciones
repetidas. Por ejemplo, una nica variable Semana puede identificar las 10 semanas de
observaciones de un estudio mdico o se pueden usar Mes y Da para identificar las observaciones
diarias realizadas a lo largo de un ao.
Tipo de covarianza para Repetidas. Especifica la estructura de la covarianza para los residuos.
Las estructuras disponibles son las siguientes:
AR(1).
AR(1): Heterognea
ARMA(1,1).
Simetra compuesta
Diagonal
Huynh-Feldt
Identidad escalada
Toeplitz
Toeplitz: Heterognea
Sin estructura
40
Captulo 5
Efectos fijos. No existe un modelo por defecto, por lo que debe especificar de forma explcita los
modelos sin casillas perdidas, el mtodo Tipo III es por lo general el ms utilizado.
41
Modelos lineales mixtos
Todos los factores incluidos en una interaccin deben ser exclusivos entre s. Por consiguiente,
si A es un factor, no es vlido especificar A*A.
Todos los factores incluidos en un efecto anidado deben ser exclusivos entre s. Por
consiguiente, si A es un factor, no es vlido especificar A(A).
No se puede anidar ningn efecto dentro de una covariable. Por consiguiente, si A es un factor
y X es una covariable, no es vlido especificar A(X).
Suma de cuadrados
Para el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y
es el tipo por defecto.
Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica de la suma
de cuadrados. Cada trmino se corrige slo para el trmino que le precede en el modelo. El
mtodo Tipo I para la obtencin de sumas de cuadrados se utiliza normalmente para:
Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro
del segundo efecto especificado, el segundo efecto especificado est anidado dentro del
tercero, y as sucesivamente. Esta forma de anidamiento solamente puede especificarse
utilizando la sintaxis.
Tipo III. Es el mtodo por defecto. Este mtodo calcula las sumas de cuadrados de un efecto
del diseo como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo
contenga y ortogonales a cualquier efecto (si existe) que lo contenga. Las sumas de cuadrados de
Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre
que la forma general de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados
se suele considerar de gran utilidad para un modelo no equilibrado sin casillas perdidas. En un
diseo factorial sin casillas perdidas, este mtodo equivale a la tcnica de cuadrados ponderados
42
Captulo 5
de las medias de Yates. El mtodo Tipo III para la obtencin de sumas de cuadrados se utiliza
normalmente para:
AR(1).
AR(1): Heterognea
ARMA(1,1).
Simetra compuesta
43
Modelos lineales mixtos
Diagonal
Huynh-Feldt
Identidad escalada
Toeplitz
Toeplitz: Heterognea
Sin estructura
Variance Components
44
Captulo 5
Mxima subdivisin por pasos. En cada iteracin, se reduce el tamao del paso mediante un
Imprimir el historial de iteraciones para cada n pasos. Muestra una tabla que incluye el valor
45
Modelos lineales mixtos
Estadsticos descriptivos. Muestra los tamaos de las muestras, medias y desviaciones tpicas
Resumen de procesamiento de casos. Muestra los valores ordenados de los factores, las
variables de medidas repetidas, los sujetos de medidas repetidas y los sujetos de los efectos
aleatorios junto con las frecuencias correspondientes.
Estadsticos del modelo. Genera tablas correspondientes a:
Estimaciones de los parmetros. Muestra las estimaciones de los parmetros de los efectos
Contrastes sobre parmetros de covarianza. Muestra los errores tpicos asintticos y las pruebas
46
Captulo 5
Covarianzas de los efectos aleatorios. Muestra la matriz de covarianzas estimada de los efectos
aleatorios. Esta opcin est disponible slo si especifica al menos un efecto aleatorio. Si se
especifica una variable de sujetos para un efecto aleatorio, se muestra el bloque comn.
Covarianzas de los residuos. Muestra la matriz de covarianzas residual estimada. Esta opcin
est disponible slo en caso de que se haya especificado una variable para repetidas. Si se
especifica una variable de sujetos, se muestra el bloque comn.
Matriz de coeficientes del contraste. Esta opcin muestra las funciones estimables utilizadas
Especifique un valor mayor o igual a 0 e inferior a 100. El valor por defecto es 95.
47
Modelos lineales mixtos
Medias marginales estimadas de modelos ajustados. Este grupo permite solicitar las medias
Factores e interacciones de los factores. La lista contiene los factores y las interacciones de los
factores que se han especificado en el cuadro de dilogo Fijo, adems de un trmino GLOBAL.
Los trminos del modelo construidos a partir de covariables no se incluyen en esta lista.
Mostrar las medias para. El procedimiento calcular las medias marginales estimadas para
Comparar los efectos principales. Esta opcin permite solicitar comparaciones por parejas de
los niveles de los efectos principales seleccionados. La opcin Correccin del intervalo de
confianza permite aplicar ajustes a los intervalos de confianza y los valores de significacin
para explicar comparaciones mltiples. Los mtodos disponibles son: LSD (ningn ajuste),
Bonferroni y Sidak. Por ltimo, para cada factor, se puede seleccionar la categora de
referencia con la que se realizan las comparaciones. Si no se selecciona ninguna categora
de referencia, se construirn todas las comparaciones por parejas. Las opciones disponibles
para la categora de referencia son la primera, la ltima o una personalizada (en cuyo caso, se
introduce el valor de la categora de referencia).
Este cuadro de dilogo le permite guardar diversos resultados del modelo en el archivo de trabajo.
Valores pronosticados fijos. Guarda las variables relacionadas con las medias de regresin sin
los efectos.
48
Captulo 5
Valores pronosticados y residuos. Guarda las variables relacionadas con el valor ajustado por
el modelo.
Especificar contrastes de los efectos respecto a una combinacin lineal de efectos o un valor
(utilizando el subcomando TEST).
Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING).
Calcular las medias marginales estimadas de los valores especificados de las covariables
(utilizando la palabra clave WITH del subcomando EMMEANS).
Captulo
El modelo lineal generalizado ampla el modelo lineal general, de manera que la variable
dependiente est relacionada linealmente con los factores y las covariables mediante una
determinada funcin de enlace. Adems, el modelo permite que la variable dependiente tenga
una distribucin que no sea normal. El modelo lineal generalizado cubre los modelos estadsticos
ms utilizados, como la regresin lineal para las respuestas distribuidas normalmente, modelos
logsticos para datos binarios, modelos loglineales para datos de recuento, modelos log-log
complementario para datos de supervivencia censurados por intervalos, adems de muchos otros
modelos estadsticos a travs de la propia formulacin general del modelo.
Ejemplos. Una compaa de transporte puede utilizar modelos lineales generalizados para ajustar
una regresin de Poisson a las frecuencias de daos de varios tipos de barcos construidos en varios
perodos de tiempo. El modelo resultante puede ayudar a determinar cuales son los tipos de
barcos ms propensos a sufrir daos.
Una compaa de seguros de automviles puede utilizar modelos lineales generalizados para
ajustar una regresin gamma a las reclamaciones por daos de los automviles. El modelo
resultante puede ayudar a determinar los factores que ms contribuyen al tamao de la reclamacin.
Los investigadores mdicos pueden utilizar modelos lineales generalizados para ajustar una
regresin log-log complementario a los datos de supervivencia censurados por intervalos para
pronosticar el tiempo que tardar en reaparecer una enfermedad.
Datos. La respuesta puede ser de escala, de recuentos, binaria o eventos en ensayos. Se supone
que los factores son categricos. Las covariables, el peso de escala y el desplazamiento se
suponen que son de escala.
Supuestos. Se supone que los casos son observaciones independientes.
Para obtener un modelo lineal generalizado
49
50
Captulo 6
Figura 6-1
Modelos lineales generalizados: pestaa Tipo de modelo
E Especifique una distribucin y una funcin de enlace (consulte a continuacin detalles sobre
variable dependiente.
E En la pestaa Modelo, especifique los efectos del modelo utilizando las covariables y los factores
seleccionados.
La pestaa Tipo de modelo permite especificar la distribucin y la funcin de enlace del modelo,
adems de proporcionar accesos directos a varios modelos habituales que aparecen clasificados
por tipo de respuesta.
Tipos de modelos
Respuesta de escala.
51
Modelos lineales generalizados
logaritmo.
Respuesta ordinal.
logit acumulado.
acumulado.
Recuentos.
(con el valor 1 para el parmetro auxiliar) y la funcin de enlace de logaritmo. Para que el
procedimiento calcule el valor del parmetro auxiliar, especifique un modelo personalizado
con distribucin binomial negativa y seleccione Estimar valor en el grupo de parmetros.
Respuesta binaria o Datos de eventos/ensayos.
enlace de logaritmo.
identidad.
Personalizado. Especifique su propia combinacin de distribucin y funcin de enlace.
Distribucin
Binomial. Esta distribucin es adecuada nicamente para las variables que representan una
Gamma. Esta distribucin es adecuada para las variables con valores de escala positivos que se
desvan hacia valores positivos ms grandes. Si un valor de datos es menor o igual que 0 o es
un valor perdido, el correspondiente caso no se utilizar en el anlisis.
52
Captulo 6
De Gauss inversa. Esta distribucin es adecuada para las variables con valores de escala
positivos que se desvan hacia valores positivos ms grandes. Si un valor de datos es menor o
igual que 0 o es un valor perdido, el correspondiente caso no se utilizar en el anlisis.
Binomial negativa. Esta distribucin considera el nmero de intentos necesarios para lograr k
xitos y es adecuada para variables que tengan valores enteros que no sean negativos. Si un
valor de datos no es entero, es menor que 0 o es un valor perdido, el correspondiente caso no
se utilizar en el anlisis. El valor del parmetro auxiliar de la distribucin binomial negativa
puede ser cualquier nmero mayor o igual que 0; se puede establecer en un valor fijo o dejar
que lo estime el procedimiento. Cuando el parmetro auxiliar se establece en 0, utilizar esta
distribucin equivale a utilizar la distribucin de Poisson.
Normal. Es adecuada para variables de escala cuyos valores adoptan una distribucin simtrica
con forma de campana en torno a un valor central (la media). La variable dependiente debe
ser numrica.
un perodo fijo de tiempo y es apropiada para variables que tengan valores enteros que no
sean negativos. Si un valor de datos no es entero, es menor que 0 o es un valor perdido, el
correspondiente caso no se utilizar en el anlisis.
Tweedie. Esta distribucin es adecuada para variables que puedan representarse mediante
Multinomial. Esta distribucin es adecuada para variables que representan una respuesta
ordinal. La variable dependiente puede ser numrica o de cadena, y debe tener como mnimo
dos valores vlidos distintos de los datos.
Funciones de enlace
binomial.
53
Modelos lineales generalizados
especificacin de nmero necesaria y debe ser un nmero real. Es apropiada nicamente para
la distribucin binomial.
debe ser un nmero real. Este vnculo se puede utilizar con cualquier distribucin.
54
Captulo 6
En muchos casos, puede especificar sencillamente una variable dependiente. No obstante, las
variables que adoptan nicamente dos valores y las respuestas que registran eventos en ensayos
que requieren una atencin adicional.
Respuesta binaria. Cuando la variable dependiente adopta nicamente dos valores, puede
55
Modelos lineales generalizados
Para los modelos multinomiales ordinales, puede especificar el orden de las categoras de la
respuesta: ascendente, descendente o datos (el orden de los datos indica que el primer valor
encontrado en los datos define la primera categora y el ltimo valor encontrado define la ltima
categora).
Peso de escala. El parmetro de escala es un parmetro del modelo estimado relacionado con la
varianza de la respuesta. Los pesos de escala son valores conocidos que pueden variar de una
observacin a otra. Si se especifica una variable de peso de escala, el parmetro de escala, que est
relacionado con la varianza de la respuesta, se divide por l para cada observacin. Los casos cuyo
valor del peso de escala es menor o igual que 0 o que son perdidos no se utilizan en el anlisis.
Para una respuesta binaria, puede elegir la categora de referencia de la variable dependiente.
Puede afectar a ciertos resultados, como las estimaciones de los parmetros y los valores
guardados, pero no debera cambiar el ajuste del modelo. Por ejemplo, si la respuesta binaria
toma los valores 0 y 1:
Por defecto, el procedimiento utiliza la ltima categora (la de mayor valor), o 1, como la
categora de referencia. En esta situacin, las probabilidades guardadas por el modelo estiman
la posibilidad de que un determinado caso tome el valor 0 y las estimaciones de los parmetros
deben interpretarse como relativas a la probabilidad de la categora 0.
56
Captulo 6
La pestaa Predictores permite especificar los factores y las covariables que se utilizarn para
crear los efectos del modelo y para especificar un desplazamiento opcional.
Factores. Los factores son predictores categricos y pueden ser numricos o de cadena.
Covariables. Las covariables son predictores de escala y deben ser numricas.
Nota: Cuando la respuesta es binomial con formato binario, el procedimiento calcula los
estadsticos de bondad de ajuste de chi cuadrado y de desvianza por subpoblaciones que se
basan en la clasificacin cruzada de los valores observados de los factores y las covariables
seleccionadas. Debe mantener el mismo conjunto de predictores en las diferentes ejecuciones del
procedimiento para asegurarse de que se utiliza un nmero coherente de subpoblaciones.
Desplazamiento. El trmino desplazamiento es un predictor estructural. El modelo no estima
su coeficiente, pero se supone que tiene el valor 1. Por tanto, los valores del desplazamiento se
suman sencillamente al predictor lineal del destino. Esto resulta especialmente til en los modelos
57
Modelos lineales generalizados
de regresin de Poisson, en los que cada caso puede tener diferentes niveles de exposicin
al evento de inters.
Por ejemplo, al modelar las tasas de accidente de diferentes conductores, hay una importante
diferencia entre un conductor que ha sido el culpable de un accidente en tres aos y un conductor
que ha sido el culpable de un accidente en 25 aos. El nmero de accidentes se puede modelar
como una respuesta de Poisson o binomial negativa con un enlace de logaritmo si la experiencia
del conductor se incluye como un trmino de desplazamiento.
Otras combinaciones de los tipos de distribucin y enlace requerirn otras transformaciones
de la variable de desplazamiento.
caso para que se incluyan en el anlisis. Estos controles permiten decidir si los valores definidos
como perdidos por el usuario se deben tratar como vlidos entre las variables de factor.
Orden de categoras. Es relevante para determinar el ltimo nivel de un factor, que puede
estar asociado a un parmetro redundante del algoritmo de estimacin. Si se cambia el orden
de categoras es posible que cambien tambin los valores de los efectos de los niveles de los
factores, ya que estas estimaciones de los parmetros se calculan respecto al ltimo nivel. Los
58
Captulo 6
factores se pueden ordenar en orden ascendente desde el valor mnimo hasta el mximo, en
orden descendente desde el valor mximo hasta el mnimo o siguiendo el orden de los datos.
Significa que el primer valor encontrado en los datos define la primera categora, y el ltimo valor
nico encontrado define la ltima categora.
Especificar efectos del modelo. El modelo por defecto slo utiliza la interseccin, por lo que
deber especificar explcitamente todos los dems efectos del modelo. Puede elegir entre trminos
anidados o no anidados.
Trminos no anidados
59
Modelos lineales generalizados
Factorial. Crea todas las interacciones y efectos principales posibles para las variables
seleccionadas.
Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas.
Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas.
Todas de 4. Crea todas las interacciones cudruples posibles de las variables seleccionadas.
Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.
Trminos anidados
En este procedimiento, puede construir trminos anidados para el modelo. Los trminos anidados
resultan tiles para modelar el efecto de un factor o covariable cuyos valores no interactan con
los niveles de otro factor. Por ejemplo, una cadena de tiendas de comestibles desea realizar un
seguimiento de los hbitos de gasto de los clientes en las diversas ubicaciones de sus tiendas.
Dado que cada cliente frecuenta tan slo una de estas ubicaciones, se puede decir que el efecto de
Cliente est anidado dentro del efecto de Ubicacin de la tienda.
Adems, puede incluir efectos de interaccin, como trminos polinmicos que implican a la
misma covariable, o aadir varios niveles de anidacin al trmino anidado.
Limitaciones. Existen las siguientes restricciones para los trminos anidados:
Todos los factores incluidos en una interaccin deben ser exclusivos entre s. Por consiguiente,
si A es un factor, no es vlido especificar A*A.
Todos los factores incluidos en un efecto anidado deben ser exclusivos entre s. Por
consiguiente, si A es un factor, no es vlido especificar A(A).
No se puede anidar ningn efecto dentro de una covariable. Por consiguiente, si A es un factor
y X es una covariable, no es vlido especificar A(X).
Interseccin. La interseccin se incluye normalmente en el modelo. Si asume que los datos pasan
60
Captulo 6
Estimacin de parmetros. Los controles de este grupo le permiten especificar los mtodos de
estimacin y proporcionar los valores iniciales para las estimaciones de los parmetros.
61
Modelos lineales generalizados
parmetros. Otra posibilidad consiste en especificar los valores iniciales de las estimaciones
de los parmetros.
Mxima subdivisin por pasos. En cada iteracin, se reduce el tamao del paso mediante un
Comprobar si hay separacin completa de los puntos de los datos. Si se activa, el algoritmo
realiza una prueba para garantizar que las estimaciones de los parmetros tienen valores
exclusivos. Se produce una separacin cuando el procedimiento pueda generar un modelo
que clasifique cada caso de forma correcta. Esta opcin no est disponible para respuestas
multinomiales y binomiales con formato binario.
Criterios de convergencia.
la que las modificaciones absolutas o relativas en las estimaciones de los parmetros son
inferiores al valor especificado, que debe ser positivo.
62
Captulo 6
Si se especifican valores iniciales, deben proporcionarse para todos los parmetros del modelo
(incluidos los parmetros redundantes). En el conjunto de datos, el orden de las variables de
izquierda a derecha debe ser: TipoFila_, NombreVar_, P1, P2, , donde TipoFila_ y NombreVar_
son variables de cadena y P1, P2, son variables numricas que corresponden a una lista
ordenada de los parmetros.
Los valores iniciales se proporcionan en un registro con el valor EST para la variable
TipoFila_; los valores iniciales reales se proporcionan en las variables P1, P2, . El
procedimiento ignora todos los registros para los que TipoFila_ tienen un valor diferente de
EST, as como todos los registros posteriores a la primera aparicin de TipoFila_ igual a EST.
Si est activo Segmentar archivo, las variables debern comenzar con la variable (o las
variables) de segmentacin del archivo en el orden especificado al crear la segmentacin del
archivo, seguidas de TipoFila_, NombreVar_, P1, P2, como se ha indicado anteriormente.
La segmentacin debe haberse realizado en el conjunto de datos especificado en el mismo
orden que en el conjunto de datos original.
Nota: Los nombres de las variables P1, P2, no son necesarios. El procedimiento aceptar
cualquier nombre de variable vlido para los parmetros, ya que la asignacin de las variables a
los parmetros se basa en la posicin de la variable y no en el nombre de la variable. Se ignorarn
todas las variables que aparezcan despus del ltimo parmetro.
La estructura de archivo de los valores iniciales es la misma que la utilizada al exportar el modelo
como datos. Por tanto, puede utilizar los valores finales de una ejecucin del procedimiento como
entrada de una ejecucin posterior.
63
Modelos lineales generalizados
Tipo de anlisis Especifique el tipo de anlisis que desea generar. El anlisis de tipo I suele ser
apropiado cuando tiene motivos a priori para ordenar los predictores del modelo, mientras que
el tipo III es de aplicacin ms general. Los estadsticos de razn de verosimilitud o de Wald
se calculan a partir de la seleccin realizada en el grupo Estadsticos de chi-cuadrado.
Intervalos de confianza. Especifique un nivel de confianza mayor que 50 y menor que 100.
Los intervalos de Wald se basan en el supuesto de que los parmetros siguen una distribucin
normal asinttica; los intervalos de verosimilitud de perfil son ms precisos pero es posible
que tambin requieran bastantes recursos informticos. El nivel de tolerancia de los intervalos
de verosimilitud de perfil es el criterio utilizado para detener el algoritmo iterativo utilizado
para calcular los intervalos.
64
Captulo 6
Resumen del procesamiento de los casos. Muestra el nmero y el porcentaje de los casos
Informacin del modelo. Muestra el nombre del conjunto de datos, la variable dependiente o las
Estadsticos de resumen del modelo. Muestra contraste de ajuste del modelo, incluidos los
estadsticos de la razn de la verosimilitud para el contraste mnibus del ajuste del modelo y
los estadsticos para los contrastes de tipo I o III para cada efecto.
Matrices (L) de los coeficientes de contraste. Muestra los coeficientes de los contrastes para los
efectos por defecto y para las medias marginales estimadas, si se solicitaron en la pestaa
Medias marginales estimadas.
Funciones estimables generales. Muestra las matrices para generar las matrices (L) de los
coeficientes de contraste.
65
Modelos lineales generalizados
Esta pestaa permite ver medias marginales estimadas para los niveles de factores y las
interacciones de los factores. Tambin se puede solicitar que se muestre la media estimada global.
Las medias marginales estimadas no estn disponibles para modelos multinomiales ordinales.
Factores e interacciones. Esta lista contiene los factores especificados en la pestaa Predictores y
las interacciones de los factores especificadas en la pestaa Modelo. Las covariables se excluyen
de esta lista. Los trminos pueden seleccionar directamente en esta lista o combinarse en un
trmino de interaccin utilizando el botn Por *.
Mostrar las medias para. Se calculan las medias estimadas de los factores seleccionados y las
interacciones de los factores. El contraste determina como se configuran los contrastes de
hiptesis para comparar las medias estimadas. El contraste simple requiere una categora de
referencia o un nivel de factor con el que comparar los dems.
66
Captulo 6
Por parejas. Se calculan las comparaciones por parejas para todas las combinaciones de
niveles de los factores especificados o implicados. Este contraste es el nico disponible para
las interacciones de los factores.
Simple. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de
Desviacin. Cada nivel del factor se compara con la media global. Los contrastes de
Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles
Helmert. Compara la media de cada nivel del factor (excepto el ltimo) con la media de
Repetido. Compara la media de cada nivel (excepto el ltimo) con la media del nivel siguiente.
Polinmico. Compara el efecto lineal, cuadrtico, cbico, etc. El primer grado de libertad
contiene el efecto lineal a travs de todas las categoras; el segundo grado de libertad, el
efecto cuadrtico, y as sucesivamente. Estos contrastes se utilizan a menudo para estimar
las tendencias polinmicas.
Escala. Se pueden calcular las medias marginales estimadas de la respuesta, basadas en la escala
Diferencia menos significativa. Este mtodo no controla la probabilidad general de rechazar las
hiptesis de que algunos contrastes lineales son diferentes a los valores de hiptesis nula.
Bonferroni. Este mtodo corrige el nivel de significacin observado por el hecho de que se
Sidak. Este mtodo ofrece lmites ms estrechos que los de la aproximacin de Bonferroni.
es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que
mantiene el mismo nivel de significacin global.
67
Modelos lineales generalizados
Los elementos marcados se guardan con el nombre especificado. Puede elegir si desea sobrescribir
las variables existentes con el mismo nombre que las nuevas variables o evitar conflictos de
nombres adjuntando sufijos para asegurarse de que los nombres de las nuevas variables son nicos.
Valor pronosticado del promedio de la respuesta. Guarda los valores pronosticados por el
Lmite inferior del intervalo de confianza para el promedio de la respuesta. Guarda el lmite
68
Captulo 6
inferior de cada categora de la respuesta, excepto la ltima, hasta el nmero de categoras que
se ha especificado que se guarden.
Lmite superior del intervalo de confianza para el promedio de la respuesta. Guarda el lmite
Categora pronosticada. Para los modelos con distribucin binomial y variable dependiente
Valor pronosticado del predictor lineal. Guarda los valores pronosticados por el modelo para
cada caso en la mtrica del predictor lineal (respuesta transformada mediante la funcin de
enlace especificada). Cuando la distribucin de respuesta es multinomial, el procedimiento
guarda el valor pronosticado de cada categora de la respuesta, excepto la ltima, hasta el
nmero de categoras que se ha especificado que se guarden.
Error tpico estimado del valor pronosticado del predictor lineal. Cuando la distribucin de
Distancia de Cook. Una medida de cunto cambiaran los residuos de todos los casos si un
caso particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de
Cook grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin
har variar substancialmente los coeficientes.
Residuo bruto. Diferencia entre un valor observado y el valor pronosticado por el modelo.
del caso) de los cuadrados de los residuos tipificados de Pearson y de desvianza, con el
signo del residuo bruto.
69
Modelos lineales generalizados
Exportar modelo como datos. Escribe un conjunto de datos de formato IBM SPSS Statistics
que contiene la matriz de covarianzas o correlaciones de los parmetros con las estimaciones de
los parmetros, errores tpicos, valores de significacin y grados de libertad. El orden de las
variables en el archivo matricial es el siguiente.
Variables de segmentacin. Si se han utilizado, todas las variables que definan segmentaciones.
RowType_. Toma los valores (y las etiquetas de valor) COV (covarianzas), CORR
VarName_. Toma los valores P1, P2, ..., correspondientes a una lista ordenada de todos los
parmetros estimados del modelo (salvo los parmetros binomiales negativos o de escala),
para los tipos de fila COV o CORR, con las etiquetas de valor correspondientes a las cadenas
70
Captulo 6
P1, P2, ... Estas variables corresponden a una lista ordenada de todos los parmetros del modelo
(incluidos los parmetros binomiales negativos y de escala, segn sea apropiado), con las
etiquetas de variable correspondientes a las cadenas de parmetros mostradas en la tabla de
estimaciones de los parmetros y toman valores segn el tipo de fila.
Para los parmetros redundantes, todas las covarianzas se establecen en cero, las correlaciones
se establecen en el valor perdido del sistema; todas las estimaciones de los parmetros se
establecen en cero; y todos los errores tpicos, niveles de significacin y los grados de libertad
residuales se establecen en el valor perdido del sistema.
Para el parmetro de escala, las covarianzas, correlaciones, nivel de significacin y grados
de libertad se establecen en el valor perdido del sistema. Si el parmetro de escala se estima
mediante mxima verosimilitud, se indica el error tpico; en otro caso se establece en el
valor perdido del sistema.
Para el parmetro binomial negativo, las covarianzas, correlaciones, nivel de significacin
y grados de libertad se establecen en el valor perdido del sistema. Si el parmetro binomial
negativo se estima mediante mxima verosimilitud, se indica el error tpico; en otro caso se
establece en el valor perdido del sistema.
Si hay segmentaciones, se debe acumular la lista de parmetros a travs de todas las
segmentaciones. En una determinada segmentacin, es posible que algunos parmetros sean
irrelevantes; pero no es lo mismo que sean redundantes. Para los parmetros irrelevantes,
todas las covarianzas y correlaciones, estimaciones de los parmetros, errores tpicos, niveles
de significacin y grados de libertad se establecen en el valor perdido del sistema.
Puede utilizar este archivo matricial como valores iniciales para una estimacin posterior del
modelo; tenga en cuenta que este archivo no se puede utilizar directamente para realizar otros
anlisis en otros procedimientos que lean un archivo matricial a menos que dichos procedimientos
acepten todos los tipos de filas que aqu se exportan. Incluso en esos casos, deber asegurarse de
que todos los parmetros del archivo matricial tienen el mismo significado para el procedimiento
que lee el archivo.
Exportar modelo como XML. Guarda las estimaciones de los parmetros y la matriz de covarianzas
de los parmetros (si se selecciona) en formato XML (PMML). Puede utilizar este archivo de
modelo para aplicar la informacin del modelo a otros archivos de datos para puntuarlo.
Especificar valores iniciales para las estimaciones de los parmetros como una lista de
nmeros (utilizando el subcomando CRITERIA).
Fijar covariables en valores distintos los de sus medias al calcular las medias marginales
estimadas (utilizando el subcomando EMMEANS).
71
Modelos lineales generalizados
Especificar un subconjunto de los factores para los que se muestran las medias marginales
estimadas para compararlos utilizando el tipo de contraste especificado (utilizando las
palabras clave TABLES y COMPARE del subcomando EMMEANS).
Captulo
Ecuaciones de estimacin
generalizadas
los factores son categricos. Las covariables, el peso de escala y el desplazamiento se suponen que
son de escala. Las variables utilizadas para definir los sujetos o las medidas repetidas intra-sujetos
no se pueden utilizar para definir la respuesta pero pueden desempear otros papeles en el modelo.
Supuestos. Los casos se supone que son dependientes dentro de los sujetos e independientes entre
los sujetos. La matriz de correlaciones que representa las dependencias intra-sujetos se estima
como parte del modelo.
Obtencin de ecuaciones de estimacin generalizadas
72
73
Ecuaciones de estimacin generalizadas
Figura 7-1
Ecuaciones de estimacin generalizadas: Pestaa Repetido
La combinacin de valores de las variables especificadas debe definir de manera nica los sujetos
del conjunto de datos. Por ejemplo, una nica variable ID de paciente debera ser suficiente para
definir los sujetos de un nico hospital, pero puede que sea necesario combinar ID de hospital e
ID de paciente si los nmeros de identificacin de paciente no son nicos entre varios hospitales.
En una configuracin de medidas repetidas, se registran varias observaciones para cada sujeto, de
manera que cada sujeto puede ocupar varios casos del conjunto de datos.
E En la pestaa Tipo de modelo, especifique una distribucin y una funcin de enlace.
E En la pestaa Respuesta, seleccione una variable dependiente.
E En la pestaa Predictores, seleccione los factores y las covariables que utilizar para pronosticar la
variable dependiente.
74
Captulo 7
E En la pestaa Modelo, especifique los efectos del modelo utilizando las covariables y los factores
seleccionados.
Si lo desea, en la pestaa Repetido puede especificar:
Variables intra-sujetos. La combinacin de valores de las variables intra-sujetos define el orden de
las medidas dentro de los sujetos. Por tanto, la combinacin de las variables intra-sujetos y de
los sujetos define de manera nica cada medida. Por ejemplo, la combinacin de Perodo, ID
de hospital e ID de paciente define, para cada caso, una determinada visita a la consulta de un
determinado paciente dentro de un determinado hospital.
Si el conjunto de datos ya est ordenado de manera que las medidas repetidas de cada sujeto se
producen en un bloque contiguo de casos y en el orden correcto, no es estrictamente necesario
especificar un variable intra-sujetos y puede anular la seleccin de Ordenar casos por variables de
sujetos e intra-sujetos con el fin de ahorrar el tiempo de procesamiento necesario para determinar el
orden (temporal). Por lo general, es aconsejable utilizar las variables intra-sujetos para asegurarse
de que las medidas se ordenan correctamente.
Las variables de sujetos e intra-sujetos no se pueden utilizar para definir la respuesta, pero
pueden realizar otras funciones en el modelo. Por ejemplo, ID de hospital se puede utilizar
como factor en el modelo.
Matriz de covarianzas. El estimador basado en el modelo es la negativa de la inversa
intra-sujetos. Su tamao queda determinado por el nmero de medidas y, por tanto, por la
combinacin de los valores de las variables intra-sujetos. Puede especificar una de las siguientes
estructuras:
AR(1). Las medidas repetidas tienen una relacin autorregresiva de primer orden. La
Intercambiable. Esta estructura tiene correlaciones homogneas entre los elementos. Tambin
75
Ecuaciones de estimacin generalizadas
en las estimaciones de los parmetros, que se actualizan en cada iteracin del algoritmo. Si
la matriz de correlaciones de trabajo no se actualiza en absoluto, se utilizar la matriz de
correlaciones de trabajo inicial en todo el proceso de estimacin. Si se actualiza la matriz,
puede especificar el intervalo de iteracin segn el que se actualizarn los elementos de la
matriz de correlaciones de trabajo. La especificacin de un valor mayor que 1 puede reducir
el tiempo de procesamiento.
Criterios de convergencia. Estas especificaciones se aplican a los parmetros del modelo lineal que
la que las modificaciones absolutas o relativas en las estimaciones de los parmetros son
inferiores al valor especificado, que debe ser positivo.
76
Captulo 7
La pestaa Tipo de modelo permite especificar la distribucin y la funcin de enlace del modelo,
adems de proporcionar accesos directos a varios modelos habituales que aparecen clasificados
por tipo de respuesta.
Tipos de modelos
Respuesta de escala.
logaritmo.
Respuesta ordinal.
77
Ecuaciones de estimacin generalizadas
logit acumulado.
acumulado.
Recuentos.
(con el valor 1 para el parmetro auxiliar) y la funcin de enlace de logaritmo. Para que el
procedimiento calcule el valor del parmetro auxiliar, especifique un modelo personalizado
con distribucin binomial negativa y seleccione Estimar valor en el grupo de parmetros.
Respuesta binaria o Datos de eventos/ensayos.
enlace de logaritmo.
identidad.
Personalizado. Especifique su propia combinacin de distribucin y funcin de enlace.
Distribucin
Binomial. Esta distribucin es adecuada nicamente para las variables que representan una
Gamma. Esta distribucin es adecuada para las variables con valores de escala positivos que se
desvan hacia valores positivos ms grandes. Si un valor de datos es menor o igual que 0 o es
un valor perdido, el correspondiente caso no se utilizar en el anlisis.
De Gauss inversa. Esta distribucin es adecuada para las variables con valores de escala
positivos que se desvan hacia valores positivos ms grandes. Si un valor de datos es menor o
igual que 0 o es un valor perdido, el correspondiente caso no se utilizar en el anlisis.
Binomial negativa. Esta distribucin considera el nmero de intentos necesarios para lograr k
xitos y es adecuada para variables que tengan valores enteros que no sean negativos. Si un
valor de datos no es entero, es menor que 0 o es un valor perdido, el correspondiente caso no
78
Captulo 7
Normal. Es adecuada para variables de escala cuyos valores adoptan una distribucin simtrica
con forma de campana en torno a un valor central (la media). La variable dependiente debe
ser numrica.
un perodo fijo de tiempo y es apropiada para variables que tengan valores enteros que no
sean negativos. Si un valor de datos no es entero, es menor que 0 o es un valor perdido, el
correspondiente caso no se utilizar en el anlisis.
Tweedie. Esta distribucin es adecuada para variables que puedan representarse mediante
Multinomial. Esta distribucin es adecuada para variables que representan una respuesta
ordinal. La variable dependiente puede ser numrica o de cadena, y debe tener como mnimo
dos valores vlidos distintos de los datos.
Funcin de enlace
binomial.
79
Ecuaciones de estimacin generalizadas
especificacin de nmero necesaria y debe ser un nmero real. Es apropiada nicamente para
la distribucin binomial.
debe ser un nmero real. Este vnculo se puede utilizar con cualquier distribucin.
80
Captulo 7
En muchos casos, puede especificar sencillamente una variable dependiente. No obstante, las
variables que adoptan nicamente dos valores y las respuestas que registran eventos en ensayos
que requieren una atencin adicional.
Respuesta binaria. Cuando la variable dependiente adopta nicamente dos valores, puede
varianza de la respuesta. Los pesos de escala son valores conocidos que pueden variar de una
observacin a otra. Si se especifica una variable de peso de escala, el parmetro de escala, que est
relacionado con la varianza de la respuesta, se divide por l para cada observacin. Los casos cuyo
valor del peso de escala es menor o igual que 0 o que son perdidos no se utilizan en el anlisis.
81
Ecuaciones de estimacin generalizadas
Para una respuesta binaria, puede elegir la categora de referencia de la variable dependiente.
Puede afectar a ciertos resultados, como las estimaciones de los parmetros y los valores
guardados, pero no debera cambiar el ajuste del modelo. Por ejemplo, si la respuesta binaria
toma los valores 0 y 1:
Por defecto, el procedimiento utiliza la ltima categora (la de mayor valor), o 1, como la
categora de referencia. En esta situacin, las probabilidades guardadas por el modelo estiman
la posibilidad de que un determinado caso tome el valor 0 y las estimaciones de los parmetros
deben interpretarse como relativas a la probabilidad de la categora 0.
82
Captulo 7
La pestaa Predictores permite especificar los factores y las covariables que se utilizarn para
crear los efectos del modelo y para especificar un desplazamiento opcional.
Factores. Los factores son predictores categricos y pueden ser numricos o de cadena.
Covariables. Las covariables son predictores de escala y deben ser numricas.
Nota: Cuando la respuesta es binomial con formato binario, el procedimiento calcula los
estadsticos de bondad de ajuste de chi cuadrado y de desvianza por subpoblaciones que se
basan en la clasificacin cruzada de los valores observados de los factores y las covariables
seleccionadas. Debe mantener el mismo conjunto de predictores en las diferentes ejecuciones del
procedimiento para asegurarse de que se utiliza un nmero coherente de subpoblaciones.
83
Ecuaciones de estimacin generalizadas
su coeficiente, pero se supone que tiene el valor 1. Por tanto, los valores del desplazamiento se
suman sencillamente al predictor lineal del destino. Esto resulta especialmente til en los modelos
de regresin de Poisson, en los que cada caso puede tener diferentes niveles de exposicin
al evento de inters.
Por ejemplo, al modelar las tasas de accidente de diferentes conductores, hay una importante
diferencia entre un conductor que ha sido el culpable de un accidente en tres aos y un conductor
que ha sido el culpable de un accidente en 25 aos. El nmero de accidentes se puede modelar
como una respuesta de Poisson o binomial negativa con un enlace de logaritmo si la experiencia
del conductor se incluye como un trmino de desplazamiento.
Otras combinaciones de los tipos de distribucin y enlace requerirn otras transformaciones
de la variable de desplazamiento.
caso para que se incluyan en el anlisis. Estos controles permiten decidir si los valores definidos
como perdidos por el usuario se deben tratar como vlidos entre las variables de factor.
84
Captulo 7
Orden de categoras. Es relevante para determinar el ltimo nivel de un factor, que puede
estar asociado a un parmetro redundante del algoritmo de estimacin. Si se cambia el orden
de categoras es posible que cambien tambin los valores de los efectos de los niveles de los
factores, ya que estas estimaciones de los parmetros se calculan respecto al ltimo nivel. Los
factores se pueden ordenar en orden ascendente desde el valor mnimo hasta el mximo, en
orden descendente desde el valor mximo hasta el mnimo o siguiendo el orden de los datos.
Significa que el primer valor encontrado en los datos define la primera categora, y el ltimo valor
nico encontrado define la ltima categora.
Especificar efectos del modelo. El modelo por defecto slo utiliza la interseccin, por lo que
deber especificar explcitamente todos los dems efectos del modelo. Puede elegir entre trminos
anidados o no anidados.
85
Ecuaciones de estimacin generalizadas
Trminos no anidados
En este procedimiento, puede construir trminos anidados para el modelo. Los trminos anidados
resultan tiles para modelar el efecto de un factor o covariable cuyos valores no interactan con
los niveles de otro factor. Por ejemplo, una cadena de tiendas de comestibles desea realizar un
seguimiento de los hbitos de gasto de los clientes en las diversas ubicaciones de sus tiendas.
Dado que cada cliente frecuenta tan slo una de estas ubicaciones, se puede decir que el efecto de
Cliente est anidado dentro del efecto de Ubicacin de la tienda.
Adems, puede incluir efectos de interaccin o aadir varios niveles de anidacin al trmino
anidado.
Limitaciones. Existen las siguientes restricciones para los trminos anidados:
Todos los factores incluidos en una interaccin deben ser exclusivos entre s. Por consiguiente,
si A es un factor, no es vlido especificar A*A.
Todos los factores incluidos en un efecto anidado deben ser exclusivos entre s. Por
consiguiente, si A es un factor, no es vlido especificar A(A).
No se puede anidar ningn efecto dentro de una covariable. Por consiguiente, si A es un factor
y X es una covariable, no es vlido especificar A(X).
Interseccin. La interseccin se incluye normalmente en el modelo. Si asume que los datos pasan
86
Captulo 7
Estimacin de parmetros. Los controles de este grupo le permiten especificar los mtodos de
estimacin y proporcionar los valores iniciales para las estimaciones de los parmetros.
de escala.
87
Ecuaciones de estimacin generalizadas
parmetros. Otra posibilidad consiste en especificar los valores iniciales de las estimaciones
de los parmetros.
Las iteraciones y los criterios de convergencia especificados en esta pestaa se aplican nicamente
al modelo lineal generalizado inicial. Para ver los criterios de estimacin utilizados para ajustar
las ecuaciones de estimacin generalizadas, consulte la pestaa Repetida.
Iteraciones.
Mxima subdivisin por pasos. En cada iteracin, se reduce el tamao del paso mediante un
Comprobar si hay separacin completa de los puntos de los datos. Si se activa, el algoritmo
realiza una prueba para garantizar que las estimaciones de los parmetros tienen valores
exclusivos. Se produce una separacin cuando el procedimiento pueda generar un modelo
que clasifique cada caso de forma correcta. Esta opcin no est disponible para respuestas
multinomiales y binomiales con formato binario.
Criterios de convergencia.
la que las modificaciones absolutas o relativas en las estimaciones de los parmetros son
inferiores al valor especificado, que debe ser positivo.
88
Captulo 7
Tolerancia para la singularidad. Las matrices singulares (que no se pueden invertir) tienen
columnas linealmente dependientes, lo que causar graves problemas al algoritmo de estimacin.
Incluso las matrices casi singulares pueden generar resultados deficientes, por lo que el
procedimiento tratar una matriz cuyo determinante es menor que la tolerancia como singular.
Especifique un valor positivo.
Si se especifican valores iniciales, deben proporcionarse para todos los parmetros del modelo
(incluidos los parmetros redundantes). En el conjunto de datos, el orden de las variables de
izquierda a derecha debe ser: TipoFila_, NombreVar_, P1, P2, , donde TipoFila_ y NombreVar_
son variables de cadena y P1, P2, son variables numricas que corresponden a una lista
ordenada de los parmetros.
Los valores iniciales se proporcionan en un registro con el valor EST para la variable
TipoFila_; los valores iniciales reales se proporcionan en las variables P1, P2, . El
procedimiento ignora todos los registros para los que TipoFila_ tienen un valor diferente de
EST, as como todos los registros posteriores a la primera aparicin de TipoFila_ igual a EST.
89
Ecuaciones de estimacin generalizadas
Si est activo Segmentar archivo, las variables debern comenzar con la variable (o las
variables) de segmentacin del archivo en el orden especificado al crear la segmentacin del
archivo, seguidas de TipoFila_, NombreVar_, P1, P2, como se ha indicado anteriormente.
La segmentacin debe haberse realizado en el conjunto de datos especificado en el mismo
orden que en el conjunto de datos original.
Nota: Los nombres de las variables P1, P2, no son necesarios. El procedimiento aceptar
cualquier nombre de variable vlido para los parmetros, ya que la asignacin de las variables a
los parmetros se basa en la posicin de la variable y no en el nombre de la variable. Se ignorarn
todas las variables que aparezcan despus del ltimo parmetro.
La estructura de archivo de los valores iniciales es la misma que la utilizada al exportar el modelo
como datos. Por tanto, puede utilizar los valores finales de una ejecucin del procedimiento como
entrada de una ejecucin posterior.
90
Captulo 7
Tipo de anlisis Especifique el tipo de anlisis que desea generar para contrastar los efectos
del modelo. El anlisis de tipo I suele ser apropiado cuando tiene motivos a priori para
ordenar los predictores del modelo, mientras que el tipo III es de aplicacin ms general.
Los estadsticos generalizados de puntuacin o de Wald se calculan a partir de la seleccin
realizada en el grupo Estadsticos de chi-cuadrado.
91
Ecuaciones de estimacin generalizadas
Intervalos de confianza. Especifique un nivel de confianza mayor que 50 y menor que 100.
Informacin del modelo. Muestra el nombre del conjunto de datos, la variable dependiente o las
Estadsticos de resumen del modelo. Muestra contraste de ajuste del modelo, incluidos los
estadsticos de la razn de la verosimilitud para el contraste mnibus del ajuste del modelo y
los estadsticos para los contrastes de tipo I o III para cada efecto.
Matrices (L) de los coeficientes de contraste. Muestra los coeficientes de los contrastes para los
efectos por defecto y para las medias marginales estimadas, si se solicitaron en la pestaa
Medias marginales estimadas.
Funciones estimables generales. Muestra las matrices para generar las matrices (L) de los
coeficientes de contraste.
92
Captulo 7
Matriz de correlaciones de trabajo. Muestra los valores de la matriz que representan las
Esta pestaa permite ver medias marginales estimadas para los niveles de factores y las
interacciones de los factores. Tambin se puede solicitar que se muestre la media estimada global.
Las medias marginales estimadas no estn disponibles para modelos multinomiales ordinales.
93
Ecuaciones de estimacin generalizadas
Factores e interacciones. Esta lista contiene los factores especificados en la pestaa Predictores y
las interacciones de los factores especificadas en la pestaa Modelo. Las covariables se excluyen
de esta lista. Los trminos pueden seleccionar directamente en esta lista o combinarse en un
trmino de interaccin utilizando el botn Por *.
Mostrar las medias para. Se calculan las medias estimadas de los factores seleccionados y las
Por parejas. Se calculan las comparaciones por parejas para todas las combinaciones de
niveles de los factores especificados o implicados. Este contraste es el nico disponible para
las interacciones de los factores.
Simple. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de
Desviacin. Cada nivel del factor se compara con la media global. Los contrastes de
Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles
Helmert. Compara la media de cada nivel del factor (excepto el ltimo) con la media de
Repetido. Compara la media de cada nivel (excepto el ltimo) con la media del nivel siguiente.
Polinmico. Compara el efecto lineal, cuadrtico, cbico, etc. El primer grado de libertad
contiene el efecto lineal a travs de todas las categoras; el segundo grado de libertad, el
efecto cuadrtico, y as sucesivamente. Estos contrastes se utilizan a menudo para estimar
las tendencias polinmicas.
Escala. Se pueden calcular las medias marginales estimadas de la respuesta, basadas en la escala
original de la variable dependiente o, para el predictor lineal, basadas en la variable dependiente
tal como la transforma la funcin de enlace.
Correccin para comparaciones mltiples. Al realizar contrastes de hiptesis con varios contrastes,
el nivel de significacin global se puede ajustar utilizando los niveles de significacin de los
contrastes incluidos. Este grupo permite elegir el mtodo de ajuste.
Diferencia menos significativa. Este mtodo no controla la probabilidad general de rechazar las
hiptesis de que algunos contrastes lineales son diferentes a los valores de hiptesis nula.
Bonferroni. Este mtodo corrige el nivel de significacin observado por el hecho de que se
Sidak. Este mtodo ofrece lmites ms estrechos que los de la aproximacin de Bonferroni.
es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que
mantiene el mismo nivel de significacin global.
94
Captulo 7
Los elementos marcados se guardan con el nombre especificado. Puede elegir si desea sobrescribir
las variables existentes con el mismo nombre que las nuevas variables o evitar conflictos de
nombres adjuntando sufijos para asegurarse de que los nombres de las nuevas variables son nicos.
Valor pronosticado del promedio de la respuesta. Guarda los valores pronosticados por el
95
Ecuaciones de estimacin generalizadas
Lmite inferior del intervalo de confianza para el promedio de la respuesta. Guarda el lmite
Lmite superior del intervalo de confianza para el promedio de la respuesta. Guarda el lmite
Categora pronosticada. Para los modelos con distribucin binomial y variable dependiente
Valor pronosticado del predictor lineal. Guarda los valores pronosticados por el modelo para
cada caso en la mtrica del predictor lineal (respuesta transformada mediante la funcin de
enlace especificada). Cuando la distribucin de respuesta es multinomial, el procedimiento
guarda el valor pronosticado de cada categora de la respuesta, excepto la ltima, hasta el
nmero de categoras que se ha especificado que se guarden.
Error tpico estimado del valor pronosticado del predictor lineal. Cuando la distribucin de
Residuo bruto. Diferencia entre un valor observado y el valor pronosticado por el modelo.
96
Captulo 7
Exportar modelo como datos. Escribe un conjunto de datos de formato IBM SPSS Statistics
que contiene la matriz de covarianzas o correlaciones de los parmetros con las estimaciones de
los parmetros, errores tpicos, valores de significacin y grados de libertad. El orden de las
variables en el archivo matricial es el siguiente.
Variables de segmentacin. Si se han utilizado, todas las variables que definan segmentaciones.
RowType_. Toma los valores (y las etiquetas de valor) COV (covarianzas), CORR
97
Ecuaciones de estimacin generalizadas
VarName_. Toma los valores P1, P2, ..., correspondientes a una lista ordenada de todos los
parmetros estimados del modelo (salvo los parmetros binomiales negativos o de escala),
para los tipos de fila COV o CORR, con las etiquetas de valor correspondientes a las cadenas
de parmetros mostradas en la tabla de estimaciones de los parmetros. Las casillas estn
vacas para los dems tipos de filas.
P1, P2, ... Estas variables corresponden a una lista ordenada de todos los parmetros del modelo
(incluidos los parmetros binomiales negativos y de escala, segn sea apropiado), con las
etiquetas de variable correspondientes a las cadenas de parmetros mostradas en la tabla de
estimaciones de los parmetros y toman valores segn el tipo de fila.
Para los parmetros redundantes, todas las covarianzas se establecen en cero, las correlaciones
se establecen en el valor perdido del sistema; todas las estimaciones de los parmetros se
establecen en cero; y todos los errores tpicos, niveles de significacin y los grados de libertad
residuales se establecen en el valor perdido del sistema.
Para el parmetro de escala, las covarianzas, correlaciones, nivel de significacin y grados
de libertad se establecen en el valor perdido del sistema. Si el parmetro de escala se estima
mediante mxima verosimilitud, se indica el error tpico; en otro caso se establece en el
valor perdido del sistema.
Para el parmetro binomial negativo, las covarianzas, correlaciones, nivel de significacin
y grados de libertad se establecen en el valor perdido del sistema. Si el parmetro binomial
negativo se estima mediante mxima verosimilitud, se indica el error tpico; en otro caso se
establece en el valor perdido del sistema.
Si hay segmentaciones, se debe acumular la lista de parmetros a travs de todas las
segmentaciones. En una determinada segmentacin, es posible que algunos parmetros sean
irrelevantes; pero no es lo mismo que sean redundantes. Para los parmetros irrelevantes,
todas las covarianzas y correlaciones, estimaciones de los parmetros, errores tpicos, niveles
de significacin y grados de libertad se establecen en el valor perdido del sistema.
Puede utilizar este archivo matricial como valores iniciales para una estimacin posterior del
modelo; tenga en cuenta que este archivo no se puede utilizar directamente para realizar otros
anlisis en otros procedimientos que lean un archivo matricial a menos que dichos procedimientos
acepten todos los tipos de filas que aqu se exportan. Incluso en esos casos, deber asegurarse de
que todos los parmetros del archivo matricial tienen el mismo significado para el procedimiento
que lee el archivo.
Exportar modelo como XML. Guarda las estimaciones de los parmetros y la matriz de covarianzas
de los parmetros (si se selecciona) en formato XML (PMML). Puede utilizar este archivo de
modelo para aplicar la informacin del modelo a otros archivos de datos para puntuarlo.
Especificar valores iniciales para las estimaciones de los parmetros como una lista de
nmeros (utilizando el subcomando CRITERIA).
98
Captulo 7
Fijar covariables en valores distintos los de sus medias al calcular las medias marginales
estimadas (utilizando el subcomando EMMEANS).
Especificar un subconjunto de los factores para los que se muestran las medias marginales
estimadas para compararlos utilizando el tipo de contraste especificado (utilizando las
palabras clave TABLES y COMPARE del subcomando EMMEANS).
Captulo
Los modelos mixtos lineales generalizados amplan el modelo lineal de forma que:
el destino tenga una relacin lineal con los factores y covariables mediante una funcin de
enlace especificada.
los modelos mixtos lineales generalizados cubren una amplia variedad de modelos, desde modelos
mixtos lineales generalizados a modelos multinivel complejos de datos longitudinales no normales.
Ejemplos. El consejo escolar del distrito puede utilizar un modelo mixto lineal generalizado para
determinar si un mtodo de enseanza experimental es eficaz para mejorar las calificaciones de
matemticas. Los estudiantes de la misma aula deben correlacionarse, ya que reciben la enseanza
del mismo profesor, y adems las aulas de la misma escuela deben tambin correlacionarse, de
modo que se puedan incluir efectos aleatorios en los niveles de la escuela y las clases para explicar
las diversas fuentes de variabilidad.
Los investigadores mdicos pueden utilizar un modelo mezclado lineal generalizado para
determinar si un nuevo frmaco anticonvulsivo puede reducir el ndice de ataques epilpticos
de un paciente. Las mediciones repetidas del mismo paciente se correlacionan positivamente
de forma habitual, de modo que podra ser apropiado un modelo mixto con algunos efectos
aleatorios. El campo objetivo, que es el nmero de ataques, recibe valores enteros positivos, de
modo que es posible que sea apropiado un modelo mixto lineal generalizado con una distribucin
Poisson y un enlace de logaritmo.
Los ejecutivos de un proveedor de televisin por cable, telfono y servicios de Internet puede
utilizar un modelo mixto lineal generalizado para conocer ms detalles sobre clientes potenciales.
Ya que las posibles respuestas tienen niveles de medicin nominales, el analista de la empresa
utiliza un modelo mixto logit generalizado con una intercepcin aleatoria para capturar la
correlacin entre respuestas a las preguntas de uso de servicios entre los tipos de servicios
(televisin, telfono, Internet) dentro de las respuestas de un encuestado especfico.
99
100
Captulo 8
Figura 8-1
Pestaa Estructura de datos
La pestaa Estructura de datos le permite especificar las relaciones estructurales entre los registros
de su conjunto de datos cuando se correlacionan las observaciones. Si los registros del conjunto
de datos representan observaciones independientes, no deber especificar nada en esta pestaa.
Sujetos. La combinacin de valores de los campos categricos especificados debe definir de
manera nica los sujetos del conjunto de datos. Por ejemplo, un campo nico ID de paciente
debera ser suficiente para definir los sujetos de un nico hospital, pero puede que sea necesario
combinar ID de hospital e ID de paciente si los nmeros de identificacin de paciente no son
nicos entre varios hospitales. En una configuracin de medidas repetidas, se registran varias
observaciones para cada sujeto, de manera que cada sujeto puede ocupar varios registros del
conjunto de datos.
Un sujeto es una unidad de observacin, la cual se puede considerar independiente de
otros sujetos. Por ejemplo, en un estudio mdico, las lecturas de la presin sangunea de un
paciente se pueden considerar independientes de las lecturas de otros pacientes. La definicin
de los sujetos es particularmente importante cuando se dan medidas repetidas para cada sujeto
y desea modelar la correlacin entre estas observaciones. Por ejemplo, cabe esperar que estn
correlacionadas las lecturas de la presin sangunea de un nico paciente en una serie de visitas
consecutivas al mdico.
101
Modelos mixtos lineales generalizados
Todos los campos especificados como Sujetos en la pestaa Estructura de datos se utilizan
para definir sujetos para la estructura de la covarianza residual y obtener la lista de posibles
campos para definir sujetos para estructuras de covarianza de los efectos aleatorios en el Bloque
de efectos aleatorios.
Medidas repetidas. Los campos especificados aqu se usan para identificar las observaciones
repetidas. Por ejemplo, una nica variable Semana puede identificar las 10 semanas de
observaciones de un estudio mdico o se pueden usar Mes y Da para identificar las observaciones
diarias realizadas a lo largo de un ao.
Definir grupos de covarianza por. Los campos que se especifiquen aqu definen conjuntos
independientes de parmetros de covarianza de efectos repetidos, uno por cada categora definida
por la clasificacin cruzada de los campos de agrupacin. Todos los sujetos tienen el mismo
tipo de covarianza; los sujetos en el mismo grupo de covarianza tendrn los mismos valores de
los parmetros.
Tipo de covarianza para Repetidas. Especifica la estructura de la covarianza para los residuos. Las
Simetra compuesta
Diagonal
Identidad escalada
Toeplitz
Sin estructura
Componentes de la varianza
102
Captulo 8
E Pulse en Opciones de modelo para guardar puntuaciones en el conjunto de datos activo y exportar
Explorar datos. Lee los datos del conjunto de datos activo y asigna el nivel de medicin
Asignar manualmente. Abre un cuadro de dilogo que contiene todos los campos con un
nivel de medicin desconocido. Puede utilizar este cuadro de dilogo para asignar el nivel
de medicin a esos campos. Tambin puede asignar un nivel de medicin en la Vista de
variables del Editor de datos.
Como el nivel de medicin es importante para este procedimiento, no puede acceder al cuadro
de dilogo para ejecutar este procedimiento hasta que se hayan definido todos los campos en
el nivel de medicin.
103
Modelos mixtos lineales generalizados
Objetivo
Figura 8-3
Configuracin de destino
Esta configuracin define el destino, su distribucin y su relacin con los predictores mediante
la funcin de enlace.
Objetivo. El objetivo es obligatorio. Puede tener cualquier nivel de medicin y el nivel de
medicin del destino restringe las distribuciones y funciones de enlace que son adecuadas.
104
Captulo 8
El nmero de ensayos debe ser mayor o igual que el nmero de eventos para cada registro.
Los eventos deben ser enteros no negativos y los ensayos deben ser enteros positivos.
categora de referencia. Esto puede afectar a ciertos resultados, como las estimaciones de
los parmetros, pero no debera cambiar el ajuste del modelo. Por ejemplo, si su destino
toma los valores 0, 1 y 2, por defecto el procedimiento realiza la ltima categora (la de
mayor valor) o 2, la categora de referencia. En esta situacin, las estimaciones de parmetros
deben interpretarse como relacionadas con la probabilidad de la categora 0 1 relativa a
la probabilidad de que haya una categora 2. Si especifica una categora personalizada y su
destino tiene etiquetas definidas, puede definir la categora de referencia seleccionando un
valor de la lista. Puede resultar cmodo si, a mitad del proceso de especificar un modelo, no
recuerda exactamente cmo se ha codificado un campo concreto.
Distribucin de destino y relacin (enlace) con el modelo lineal. Teniendo en cuenta los valores
de los predictores, el modelo espera que la distribucin de los valores del destino siga la forma
especificada y que los valores de destino tengan una relacin lineal con los predictores mediante la
funcin de enlace especificada. Se proporcionan los accesos directos de varios modelos comunes
o seleccione un ajuste Personalizado si hay una combinacin especfica de distribucin y funcin
de enlace que desee ajustar y que no est en la lista corta.
Modelo lineal. Especifica una distribucin normal con un enlace de identidad, que es til si el
Regresin gamma. Especifica una distribucin gamma con un enlace de logaritmo, que se debe
utilizar si el destino contiene todos los valores positivos y es asimtrico a valores mayores.
Loglinear. Especifica una distribucin de Poisson con un enlace de logaritmo, que se debe
Regresin binomial negativa. Especifica una distribucin binomial negativa con un enlace
Regresin logstica multinomial. Especifica una distribucin multinomial, que se debe utilizar si
el destino es una respuesta de categora mltiple. Utiliza un enlace logit acumulado (resultados
ordinales) o un enlace logit generalizado (respuestas nominales con categoras mltiples).
Regresin logstica binaria. Especifica una distribucin binomial con un enlace Logit, que se
debe utilizar si el destino es una respuesta binaria pronosticada por un modelo de regresin
logstica.
Probit binario. Especifica una distribucin binomial con un enlace probit, que se debe utilizar
Esta seleccin especifica la distribucin del destino. La posibilidad de especificar una distribucin
que no sea la normal y una funcin de enlace que no sea la identidad es la principal mejora
que aporta el modelo mixto lineal generalizado respecto al modelo lineal general. Hay muchas
105
Modelos mixtos lineales generalizados
combinaciones posibles de distribucin y funcin de enlace, varias de las cuales pueden ser
adecuadas para un determinado conjunto de datos, por lo que su eleccin puede estar guiada por
consideraciones tericas a priori y por las combinaciones que parezcan funcionar mejor.
Binomial. Esta distribucin es adecuada nicamente para un destino que represente una
Gamma. Esta distribucin es adecuada para un destino con valores de escala positivos que se
desvan hacia valores positivos ms grandes. Si un valor de datos es menor o igual que 0 o es
un valor perdido, el correspondiente caso no se utilizar en el anlisis.
De Gauss inversa. Esta distribucin es adecuada para un destino con valores de escala positivos
que se desvan hacia valores positivos ms grandes. Si un valor de datos es menor o igual que
0 o es un valor perdido, el correspondiente caso no se utilizar en el anlisis.
Multinomial. Esta distribucin es adecuada para un destino que represente una respuesta de
categora mltiple. La forma del modelo depender del nivel de medicin del destino.
Un destino nominal dar como resultado un modelo nominal multinomial en el que un
conjunto separado de parmetros de modelo se estiman para cada categora del destino
(excepto la categora de referencia). Las estimaciones de parmetro de un predictor dado
muestran la relacin entre ese predictor y la similitud de cada categora del destino, relativa a
la categora de referencia.
Un destinoordinal dar como resultado un modelo ordinal multinomial en el que el trmino
de interseccin tradicional viene sustituido por un conjunto de parmetros de umbral que se
relaciona con la probabilidad acumulada de las categoras de destino.
Binomial negativa. La regresin binomial negativa utiliza una distribucin binomial negativa
Normal. Es adecuada para un destino continuo cuyos valores adoptan una distribucin
un perodo fijo de tiempo y es apropiada para variables que tengan valores enteros que no
sean negativos. Si un valor de datos no es entero, es menor que 0 o es un valor perdido, el
correspondiente caso no se utilizar en el anlisis.
Funciones de enlace
La funcin de enlace es una transformacin del destino que permite la estimacin del modelo. Se
encuentran disponibles las siguientes funciones:
Identidad. f(x)=x. El destino no se transforma. Este vnculo se puede utilizar con cualquier
binomial o multinomial.
multinomial.
Log. f(x)=log(x). Este vnculo se puede utilizar con cualquier distribucin, excepto la
multinomial.
106
Captulo 8
multinomial.
o multinomial.
debe ser un nmero real. Este vnculo se puede utilizar con cualquier distribucin, excepto
la multinomial.
Efectos fijos
Figura 8-4
Configuracin de efectos fijos
Los factores de efectos fijos se suelen considerar campos cuyos valores de inters se representan
en el conjunto de datos y se pueden utilizar para la puntuacin. Por defecto, los campos con el
papel de entrada predefinido que no se especifican en ninguna otra parte del cuadro de dilogo se
introducen en la seccin de efectos fijos del modelo. Los campos categricos (nominal y ordinal)
se utilizan como factores en el modelo y los campos continuos se utilizan como covariables.
107
Modelos mixtos lineales generalizados
Principal. Los campos aparecen como efectos principales diferentes en la parte inferior de la
lista de efectos.
2 vas. Todos los pares posibles de los campos aparecern como interacciones de 2 vas en la
3 vas. Todos los triples posibles de los campos aparecern como interacciones de 3 vas en la
*. La combinacin de todos los campos aparecer como una interaccin nica en la parte
Incluir interseccin. La interseccin se incluye normalmente en el modelo. Si asume que los datos
108
Captulo 8
En este procedimiento, puede construir trminos anidados para el modelo. Los trminos anidados
resultan tiles para modelar el efecto de un factor o covariable cuyos valores no interactan con
los niveles de otro factor. Por ejemplo, una cadena de tiendas de comestibles desea realizar un
seguimiento de los hbitos de gasto de los clientes en las diversas ubicaciones de sus tiendas.
Dado que cada cliente frecuenta tan slo una de estas ubicaciones, se puede decir que el efecto de
Cliente est anidado dentro del efecto de Ubicacin de la tienda.
Adems, puede incluir efectos de interaccin, como trminos polinmicos que implican a la
misma covariable, o aadir varios niveles de anidacin al trmino anidado.
Limitaciones. Existen las siguientes restricciones para los trminos anidados:
Todos los factores incluidos en una interaccin deben ser exclusivos entre s. Por consiguiente,
si A es un factor, no es vlido especificar A*A.
Todos los factores incluidos en un efecto anidado deben ser exclusivos entre s. Por
consiguiente, si A es un factor, no es vlido especificar A(A).
No se puede anidar ningn efecto dentro de una covariable. Por consiguiente, si A es un factor
y X es una covariable, no es vlido especificar A(X).
botn de flecha.
E Pulse en (Dentro).
E Seleccione el factor dentro del cual el factor o covariable anterior se anida y pulse en el botn
de flecha.
E Pulse en Aadir trmino.
Si lo desea, puede incluir efectos de interaccin o aadir varios niveles de anidacin al trmino
anidado.
109
Modelos mixtos lineales generalizados
Efectos aleatorios
Figura 8-6
Configuracin de efectos aleatorios
Los factores de efectos aleatorios son campos cuyos valores en el archivo de datos se pueden
considerar una muestra aleatoria de una poblacin mayor de valores. Son tiles para explicar el
exceso de variabilidad en el destino. Por defecto, si ha seleccionado ms de un sujeto en la pestaa
Estructura de datos, se crear un bloque de efectos aleatorios para cada sujeto ms all de su sujeto
ms interior. Por ejemplo, si ha seleccionado Colegio, Clase y Alumno como sujetos en la pestaa
Estructura de datos, se crearn automticamente los siguientes bloques de efectos aleatorios:
de efectos aleatorios .
E Para modificar un bloque existente, seleccione el bloque que desea modificar y pulse en Editar
bloque... Se abrir el cuadro de dilogo Bloque de efectos aleatorios .
E Para eliminar uno o ms bloques, seleccione los bloques que desee eliminar y pulse en botn
Eliminar.
110
Captulo 8
Principal. Los campos aparecen como efectos principales diferentes en la parte inferior de la
lista de efectos.
2 vas. Todos los pares posibles de los campos aparecern como interacciones de 2 vas en la
3 vas. Todos los triples posibles de los campos aparecern como interacciones de 3 vas en la
*. La combinacin de todos los campos aparecer como una interaccin nica en la parte
111
Modelos mixtos lineales generalizados
forma predeterminada. Si asume que los datos pasan por el origen, puede excluir la interseccin.
Definir grupos de covarianza por. Los campos que se especifiquen aqu definen conjuntos
independientes de parmetros de covarianza de efectos aleatorios, uno por cada categora definida
por la clasificacin cruzada de los campos de agrupacin. Es posible especificar un conjunto
distinto de campos de agrupacin para cada bloque de efectos aleatorios. Todos los sujetos tienen
el mismo tipo de covarianza; los sujetos en el mismo grupo de covarianza tendrn los mismos
valores de los parmetros.
Combinacin de sujetos. Le permite especificar sujetos de efectos aleatorios desde combinaciones
predefinidas de sujetos de la pestaa Estructura de datos. Por ejemplo, si Colegio, Clase y Alumno
se definen como sujetos en la pestaa Estructura de datos y en ese orden, la lista desplegable
Combinacin de sujetos tendr las opciones Ninguno, Colegio, Colegio * Clase y Colegio * Clase
* Alumno.
Tipo de covarianza de efecto aleatorio. Especifica la estructura de la covarianza para los residuos.
Simetra compuesta
Diagonal
Identidad escalada
Toeplitz
Sin estructura
Componentes de la varianza
112
Captulo 8
Ponderacin y desplazamiento
Figura 8-8
Configuracin de Ponderacin y desplazamiento
con la varianza de la respuesta. Los pesos de anlisis son valores conocidos que pueden variar
de una observacin a otra. Si se especifica el campo de ponderacin de anlisis, el parmetro
de escala, que est relacionado con la varianza de la respuesta, se divide por los valores de
ponderacin de anlisis para cada observacin. Los registros cuyos valores de ponderacin de
anlisis es menor o igual que 0 o que son perdidos no se utilizan en el anlisis.
Desplazamiento. El trmino desplazamiento es un predictor estructural. El modelo no estima
su coeficiente, pero se supone que tiene el valor 1. Por tanto, los valores del desplazamiento se
suman sencillamente al predictor lineal del destino. Esto resulta especialmente til en los modelos
de regresin de Poisson, en los que cada caso puede tener diferentes niveles de exposicin
al evento de inters.
Por ejemplo, al modelar las tasas de accidente de diferentes conductores, hay una importante
diferencia entre un conductor que ha sido el culpable de un accidente en tres aos y un conductor
que ha sido el culpable de un accidente en 25 aos. El nmero de accidentes se puede modelar
como una respuesta de Poisson o binomial negativa con un enlace de logaritmo si la experiencia
del conductor se incluye como un trmino de desplazamiento.
113
Modelos mixtos lineales generalizados
Opciones de construccin
Figura 8-9
Configuracin de Opciones de construccin
Estas selecciones especifican algunos de los criterios ms avanzados utilizados para crear el
modelo.
Orden de clasificacin. Estos controles determinan el orden de las categoras del destino y los
Nivel de confianza. ste es el nivel de confianza que se utiliza para calcular las estimaciones
de intervalos de los coeficientes de modelos. Especifique un valor mayor que 0 y menor que
100. El valor por defecto es 95.
114
Captulo 8
Grados de libertad. Especifica cmo se calculan los grados de libertad para las comprobaciones
de significacin. Seleccione Fijo para todas las pruebas (mtodo residual) si el tamao de
muestra es suficientemente grande, si datos estn equilibrados o si el modelo utiliza un tipo
de covarianza ms sencillo; por ejemplo, identidad escalada o diagonal. sta es la opcin
por defecto. Seleccione Variados entre pruebas (aproximacin Satterthwaite) si el tamao de
muestra es pequeo, los datos no estn equilibrados o el modelo utiliza un tipo de covarianza
complicado; por ejemplo, sin estructurar.
Medias estimadas
Figura 8-10
Configuracin de Medias estimadas
Esta pestaa permite ver medias marginales estimadas para los niveles de factores y las
interacciones de los factores. Las medias marginales estimadas no estn disponibles para modelos
multinomiales.
Trminos. Los trminos de modelo de los Efectos fijos que se componen enteramente de campos
categricos se enumeran aqu. Seleccione cada trmino para el que desea que el modelo produzca
las medias marginales.
115
Modelos mixtos lineales generalizados
Tipo de contraste. Especifica el tipo de contraste que se utilizar para los niveles del campo
contraste seleccionado. Si se selecciona Ninguno como tipo de contraste, no podr (ni ser
necesario) seleccionar ningn campo de contraste.
Campos continuos. Los campos continuos enumerados se extraen de los trminos de los efectos
fijos que usan campos continuos. Al calcular las medias marginales, las covariables se fijan en los
valores especificados. Seleccione la media o especifique un valor personalizado.
Mostrar medias estimadas segn. Especifica si se calcularn las medias marginales en funcin de
la escala original del destino o en funcin de la transformacin de la funcin de enlace. Escala
original del objetivo calcula las medias marginales del destino. Tenga en cuenta que si se especifica
el destino utilizando la opcin eventos/ensayos, proporciona la media marginal para la proporcin
eventos/ensayos en lugar del nmero de eventos. Transformacin de funcin de enlace calcula la
media marginal del predictor lineal.
Ajustar para comparaciones mltiples utilizando. Al realizar contrastes de hiptesis con varios
contrastes, el nivel de significacin global se puede ajustar utilizando los niveles de significacin
de los contrastes incluidos. Permite elegir el mtodo de ajuste.
Diferencia menos significativa. Este mtodo no controla la probabilidad general de rechazar las
hiptesis de que algunos contrastes lineales son diferentes a los valores de hiptesis nula.
es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que
mantiene el mismo nivel de significacin global.
El mtodo de diferencia menos significativa es menos conservador que el mtodo de Sidak
secuencial, que a su vez es menos conservador que el de Bonferroni secuencial; en otras palabras,
el mtodo de diferencia menos significativa rechazar como mnimo tantas hiptesis como el
mtodo de Sidak secuencial, que a su vez rechazar como mnimo tantas hiptesis como el
mtodo de Bonferroni secuencial.
116
Captulo 8
Guardar
Figura 8-11
Configuracin de guardar
guarda las probabilidades pronosticadas de las primeras n categoras, hasta el valor especificado
como Mximo de categoras para guardar. Los valores calculados son probabilidades acumuladas
para destinos ordinales. El nombre de raz por defecto es PredictedProbability. Para guardar
la probabilidad pronosticada de la categora pronosticada, guarde la confianza (consulte a
continuacin).
Intervalos de confianza. Guarda el lmite inferior y superior del intervalo de confianza del valor
pronosticado o la probabilidad pronosticada. Para todas las distribuciones excepto la multinomial,
crea dos variables y el nombre de raz por defecto es CI, con _Lower y _Upper como sufijos.
117
Modelos mixtos lineales generalizados
Para la distribucin multinomial y un destino nominal, se crea un campo para cada categora de
variable dependiente. Esta guarda los lmites inferior y superior de la probabilidad pronosticada
de las primeras n categoras, hasta el valor especificado como Mximo de categoras para guardar.
El nombre de raz por defecto es CI y los nombres de campos por defecto son CI_Lower_1,
CI_Upper_1, CI_Lower_2, CI_Upper_2, etctera, que se corresponden con el orden de las
categoras de destino.
Para la distribucin multinomial y un destino ordinal, se crea un campo para cada categora de
variable dependiente, excepto la ltima (Si desea obtener ms informacin, consulte el tema
Opciones de construccin el p. 113.). Guarda los lmites inferior y superior de la probabilidad
acumulada pronosticada para las n primeras categoras, hasta la ltima, sin incluirla y hasta el
valor especificado como Mximo de categoras para guardar. El nombre de raz por defecto es CI y
los nombres de campos por defecto son CI_Lower_1, CI_Upper_1, CI_Lower_2, CI_Upper_2,
etctera, que se corresponden con el orden de las categoras de destino.
Residuos de Pearson Guarda el residuo de Pearson de cada registro, que se puede utilizar
tras el clculo como diagnsticos del ajuste del modelo. El nombre del campo por defecto
es ResiduoPearson.
Confianzas. Guarda la confianza en el valor pronosticado del destino categrico. La confianza
calculada se puede basar en las probabilidades del valor pronosticado (la probabilidad ms alta
pronosticada) o la diferencia entre la probabilidad ms alta pronosticada y la segunda probabilidad
ms alta pronosticada. El nombre del campo por defecto es Confianza.
Exportar modelo.Escribe el modelo en un archivo .zip externo. Puede utilizar este archivo
de modelo para aplicar la informacin del modelo a otros archivos de datos para puntuarlo.
Especifique un nombre de archivo exclusivo y vlido. Si la especificacin de archivo hace
referencia a un archivo existente, se sobreescribir el archivo.
118
Captulo 8
especificada en la configuracin del destino. Si el destino est definido por eventos y ensayos,
la casilla se divide mostrando el campo de eventos y el campo de ensayos o el nmero fijo de
ensayos. Adems se muestran el criterio de informacin de Akaike para muestras finitas (AICC) y
el criterio de informacin bayesiano (BIC).
Akaike corregido. Una medida para seleccionar y comparar modelos mixtos basada en la -2
log verosimilitud (restringida). Los valores menores indican modelos mejores. El AICC
"corrige" el AIC respecto a tamaos muestrales pequeos. A medida que aumenta el tamao
muestral, el AICC converge con el AIC.
Bayesiano. Una medida para seleccionar y comparar modelos basada en la -2 log verosimilitud.
Los valores menores indican modelos mejores. El BIC tambin penaliza los modelos
sobreparametrizados, pero de manera ms estricta que el AIC.
Grfico. Si el destino es categrico, un grfico muestra la precisin del modelo final, que es el
119
Modelos mixtos lineales generalizados
Estructura de datos
Figura 8-13
Vista de estructura de datos
120
Captulo 8
121
Modelos mixtos lineales generalizados
Clasificacin
Figura 8-15
Vista de clasificacin
Porcentajes de fila. Muestra los porcentajes de fila (los recuentos de casillas expresados como
un porcentaje de los totales de filas) en las casillas. sta es la opcin por defecto.
Recuentos de las casillas. Muestra los recuentos de las casillas. El sombreado del mapa
Comprimido. No muestra encabezados de fila y columna ni valores de las casillas. Puede ser
fila (Perdidos) en todas las filas vlidas. Los registros con valores perdidos no contribuyen en el
porcentaje global correcto.
Mltiples variables. Si hay mltiples objetivos categricos, cada destino se muestra en una tabla
diferente y hay una lista desplegable Destino que controla los destinos que se muestran.
Tablas grandes. Si el destino que se muestra tiene ms de 100 categoras, no se mostrar la tabla.
122
Captulo 8
Efectos fijos
Figura 8-16
Vista de efectos fijos, estilo de diagrama
Figura 8-17
Vista de efectos fijos, estilo de tabla
123
Modelos mixtos lineales generalizados
desplegable Estilo.
que se han especificado en la configuracin de Efectos fijos. Las lneas de conexin del
diagrama se ponderan tomando como base la significacin del efecto, con un grosor de lnea
mayor correspondiente a efectos con mayor significacin (valores p inferiores). sta es la
opcin por defecto.
Tabla. Se trata de una tabla ANOVA para el modelo completo y los efectos de modelo
Coeficientes fijos
Figura 8-18
Vista de coeficientes fijos, estilo de diagrama
124
Captulo 8
Figura 8-19
Vista de coeficientes fijos, estilo de tabla
Esta vista muestra el valor de cada coeficiente fijo en el modelo. Tenga en cuenta que los factores
(predictores categricos) tienen codificacin de indicador dentro del modelo, de modo que los
efectos que contienen los factores generalmente tendrn mltiples coeficientes asociados: uno por
cada categora exceptuando la categora que corresponde al coeficiente redundante.
Estilos. Existen varios estilos de visualizacin diferentes, que son accesibles desde la lista
desplegable Estilo.
Diagrama. Es un grfico que muestra la interseccin primero y clasifica los efectos de superior
125
Modelos mixtos lineales generalizados
como base la significacin del coeficiente, con un grosor de lnea mayor correspondiente a
coeficientes con mayor significacin (valores p inferiores). Este es el estilo por defecto.
Tabla. Muestra los valores, las pruebas de significacin y los intervalos de confianza para
desplegable Estilo.
columna.
Bloques. Si hay mltiples de bloques de efectos aleatorios, hay una lista desplegable Bloque
los destinos categricos que se mostrarn. El orden de clasificacin de los valores de la lista est
determinado por la especificacin de la configuracin de Opciones de construccin.
126
Captulo 8
Parmetros de covarianza
Figura 8-20
Vista de parmetros de covarianza
Esta vista muestra los clculos de los parmetros de covarianza y sus estadsticos relacionados
de efectos residuales y aleatorios. Son resultados avanzados y fundamentales que proporcionan
informacin sobre si la estructura de la covarianza es la adecuada.
Tabla de resumen Es una referencia rpida del nmero de parmetros en las matrices de covarianza
residuales (R) y de efectos aleatorios (G), el rango (nmero de columnas) en el efecto fijo (X) y
aleatorio (Z) matrices de diseo y el nmero de sujetos definidos por los campos de sujeto que
definen la estructura de los datos.
Tabla de parmetros de covarianza. Para el efecto seleccionado, la estimacin, error tpico y el
127
Modelos mixtos lineales generalizados
Efectos Si hay mltiples de bloques de efectos aleatorios, hay una lista desplegable Efecto para
seleccionar el efecto de bloque residual o aleatorio que se mostrar. El efecto residual est
siempre disponible.
Grupos. Si un bloque de efecto residual o aleatorio tiene una especificacin de grupo, se incluir
una lista desplegable Grupo para seleccionar el nivel de grupo que se mostrar.
Multinomial. Si la distribucin multinomial est activada, la lista desplegable Multinomial controla
los destinos categricos que se mostrarn. El orden de clasificacin de los valores de la lista est
determinado por la especificacin de la configuracin de Opciones de construccin.
desplegable Estilo.
Diagrama. Muestra un grfico de lneas del valor de estimacin del modelo del destino en el
eje vertical de cada valor del efecto principal (o primer efecto de la lista en una interaccin)
en el eje horizontal; se produce una lnea diferente para cada valor del segundo efecto en una
interaccin y un grfico distinto para cada valor del tercer efecto en una interaccin de 3 vas;
el resto de predictores se mantienen constantes.
Si se han solicitado contrastes, se muestra otro grfico para comparar los niveles del campo de
contraste; para las interacciones, se muestra un grfico para cada nivel de combinacin de
los efectos diferente al campo de contraste. En contrastes por parejas, es una representacin
grfica de la tabla de comparaciones en la que las distancias entre nodos de la red corresponden
a las diferencias entre las muestras. Las lneas amarillas corresponden a diferencias
estadsticamente importantes, mientras que las lneas negras corresponden a diferencias no
significativas. Al pasar el ratn por una lnea de la red se muestra una sugerencia con la
significacin corregida de la diferencia entre los nodos conectados por la lnea.
128
Captulo 8
En contrastes de desviacin, se muestra un grfico de barras con el valor estimado del modelo
del destino en el eje vertical y los valores del campo de contraste en el eje horizontal; en las
interacciones, se muestra un grfico para cada combinacin de niveles de los efectos en lugar
del campo de contraste. Las barras muestran la diferencia entre cada nivel del campo de
contraste y la media global, que se representa por una lnea horizontal negra.
En contrastes simples, se muestra un grfico de barras con el valor estimado del modelo del
destino en el eje vertical y los valores del campo de contraste en el eje horizontal; en las
interacciones, se muestra un grfico para cada combinacin de niveles de los efectos en lugar
del campo de contraste. Las barras muestran la diferencia entre cada nivel del campo de
contraste (excepto el ltimo) y el ltimo nivel, que se representa por una lnea horizontal negra.
Tabla. Este estilo muestra una tabla de valores del destino estimados por el usuario, su error
menos contrastes que el diseo de red, pero evita que las lneas se superpongan.
Captulo
investigadores contaron las personas presentes en cada grupo, combinando las diversas categoras
de grado de dureza del agua (blanda, media o dura), uso previo de una de las dos marcas y
temperaturas de lavado (fro o caliente). Averiguaron que la temperatura est relacionada con
la dureza del agua y con la preferencia por una u otra marca.
Estadsticos. Frecuencias, residuos, estimaciones de los parmetros, errores tpicos, intervalos de
confianza y pruebas de asociacin parcial. Para los modelos personalizados, grficos de residuos
y grficos de probabilidad normal.
Datos. Las variables de factor son categricas. Todas las variables que se vayan a analizar deben
ser numricas. Las variables categricas de cadena se pueden recodificar en variables numricas
antes de comenzar el anlisis para la seleccin del modelo.
Evite especificar muchas variables con un nmero elevado de niveles. Tales especificaciones
pueden conducir a una situacin en la que muchas casillas posean un nmero reducido de
observaciones y los valores de chi-cuadrado puede que no sean tiles.
Procedimientos relacionados. El procedimiento Seleccin de modelo puede ayudar a identificar
los trminos que se necesitan en el modelo. A continuacin, puede pasar a evaluar el modelo
utilizando el Anlisis loglineal general o el Anlisis loglineal logit. Es posible utilizar la
recodificacin automtica para recodificar las variables de cadena. Si una variable numrica posee
categoras vacas, utilice Recodificar para crear valores enteros consecutivos.
Para obtener una seleccin de modelo en el anlisis loglineal
129
130
Captulo 9
Figura 9-1
Cuadro de dilogo Anlisis loglineal: Seleccin de modelo
Si lo desea, puede seleccionar una variable de ponderacin de casilla para especificar los ceros
estructurales.
Se debe indicar el rango de categoras para cada variable de factor. Los valores para Mnimo y
Mximo corresponden a las categoras menor y mayor de la variable de factor. Ambos valores
deben ser enteros y el valor mnimo debe ser menor que el mximo. Se excluyen los casos con
valores fuera de los lmites. Por ejemplo, si especifica un valor mnimo de 1 y uno mximo de 3,
solamente se utilizarn los valores 1, 2 y 3. Repita este proceso para cada variable de factor.
131
Anlisis loglineal: Seleccin de modelo
Especificar modelo. Un modelo saturado contiene todos los efectos principales de factor y todas
las interacciones factor por factor. Seleccione Personalizado para especificar una clase generadora
para un modelo no saturado.
Clase generadora. Una clase generadora es una lista de los trminos de mayor orden en los que
se encuentran implicados los factores. Un modelo jerrquico contiene los trminos que definen
la clase generadora y todos los relativos de orden inferior. Supongamos que se seleccionan
las variables A, B y C en la lista Factores y, a continuacin, Interaccin en la lista desplegable
Construir trminos. El modelo resultante contendr la interaccin triple A*B*C especificada,
las interacciones dobles A*B, A*C y B*C, as como los efectos principales para A, B y C. No
especifique los relativos de orden inferior en la clase generadora.
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
132
Captulo 9
Mostrar. Puede elegir entre Frecuencias, Residuos, o ambos. En un modelo saturado, las
frecuencias observadas y las esperadas son iguales, y los residuos son iguales a 0.
Grfico. Para los modelos personalizados es posible elegir uno o ambos tipos de grficos, Residuos
y Probabilidad normal. stos ayudarn a determinar cmo se ajusta el modelo a los datos.
Mostrar para el modelo saturado. Para un modelo saturado, es posible elegir Estimaciones de
los parmetros. Las estimaciones de los parmetros pueden ayudar a determinar qu trminos
se pueden excluir del modelo. Tambin se encuentra disponible una tabla de asociacin que
enumera pruebas de asociacin parcial. Esta opcin supone un proceso de clculo muy extenso
cuando se trata de tablas con muchos factores.
Criterios del modelo. Se utiliza un algoritmo iterativo de ajuste proporcional para obtener
las estimaciones de los parmetros. Es posible suprimir uno o ms criterios de estimacin
especificando N mximo de iteraciones, Convergencia o Delta (un valor aadido a todas las
frecuencias de casilla para los modelos saturados).
Captulo
10
matriz del diseo; estimaciones de los parmetros; razn de las ventajas; log-razn de las ventajas;
GLOR (log-razn de las ventajas generalizada); estadstico de Wald; intervalos de confianza.
Grficos: residuos corregidos, residuos de desviacin y probabilidad normal.
Datos. Los factores son categricos y las covariables de casilla son continuas. Cuando se introduce
una covariable en el modelo, se aplica a cada casilla el valor medio de la covariable para los casos
de esa casilla. Las variables de contraste son continuas. Se utilizan para calcular los logaritmos de
la razn de las ventajas generalizadas. Los valores de la variable de contraste son los coeficientes
para la combinacin lineal de los logaritmos de las frecuencias esperadas de casilla.
Una variable de estructura de casilla asigna ponderaciones. Por ejemplo, si algunas de las
casillas son ceros estructurales, la variable de estructura de casilla posee un valor de 0 1. No
utilice una variable de estructura de casilla para ponderar los datos agregados. En su lugar, elija
Ponderar casos en el men Datos.
Supuestos. Existen dos distribuciones disponibles en el anlisis loglineal general: Poisson y
multinomial.
133
134
Captulo 10
El evento de una observacin que est en una casilla es estadsticamente independiente de los
recuentos de casilla de otras casillas.
El tamao muestral total es fijo o el anlisis est condicionado al tamao muestral total.
factor.
Si lo desea, puede:
Seleccionar una variable de estructura de casilla para definir ceros estructurales o incluir un
trmino de desplazamiento.
135
Anlisis loglineal general
Especificar modelo. Un modelo saturado contiene todos los efectos principales e interacciones
que impliquen a las variables de factor. No contiene trminos para las covariables. Seleccione
Personalizado para especificar slo un subconjunto de interacciones o para especificar
interacciones factor por covariable.
Factores y covariables. Muestra una lista de los factores y las covariables.
Trminos del modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar
Personalizado, puede elegir los efectos principales y las interacciones que sean de inters para el
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
136
Captulo 10
El procedimiento Anlisis loglineal general muestra informacin sobre el modelo y los estadsticos
de bondad de ajuste. Adems, tiene la posibilidad de elegir una o varias de las opciones siguientes:
Mostrar. Puede elegir entre varias opciones de estadsticos: frecuencias esperadas y observadas de
casilla, residuos de desviacin, corregidos y simples (o brutos), una matriz del diseo del modelo
y estimaciones de los parmetros para el modelo.
Grfico. Los grficos, los cuales slo estn disponibles para los modelos personalizados, incluyen
parmetros.
Criterios. Se utiliza el mtodo de Newton-Raphson para obtener estimaciones maximo-verosmiles
de los parmetros. Es posible introducir nuevos valores para el nmero mximo de iteraciones, el
criterio de convergencia y la delta (constante aadida a todas las casillas para las aproximaciones
iniciales). La delta permanece en las casillas para los modelos saturados.
137
Anlisis loglineal general
Seleccione los valores que desee guardar como nuevas variables en el conjunto de datos activo.
El sufijo n aadido a los nuevos nombres de variable se incrementa para formar un nombre
exclusivo para cada variable guardada.
Los valores guardados hacen referencia a los datos agregados (las casillas de la tabla de
contingencia), aunque los datos estn registrados como observaciones individuales en el Editor
de datos. Si se guardan los valores pronosticados o los residuos para datos no agregados, el
valor a guardar para una casilla de la tabla de contingencia es introducido en el Editor de datos
para cada caso de esa casilla. Para que los valores guardados tengan sentido, se debera agregar
los datos para obtener los recuentos de casilla.
Se pueden guardar cuatro tipos de residuos: de desviacin, corregidos, tipificados y brutos.
Tambin se pueden guardar los valores pronosticados.
Residuos tipificados. Los residuos divididos por una estimacin de su error tpico. Los residuos
Residuos corregidos. El residuo tipificado dividido por la estimacin de su error tpico. Dado
que, cuando el modelo es el correcto, los residuos corregidos son asintticamente normales
tpicos, stos son preferidos a los residuos tipificados a la hora de contrastar la normalidad.
Cambiar el valor por defecto del umbral para la comprobacin de la redundancia (utilizando el
subcomando CRITERIA).
138
Captulo 10
Captulo
11
valores numricos o valores de cadena de hasta ocho caracteres. Las covariables de casilla pueden
ser continuas, pero cuando una covariable est en el modelo, se aplica a una casilla dada el valor
medio de la covariable para los casos de a esa casilla. Las variables de contraste son continuas. Se
utilizan para calcular el logaritmo de la razn de las ventajas (GLOR). Los valores de la variable
de contraste son los coeficientes para la combinacin lineal de los logaritmos de las frecuencias
esperadas de casilla.
Una variable de estructura de casilla asigna ponderaciones. Por ejemplo, si algunas de las
casillas son ceros estructurales, la variable de estructura de casilla posee un valor de 0 o 1. No
utilice una variable de estructura de casilla para ponderar datos de agregacin. En su lugar,
utilice Ponderar casos del men Datos.
139
140
Captulo 11
Supuestos. Se supone que los recuentos dentro de cada combinacin de categoras de las variables
El tamao muestral total es fijo o el anlisis est condicionado al tamao muestral total.
tablas de contingencia. Utilice el procedimiento Anlisis loglineal general cuando quiera analizar
la relacin entre una frecuencia observada y un conjunto de variables explicativas.
Para obtener un anlisis loglineal logit
E En los mens, seleccione:
Analizar > Loglineal > Logit...
Figura 11-1
Cuadro de dilogo Anlisis loglineal logit
El nmero total de variables dependientes y de factor debe ser menor o igual a 10.
Si lo desea, puede:
Seleccionar una variable de estructura de casilla para definir ceros estructurales o incluir un
trmino de desplazamiento.
141
Anlisis loglineal logit
Especificar modelo. Un modelo saturado contiene todos los efectos principales e interacciones
que impliquen a las variables de factor. No contiene trminos para las covariables. Seleccione
Personalizado para especificar slo un subconjunto de interacciones o para especificar
un modelo personalizado.
142
Captulo 11
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
parmetros.
143
Anlisis loglineal logit
Seleccione los valores que desee guardar como nuevas variables en el conjunto de datos activo.
El sufijo n aadido a los nuevos nombres de variable se incrementa para formar un nombre
exclusivo para cada variable guardada.
Los valores guardados hacen referencia a los datos agregados (a casillas de la tabla de
contingencia), aunque los datos se encuentren registrados como observaciones individuales en el
Editor de datos. Si se guardan los valores pronosticados o los residuos para datos no agregados, el
valor a guardar para una casilla de la tabla de contingencia es introducido en el Editor de datos
para cada caso de esa casilla. Para que los valores guardados tengan sentido, se debera agregar
los datos para obtener los recuentos de casilla.
Se pueden guardar cuatro tipos de residuos: de desviacin, corregidos, tipificados y brutos.
Tambin se pueden guardar los valores pronosticados.
Residuos tipificados. Los residuos divididos por una estimacin de su error tpico. Los residuos
Residuos corregidos. El residuo tipificado dividido por la estimacin de su error tpico. Dado
que, cuando el modelo es el correcto, los residuos corregidos son asintticamente normales
tpicos, stos son preferidos a los residuos tipificados a la hora de contrastar la normalidad.
144
Captulo 11
Cambiar el valor por defecto del umbral para la comprobacin de la redundancia (utilizando el
subcomando CRITERIA).
Captulo
Tablas de mortalidad
12
Existen muchas situaciones en las se desea examinar la distribucin de un perodo entre dos
eventos, como la duracin del empleo (tiempo transcurrido entre el contrato y el abandono de la
empresa). Sin embargo, este tipo de datos suele incluir algunos casos para los que no se registra el
segundo evento; por ejemplo, la gente que todava trabaja en la empresa al final del estudio. Las
razones para que no se verifique el segundo evento pueden ser muy variadas: en algunos casos, el
evento simplemente no tiene lugar antes de que finalice el estudio; en otros, el investigador puede
haber perdido el seguimiento de su estado en algn momento anterior a que finalice el estudio; y
existen adems casos que no pueden continuar por razones ajenas al estudio (como el caso en que
un empleado caiga enfermo y se acoja a una baja laboral). Estos casos se conocen globalmente
como casos censurados y hacen que el uso de tcnicas tradicionales como las pruebas t o la
regresin lineal sea inapropiado para este tipo de estudio.
Existe una tcnica estadstica til para este tipo de datos llamada tabla de mortalidad de
seguimiento. La idea bsica de la tabla de mortalidad es subdividir el perodo de observacin en
intervalos de tiempo ms pequeos. En cada intervalo, se utiliza toda la gente que se ha observado
como mnimo durante ese perodo de tiempo para calcular la probabilidad de que un evento
terminal tenga lugar dentro de ese intervalo. Las probabilidades estimadas para cada intervalo
se utilizan para estimar la probabilidad global de que el evento tenga lugar en diferentes puntos
temporales.
Ejemplo. Funciona la nueva terapia de parches de nicotina mejor que la terapia de parches
tradicional a la hora de ayudar a la gente a dejar de fumar? Se podra llevar a cabo un estudio
utilizando dos grupos de fumadores, uno que haya seguido la terapia tradicional y el otro la
terapia experimental. Al construir las tablas de mortalidad a partir de los datos podr comparar
las tasas de abstinencia globales para los dos grupos, con el fin de determinar si el tratamiento
experimental representa una mejora con respecto a la terapia tradicional. Si desea obtener
informacin ms detallada, tambin es posible representar grficamente las funciones de impacto
o de supervivencia y compararlas visualmente.
Estadsticos. Nmero que entra, nmero que abandona, nmero expuesto a riesgo, nmero de
eventos terminales, proporcin que termina, proporcin que sobrevive, proporcin acumulada
que sobrevive (y error tpico), densidad de probabilidad (y error tpico), tasa de impacto (y error
tpico) para cada intervalo de tiempo en cada grupo. Grficos: grficos de las funciones para
supervivencia, log de la supervivencia, densidad, tasa de impacto y uno menos la supervivencia.
Datos. La variable de tiempo deber ser cuantitativa. La variable de estado deber ser dicotmica
o categrica, codificada en forma de nmeros enteros, con los eventos codificados en forma de un
valor nico o un rango de valores consecutivos. Las variables de factor debern ser categricas,
codificadas como valores enteros.
Supuestos. Las probabilidades para el evento de inters deben depender solamente del tiempo
transcurrido desde el evento inicial (se asume que son estables con respecto al tiempo absoluto).
Es decir, los casos que se introducen en el estudio en horas diferentes (por ejemplo, pacientes que
inician el tratamiento en horas diferentes) se deberan comportar de manera similar. Tampoco
Copyright IBM Corporation 1989, 2012.
145
146
Captulo 12
deben existir diferencias sistemticas entre los casos censurados y los no censurados. Si, por
ejemplo, muchos de los casos censurados son pacientes en condiciones ms graves, los resultados
pueden resultar sesgados.
Procedimientos relacionados. El procedimiento Tablas de mortalidad utiliza un enfoque actuarial
147
Tablas de mortalidad
Si lo desea, puede seleccionar una variable de factor de primer orden. Se generan tablas actuariales
de la variable de supervivencia para cada categora de la variable de factor.
Adems es posible seleccionar una variable por factor de segundo orden. Las tablas actuariales
de la variable de supervivencia se generan para cada combinacin de las variables de factor
de primer y segundo orden.
Las apariciones del valor o valores seleccionados para la variable de estado indican que el evento
terminal ha tenido lugar para esos casos. Todos los dems casos se consideran censurados.
Introduzca un nico valor o un rango de valores que identifiquen el evento de inters.
Los casos con valores para la variable de factor dentro del rango especificado se incluirn en el
anlisis y se generarn tablas individuales (y grficos si se solicita) para cada valor individual
dentro del rango.
148
Captulo 12
de factor, se generan grficos para cada subgrupo definido por las variables de factor. Los grficos
disponibles son Supervivencia, Log de la supervivencia, Impacto, Densidad y Uno menos la
supervivencia.
Uno menos la supervivencia. Representa la funcin uno menos la supervivencia en una escala
lineal.
Comparar los niveles del primer factor. Si tiene una variable de control de primer orden, se puede
seleccionar una de las opciones de este grupo para realizar la prueba de Wilcoxon (Gehan), la
cual compara la supervivencia para los subgrupos. Las pruebas se realizan en el factor de primer
orden. Si ha definido un factor de segundo orden, se realizarn pruebas para cada nivel de la
variable de segundo orden.
149
Tablas de mortalidad
Captulo
Anlisis de supervivencia de
Kaplan-Meier
13
Existen muchas situaciones en las se desea examinar la distribucin de un perodo entre dos
eventos, como la duracin del empleo (tiempo transcurrido entre el contrato y el abandono de la
empresa). Sin embargo, este tipo de datos incluye generalmente algunos casos censurados. Los
casos censurados son casos para los que no se registra el segundo evento (por ejemplo, la gente
que todava est trabajando en la empresa al final del estudio). El procedimiento de Kaplan-Meier
es un mtodo de estimacin de modelos hasta el evento en presencia de casos censurados.
El modelo de Kaplan-Meier se basa en la estimacin de las probabilidades condicionales en
cada punto temporal cuando tiene lugar un evento y en tomar el lmite del producto de esas
probabilidades para estimar la tasa de supervivencia en cada punto temporal.
Ejemplo. Posee algn beneficio teraputico sobre la prolongacin de la vida un nuevo tratamiento
para el SIDA Se podra dirigir un estudio utilizando dos grupos de pacientes de SIDA, uno que
reciba la terapia tradicional y otro que reciba el tratamiento experimental. Al construir un modelo
de Kaplan-Meier a partir de los datos, se podrn comparar las tasas de supervivencia globales
entre los dos grupos, para determinar si el tratamiento experimental representa una mejora con
respecto a la terapia tradicional. Si desea obtener informacin ms detallada, tambin es posible
representar grficamente las funciones de impacto o de supervivencia y compararlas visualmente.
Estadsticos. La tabla de supervivencia, que incluye el tiempo, el estado, la supervivencia
acumulada y el error tpico, los eventos acumulados y el nmero que permanece; la media y
mediana del tiempo de supervivencia, con el error tpico y el intervalo de confianza al 95%.
Grficos: supervivencia, impacto, log de la supervivencia y uno menos la supervivencia.
Datos. La variable de tiempo deber ser continua, la variable de estado puede ser continua o
transcurrido desde el evento inicial (se asume que son estables con respecto al tiempo absoluto).
Es decir, los casos que se introducen en el estudio en horas diferentes (por ejemplo, pacientes que
inician el tratamiento en horas diferentes) se deberan comportar de manera similar. Tampoco
deben existir diferencias sistemticas entre los casos censurados y los no censurados. Si, por
ejemplo, muchos de los casos censurados son pacientes en condiciones ms graves, los resultados
pueden resultar sesgados.
Procedimientos relacionados. El procedimiento de Kaplan-Meier utiliza un mtodo de clculo
de las tablas de mortalidad que estima la funcin de impacto o supervivencia para el tiempo en
que tiene lugar cada evento. El procedimiento Tablas de mortalidad utiliza un mtodo actuarial
al anlisis de supervivencia que se basa en la particin del perodo de observacin en intervalos
de tiempo menores y puede ser til para trabajar con grandes muestras. Si dispone de variables
que cree que estn relacionadas con el tiempo de supervivencia o variables que desea controlar
(covariables), utilice el procedimiento Regresin de Cox. Si las covariables pueden tener distintos
Copyright IBM Corporation 1989, 2012.
150
151
Anlisis de supervivencia de Kaplan-Meier
valores en diferentes puntos temporales para el mismo caso, utilice el procedimiento Regresin de
Cox con covariables dependientes del tiempo.
P ara obtener un anlisis de supervivencia de Kaplan-Meier
E En los mens, seleccione:
Analizar > Supervivencia > Kaplan-Meier...
Figura 13-1
Cuadro de dilogo Kaplan-Meier
Si lo desea, puede seleccionar una variable de factor para examinar las diferencias entre grupos.
Adems es posible seleccionar una variable de estrato, que generar anlisis diferentes para cada
nivel (cada estrato) de la variable.
152
Captulo 13
Introduzca el valor o valores que indican que el evento terminal ha tenido lugar. Se puede
introducir un solo valor, un rango de valores o una lista de valores. La opcin Rango de valores
solamente estar disponible si la variable de estado es numrica.
Log rango. Prueba para contrastar la igualdad de las distribuciones de supervivencia. En esta
puntos del tiempo se ponderan por el nmero de los casos bajo riesgo que hay en cada punto
del tiempo.
153
Anlisis de supervivencia de Kaplan-Meier
puntos del tiempo se multiplican por la raz cuadrada del nmero de los casos bajo riesgo
que hay en cada punto del tiempo.
Combinada sobre los estratos. Compara todos los niveles del factor en una nica prueba, para
Por parejas sobre los estratos. Compara cada par diferente de niveles del factor. No estn
Para cada estrato. Realiza una prueba de igualdad para todos los niveles del factor, distinta
para cada estrato. Si no tiene una variable de estratificacin, las pruebas no se realizarn.
Por parejas en cada estrato. Compara cada par diferente de niveles del factor en cada estrato.
No estn disponibles las pruebas de tendencia por parejas. Si no tiene una variable de
estratificacin, las pruebas no se realizarn.
Tendencia lineal para los niveles del factor. Permite contrastar la tendencia lineal a lo largo de los
niveles del factor. Esta opcin solamente estar disponible para las comparaciones globales (en
vez de por parejas) de los niveles del factor.
variable por defecto es el prefijo sur_ con un nmero secuencial. Por ejemplo, si sur_1 ya
existe, Kaplan-Meier asigna el nombre de variable sur_2.
nombre de variable por defecto es el prefijo se_ con un nmero secuencial. Por ejemplo, si
se_1 ya existe, Kaplan-Meier asigna el nombre de variable se_2.
154
Captulo 13
es el prefijo haz_ con un nmero secuencial. Por ejemplo, si haz_1 ya existe, Kaplan-Meier
asigna el nombre de variable haz_2.
Eventos acumulados. Frecuencia acumulada de los eventos, cuando los casos se ordenan por
los tiempos de supervivencia y por los cdigos de estado. El nombre de variable por defecto
es el prefijo cum_ con un nmero secuencial. Por ejemplo, si cum_1 ya existe, Kaplan-Meier
asigna el nombre de variable cum_2.
Kaplan-Meier: Opciones
Figura 13-5
Cuadro de dilogo Kaplan-Meier: Opciones
Uno menos la supervivencia. Representa la funcin uno menos la supervivencia en una escala
lineal.
Obtener tablas de frecuencias que consideren los casos perdidos durante el seguimiento como
una categora diferente de los casos censurados.
155
Anlisis de supervivencia de Kaplan-Meier
Obtener percentiles diferentes a los cuartiles para la variable del tiempo de supervivencia.
Captulo
14
La regresin de Cox genera un modelo predictivo para datos de tiempo de espera hasta el evento.
El modelo genera una funcin de supervivencia que pronostica la probabilidad de que se haya
producido el evento de inters en un momento dado t para determinados valores de las variables
predictoras. La forma de la funcin de supervivencia y los coeficientes de regresin de los
predictores se estiman mediante los sujetos observados; a continuacin, se puede aplicar el modelo
a los nuevos casos que tengan medidas para las variables predictoras. Observe que la informacin
de los casos censurados, es decir, aquellos que no han experimentado el evento de inters durante
el tiempo de observacin, contribuye de manera til a la estimacin del modelo.
Ejemplo. Corren los hombres y las mujeres diferentes riesgos de desarrollar cncer de pulmn
global. Para las variables dentro del modelo: Estimaciones de los parmetros, Errores tpicos y
Estadsticos de Wald. Para variables que no estn en el modelo: Estadsticos de puntuacin y
Chi-cuadrado residual.
Datos. La variable de tiempo debera ser cuantitativa, pero la variable de estado puede ser
categrica o continua. Las variables independientes (las covariables) pueden ser continuas
o categricas; si son categricas, debern ser auxiliares (dummy) o estar codificadas con
indicadores (existe una opcin dentro del procedimiento para recodificar las variables categricas
automticamente). Las variables de estratos deberan ser categricas, codificadas como valores
enteros o cadenas cortas.
Supuestos. Las observaciones deben ser independientes y la tasa de impacto debe ser constante a lo
largo del tiempo; es decir, la proporcionalidad de los impactos de un caso a otro no debe variar en
funcin del tiempo. El ltimo supuesto se conoce como el supuesto de impactos proporcionales.
Procedimientos relacionados. Si el supuesto de impactos proporcionales no se conserva (vase
ms arriba), es posible que deba utilizar el procedimiento de Cox con covariables dependientes
del tiempo. Si no posee covariables o si solamente posee una covariable categrica, es posible
utilizar las Tablas de mortalidad o el procedimiento de Kaplan-Meier para examinar las funciones
de impacto o de supervivencia para las muestras. Si no posee datos censurados en la muestra (es
decir, si todos los casos experimentaron el evento terminal), es posible utilizar el procedimiento
Regresin lineal para modelar la relacin entre las variables predictoras y el tiempo de espera
hasta el evento.
Para obtener un anlisis de regresin de Cox
E Seleccione en los mens:
Analizar > Superviv. > Regresin de Cox...
Copyright IBM Corporation 1989, 2012.
156
157
Anlisis de regresin de Cox
Figura 14-1
Cuadro de dilogo Regresin de Cox
E Seleccione una variable de tiempo. No se analizan aquellos casos en los que los valores del
Si lo desea, es posible calcular modelos diferentes para diferentes grupos definiendo una variable
para los estratos.
158
Captulo 14
Es posible especificar los detalles sobre cmo gestionar el procedimiento de Regresin de Cox
las variables categricas:
Covariables. Muestra una lista de todas las covariables especificadas en el cuadro de dilogo
principal para cualquier capa, bien por ellas mismas o como parte de una interaccin. Si alguna
de stas son variables de cadena o son categricas, slo puede utilizarlas como covariables
categricas.
Covariables categricas. Lista las variables identificadas como categricas. Cada variable incluye
disponibles son:
Simple. Cada categora del predictor (excepto la propia categora de referencia) se compara
Diferencia. Cada categora del predictor, excepto la primera categora, se compara con el
efecto promedio de las categoras anteriores. Tambin se conoce como contrastes de Helmert
inversos.
Helmert. Cada categora del predictor, excepto la ltima categora, se compara con el efecto
Repetidas. Cada categora del predictor, excepto la primera categora, se compara con la
159
Anlisis de regresin de Cox
Los grficos pueden ayudarle a evaluar el modelo estimado e interpretar los resultados. Es
posible representar grficamente las funciones de supervivencia, de impacto, log-menos-log y
uno menos la supervivencia.
se aplica a la estimacin.
Uno menos la supervivencia. Representa la funcin uno menos la supervivencia en una escala
lineal.
160
Captulo 14
Como estas funciones dependen de los valores de las covariables, se deben utilizar valores
constantes para las covariables con el fin de representar grficamente las funciones respecto al
tiempo. El valor por defecto es utilizar la media de cada covariable como un valor constante pero
es posible introducir los propios valores para el grfico utilizando el grupo de control Cambiar el
valor.
Es posible representar grficamente una lnea diferente para cada valor de una covariable
categrica, desplazando esa covariable al cuadro de texto Lneas separadas para. Esta opcin
solamente estar disponible para covariables categricas, con la expresin (Cat) marcada despus
de sus nombres en la lista Valores de las covariables representados en.
Es posible guardar varios resultados del anlisis como nuevas variables. Estas variables se pueden
utilizar en anlisis siguientes para contrastar hiptesis o para comprobar supuestos.
Guardar variables del modelo. Permite guardar la funcin de supervivencia y su error tpico,
estimaciones de log menos log, funcin de impacto, residuos parciales, DfBeta(s) de la regresin y
predictor lineal X*Beta como nuevas variables.
el residuo de Cox-Snell)
Residuos parciales. Puede representar los residuos parciales respecto al tiempo para contrastar
el supuesto de proporcionalidad de los impactos. Se guarda una variable por cada covariable
en el modelo final. Los residuos parciales estn disponibles slo para los modelos que
contienen al menos una covariable.
161
Anlisis de regresin de Cox
DfBetas. Cambio estimado en un coeficiente si se elimina un caso. Se guarda una variable por
cada covariable en el modelo final. Las DfBetas estn disponibles slo para los modelos que
contienen al menos una covariable.
X*Beta. Puntuacin de la prediccin lineal. La suma del producto de los valores de las
al archivo especificado en formato XML. Puede utilizar este archivo de modelo para aplicar la
informacin del modelo a otros archivos de datos para puntuarlo.
posible especificar la probabilidad para la entrada o la exclusin desde el modelo. Una variable
ser introducida si el nivel de significacin de su F para entrar es menor que el valor de Entrada y
una variable ser eliminada si el nivel de significacin es mayor que el valor de Salida. El valor de
Entrada debe ser menor que el valor de Salida.
N mximo de iteraciones. Permite especificar el nmero mximo de iteraciones para el modelo,
162
Captulo 14
Obtener tablas de frecuencias que consideren los casos perdidos durante el seguimiento como
una categora diferente de los casos censurados.
Seleccionar una categora de referencia, que no sea la primera ni la ltima, para los mtodos
de contraste de indicador, simple y de desviacin.
Especificar un espaciado desigual entre las categoras para el mtodo de contraste polinmico.
Mantener los datos de cada grupo de segmentacin del archivo en un archivo temporal externo
durante el proceso. Esto puede contribuir a conservar los recursos de memoria cuando
se ejecutan los anlisis con grandes conjuntos de datos. No se encuentra disponible con
covariables dependientes del tiempo.
Captulo
15
Existen ciertas situaciones en las que interesa calcular un modelo de regresin de Cox, pero no se
cumple el supuesto de tasas de impacto proporcionales. Es decir, que las tasas de impacto cambian
con el tiempo; los valores de una (o de varias) de las covariables son diferentes en los distintos
puntos temporales. En esos casos, es necesario utilizar un modelo de regresin de Cox extendido,
que permita especificar las covariables dependientes del tiempo.
Con el fin de analizar dicho modelo, debe definir primero una covariable dependiente del
tiempo (tambin se pueden especificar mltiples covariables dependientes del tiempo usando la
sintaxis de comandos). (Estas covariables se pueden especificar usando la sintaxis de comandos).
Para facilitar esta tarea cuenta con una variable del sistema que representa el tiempo. Esta
variable se llama T_. Puede utilizar esta variable para definir covariables dependientes del tiempo
empleando dos mtodos generales:
Algunas variables pueden tener valores distintos en perodos diferentes del tiempo, pero no
estn sistemticamente relacionadas con el tiempo. En tales casos es necesario definir una
covariable dependiente del tiempo segmentada, lo cual puede llevarse a cabo usando las
expresiones lgicas. Las expresiones lgicas toman el valor 1 cuando son verdaderas y el
valor 0 cuando son falsas. Es posible crear una covariable dependiente del tiempo a partir de
un conjunto de medidas, usando una serie de expresiones lgicas. Por ejemplo, si se toma
la tensin una vez a la semana durante cuatro semanas (identificadas como BP1 a BP4),
puede definir el covariable dependiente del tiempo como (T_ < 1) * BP1 + (T_ >= 1 & T_
< 2) * BP2 + (T_ >= 2 & T_ < 3) * BP3 + (T_ >= 3 & T_ < 4) * BP4. Tenga en cuenta
que exactamente uno de los trminos entre parntesis ser igual a uno para cualquier caso
dado y el resto sern todos 0. En otras palabras, esta funcin se puede interpretar diciendo
que Si el tiempo es inferior a una semana, use BP1; si es ms de una semana pero menos
de dos, utilice BP2, y as sucesivamente.
Puede utilizar los controles de generacin de funciones para crear la expresin para la
covariable dependiente del tiempo, o bien introducirla directamente en el rea de texto Expresin
para T_COV_. Tenga en cuenta que las constantes de cadena deben ir entre comillas o apstrofes
y que las constantes numricas se deben escribir en formato americano, con el punto como
separador de la parte decimal. La variable resultante se llama T_COV_ y se debe incluir como una
covariable en el modelo de regresin de Cox.
163
164
Captulo 15
Nota: Asegrese de incluir la nueva variable T_COV_ como covariable en el modelo de regresin
de Cox.
Si desea obtener ms informacin, consulte el tema Anlisis de regresin de Cox en el captulo 14
el p. 156.
Apndice
Esquemas de codificacin de
variables categricas
Desviacin
Desviacin desde la media global. En trminos matriciales, estos contrastes tienen la forma:
media
gl(1)
gl(2)
.
.
gl(k1)
( 1/k
( 11/k
( 1/k
( 1/k
1/k
1/k
11/k
.
.
1/k
...
...
...
1/k
1/k
1/k
1/k )
1/k )
1/k )
...
11/k
1/k )
1/3
1/3
2/3
1/3 )
1/3 )
1/3 )
Para omitir una categora distinta de la ltima, especifique el nmero de la categora omitida entre
el parntesis que sucede a la palabra clave DEVIATION. Por ejemplo, el siguiente subcomando
obtiene las desviaciones para la primera y tercera categoras y omite la segunda:
/CONTRAST(FACTOR)=DEVIATION(2)
Suponga que factor tiene tres categoras. La matriz de contraste resultante ser
( 1/3
( 2/3
( 1/3
1/3
1/3
1/3
1/3 )
1/3 )
2/3 )
165
166
Apndice A
Simple
Contrastes simples. Compara cada nivel de un factor con el ltimo. La forma de la matriz general es
media
gl(1)
gl(2)
.
.
gl(k1)
( 1/k
(1
(0
1/k
0
1
.
.
0
(0
...
...
...
1/k
0
0
1/k )
1 )
1 )
...
1 )
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes
simples para una variable independiente con cuatro categoras son los siguientes:
( 1/4
(1
(0
(0
1/4
0
1
0
1/4
0
0
1
1/4
1
1
1
)
)
)
)
Para utilizar otra categora en lugar de la ltima como categora de referencia, especifique entre
parntesis tras la palabra clave SIMPLE el nmero de secuencia de la categora de referencia, que
no es necesariamente el valor asociado con dicha categora. Por ejemplo, el siguiente subcomando
CONTRAST obtiene una matriz de contraste que omite la segunda categora:
/CONTRAST(FACTOR) = SIMPLE(2)
Suponga que factor tiene cuatro categoras. La matriz de contraste resultante ser
( 1/4
(1
(0
(0
1/4
1
1
1
1/4
0
1
0
1/4
0
0
1
)
)
)
)
Helmert
Contrastes de Helmert. Compara categoras de una variable independiente con la media de las
( 1/k
(1
(0
(0
(0
1/k
1/(k1)
1
.
.
0
0
...
...
...
1/k
1/(k1)
1/(k2)
1/k )
1/(k1) )
1/(k2) )
1
...
1/2
1
1/2
1 )
167
Esquemas de codificacin de variables categricas
1/4
1/3
1
0
1/4
1/3
1/2
1
1/4
1/3
1/2
1
)
)
)
)
Diferencia
Diferencia o contrastes de Helmert inversos. Compara categoras de una variable independiente con
( 1/k
( 1
( 1/2
( 1/(k1)
1/k
1
1/2
.
.
1/(k1)
1/k
0
1
...
...
...
1/k )
0)
0)
1/(k1)
...
1)
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes de
diferencia para una variable independiente con cuatro categoras son los siguientes:
( 1/4
( 1
( 1/2
( 1/3
1/4
1
1/2
1/3
1/4
0
1
1/3
1/4
0
0
1
)
)
)
)
Polinmico
Contrastes polinmicos ortogonales. El primer grado de libertad contiene el efecto lineal a travs de
todas las categoras; el segundo grado de libertad, el efecto cuadrtico, el tercer grado de libertad,
el cbico, y as sucesivamente hasta los efectos de orden superior.
Se puede especificar el espaciado entre niveles del tratamiento medido por la variable
categrica dada. Se puede especificar un espaciado igual, que es el valor por defecto si se omite la
mtrica, como enteros consecutivos desde 1 hasta k, donde k es el nmero de categoras. Si la
variable frmaco tiene tres categoras, el subcomando
/CONTRAST(DRUG)=POLYNOMIAL
es idntico a
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)
168
Apndice A
administrada al tercer grupo es el triple que la del primer grupo, las categoras del tratamiento
estn espaciadas por igual y una mtrica adecuada para esta situacin se compone de enteros
consecutivos:
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)
Repetido
Compara niveles adyacentes de una variable independiente. La forma de la matriz general es
media
gl(1)
gl(2)
.
.
gl(k1)
( 1/k
(1
(0
(0
1/k
1
1
.
.
0
1/k
0
1
...
...
...
1/k
0
0
1/k )
0)
0)
...
1 )
donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes
repetidos para una variable independiente con cuatro categoras son los siguientes:
( 1/4
(1
(0
(0
1/4
1
1
0
1/4
0
1
1
1/4
0
0
1
)
)
)
)
Estos contrastes son tiles en el anlisis de perfiles y siempre que sean necesarias puntuaciones de
diferencia.
Especial
Un contraste definido por el usuario. Permite la introduccin de contrastes especiales en forma de
matrices cuadradas con tantas filas y columnas como categoras haya de la variable independiente.
Para MANOVA y LOGLINEAR, la primera fila introducida es siempre el efecto promedio, o
constante, y representa el conjunto de ponderaciones que indican cmo promediar las dems
variables independientes, si las hay, sobre la variable dada. Generalmente, este contraste es un
vector de contrastes.
169
Esquemas de codificacin de variables categricas
Las restantes filas de la matriz contienen los contrastes especiales que indican las
comparaciones deseadas entre categoras de la variable. Normalmente, los contrastes ortogonales
son los ms tiles. Este tipo de contrastes son estadsticamente independientes y son no
redundantes. Los contrastes son ortogonales si:
Los productos de los correspondientes coeficientes para todos los pares de filas disjuntas
tambin suman cero.
Por ejemplo, supongamos que el tratamiento tiene cuatro niveles y que deseamos comparar los
diversos niveles del tratamiento entre s. Un contraste especial adecuado sera
(
(
(
(
1
3
0
0
1
1
2
0
1
1
1
1
1
1
1
1
)
)
)
)
todo lo cual se especifica mediante el siguiente subcomando CONTRAST para MANOVA, LOGISTIC
REGRESSION y COXREG:
/CONTRAST(TREATMNT)=SPECIAL( 1 1 1 1
3 -1 -1 -1
0 2 -1 -1
0 0 1 -1 )
Cada fila, excepto la fila de las medias suman cero. Los productos de cada par de filas disjuntas
tambin suman cero:
Filas 2 y 3:
Filas 2 y 4:
Filas 3 y 4:
No es necesario que los contrastes especiales sean ortogonales. No obstante, no deben ser
combinaciones lineales de unos con otros. Si lo son, el procedimiento informar de la dependencia
lineal y detendr el procesamiento. Los contrastes de Helmert, de diferencia y polinmicos son
todos contrastes ortogonales.
Indicador
Codificacin de la variable indicadora. Tambin conocida como variable auxiliar o dummy, no est
disponible en LOGLINEAR o MANOVA. El nmero de variables nuevas codificadas es k1. Los
casos que pertenezcan a la categora de referencia se codificarn como 0 para las kvariables 1.
Un caso en la categora isima se codificar como 0 para todas las variables indicadoras excepto
la isima, que se codificar como 1.
Apndice
Estructuras de covarianza
AR(1). Se trata de una estructura autorregresiva de primer orden con varianzas homogneas. La
correlacin entre dos elementos es igual a rho en el caso de elementos adyacentes, 2 cuando se
trata de elementos separados entre s por un tercero, y as sucesivamente. est limitado de
manera que 1<<1.
AR(1): Heterognea. Se trata de una estructura autorregresiva de primer orden con varianzas
ARMA(1,1). Se trata de una estructura de media mvil autorregresiva. Tiene varianzas homogneas.
170
171
Estructuras de covarianza
Simetra compuesta. Esta estructura tiene una varianza y una covarianza constantes.
Diagonal. Esta estructura de covarianza tiene varianzas heterogneas y una correlacin cero
Factor analtico: Primer orden. Esta estructura de covarianza tiene varianzas heterogneas que estn
172
Apndice B
Factor analtico: Primer orden, Heterogneo. Esta estructura de covarianza tiene varianzas
heterogneas que estn compuestas de dos trminos que son heterogneos en los elementos. La
covarianza entre dos elementos es la raz cuadrada del producto del primero de sus trminos
de varianza heterogneos.
Huynh-Feldt. Se trata de una matriz circular en la que la covarianza entre dos elementos es igual a
la media de las varianzas menos una constante. Ni las varianzas ni las covarianzas son constantes.
Identidad escalada. Esta estructura tiene una varianza constante. Se asume que no existe
173
Estructuras de covarianza
Sin estructura: Mtrica de correlacin. Esta estructura de covarianza tiene varianzas heterogneas
y correlaciones heterogneas.
Componentes de la varianza. Esta estructura asigna una estructura de identidad escalada (ID) a
cada uno de los efectos aleatorios especificados.
Apndice
Avisos
Esta informacin se ha desarrollado para los productos y servicios ofrecidos en todo el mundo.
Puede que IBM no ofrezca los productos, los servicios o las caractersticas de los que se habla
en este documento en otros pases. Consulte a su representante local de IBM para obtener
informacin acerca de los productos y servicios que est disponibles actualmente en su zona.
Toda referencia que se haga de un producto, programa o servicio de IBM no implica que slo
se deba utilizar ese producto, programa o servicio de IBM. En su lugar, puede utilizarse todo
producto, programa o servicio con funcionalidades equivalentes que no infrinjan los derechos de
propiedad intelectual de IBM. Sin embargo, es responsabilidad del usuario evaluar y comprobar el
funcionamiento de todo producto, programa o servicio que no sea de IBM.
IBM puede tener patentes o aplicaciones de patentes pendientes que cubren el asunto descrito en
este documento. Este documento no le otorga ninguna licencia para estas patentes. Puede enviar
preguntas acerca de las licencias, por escrito, a:
IBM Director of Licensing, IBM Corporation, North Castle Drive, Armonk, NY 10504-1785,
Estados Unidos
Si tiene alguna pregunta sobre la licencia relacionada con la informacin del juego de caracteres
de doble byte (DBCS), pngase en contacto con el departamento de propiedad intelectual de IBM
de su pas o enve sus preguntas por escrito a:
Intellectual Property Licensing, Legal and Intellectual Property Law, IBM Japan Ltd., 1623-14,
Shimotsuruma, Yamato-shi, Kanagawa 242-8502 Japan.
El prrafo siguiente no se aplica a los Reino Unido o cualquier otro pas donde tales disposiciones
son incompatibles con la legislacin local: INTERNATIONAL BUSINESS MACHINES
174
175
Avisos
Los licenciatarios de este programa que deseen tener informacin sobre el mismo con el objetivo
de habilitar: (i) el intercambio de informacin entre programas creados independientemente y
otros programas (incluyendo este) y (ii) el uso comn de la informacin que se ha intercambiado,
deben ponerse en contacto con:
IBM Software Group, a la atencin de: Licensing, 233 S. Wacker Dr., Chicago, IL 60606, USA.
Esta informacin estar disponible, bajo las condiciones adecuadas, incluyendo en algunos casos
el pago de una cuota.
IBM proporciona el programa bajo licencia que se describe en este documento y todo el material
bajo licencia disponible para el mismo bajo los trminos de IBM Customer Agreement (Acuerdo
de cliente de IBM), IBM International Program License Agreement (Acuerdo de licencia de
programa internacional de IBM) o cualquier acuerdo equivalente entre las partes.
Se ha obtenido informacin acerca de productos que no son de IBM de los proveedores de
esos productos, de sus publicaciones anunciadas o de otras fuentes disponibles pblicamente.
IBM no ha probado estos productos y no puede confirmar la precisin de su rendimiento, su
compatibilidad o cualquier otra reclamacin relacionada con productos que no sean de IBM.
Las preguntas acerca de las aptitudes de productos que no sean de IBM deben dirigirse a los
proveedores de dichos productos.
Esta informacin contiene ejemplos de datos e informes utilizados en operaciones comerciales
diarias. Para ilustrarlos lo mximo posible, los ejemplos incluyen los nombres de las personas,
empresas, marcas y productos. Todos esos nombres son ficticios y cualquier parecido con los
nombres y direcciones utilizados por una empresa real es pura coincidencia.
Si est viendo esta informacin en copia electrnica, es posible que las fotografas y las
ilustraciones en color no aparezcan.
Marcas comerciales
IBM, el logotipo de IBM, ibm.com y SPSS son marcas comerciales de IBM Corporation,
registradas en muchas jurisdicciones de todo el mundo. Existe una lista actualizada de marcas
comerciales de IBM en Internet en http://www.ibm.com/legal/copytrade.shtml.
Adobe, el logotipo Adobe, PostScript y el logotipo PostScript son marcas registradas o marcas
comerciales de Adobe Systems Incorporated en Estados Unidos y/o otros pases.
Intel, el logotipo de Intel, Intel Inside, el logotipo de Intel Inside, Intel Centrino, el logotipo de
Intel Centrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium y Pentium son marcas comerciales o
marcas registradas de Intel Corporation o sus filiales en Estados Unidos y otros pases.
Java y todas las marcas comerciales y los logotipos basados en Java son marcas comerciales de
Sun Microsystems, Inc. en Estados Unidos, otros pases o ambos.
Linux es una marca registrada de Linus Torvalds en Estados Unidos, otros pases o ambos.
Microsoft, Windows, Windows NT, y el logotipo de Windows son marcas comerciales de
Microsoft Corporation en Estados Unidos, otros pases o ambos.
UNIX es una marca registrada de The Open Group en Estados Unidos y otros pases.
Este producto utiliza WinWrap Basic, Copyright 1993-2007, Polar Engineering and Consulting,
http://www.winwrap.com.
176
Apndice C
Otros productos y nombres de servicio pueden ser marcas comerciales de IBM u otras empresas.
Capturas de pantalla de productos de Adobe reimpresas con permiso de Adobe Systems
Incorporated.
Capturas de pantalla de productos de Microsoft reimpresas con permiso de Microsoft Corporation.
ndice
anlisis de covarianza
en MLG multivariante, 2
anlisis de la varianza
en los componentes de la varianza, 33
en modelos mixtos lineales generalizados, 99
anlisis de supervivencia
en Kaplan-Meier, 150
en la regresin de Cox, 156
en las tablas de mortalidad, 145
Regresin de Cox dependiente del tiempo, 163
anlisis loglineal, 129
Anlisis loglineal general, 133
Anlisis loglineal logit, 139
en modelos mixtos lineales generalizados, 99
Anlisis loglineal general
almacenamiento de valores pronosticados, 137
almacenamiento de variables, 137
contrastes, 133
covariables de casilla, 133
criterios, 136
distribucin de recuentos de casillas, 133
especificacin de modelo, 135
estructuras de casilla, 133
factores, 133
funciones adicionales del comando, 137
grficos, 136
intervalos de confianza, 136
opciones de presentacin, 136
residuos, 137
Anlisis loglineal logit, 139
almacenamiento de variables, 143
contrastes, 139
covariables de casilla, 139
criterios, 142
distribucin de recuentos de casillas, 139
especificacin de modelo, 141
estructuras de casilla, 139
factores, 139
grficos, 142
intervalos de confianza, 142
opciones de presentacin, 142
residuos, 143
valores pronosticados, 143
Anlisis loglineal: Seleccin de modelo, 129
definicin de los rangos del factor, 130
funciones adicionales del comando, 132
modelos, 131
opciones, 132
anlisis probit
modelos mixtos lineales generalizados, 99
ANOVA
en MLG medidas repetidas, 15
en MLG multivariante, 2
ANOVA multivariada, 2
avisos legales, 174
bondad de ajuste
en ecuaciones de estimacin generalizadas, 91
en modelos lineales generalizados, 64
Bonferroni
en MLG medidas repetidas, 24
en MLG multivariante, 9
C de Dunnett
en MLG medidas repetidas, 24
en MLG multivariante, 9
casos censurados
en Kaplan-Meier, 150
en la regresin de Cox, 156
en las tablas de mortalidad, 145
categora de referencia
en ecuaciones de estimacin generalizadas, 80, 83
en modelos lineales generalizados, 55
clase generadora
en el anlisis loglineal de seleccin de modelo, 131
construccin de trminos, 5, 20, 32, 131, 135, 142
contraste de multiplicador de Lagrange
en modelos lineales generalizados, 64
contrastes
en el anlisis loglineal general, 133
en el anlisis loglineal logit, 139
en la regresin de Cox, 158
convergencia de los parmetros
en ecuaciones de estimacin generalizadas, 86
en modelos lineales generalizados, 60
en modelos lineales mixtos, 44
convergencia del logaritmo de la verosimilitud
en ecuaciones de estimacin generalizadas, 86
en modelos lineales generalizados, 60
en modelos lineales mixtos, 44
Convergencia hessiana
en ecuaciones de estimacin generalizadas, 86
en modelos lineales generalizados, 60
covariables
en la regresin de Cox, 158
covariables de cadena
en la regresin de Cox, 158
covariables segmentadas dependientes del tiempo
en la regresin de Cox, 163
descomposicin jerrquica, 5, 20
en los componentes de la varianza, 34
desviacin tpica
en MLG medidas repetidas, 27
en MLG multivariante, 12
diagramas de dispersin por nivel
en MLG medidas repetidas, 27
en MLG multivariante, 12
diferencia honestamente significativa de Tukey
en MLG medidas repetidas, 24
en MLG multivariante, 9
177
178
ndice
error tpico
en MLG, 11
en MLG medidas repetidas, 2627
en MLG multivariante, 12
estadstico de Wald
en el anlisis loglineal general, 133
en el anlisis loglineal logit, 139
estadsticos descriptivos
en ecuaciones de estimacin generalizadas, 91
en MLG medidas repetidas, 27
en MLG multivariante, 12
en modelos lineales generalizados, 64
en modelos lineales mixtos, 45
estimacin de la mxima verosimilitud
en los componentes de la varianza, 33
estimacin de la mxima verosimilitud restringida
en los componentes de la varianza, 33
estimaciones de los parmetros
en ecuaciones de estimacin generalizadas, 91
en el anlisis loglineal de seleccin de modelo, 132
en el anlisis loglineal general, 133
en el anlisis loglineal logit, 139
en MLG medidas repetidas, 27
en MLG multivariante, 12
en modelos lineales generalizados, 64
en modelos lineales mixtos, 45
estimaciones de potencia
en MLG medidas repetidas, 27
en MLG multivariante, 12
estimaciones de tamao de efecto
en MLG medidas repetidas, 27
en MLG multivariante, 12
estructuras de covarianza, 170
en modelos lineales mixtos, 170
eta-cuadrado
en MLG medidas repetidas, 27
en MLG multivariante, 12
F mltiple de Ryan-Einot-Gabriel-Welsch
en MLG medidas repetidas, 24
en MLG multivariante, 9
factores
en MLG medidas repetidas, 18
frecuencias
en el anlisis loglineal de seleccin de modelo, 132
funcin de enlace
modelos mixtos lineales generalizados, 103
funcin de enlace binomial negativa
en ecuaciones de estimacin generalizadas, 78
en modelos lineales generalizados, 52
funcin de enlace Cauchit acumulada
en ecuaciones de estimacin generalizadas, 78
en modelos lineales generalizados, 52
funcin de enlace complementaria log
en ecuaciones de estimacin generalizadas, 78
en modelos lineales generalizados, 52
179
ndice
en MLG multivariante, 9
historial de iteraciones
en modelos lineales mixtos, 44
histrico de iteraciones
en ecuaciones de estimacin generalizadas, 91
en modelos lineales generalizados, 64
informacin de los niveles del factor
en modelos lineales mixtos, 45
informacin del modelo
en ecuaciones de estimacin generalizadas, 91
en modelos lineales generalizados, 64
intervalos de confianza
en el anlisis loglineal general, 136
en el anlisis loglineal logit, 142
en MLG medidas repetidas, 27
en MLG multivariante, 12
en modelos lineales mixtos, 45
iteraciones
en ecuaciones de estimacin generalizadas, 86
en el anlisis loglineal de seleccin de modelo, 132
en modelos lineales generalizados, 60
Kaplan-Meier, 150
almacenamiento de nuevas variables, 153
comparacin de niveles del factor, 152
cuartiles, 154
definicin de eventos, 152
ejemplo, 150
estadsticos, 150, 154
funciones adicionales del comando, 154
grficos, 154
media y mediana de tiempos de supervivencia, 154
tablas de supervivencia, 154
tendencia lineal para los niveles del factor, 152
variables de estado de supervivencia, 152
log-razn de las ventajas generalizadas
en el anlisis loglineal general, 133
marcas comerciales, 175
matriz de correlaciones
en ecuaciones de estimacin generalizadas, 91
en modelos lineales generalizados, 64
en modelos lineales mixtos, 45
matriz de covarianzas
en ecuaciones de estimacin generalizadas, 86, 91
en MLG, 11
en modelos lineales generalizados, 60, 64
en modelos lineales mixtos, 45
matriz de covarianzas de efectos aleatorios
en modelos lineales mixtos, 45
180
ndice
modelos jerrquicos
modelos mixtos lineales generalizados, 99
Modelos lineales generalizados, 49
categora de referencia para respuesta binaria, 55
criterios de estimacin, 60
distribucin, 49
especificacin de modelo, 58
estadsticos, 63
exportacin del modelo, 69
funcin de enlace, 49
guardar variables en el conjunto de datos activo, 67
medias marginales estimadas, 65
opciones para factores categricos, 57
predictores, 56
respuesta, 54
tipos de modelos, 49
valores iniciales, 62
Modelos lineales mixtos, 36, 170
almacenamiento de variables, 47
construccin de trminos, 4041
criterios de estimacin, 44
efectos aleatorios, 42
efectos fijos, 40
estructura de covarianza, 170
funciones adicionales del comando, 48
medias marginales estimadas, 46
modelo, 45
trminos de interaccin, 40
modelos logit multinomiales, 139
modelos loglineales jerrquicos, 129
modelos longitudinales
modelos mixtos lineales generalizados, 99
modelos mixtos
lineales, 36
modelos mixtos lineales generalizados, 99
modelos mixtos lineales generalizados, 99
bloque de efectos aleatorios, 110
coeficientes fijos, 123
covarianzas de efectos aleatorios, 125
desplazamiento, 112
distribucin de destino, 103
efectos aleatorios, 109
efectos fijos, 106, 122
estructura de datos, 119
exportacin del modelo, 116
funcin de enlace, 103
guardar campos, 116
medias estimadas, 127
medias marginales estimadas, 114
parmetros de covarianza, 126
ponderacin de anlisis, 112
predicho por observado, 120
resumen de modelo, 118
tabla de clasificacin, 121
trminos personalizados, 107
vista de modelo, 117
181
ndice
modelos multinivel
modelos mixtos lineales generalizados, 99
modelos personalizados
en el anlisis loglineal de seleccin de modelo, 131
en los componentes de la varianza, 32
en MLG medidas repetidas, 19
modelos saturados
en el anlisis loglineal de seleccin de modelo, 131
Newman-Keuls
en MLG medidas repetidas, 24
en MLG multivariante, 9
parmetro de escala
en ecuaciones de estimacin generalizadas, 86
en modelos lineales generalizados, 60
previas de los efectos aleatorios
en los componentes de la varianza, 33
productos cruzados
matrices de hiptesis y error, 12
prueba b de Tukey
en MLG medidas repetidas, 24
en MLG multivariante, 9
prueba de Breslow
en Kaplan-Meier, 152
Prueba de comparacin por parejas de Gabriel
en MLG medidas repetidas, 24
en MLG multivariante, 9
Prueba de comparacin por parejas de Games y Howell
en MLG medidas repetidas, 24
en MLG multivariante, 9
prueba de esfericidad de Bartlett
en MLG multivariante, 12
prueba de esfericidad de Mauchly
en MLG medidas repetidas, 27
prueba de Gehan
en las tablas de mortalidad, 148
prueba de Levene
en MLG medidas repetidas, 27
en MLG multivariante, 12
prueba de log rango
en Kaplan-Meier, 152
prueba de parmetros de covarianza
en modelos lineales mixtos, 45
prueba de rangos mltiples de Duncan
en MLG medidas repetidas, 24
en MLG multivariante, 9
prueba de Scheff
en MLG medidas repetidas, 24
en MLG multivariante, 9
prueba de Tarone-Ware
en Kaplan-Meier, 152
prueba de Wilcoxon
en las tablas de mortalidad, 148
Prueba M de Box
en MLG multivariante, 12
Prueba t
en MLG medidas repetidas, 27
en MLG multivariante, 12
prueba t de Dunnett
en MLG medidas repetidas, 24
en MLG multivariante, 9
prueba t de Sidak
en MLG medidas repetidas, 24
en MLG multivariante, 9
prueba t de Waller-Duncan
en MLG medidas repetidas, 24
en MLG multivariante, 9
pruebas de homogeneidad de las varianzas
en MLG medidas repetidas, 27
en MLG multivariante, 12
puntuacin
en modelos lineales mixtos, 44
puntuacin de Fisher
en modelos lineales mixtos, 44
R-E-G-W F
en MLG medidas repetidas, 24
en MLG multivariante, 9
R-E-G-W Q
en MLG medidas repetidas, 24
en MLG multivariante, 9
rango mltiple de Ryan-Einot-Gabriel-Welsch
en MLG medidas repetidas, 24
en MLG multivariante, 9
razn de ventajas
en el anlisis loglineal general, 133
Regresin de Cox, 156
almacenamiento de nuevas variables, 160
contrastes, 158
covariables, 156
covariables categricas, 158
covariables de cadena, 158
covariables dependientes del tiempo, 163164
definicin de eventos, 162
DfBetas, 160
ejemplo, 156
entrada o exclusin por pasos, 161
estadsticos, 156, 161
funcin de impacto, 160
funcin de supervivencia, 160
funciones adicionales del comando, 162
funciones de lnea base, 161
grficos, 159
iteraciones, 161
residuos parciales, 160
variable del estado de supervivencia, 162
Regresin de Poisson
en el anlisis loglineal general, 133
modelos mixtos lineales generalizados, 99
regresin logstica
modelos mixtos lineales generalizados, 99
182
ndice
en MLG multivariante, 9
tabla de contingencia
en el anlisis loglineal de seleccin de modelo, 129
tablas de contingencia
en el anlisis loglineal general, 133
Tablas de mortalidad, 145
comparacin de niveles del factor, 148
ejemplo, 145
estadsticos, 145
funcin de supervivencia, 145
funciones adicionales del comando, 148
grficos, 148
prueba de Wilcoxon (Gehan), 148
supresin de la presentacin de tablas, 148
tasa de impacto, 145
variables de estado de supervivencia, 147
variables del factor, 147
tasa de impacto
en las tablas de mortalidad, 145
trminos anidados
en ecuaciones de estimacin generalizadas, 84
en modelos lineales generalizados, 58
en modelos lineales mixtos, 41
trminos de interaccin, 5, 20, 32, 131, 135, 142
en modelos lineales mixtos, 40
tolerancia para la singularidad
en modelos lineales mixtos, 44
valores de influencia
en MLG, 11
en MLG medidas repetidas, 26
en modelos lineales generalizados, 68
valores pronosticados
en el anlisis loglineal general, 137
en el anlisis loglineal logit, 143
en modelos lineales mixtos, 47
valores pronosticados fijos
en modelos lineales mixtos, 47
valores pronosticados ponderados
en MLG, 11
en MLG medidas repetidas, 26
variables de medidas repetidas
en modelos lineales mixtos, 38
variables de sujetos
en modelos lineales mixtos, 38
Variance Components, 30
almacenamiento de resultados, 35
funciones adicionales del comando, 35
modelo, 32
opciones, 33
vista de modelo
en modelos mixtos lineales generalizados, 117