04 Sistemadeecuacionesestructurales

Sistema de ecuaciones
estructurales:
una herramienta de investigacin
4
Sistema de ecuaciones
estructurales:
Cuaderno tcnico 4
Sistema de ecuaciones estructurales:
Cuaderno tcnico 4
Abigal Manzano Patio
Salvador Zamora Muoz
Revisin tcnica:
Luca Monroy Cazorla
Mauricio Arce Orozco
Sistema de ecuaciones estructurales:
Cuaderno tcnico 4
D.R. 2009, Centro Nacional de Evaluacin
para la Educacin Superior, A.C. (Ceneval)
Av. Camino al Desierto de los Leones 19,
Col. San ngel, Deleg. lvaro Obregn,
C.P. 01000, Mxico, D.F.
www.ceneval.edu.mx
Diseo: Mnica Corts Genis
Formacin: Alvaro Edel Reynoso Castaeda
Abril de 2009
Impreso en Mxico Printed in Mxico
Directorio
Direccin General
Rafael Vidal Uribe
Direccin General Adjunta de los EGEL
Jorge Hernndez Uralde
Direccin General Adjunta de los EXANI
Jos O. Medel Bello
Direccin General Adjunta de Programas Especiales
Roco Llarena de Thierry
Direccin General Adjunta Tcnica y de Investigacin
Luca Monroy Cazorla
Direccin General Adjunta de Operacin
Francisco Javier Apreza Garca Mndez
Direccin General Adjunta de Difusin
Javier Daz de la Serna Braojos
Direccin General Adjunta de Administracin
Francisco Javier Anaya Torres

Direccin de Procesos pticos y Califcacin
Mara del Socorro Martnez de Luna
Direccin de Tecnologas de la Informacin
y las Comunicaciones
Francisco Manuel Otero Flores
ndice
Prefacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Antecedentes histricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
reas de aplicacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Relaciones causales entre variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Variables latentes y variables manifiestas . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Elementos de los modelos de ecuaciones estructurales. . . . . . . . . . . . . . . . 16
Tipos de parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Tipos de modelos de ecuaciones estructurales . . . . . . . . . . . . . . . . . . . . . . 19
Identificabilidad del modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Mtodos de estimacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Modelos con variables discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Bondad de ajuste del modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Efecto total, directo e indirecto entre variables . . . . . . . . . . . . . . . . . . . . . . 39
Lisrel (LInear Structural relations) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Introduccin a Lisrel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
La pantalla principal de Lisrel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Prelis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Crear la base desde Prelis Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Importar la base desde un archivo externo . . . . . . . . . . . . . . . . . . . . . . . . 47
Datos faltantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Obtencin de la matriz de correlaciones Pearson,
policricas y asinttica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Dibujando el diagrama que describe al modelo . . . . . . . . . . . . . . . . . . . . 54
Bibliografa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
ndice de tablas
Tabla 1.
Notacin bsica en los modelos de EE . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Tabla 2.
Funciones de ajuste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Tabla 3.
Medidas de correlacin entre variables con distintas escalas. . . . . . . . . . . . 34
ndice de figuras
Figura 1.
Modelo recursivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Figura 2.
Modelo no recursivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Figura 3.
Modelo factorial confirmatorio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Figura 4.
Modelo de regresin estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Figura 5.
Modelo mimic. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Figura 6.
Modelo de crecimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Figura 7.
Correlaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Figura 8.
One way path. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Figura 9.
Multi-segment path . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Figura 10.
Correlacin entre calesc y capitec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Figura 11.
Habilidad del sustentante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Figura 12.
Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Figura 13.
Residuos estandarizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Figura 14.
ndices modificados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Figura 15.
Valores estandarizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Figura 16.
Efectos indirectos y totales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Figura 17.
Modelo con tres factores en poblacin femenina . . . . . . . . . . . . . . . . . . . . 88
9
Sistema de ecuaciones estructurales: una herramienta de investigacin
Prefacio
E
l Centro Nacional de Evaluacin para la Educacin Superior (Ceneval) es
una institucin de carcter eminentemente tcnico. A lo largo de tres lustros
su actividad esencial ha sido promover la calidad de la educacin mediante eva-
luaciones vlidas, confables y pertinentes de los aprendizajes.
Primordialmente, evala los conocimientos y habilidades adquiridos por los
individuos en los procesos de enseanza-aprendizaje, formales o no forma-
les, de los sistemas educativos. As contribuye a la toma de decisiones funda-
mentadas. De hecho, con sus servicios de evaluacin atiende instituciones de
educacin media superior y superior, autoridades educativas, organizaciones
profesionales y otras instancias pblicas y privadas y, desde luego, al destinatario
fnal y el ms importante de sus pruebas: el propio sustentante.
Con la serie Cuadernos tcnicos el Centro promueve tambin el uso de herra-
mientas de anlisis en crculos cada vez ms amplios. El propsito de estos
ttulos es contribuir a elevar la calidad de la educacin mexicana y fomentar una
autntica cultura de la evaluacin.
El desarrollo de modelos que incorporan variables latentes y variables me-
didas objeto de estudio del presente texto se ha incrementado de forma es-
pectacular. Este tipo de modelos tienen aplicacin en diversas disciplinas, como
la psicologa (depresin en adolescentes, adicciones y problemas del compor-
tamiento), la sociologa (estudios acerca de la salud ocupacional, redes sociales,
ambientes laborales), la mercadotecnia (anlisis de satisfaccin del consumidor,
diseo y desarrollo de nuevos productos), entre otras. En lo concerniente a la
investigacin educativa, los modelos de ecuaciones estructurales se aplican en
estudios de motivacin para lectura y aprendizaje, usos de las nuevas tecnolo-
gas para la enseanza, etctera.
Sistema de ecuaciones estructurales tiene el propsito de promover una re-
fexin ms profunda sobre estas valiosas herramientas de investigacin.
10
Cuaderno tcnico 4
Antecedentes histricos
E
l primer antecedente de un modelo de ecuaciones estructurales se remonta
a 1934, ao en el que el bimetra Sewall Wright da a conocer el modelo de
trayectoria (path analysis) sobre las relaciones de tamao en mediciones seas.
Para Wright ste no era un mtodo para descubrir causas, sino ms bien era
un mtodo aplicado a modelos causales ya formulados con base en un conoci-
miento y consideracin terica. Esta tcnica permita descomponer la varianza
y covarianza de las variables involucradas, en funcin de los parmetros de un
sistema de ecuaciones simultneas y tena como fn estudiar el efecto directo e
indirecto entre estas variables. A diferencia de los mtodos matriciales emplea-
dos en la actualidad, l utilizaba diagramas de trayectoria en lugar.
No obstante su importancia, este modelo fue ignorado en biologa, socio-
loga y psicologa. No es sino hasta los aos sesenta y principios de los setenta
que Blalock, Boundon, Duncan y otros socilogos reconocen el potencial del
anlisis de trayectoria y las tcnicas relacionadas de correlacin parcial, como
herramientas para analizar datos no experimentales. Este redescubrimiento del
anlisis de trayectoria en la sociologa se propag a la ciencia poltica y a otras
ramas de las ciencias sociales.
En la segunda mitad del siglo XX varios estadsticos se vieron interesados
en los retos que presentaba la estimacin de estos modelos. D.N. Lawley, T.W.
Anderson, K.G. Jreskog, M.W. Browne, A. Satorra, D. Srbom y B. Muthn,
entre otros, dan respuesta a la gran cantidad de desafos que se derivan de los
procesos para estimar estos modelos de ecuaciones estructurales.
Un paso decisivo ocurre cuando Jreskog (1973), Keesling (1972) y Wiley
(1973) desarrollan un modelo general de ecuaciones estructurales e incorpo-
ran diagramas de trayectoria y otras caractersticas del anlisis de trayectoria,
conocido como modelo Lisrel (linear structural relations) o modelo JKW. Adems
de facilitar la difusin del anlisis de trayectoria, presenta las ecuaciones que
se derivan de las covarianzas entre las variables, a travs de operaciones matri-
ciales en lugar de que se lean del diagrama de trayectoria, y proporciona una
11
descomposicin ms clara de los efectos directos, indirectos y totales. Lisrel
incorpora modelos con variables latentes y variables medidas, fundamentales
en las tcnicas contemporneas de ecuaciones estructurales.
El desarrollo de modelos con esta combinacin de variables latentes y me-
didas se ha incrementado de forma espectacular. Jreskog extendi el anlisis
factorial exploratorio al factorial confrmatorio, desarroll el modelo factorial
de segundo orden, el anlisis factorial multi-grupo y el ya citado modelo general
de ecuacin estructural Lisrel. Adems, desarroll mtodos para la estimacin y
prueba de dichos modelos para datos transversales, longitudinales, multi-grupo
y multinivel.
La infuencia de Jreskog no slo se limita a los desarrollos propios. Varios
de sus estudiantes de doctorado han realizado importantes contribuciones. Por
ejemplo, Srbom (1974) extiende el modelo multi-grupo para incluir medias en
las variables latentes; Muthn (1977) introduce mtodos para incluir variables
observadas categricas; Hgglund (1985) contribuye con el mtodo de mnimos
cuadrados por medio de estimacin de dos estados (two-state last-square methods);
Quiroga (1992), por su parte, realiza estudios de robustez con correlaciones
policricas para desviaciones del supuesto de normalidad, mientras que Yang-
Wallentin (1997) desarrolla mtodos para estimar relaciones no lineales. Los
avances recientes en modelos de ecuaciones estructurales comprenden exten-
siones para estimaciones en datos que provienen de muestras complejas, mo-
delos lineales generalizados y series de tiempo.
12
Cuaderno tcnico 4
E
n el mbito de la psicologa, este tipo de modelos se aplica principalmente
en estudios sobre depresin en adolescentes, adicciones y problemas del
comportamiento. En sociologa, sus aplicaciones comprenden estudios acerca
de la salud ocupacional, redes sociales, ambientes laborales y otros. En merca-
dotecnia abarca, slo por citar algunos, los anlisis de satisfaccin del consu-
midor, benefcios de los medios de comunicacin en los negocios, as como
diseo y desarrollo de nuevos productos. En lo concerniente a la investigacin
educativa, los modelos de ecuaciones estructurales se aplican en estudios de
motivacin para lectura y aprendizaje, usos de las nuevas tecnologas para la
enseanza, etctera. En medicina se usan en estudios de trastornos del sueo,
servicios de salud en la poblacin, epidemiologa ambiental, entre otros. Aqu
damos cuenta de las principales reas de aplicacin, pero existen muchas ms
en las que el uso de este tipo de modelos empieza a ser una prctica comn.
reas de aplicacin
13
Relaciones causales entre variables
N
o se pretende aqu fomentar una discusin exhaustiva sobre causalidad. El
propsito es modesto: promover una refexin ms profunda sobre este
importantsimo elemento, presente en los modelos que se describen.
Un elemento fundamental en los modelos de ecuaciones estructurales es
la presencia de relaciones causales entre las variables que los componen. Las
relaciones de causalidad se establecen en diversas reas del conocimiento, en
ciencias, en humanidades y muchos otros campos. Sin embargo, existen varias
connotaciones del trmino causalidad.
De acuerdo con la defnicin general de Bollen (1989), consideremos una
variable y1, que est aislada de toda infuencia excepto de la de una segunda va-
riable x1. Si un cambio en y1 proviene de un cambio en x1, entonces x1 es causa
de y1. La defnicin de causa tiene tres componentes: aislamiento, asociacin y
direccin de la infuencia.
Al observar los elementos en las relaciones causales, se aprecia que lo que
hace casi imposible tener absoluta certeza de que una variable es causa de otra
es la posibilidad de afrmar que y1 est aislada de cualquiera otra causa, ex-
cepto de x1. Aislamiento es un ideal no asequible. Podemos decir que existe
un aislamiento cuando x1 y y1 estn en un vaco que excluye cualquier otra
infuencia. Mucho del debate sobre el estatus causal de una relacin inicia con
la interrogante sobre si la asociacin entre y1 y x1 no se debe a estos otros fac-
tores. Sin la condicin de aislamiento de y1, nunca tendremos la certeza de que
x1 causa a y1. Varios estudios experimentales, cuasi experimentales y observa-
cionales, intentan aproximarse a estas condiciones de aislamiento, por medio de
alguna forma de procesos de control o de aleatorizacin.
La asociacin es la segunda condicin para establecer la causalidad. Cuando
una supuesta causa y su efecto estn aislados de otras infuencias, podran estar
asociados. Una asociacin bivariada no es condicin necesaria ni sufciente para
una relacin causal. La asociacin, junto con otros factores, s.
14
Cuaderno tcnico 4
Bollen (1989) presenta varios escenarios relacionados con modelos de ecua-
ciones estructurales, en los que resulta difcil determinar la asociacin entre las
variables que componen un modelo. Los problemas van desde la propia deter-
minacin de la existencia de la asociacin entre las variables, los casos en los
que las tcnicas estadsticas para evaluarla son inadecuadas y los problemas que
provoca la multicolinealidad en la estimacin de estas asociaciones.
El componente fnal de una relacin causal es la direccin causal. La plausi-
bilidad de una asociacin causal inicia con la determinacin de la direccin co-
rrecta. La variable que produce la causa requiere una prioridad temporal como
una condicin de causalidad. La supuesta causa debe preceder al efecto, es decir
que la variable explicativa tiene primicia causal.
Si debe existir un intervalo entre la causa y el efecto que sta produce, qu
tan largo debe ser este intervalo? En estudios epidemiolgicos, por ejemplo, es
importante determinar cunto tiempo se debe estar expuesto a un riesgo para
desarrollar una enfermedad. Nuevamente referimos al lector a Bollen (1989)
para intentar esclarecer la direccin causal.
En sntesis, hemos tomado una defnicin de causalidad orientada a los
modelos de ecuaciones estructurales, pues se asume necesario contar con tres
condiciones: aislamiento, asociacin y direccin de la causalidad para establecer una
relacin causal. Cada una de estas condiciones es difcil de obtener; sobre todo
la certeza de que una causa y su efecto estn aislados de cualquier otra infuen-
cia. Por ello debemos ver a los modelos nicamente como una aproximacin
a la realidad. Las pruebas estadsticas slo podrn descartar modelos, jams
probarn modelos o relaciones causales dentro de ellos. Los problemas para
demostrar el aislamiento, la asociacin y la direccin causal son muy aejos en
el entorno de las distintas reas de la ciencia.
15
Variables latentes y variables manifiestas
E
n muchas disciplinas relacionadas con las ciencias sociales es usual intentar
medir la inteligencia, motivacin, efciencia, percepcin, habilidad verbal, et-
ctera fenmenos de una gran complejidad, a partir de percepciones, opinio-
nes, indicadores y variables relativas o aproximadas. Este tipo de variables recibe
un nombre genrico: variables latentes. La naturaleza de estas variables cuestiona
la posibilidad de medirlas pues, a diferencia de muchos fenmenos donde es
posible crear condiciones de laboratorio para reproducirlos, los fenmenos aso-
ciados a variables latentes carecen no slo de la posibilidad de medirlos sino,
en mltiples ocasiones, de una defnicin precisa. Cualquier entidad hipottica
de difcil defnicin dentro de una teora cientfca puede representarse a travs
de una variable latente en muchas reas denominada constructo, la cual no se
puede observar o manipular de forma directa.
Las variables manifestas se pueden medir de manera directa y representan
caractersticas observables de algn fenmeno subyacente, al contrario de las
latentes. Una caracterstica importante de estas variables es que sirven para evi-
denciar o defnir a las variables no observadas o latentes.
La forma de modelar un fenmeno que requiere representar relaciones entre
variables latentes y variables medidas o manifestas es a travs de los modelos de
ecuaciones estructurales.
16
Cuaderno tcnico 4
U
n modelo de ecuaciones estructurales puede representarse por medio de
un diagrama de trayectorias y un sistema de ecuaciones. En general, es
recomendable comenzar por representarlo grfcamente, lo cual facilita la escri-
tura de las ecuaciones que describen a dicho modelo. Existe un consenso para
la representacin de estos modelos. As, una variable observada se expresa por
medio de un cuadrado o rectngulo, una variable latente con un crculo o elipse,
y la asociacin y la correlacin entre dos variables se manifestan por medio de
una fecha unidireccional () y bidireccional (), respectivamente. Las va-
riables dependientes son fcilmente identifcables: reciben al menos una fecha.
De las independientes slo salen fechas, pero no entran. La tabla 1 muestra la
notacin bsica para representar los modelos en trminos de ecuaciones.
Elementos de los modelos de ecuaciones estructurales
Tabla 1. Notacin bsica en los modelos de EE
Smbolo
expresado en
forma matricial
Variable Descripcin
Coeficiente entre una variable observada o entre una
variable latente y una observada
Variable observada independiente
Variable observada dependiente
Error asociado a Y
Error asociado a X
Variable latente independiente
Variable latente dependiente
Coeficiente entre variables latentes dependientes
Coeficiente entre una variable latente independiente
y una dependiente
Error asociado a
Matriz de covarianza asociada a
17
En modelos en donde slo se incluyen variables observadas (modelo de
trayectorias) algunas veces se usan las matrices B y en lugar de . En el caso
de los errores, se utiliza en lugar de para simplifcar la notacin. Lo anterior
es conveniente si dichos modelos ajustan con Lisrel.
18
Cuaderno tcnico 4
Tipos de parmetros
E
n los modelos de ecuaciones estructurales hay tres tipos de parmetros:
libres, fjos y de restriccin. Los libres, que debern estimarse en el proceso,
son los siguientes: las varianzas que corresponden a las variables independien-
tes, las covarianzas entre variables independientes, todos los coefcientes que
conectan a las variables latentes con sus respectivas variables observadas, los
que conectan a latentes con latentes y los que conectan a observadas con ob-
servadas. A los fjos se les asigna de inicio un valor constante sin ser parmetros
por estimar en el modelo. Los de restriccin son aquellos sobre los que se expresa
una conjetura acerca de sus valores. Esencialmente, esta presuncin se establece
en trminos de una hiptesis, por lo que se igualan a un valor particular (cero,
por ejemplo), o se asume que son iguales a otro u otros parmetros del modelo.
19
Tipos de modelos de ecuaciones estructurales
D
e acuerdo con su estructura y con la naturaleza de las variables que contie-
nen, hay varios tipos de modelos de ecuaciones estructurales: de trayecto-
ria, factorial confrmatoria, factorial de segundo orden, de regresin estructural,
mimic, de crecimiento, entre otros.
El anlisis de trayectoria, el modelo ms simple, slo involucra variables ob-
servadas. Es similar a un modelo de regresin lineal, aunque la diferencia radica
en que en stos se puede estimar el efecto indirecto que tiene una variable sobre
otra, lo que no puede hacerse con el de regresin lineal. Hay dos tipos de mode-
los de trayectoria: recursivos y no recursivos. En los modelos recursivos (fgura 1)
no es posible que haya causalidad recproca (si hay una trayectoria de Y1 a Y2
no puede haber una de Y2 a Y1) ni ciclos ni correlacin entre los errores; en un
modelo no recursivo (fgura 2), s.
Figura 1. Modelo recursivo
X
1
Y
1
Y
2
21
22
21
11
12
1
X
2
Figura 2. Modelo no recursivo
X
1
Y
1
Y
2
12
21
22
21
11
12
1
X
2
20
Cuaderno tcnico 4
La ecuacin que describe el modelo recursivo es de la siguiente forma
Y = BY + X+
Esto es:
Y
1
=
11
X
1
+
12
X
2
+
1
Y
2
=
21
Y
1
+
21
X
1
+
22
X
2
+
2
De forma matricial se escribe como:
El modelo factorial confrmatorio permite explicar la correlacin entre varia-
bles latentes y la asociacin entre cada latente y sus correspondientes variables
observadas. Como su nombre lo indica, est orientado a confrmar la estructura
sugerida por medio del modelo.
( ) ( )( ) ( )( ) ( )
= + +
Y
1
Y
1
0 0
12
11
X
1
1
Y
2
Y
2
0
22
21
21
X
2
2
Figura 3. Modelo factorial confirmatorio
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
11
21
31
42
62
52
73
83
2
21 32
31
21
La ecuacin asociada a este modelo es:
X =
x
+
El modelo de regresin estructural difere del factorial confrmatorio en
que entre las variables latentes existe asociacin y no slo correlacin, lo que
permite identifcar dos submodelos de manera natural. Uno de ellos, que suele
denominarse modelo estructural, establece la asociacin entre variables latentes,
mientras que el otro est formado por la asociacin entre variables latentes y
observadas.
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
= +
11
21
31
0
0
0
0
0
0
0
0
42
52
62
0
0
0
0
0
0
0
0
73
83
22
Cuaderno tcnico 4
Modelo estructural:
= B + X +
Modelo de medicin:
Y =
X
+
X =
Y
+
El modelo mimic (multiple indicators and multiple causes of a single latent variable)
es un caso especial del modelo de regresin estructural.
Figura 4. Modelo de regresin estructural
Y
4
Y
1
X
1
Y
2
X
2
Y
3
X
3
Y
5
Y
6
y
42
y
11
y
21
y
31
x
11
x
21
x
31
y
52
y
62
21
11
21
2
23
Las ecuaciones que lo describen son:
= X+
Y=
y
+
El modelo de crecimiento (Latent Growth Curve Model) se utiliza con datos
de tipo longitudinal. Para que este tipo de modelo funcione adecuadamente se
deber garantizar que se cumplan los siguientes requerimientos: todos los in-
dividuos debern contar con informacin en cada uno de los tiempos o etapas
involucrados en el modelo, el espaciamiento entre un tiempo (o etapa) y otro
debe ser similar en todos los individuos, la variable de respuesta debe ser conti-
nua, el nmero de periodos debe ser mayor a dos y el tamao de muestra debe
ser al menos de 200 en cada uno de los tiempos (Boomsma, 1985; Boomsma y
Sayer, 2001).
Figura 5. Modelo mimic
X
2
X
1
X
3
X
4
X
5
Y
3
3
Y
2
2
Y
1
1
24
Cuaderno tcnico 4
Figura 6. Modelo de crecimiento
Xt
1
Xt
2
Xt
3
Xt
4
Intercepto Pendiente
25
Identificabilidad del modelo
D
esde que en el aula cursamos lgebra elemental enfrentamos problemas
de identifcabilidad de un modelo, concretamente cuando trabajamos con
ecuaciones simultneas. Una ecuacin de la forma 2x - 3y = 4 no tena solucin
nica y su solucin dependa de asignar un valor particular a alguna de las in-
cgnitas (x o y) y encontrar el valor correspondiente de la otra. Dicho en los
trminos, x y y son nuestros parmetros, y fjamos uno de ellos, para encontrar
solucin de la ecuacin o del sistema. Tambin recordamos que si tenamos otra
ecuacin que no fuera linealmente dependiente de la primera, podramos encontrar
la solucin sin necesidad de asignar ningn valor a nuestras incgnitas. Retoma-
remos ms adelante, algunas de estas condiciones para garantizar identifcabili-
dad en los modelos de ecuaciones estructurales.
En un modelo no identifcable es imposible obtener de manera nica el
valor de cada uno de los parmetros libres. Las principales razones por las que
se da este problema se deben a que se estipulan dentro del modelo parmetros
que por regla general no son estimables. Un ejemplo es cuando en un modelo
de regresin estructural se incluye una correlacin entre dos variables depen-
dientes. En el caso de modelos que contienen variables latentes es importante
no olvidar fjar la escala de cada uno de ellos para evitar este problema. Otra
caracterstica que puede generar confictos es cuando hay ms parmetros libres
que ecuaciones y por lo tanto uno o varios parmetros quedan expresados en
trminos de otros, o bien cuando se obtienen valores de parmetros que son
inadmisibles como varianzas negativas.
Para determinar si un modelo es identifcable bastar con verifcar ciertas
reglas. Una de ellas es aplicable a todos los tipos de modelos, mientras que el
resto varan dependiendo el tipo.
La regla ms sencilla y general es la regla t. Para utilizarla slo se necesita co-
nocer el nmero de parmetros libres y de variables observadas, y bastar con
que se satisfaga la siguiente desigualdad:
26
Cuaderno tcnico 4
donde t es el nmero de parmetros libres y p + q es el nmero de variables
observadas. Esta regla es necesaria mas no sufciente para garantizar la identi-
fcabilidad del modelo.
Algunas reglas pueden ser aplicables a un modelo de trayectorias: regla de la B
nula, regla recursiva, regla de condicin de orden y regla de condicin de rango; a modelos de
anlisis confrmatorio o derivados de ste: regla de tres variables observadas y regla de
dos variables observadas; o bien, a modelos de regresin estructural: regla de los dos
pasos y regla mimic.
Regla de la B nula. Aunque no se establezcan asociaciones entre variables
dependientes en modelos de trayectorias, y por lo tanto la matriz B sea cero, el
modelo es identifcable.
Regla recursiva. Se aplica a los modelos recursivos y slo verifca que no haya
correlacin entre los errores asociados a las variables dependientes.
Regla de condicin de orden. Su propsito es revisar la identifcabilidad en cada
una de las ecuaciones asociadas al modelo. Una condicin necesaria para la
identifcabilidad de una ecuacin es que el nmero de variables excluidas sea al
menos p-1, donde p representa el nmero de variables dependientes.
Regla de condicin de rango. Al igual que la regla de orden, se aplica a cada una de
las ecuaciones. Para poder aplicar esta regla es necesario formar una nueva ma-
triz C de la forma [(I-B)|- ], donde I es la matriz identidad (con valores de uno
en la diagonal y lo dems cero). Para verifcar la identifcabilidad de la i-sima
ecuacin, se borran todas las columnas en C en las que no hay un cero en el
i-simo rengln. Las columnas no borradas formarn una nueva matriz C
i
. Una
condicin sufciente y necesaria para que la i-sima ecuacin sea identifcable es
que el rango
1
de C
i
sea igual a p-1.
t
( p + q ) ( p + q + 1 )
2
27
Para ilustrar la regla de condicin de orden, considrese el modelo expresado
por medio de las siguientes ecuaciones.
Y
1
=
12
Y
2
+
11
X
1
+
1
...(1)
Y
2
=
21
Y
1
+
22
X
2
+
2
...(2)
Hay dos variables dependientes (Y1 y Y2) y dos independientes (X1 y X2).
Si se aplica la regla de condicin de orden para la ecuacin uno, se cumple que
por lo menos exista una variable excluida de la ecuacin (esto es, Y1 y X2) y lo
mismo sucede con la ecuacin dos.
Para aplicar la regla de condicin de rango usando este ejemplo, primero se
obtendr la matriz C.
Si se junta a (I-B) con - se obtiene:
1
El rango de una matriz es el nmero de flas o columnas linealmente independientes. Una fla
o columna es linealmente dependiente de otra cuando es posible establecer una combinacin
lineal entre ellas. Por ejemplo, si f
1
= 2f
2
+ 3f
3
entonces se dice que la fla uno es linealmente
dependiente de la fla 2 y la fla 3. Por el contrario, una fla o columna es linealmente indepen-
diente de otra u otras cuando no se puede establecer una combinacin lineal entre ellas.
( ) ( ) ( )
= =
-
( I - B )
0 1 0 1
21
-
21
12
-
12
1 0 0 1
( )
= C
1
-
12
-
11
0
-
21
1 0
-
22
28
Cuaderno tcnico 4
Para verifcar a la ecuacin uno, se debern borrar las columnas uno, dos y
tres (ya que no contienen al cero en el primer rengln) de esta forma:
Como p- 1 = 1 y el rango de C
1
es uno, entonces se cumple la identifcabi-
lidad para la ecuacin uno. El procedimiento para la ecuacin dos es anlogo.
Regla de tres variables observadas. Para un modelo con un slo factor, una con-
dicin sufciente para su identifcabilidad es que tenga asociadas al menos tres
variables observadas, con cargas factoriales diferentes de cero y que la matriz
de varianzas y covarianzas asociada a los errores (

) sea diagonal. Para mo-
delos con ms de un factor se deben de considerar tres especifcaciones: que
cada factor tenga asociadas por lo menos tres variables observadas, que cada
rengln de
X
posea un slo elemento diferente de cero y que

sea diagonal.
La condicin dos se puede traducir al hecho de que si un factor tiene asociadas
tres variables, stas no estn asociadas a otro factor, mientras que la tres indica
que no hay correlacin entre los errores asociados a las variables observadas.
Regla de dos variables observadas. Esta regla aplica en dos casos. El primero de
ellos requiere que se satisfagan la segunda y tercera condiciones de la regla de
tres variables observadas y que la matriz sea diferente de cero. El segundo
caso difere del primero con respecto a ya que puede suceder que algunos
valores de est matriz sean cero. En ambos casos, con tener dos variables obser-
vadas por cada variable latente es sufciente para que el modelo sea identifcable.
Regla de los dos pasos. Esta regla consta de dos pasos: el primero requiere ver al
modelo como un factorial confrmatorio: X y Y se expresan slo como X; y
como . La manera de identifcar este nuevo modelo es por medio de las reglas
aplicables a un confrmatorio. Una vez que se ha determinado que es identifca-
ble se procede al segundo paso. ste involucra nicamente a la parte del modelo
( )
= C
1
0
-
22
29
en donde se observan las asociaciones entre latentes (lo que se denomin como
modelo estructural). De esta forma se reescribe al modelo como uno de varia-
bles observadas en donde es ahora Y y es X y se procede a utilizar una de las
reglas de identifcabilidad para modelos de trayectoria. Si la identifcabilidad se
cumple en ambos pasos, es sufciente para considerar al modelo en su totalidad
como identifcable.
Regla mimic. Slo es aplicable en los modelos mimic. Establece que si el n-
mero de variables observadas Y es mayor o igual que dos y el de observadas X
es mayor o igual que uno, y se fja uno de los coefcientes que van de a Y, es
sufciente para que el modelo sea identifcable.
30
Cuaderno tcnico 4
Mtodos de estimacin
E
l proceso de estimacin de un modelo de ecuaciones estructurales es crucial
debido a que permite obtener de manera nica el valor estimado que tendr
cada parmetro libre.
La hiptesis bsica en un modelo de ecuaciones estructurales se reduce a
probar que la matriz de varianzas y covarianzas poblacional es igual a la matriz
de varianzas y covarianzas asociada al modelo terico, esto es:
= ( )
donde es la matriz poblacional y () es la matriz asociada al modelo pro-
puesto. Aunque en la prctica es improbable que se d la igualdad como tal, el
objetivo ser encontrar

, de tal forma que sea lo ms parecido a (

). Par-
tiendo del hecho de que no es posible conocer explcitamente los valores de la
matriz de varianzas y covarianzas poblacional (si se conociera no tendra senti-
do plantearse siquiera un modelo), se utiliza a la matriz de varianzas-covarianzas
muestral (S) como estimador de .
La diferencia entre estas dos matrices (S-(

)) se denomina residuo e indica
la discrepancia entre lo observado por medio de los datos y las estimaciones
arrojadas por el modelo.
La estimacin se lleva a cabo por medio de un proceso iterativo cuyo obje-
tivo es minimizar el valor de una funcin. Esta funcin, denominada de ajuste
(F), se escribe en trminos de las matrices S y (

). La manera de expresar a F
vara segn el mtodo de estimacin que se utilice. F siempre es mayor o igual a
cero y slo es cero si se cumple que S=(

), es decir que el modelo propuesto
ajusta perfectamente a los datos.
Los mtodos de estimacin ms empleados son mxima verosimilitud (ML),
mnimos cuadrados no ponderados (ULS), mnimos cuadrados ponderados
(WLS) y mnimos cuadrados generalizados (GLS).
31
El mtodo de mxima verosimilitud es quiz el ms empleado y trabaja bajo
el supuesto de normalidad de los datos. Recientemente se ha comprobado (Bo-
llen, 1989) que bajo pequeas desviaciones de normalidad este mtodo puede
ser adecuado. Otro mtodo que tambin opera bajo el supuesto de normalidad
es el de mnimos cuadrados generalizados. Este mtodo y el de mnimos cua-
drados no ponderados son anlogos al mtodo de OLS (ordinary least square) em-
pleado en regresin lineal, aunque el GLS se pondera por una matriz de pesos.
El mtodo de mnimos cuadrados ponderados, tambin conocido como m-
todo de distribucin asintticamente libre, se puede utilizar cuando se viole el
supuesto de normalidad de los datos. De hecho, es imprescindible si el modelo
contiene una o ms variables categricas y por lo tanto se trabaja con matrices
policricas, poliseriales y tetracricas. Este mtodo requiere particularmente
que la muestra sea considerablemente grande (n > 250, Willet y Sayer, 1994).
En la tabla 2 se presentan las funciones de ajuste para estos cuatro mtodos.
Tabla 2. Funciones de ajuste
Mtodo de estimacin Funcin de ajuste
Mxima verosimilitud
Mnimos cuadrados no ponderados
Mnimos cuadrados generalizados
Mnimos cuadrados ponderados o
de distribucin asintticamente libre
F
ML
= log| ( )|+ tr (S
-1
( )) log|S| (p + q)
F
ULS
= ( ) tr [(S

( ))
2
]
F
GLS
= ( ) tr ({[S

( )] W
-1
}
2
)
F
WLS
= ( ) tr {[S

( )] V
-1
}
2
32
Cuaderno tcnico 4
donde tr representa la traza, la cual se defne como la suma de los elementos
de la diagonal principal de una matriz. Por ejemplo, sea A una matriz de 3x3
de la forma:
la traza de A, esto es, tr(A) = a
11
+ a
22
( )
= A
a
11
a
12

a
21
a
22
33
Modelos con variables discretas
E
n las aplicaciones comunes de los modelos de ecuaciones estructurales se
asume que las variables medidas tienen una escala continua, lo que justifca,
al menos en principio, los supuestos de distribucin normal de los datos, as
como el uso de la matriz de correlaciones de Pearson. Sin embargo, en muchas
reas relacionadas con las ciencias sociales, las variables de inters generalmente
presentan escalas discretas, ya sean de conteo, nominales u ordinales (principal-
mente estas dos ltimas). En esta situacin, como comentamos en el prrafo
anterior, es necesario construir esta matriz de correlaciones considerando la
escala de medicin de las variables involucradas en el clculo de cada entrada
de esta matriz. La tabla 3 presenta el tipo de correlacin que es conveniente
calcular de acuerdo con el orden de medicin de las dos variables involucradas.
Cada una de estas variables discretas provienen de un proceso de discreti-
zacin de una variable continua. Es decir, se asume que subyace una variable
latente continua, con distribucin normal. Recordemos que la mayora de las
variables ordinales de uso comn (nivel socioeconmico, nivel de satisfaccin
de un servicio, evaluacin de la calidad de un producto, etctera) provienen de
discretizar variables continuas. Entonces, cuando se desee construir un modelo
de ecuaciones estructurales con este tipo de variables, tendremos que trabajar
con matrices policricas, poliseriales, tetracricas o, lo ms comn, con una ma-
triz de correlaciones mixta, que contenga varias de las correlaciones anteriores.
Tabla 3. Medidas de correlacin entre variables con distintas escalas
Escala de medicin
Continua
Ordinal
Dicotmica
Continua
Pearson
Ordinal
Poliserial
Policrica
Dicotmica
Punto biserial
Policrica
Tetracrica
34
Cuaderno tcnico 4
Un aspecto importante: cuando se utiliza el tipo de correlacin respetando
la escala de las variables involucradas, generalmente se obtienen correlaciones
ms grandes que si se utilizan las correlaciones de Pearson, y debemos recordar
que un buen principio es tener una estructura de correlacin fuerte entre las
variables que componen nuestro modelo.
35
Bondad de ajuste del modelo
L
a etapa en la que se lleva a cabo la evaluacin del modelo propuesto es fun-
damental para determinar si dicho modelo describe de manera apropiada al
fenmeno objeto de estudio.
Como ya se mencion, la hiptesis bsica que se contrasta es que la matriz
de varianzas y covarianzas muestral es igual a la matriz de varianzas y covarian-
zas conformada con los parmetros del modelo (S=( )). A diferencia de la
metodologa clsica de regresin, en la cual el principal inters se enfoca en
rechazar la hiptesis nula (Ho: =0) en ecuaciones estructurales el inters radica
en no rechazarla para garantizar que el modelo propuesto ajusta adecuadamente
a los datos.
Las diferentes formas de evaluar el modelo deben ser valoradas de manera
global; todas sern indicadores del grado de ajuste del modelo. Basar nuestro
juicio sobre lo adecuado del modelo en una sola prueba, puede generar conclu-
siones errneas.
Prueba ji-cuadrada (
2
). Esta prueba se usa para contrastar la hiptesis bsica.
Se le conoce con este nombre, ya que si el modelo es correcto y ajusta adecuada-
mente a los datos, entonces T, el estadstico de prueba, se distribuye como una
ji-cuadrada con (t (t+1) / 2) - p grados de libertad (donde t = nmero de par-
metros y p = nmero de variables observadas). Este estadstico se escribe as:
T = (N-1) F
min
donde N es el tamao de muestra y F
min
es el valor mnimo que toma la funcin de
ajuste una vez que se estimaron los parmetros. El criterio para aceptar la hipte-
sis nula es que el valor de T sea menor al valor en tablas de una ji-cuadrada con
los grados de libertad mencionados y a un nivel de signifcancia

. Otra forma
es observando que el p-value es mayor que el . Una limitacin de esta prueba
es que es susceptible ante cambios en el tamao de muestra, por lo que para
muestras grandes T tiende a incrementarse, lo que aumenta la frecuencia con
36
Cuaderno tcnico 4
que se rechaza Ho, a pesar de que esto no refeje la realidad. Esta es una razn
por la cual no se recomienda usar como nico criterio de bondad de ajuste a
esta prueba, sino ms bien como complemento de otros ndices de ajuste.
ndices de ajuste. Hay dos tipos de ndices: los de ajuste absoluto y los de incre-
mento. Los primeros evalan directamente el ajuste del modelo, mientras que
los de incremento comparan al modelo propuesto con el modelo de indepen-
dencia, en el cual se asume que no hay asociaciones entre las variables. Los ndi-
ces de ajuste absoluto son: el ndice de bondad de ajuste (GFI = Goodness of Fit Index),
el ndice ajustado de bondad de ajuste (AGFI = Adjusted Goodness of Fit Index), el ndice
de aproximacin de la raz de cuadrados medios del error (RMSEA = Root Mean Square
Error of Aproximation) y el ndice de la raz del cuadrado medio del residuo (RMR).
El ndice GFI puede interpretarse como una medida que determina la pro-
porcin de varianza explicada por el modelo (como la R
2
en regresin lineal). Si
adems se consideran los grados de libertad y el nmero de variables observa-
das del modelo, se obtiene el ndice AGFI. El valor que toman estos dos ndices
se encuentra entre cero y uno (aunque en casos aislados puede tomar valores
negativos). En ambos casos, valores cercanos a uno determinan que el modelo
tiene muy buen ajuste. Uno de los ndices ms populares es el RMSEA, que slo
puede tomar valores positivos. Un valor menor a 0.05 indica que el ajuste del
modelo es bueno aunque es ms deseable uno cercano a cero. El RMSEA tiene
asociada la prueba de hiptesis:

Ho: RMSEA 0.05 vs Ha: RMSEA > 0.05
Si el pclose (as se le denomina dentro de la paquetera estadstica) es mayor al
nivel de signifcancia entonces hay evidencia para rechazar a Ho. Una limita-
cin de este ndice es que, como su expresin involucra al tamao de muestra,
para muestras pequeas tiende a sobreestimar el ajuste del modelo. El ndice
RMR es similar en corte al RMSEA: los valores ms deseables se encuentran por
37
debajo de 0.05 y entre ms cercano a cero es mayor la evidencia de buen ajuste.
Los ndices de ajuste de incremento son: ndice de ajuste normado (NFI = Nor-
med Fit Index), ndice de ajuste no normado (NNFI o TLI = Non Normed Fit Index),
ndice de ajuste comparativo (CFI = Comparative Fit Index), ndice incremental de ajuste
(IFI o BL89 = Incremental Fit Index), ndice relativo de ajuste (RFI = Relative Fit Index),
ndice esperado de validacin cruzada (ECVI = Expected Cross Validation Index) y criterio
de informacin de Akaike (AIC = Akaike Information Criterion).
El NFI se calcula por medio de la diferencia del valor de la ji-cuadrada aso-
ciada al modelo de independencia con respecto a la del modelo propuesto.
Una limitacin de este ndice es que no toma en cuenta los grados de libertad,
de manera que no es posible valorar la complejidad del modelo ni tampoco el
tamao de muestra. El NNFI es una variante del NFI aunque aquel s considera
los grados de libertad y el tamao de muestra. Los ndices CFI, IFI y RFI tienen
variaciones con respecto al NFI pero siempre bajo la misma idea de incluir en la
expresin al modelo de independencia versus el modelo propuesto. En general,
todos estos ndices toman valores entre cero y uno, y valores cercanos a uno
indicarn que el modelo tiene muy buen ajuste.
El ECVI permite cuantifcar el cambio que se produce al comparar al modelo
propuesto con el modelo de independencia y saturado. Lo deseable es que el ECVI
asociado al modelo propuesto sea el ms pequeo con respecto a los otros dos.
El AIC es un ndice que toma en cuenta la complejidad del modelo y el grado
de ajuste; al igual que el ECVI compara al modelo con los otros dos ya mencio-
nados. Lo atractivo de estos dos ndices es que, cuando se cuenta con varias
versiones del modelo original, se pueden comparar entre s por medio de los
valores obtenidos del ECVI y AIC y utilizarlos para elegir al que tenga el mejor
ajuste, prefriendo a aquel cuyos ndices en conjunto sean los de menor valor.
Un punto de corte aceptable para los ndices GFI, AGFI, NFI, NNFI, CFI, IFI
y RFI es de 0.9.
38
Cuaderno tcnico 4
El test de los multiplicadores de Lagrange conocido en Lisrel como ndices modi-
fcados, as como el test de Wald, se usan para cuantifcar la contribucin que
tiene un parmetro en el modelo propuesto. El test de los multiplicadores de
Lagrange muestra el decremento provocado en la ji-cuadrada al considerar un
nuevo parmetro libre (por ejemplo, una nueva trayectoria antes no impuesta).
Por el contrario, el test de Wald muestra el incremento en la ji-cuadrada al fjar en
cero un parmetro (semejante a eliminar el parmetro del modelo). A diferencia
de los ndices de ajuste, en los cuales existe un punto de corte sugerido para
determinar que el modelo es bueno, en estas dos pruebas no los hay, por lo que
el criterio del investigador juega un papel importante en la toma de decisiones
para considerar nuevos parmetros sugeridos por medio de las dos pruebas a
favor del modelo y tomando siempre en cuenta, que al modifcar un parmetro
puede afectar otras partes del modelo ya sea en sentido positivo o negativo,
esto es, puede hacer que el ajuste del modelo mejore o empeore con respecto al
modelo originalmente propuesto.
Cuando se desea evaluar el ajuste de un segmento particular del modelo, los
ndices de ajuste no nos aportan informacin al respecto, para lo cual podemos
utilizar la matriz de residuos estandarizados. Cada una de las entradas de esta matriz
cuantifca la discrepancia que hay entre lo observado por medio de los datos y
las estimaciones que el modelo produce. Lo deseable es obtener residuos estan-
darizados cercanos a cero; sin embargo, un rango aceptable es entre -2 y 2. En
ecuaciones estructurales no es posible realizar anlisis de residuos anlogos a
los que se hacen con la metodologa clsica de regresin lineal.
Finalmente, otra forma de evaluar si un parmetro libre es estadsticamente
signifcativo es por medio de su valor t. Para obtener a t se divide el valor esti-
mado del parmetro entre su error estndar. Si t se encuentra por fuera de -2 y
2, entonces el parmetro es signifcativo al 5%, y puede considerarse diferente
de cero a ese nivel de signifcancia.
39
Efecto total, directo e indirecto entre variables
U
no de los atractivos de SEM es que permite estimar el efecto indirecto y
total que puede tener una variable sobre otra y no slo el directo como en
regresin lineal.
Hay tres tipos de efecto: a) el directo es la infuencia que tienen una variable
sobre otra, que se da de manera directa dentro del diagrama de trayectorias (por
medio de la fecha que une a dos variables); b) el indirecto es la infuencia que
tiene una variable sobre otra, pero en cuya trayectoria hay al menos otra variable
intermedia que las une, y c) el total, que es la suma del efecto directo y el indirec-
to, permite cuantifcar el cambio que se observa en la variable en que se produjo
el efecto (la que recibe la fecha), inducido por un cambio en la variable que lo
caus (variable de la que sale la fecha), independientemente de los mecanismos
por los cuales se haya producido dicho cambio.
40
Cuaderno tcnico 4
D
iversos paquetes estadsticos sirven para ajustar este tipo de modelos. Al-
gunos fueron desarrollados especfcamente para este fn, como AMOS,
EQS, Lisrel y M-PLUS; otros incluyen nicamente un mdulo particular para
realizar esta tarea. Dentro de estos ltimos destacan R, S-plus, SAS, SPSS, Stata,
Systat, entre otros.
Lisrel se mantiene a la vanguardia en el desarrollo de las rutinas computa-
cionales para introducir los desarrollos recientes en estos modelos. Para ilustrar
el ajuste de algunos modelos de ecuaciones estructurales, en el mbito de la
evaluacin educativa, haremos uso de este paquete.
Lisrel (LInear Structural relations)
41
Introduccin a Lisrel
L
a primera versin de Lisrel (versin 3) apareci en 1975 y es atribuido a Karl
Jreskog. Lisrel es el acrnimo de LInear Structural RELations, aunque
en la actualidad hablar de Lisrel es sinnimo de SEM (Structural Equation Mo-
deling). Sin embargo, no fue hasta 1998 cuando apareci la primera versin
interactiva de Lisrel (versin 8.2 para Windows). La primera versin del m-
dulo Prelis (PREprocessor for Lisrel) se lanz en 1986. Este mdulo ha ido
evolucionando hasta convertirse en una herramienta exploratoria de los datos
que sern usados posteriormente en Lisrel, como el clculo de la matriz de co-
rrelaciones policricas cuando los datos son categricos, el clculo de la matriz
de varianzas-covarianzas asinttica, anlisis descriptivo de los datos, etctera.
42
Cuaderno tcnico 4
La pantalla principal de Lisrel
L
a pantalla inicial de Lisrel permite acceder a la barra de men de opciones
por medio del cual se podr ingresar a la ayuda, abrir archivos, importarlos...
Como se observa en la pantalla siguiente, hay iconos que no estn habilita-
dos; esto cambia una vez especifcado el tipo de proyecto que se va a usar. Un
proyecto es el tipo de archivo de trabajo.
La opcin File permite abrir documentos o comenzar un nuevo proyecto,
importar datos en otros formatos (por ejemplo SPSS) e imprimir. Cuando se
elige esta opcin aparecen otras.
La opcin New contiene cinco tipos de archivo (o proyectos), de los cuales
se debe elegir uno. Son:
43
Syntax Only (.pr2, .ls8, .spl)
PRELIS Data (.pr2)
SIMPLIS Project (.spj)
LISREL Project (.lpj)
Path diagram (.pth)
Cuando se est familiarizado con la notacin de las variables y las matrices
y se es capaz de escribir las ecuaciones e instrucciones tal como el paquete lo
requiere, se recomienda usar el proyecto de sintaxis (Syntax Only). Por medio de
ste, se pueden escribir programas para Prelis o para Lisrel, ya sea para calcular
una matriz de correlaciones, o bien para obtener las ecuaciones del modelo y
estimarlo. Si no se est familiarizado con Lisrel existen, por fortuna, otras op-
ciones que permiten, de manera ms sencilla, realizar anlisis descriptivo de los
datos, calcular matrices, etctera. La opcin de Prelis Data despliega una hoja en
la que se podr capturar la base con la que se trabajar. Los archivos de Prelis
siempre se guardan con la extensin .psf.
Lisrel Project y Simplis Project sirven para escribir las ecuaciones subyacentes al
modelo de ecuaciones y los archivos con los que trabajan, tienen extensin .lpj
y .spj, respectivamente.
Path diagram permite dibujar el modelo de ecuaciones y guarda los archivos
con extensin .pth
44
Cuaderno tcnico 4
Prelis
P
relis es un mdulo incluido en Lisrel que sirve para preparar los datos que se-
rn usados cuando se lleve a cabo la construccin del modelo de ecuaciones
estructurales, o bien para hacer otro tipo de anlisis estadstico diferente a SEM.
Para poder trabajar los datos en Prelis es necesario disponer de una base con ex-
tensin .pr2. Hay dos formas de obtenerla: a) capturando directamente los datos
por medio de la opcin Prelis Data, y b) importando una base que se encuentre
en otro tipo de formato.
45
Crear la base desde Prelis DATA
E
n la pantalla principal de Lisrel elija File New Prelis Data. Inmediata-
mente aparecer la siguiente pantalla
La opcin Data, en la parte izquierda superior de la pantalla, permitir inser-
tar los nombres de las variables. Data Defne Variable nos despliega una nueva
pantalla; para poder insertar el nombre de la variable se elegir la opcin Insert.
En una nueva ventana (Add Variables) se escribir el nombre de la variable y se
oprimir Ok. Este procedimiento se har segn el nmero de variables que se
desee insertar. Una vez que se han terminado de defnir todas las variables se
oprimir Ok en la pantalla Defne variables.
46
Cuaderno tcnico 4
Para insertar el nmero de casos se elegir nuevamente Data Insert case.
Una vez elegido el nmero de casos, en una ventana parecida a Excel se po-
drn ir capturando los datos. En principio, siempre aparece en ceros. Una vez
capturada la informacin se debe guardar la base por medio de File Save o
con el icono que muestra un diskete (la extensin debe ser .psf).
47
Importar la base desde un archivo externo
T
ambin es posible capturar el archivo como SPSS, texto, ASCII, Excel, SAS.
Para importar la base se deber elegir de la pantalla principal las siguientes
opciones File Import Data in Free Format o File Import External Data in
Other Format, lo que depende del tipo de archivo. Como se despliega una nueva
ventana se deber buscar la ubicacin de la base que se desea importar y elegir
abrir. Aparecer una pantalla con la base importada, la cual ha sido guardada
automticamente con el mismo nombre pero con extensin .psf.
48
Cuaderno tcnico 4
Datos faltantes
A
veces, cuando se importa una base o se captura directamente algunos suje-
tos o casos no cuentan con informacin en alguna de las variables. Es posi-
ble declarar estos valores como datos faltantes. Esta opcin de Missing values se
ubica en la misma ventana en donde se insertan las variables y se puede declarar
un valor diferente de dato faltante para cada variable. Por ejemplo, si la variable
sexo tuviera valores de 1 y 2, un dato faltante podra ser declarado con un 9,
pero si por ejemplo otra variable con ms dgitos digamos edad tuviera un
rango entre 0 y 100, entonces el dato faltante podra ser 999, por conveniencia.
49
Obtencin de la matriz de correlaciones Pearson,
policricas y asinttica
C
uando la base de datos es grande, conviene emplear la matriz de correla-
ciones en lugar de trabajar con la base original. Para poder obtener esta
matriz se deber utilizar Prelis. Ser necesario entonces abrir una base de datos
con extensin .psf, para que de esta forma se activen nuevos iconos y opciones
en la parte superior de la pantalla principal, tal como se muestra enseguida:
Estas nuevas opciones permitirn realizar diferentes tipos de anlisis esta-
dsticos, como regresiones mltiples, anlisis de factores, anlisis multinivel,
imputacin de datos, grfcas, calcular variables a partir de otras, realizar trans-
formaciones u obtener correlaciones, entre otras cosas.
Cuando algunas de las variables de un modelo de ecuaciones estructurales
son categricas no es posible trabajar con correlaciones de Pearson, por lo que se
tiene que calcular la matriz de correlaciones policricas. Una vez abierta la base de
50
Cuaderno tcnico 4
la que se leern los datos (con extensin .psf), seleccione Statistics Output options.
Automticamente aparecer una ventana Output. En la parte superior izquierda
se encuentra el recuadro Moment matrix en el cual se tendr que elegir la opcin
Correlations. En caso de que se desee guardar la matriz en un archivo, se deber
elegir la opcin Save to fle y debajo de esta opcin escribir el nombre del archivo
que deber guardarse con extensin .cor. Tambin por medio de esta ventana
se puede calcular la matriz de varianzas-covarianzas asinttica (Asymptotic Cova-
riance Matrix), indispensable si se utiliza el mtodo de estimacin de mnimos
cuadrados ponderados (WLS) o el de mxima verosimilitud robusto. Al igual que
la matriz de correlaciones, sta se puede guardar con extensin .acm. Para cerrar
la ventana se elegir Ok. Cabe mencionar que cuando se calcula la matriz de
correlaciones, Prelis es capaz de determinar si todas las variables son continuas
o solo algunas, por lo que en caso de que todas sean continuas, las correlaciones
que calcular sern de Pearson y en caso contrario la correspondiente (polic-
rica, poliserial o tetracrica), adems de que en el archivo de salida especifcar
qu tipo de correlacin obtuvo.
51
Automticamente aparecer un nuevo archivo que contiene la salida comple-
ta: cdigo de instrucciones para obtener la matriz, ubicacin de la base de datos
que utiliz Prelis para leer la informacin, as como estadsticas descriptivas de
las variables (frecuencias en caso de variables no continuas), la matriz de corre-
laciones policricas, entre otras cosas. Este archivo generalmente es guardado
con el mismo nombre de la base de datos que utiliz pero con extensin .out.
Tambin, por default, Prelis crear un archivo con extensin .dsf que deber ser
usado cuando se construya el modelo, ya que contiene la informacin del nombre
de las variables, as como la ubicacin de los archivos que contienen a las matrices
que se calcularon. El siguiente cuadro muestra una porcin de la salida para el
ejemplo que se estar utilizando a lo largo de la construccin del modelo. La base
que se utiliz (modcua2h2.psf) contiene 24 variables y slo una de ellas (theta)
es continua. Como no se declara explcitamente cul variable es categrica y cul
continua, el programa impone un lmite mximo de categoras; si se rebasa el n-
mero, el paquete declarar a esa variable como continua y desplegar en la salida
un Warning en el que informa que la variable ser tratada como continua, tal como
se muestra en el ejemplo. Esta salida despliega, entre otras cosas, el nmero de
casos faltantes por variable, grfca de frecuencias y medidas de tendencia central
(en caso de que la variable sea continua), tipo de correlacin que se calcul segn
el par de variables y, por ltimo, la matriz de correlaciones.
52
Cuaderno tcnico 4
Figura 7. Correlaciones
53
Figura 7.
54
Cuaderno tcnico 4
Dibujando el diagrama que describe al modelo
A
ntes de explicar la forma en la que se debe dibujar el modelo, se dar una
breve explicacin sobre el ejemplo que se presentar y analizar.
Las hiptesis que sustenta este modelo son tres: a) la calidad de la escuela y el
capital econmico familiar tienen una asociacin con el compromiso acadmico
que adquiere un estudiante; b) la calidad de la escuela y el capital econmico
tienen un efecto indirecto, mediado por el compromiso acadmico, sobre la ha-
bilidad del sustentante evaluada mediante un examen, y c) la calidad de la escuela
y el capital econmico estn correlacionadas entre s. De esta forma, el modelo
es de tipo regresin estructural y est conformado por tres variables latentes y
24 variables observadas.
Variables latentes:
= compromiso acadmico (comaca)
1
= calidad de la escuela (calesc)
2
= capital econmico (capiteco)
Variables observadas que miden al compromiso acadmico:
Y
1
= habilidad del sustentante (theta)
Y
2
= faltar a la escuela (con_fal)
Y
3
= llegar tarde a las clases (con_tar)
Y
4
= no entrar a las clases estando en la escuela (con_ent)
Y
5
= das a la semana que hacia tareas o estudiaba (dia_est)
Y
6
= promedio de horas al da dedicadas a estudiar o hacer tareas fuera del
horario escolar (hor_tar)
Y
7
= calidad de las tareas entregadas (cal_tar)
Variables observadas que miden a la calidad de la escuela:
X
1
= nivel de exigencia de la escuela secundaria (exi_esc)
55
X
2
= porcentaje de compaeros que logr una excelente preparacin en la se-
cundaria (pre_com)
X
3
= preparacin de los maestros que impartan clases en la secundaria (pre_ma)
X
4
= maestros que llegaban tarde a clase en el ltimo ao de secundaria (ma_tar)
X
5
= faltas frecuentes de maestros en el ltimo ao de la secundaria (ma_falt)
Por ltimo, variables que miden al capital econmico:
X
6
= horno de microondas en casa (ser_mic)
X
7
= lavadora en casa (ser_lav)
X
8
= suscripcin a peridicos o revistas en casa (ser_sus)
X
9
= dvd en casa (ser_dvd)
X
10
= computadora en casa (ser_pc)
X
11
= televisor en casa (ser_tv)
X1
2
= automvil en casa (ser_auto)
X
13
= reproductor de mp3 para uso personal (ser_mp3)
X
14
= telfono celular para uso personal (ser_tec)
X
15
= vacaciones dentro de la Repblica Mexicana en los ltimos dos aos
(vva_rp)
X
16
= vacaciones fuera del pas en los ltimos dos aos (vva_fp)
X
17
= nmero de estados de la Repblica que ha visitado en los ltimos dos
aos (edo_rep)
De esta forma, X
1
a X
5
estarn asociadas con la primera variable latente
independiente (
1
) y X
6
a X
17
con la segunda latente independiente (
2
); Y
1
a Y
7

estarn asociadas con la nica variable latente dependiente . Ambas (calesc
y capitec) estn correlacionadas entre s y tienen asociacin con compac. Este
modelo se aplic individualmente para hombres y mujeres, por lo que las bases
estuvieron conformadas por un tamao de muestra de 1075 y 1144, respectiva-
56
Cuaderno tcnico 4
mente. El mtodo de estimacin fue mnimos cuadrados ponderados (WLS), ya
que todas las variables observadas, con excepcin de X
1
, son categricas.
Existen varios caminos para especifcar y estimar el modelo de ecuaciones
estructurales. El ms sencillo es dibujar el modelo y permitir que Lisrel escri-
ba de forma autnoma el cdigo del programa que detalla las asociaciones,
correlaciones y parmetros que conformarn el modelo terico. Para dibujar
el diagrama es necesario especifcar a Lisrel que queremos trabajar con un pro-
yecto Path diagram.
En la ventana principal, abrir File New Path diagram. Aparecer una
ventana que pedir el nombre con el cual se guardar el diagrama con extensin
.pth (por ejemplo, modelo2hom2.pth).
Al activar la opcin de Path diagram o abrir un archivo .pth se muestra la
siguiente pantalla:
57
La parte superior es muy parecida, pero no igual, a la pantalla principal de
Lisrel. La barra de men contiene las opciones File, Edit, Setup, Draw, View, Ima-
ge, Output, Window y Help.
File cuenta con las mismas caractersticas del File de la pantalla principal,
aunque aqu es posible exportar un diagrama a otros tipos de formato como .gif
y .wmf. Edit permite hacer modifcaciones al modelo. Setup introduce la infor-
macin con respecto a los datos como ubicacin de la base, nmero de casos,
tipo de matriz con la que se va a trabajar, etc. En Draw se dibujan las variables,
las trayectorias, correlaciones y se pueden escribir notas dentro del diagrama.
View permite modifcar el aspecto de la pantalla cuadriculada (rea en donde
se dibujar el modelo) y los iconos que aparecen en la parte superior, elegir qu
resultados se mostrarn en el diagrama (parmetros estimados, solucin estan-
darizada, valores t, entre otros) y especifcar (opcional) el tipo de modelo que
se va a dibujar. Image ayuda a cambiar el aspecto del diagrama. Con Output es
posible escoger el tipo de mtodo de estimacin, el contenido de la corrida y las
matrices que se quieran guardar en un archivo independiente. Para comenzar a
construir el modelo, utilizaremos principalmente Setup, Draw y Output.
Al elegir Setup Title and Comments aparece la siguiente ventana:
58
Cuaderno tcnico 4
En ella se escriben el ttulo y los comentarios del modelo; aunque es opcio-
nal, es recomendable hacerlo para que en el caso de correr varias versiones del
mismo modelo sea ms fcil identifcar con cul se est trabajando. El botn
Next es de mucha utilidad, ya que permite acceder a las otras ventanas que se
activan dentro de la misma opcin (este botn tambin tiene la misma utilidad
en Output), pero sin tener que estar eligiendo una por una. Como en nuestro
ejemplo hay tres variables latentes o factores, se especifcar el ttulo segn lo
muestra la ventana anterior.
Group names es una ventana opcional. Se utiliza cuando hay varias submues-
tras para las cuales se quiere correr el mismo modelo.
59
La tercera ventana, Labels, sirve para especifcar cules sern las variables
observadas y latentes que describirn al modelo.
Para incluir las variables observadas se elige la opcin Add/read variables del
cuadro izquierdo (Observed variables) y las latentes por medio del cuadro derecho
(Latent variables). Sin embargo, la diferencia entre estos dos radica en que por
medio del primero se debern leer las variables observadas de una base en par-
ticular, mientras que en el otro nicamente se puede escribir el nombre con el
cual se identifcar una variable latente.
Al elegir la opcin izquierda aparece una nueva ventana Add/read variables.
Con el botn Browse se busca el archivo que contiene la informacin de las
variables que intervendrn en el modelo. Se puede elegir un archivo creado en
Prelis o en Lisrel. En general, el ms usado es el del segundo. Este archivo tiene
extensin .dsf y, como se mencion, contiene la informacin del nombre de las
variables y la ubicacin de las matrices que se obtuvieron por medio de Prelis.
60
Cuaderno tcnico 4
Una vez que aparece en el recuadro en blanco del File name la ubicacin y
nombre del archivo del cual se leern las variables observadas, se sabr que
efectivamente se ley la informacin, pues aparecern los nombres de las va-
riables de la base solicitada dentro del cuadro derecho en la ventana Labels. El
nombre de las variables latentes se introduce manualmente:
61
En el cuadro de la izquierda se despliegan los nombres de las variables ob-
servadas que conformarn al modelo y en el de la derecha, los nombres de las
latentes: compac, calesc y capiteco (siguiendo ese orden).
Finalmente, si se desea borrar una variable latente se hace clic en el nmero
del costado izquierdo de la variable seguido de la tecla supr del teclado.
La siguiente ventana es Data. En ella se debe especifcar el tamao de la
muestra (Number of observation) y la matriz que se va a analizar, recordando que
cuando se calcule la matriz policrica o asinttica, la matriz que se va a analizar
ser de correlaciones. Esta ventana es la ltima opcin del Setup, por lo que
ahora se deber oprimir Ok.
62
Cuaderno tcnico 4
Para verifcar que se han incluido, los nombres de las variables se aprecian
en la parte izquierda de la pantalla cuadriculada. Para que una variable aparez-
ca dentro de la cuadrcula en forma de fgura, se debe arrastrar con ayuda del
mouse. Cuando el modelo contiene variables observadas X y Y, as como la-
tentes dependientes e independientes, se deber especifcar en dnde aparecen
los nombres de las variables, cules de ellas son Y (variables observadas asocia-
das a latentes dependientes) y ETA (as se les denomina en Lisrel a las latentes
dependientes). Las que no se especifquen se tomarn como X (observadas) y
como latentes independientes (no observadas). Para este ejemplo, nicamente
las variables theta y cal_tar son Ys, y por lo tanto aparece un tache enseguida
de los nombres y compac es la nica ETA (variable latente dependiente).
63
Por medio de la opcin Draw o de la paleta de dibujo (en general se activa
automticamente), que tienen las mismas seis opciones, se podrn trazar las
trayectorias (fechas unidireccionales ) y correlaciones (fechas bidireccionales
) entre variables, adems de escribir texto y fjar parmetros.
Select (primer icono en la paleta) permite seleccionar uno o ms objetos del
diagrama para moverlos, alinearlos, cambiarles el color, el tipo de fuente, etctera.
One-way path (segundo icono) sirve para dibujar la trayectoria (asociaciones)
entre las variables. Para dibujar una trayectoria, se debe seleccionar esta opcin
y colocar el mouse en la variable de la cual saldr la fecha, arrastrarlo con el bo-
tn izquierdo apretado hasta llegar a la variable que recibir la trayectoria. Esto
se hace para cada una de las trayectorias del modelo. Si se quiere desactivar ese
icono, se deber seleccionar Select y dar clic con el botn izquierdo del mouse
dentro de la cuadrcula. Esto aplica para cualquier opcin de la paleta.
64
Cuaderno tcnico 4
Error covariance or factor correlation (cuarto icono) sirve para dibujar las correlacio-
nes entre variables o errores. Para ello se procede igual que con las trayectorias.
Plain text (quinto icono) sirve para insertar texto al diagrama. Una vez activa-
do este icono se deber dibujar un rectngulo arrastrando el botn izquierdo del
mouse y escribiendo el texto dentro de la fgura trazada. Para cambiar la fuente
o el color del texto se utiliza el botn derecho del mouse y se selecciona Options.
Multi-segment path (tercer icono) tiene la misma fnalidad del segundo icono,
pero permite dibujar la fecha en segmentos.
Figura 8. One way path
Figura 9. Multi-segment path
65
Por ltimo, Zoom (sexto icono) permite reducir o incrementar el tamao del
diagrama.
Cuando el modelo incluye variables latentes, es necesario fjar la escala de
cada una de ellas (para que el modelo no tenga problemas de identifcabilidad).
Esto se logra fjando en un valor especfco (Lisrel los fja en 1) a alguna de
las trayectorias que van de la variable latente a una de las observadas. As, por
ejemplo, si el modelo contiene tres variables latentes se debern fjar tres trayec-
torias, una por cada una de ellas. Para realizar esto, se selecciona con el botn
izquierdo del mouse la trayectoria deseada y se utiliza el botn derecho para se-
leccionar la opcin Fix. Deber cambiar de color la fecha dentro del diagrama,
lo que permite verifcar que efectivamente se fj ese parmetro.
En el ejemplo se decidi fjar en uno las trayectorias que van de compac a
con_ent, de calesc a pre_com y de capiteco a ser_lav. En los dos primeros casos
fue arbitraria la decisin, en la tercera trayectoria se fj debido a que contar con
lavadora present la menor variabilidad en la respuesta.
66
Cuaderno tcnico 4
Una vez dibujado el modelo se debe especifcar el mtodo de estimacin y
lo que queremos que despliegue el archivo de salida. Para ello se elige Output
Lisrel Outputs. Esta seleccin despliega tres opciones Estimations, Selections y Save.
Al elegir Estimations aparece la siguiente ventana:
67
La ventana despliega todos los mtodos disponibles para estimar los pa-
rmetros, as como otras opciones relacionadas con el nmero de iteraciones
permitidas para llegar a la solucin fnal, etctera. En general estas opciones no
se modifcan a menos que exista un problema de convergencia, por lo que no es
necesario hacer cambios en esta seccin. La siguiente ventana, Selections, muestra
las opciones que queremos que despliegue en el archivo de salida. Se pueden
elegir algunas o todas por medio de Print all. La parte inferior de esta ventana
permite invocar al modelo, si as se desea.
68
Cuaderno tcnico 4
La tercera ventana, Save, permite salvar en archivos separados matrices, ndi-
ces de bondad de ajuste, valores t, entre otras cosas.
Cuando se termina de dibujar el modelo y de especifcar el mtodo de esti-
macin y opciones de salida, se debe pedir que se muestre la sintaxis que subyace
al modelo. Esto se hace por medio de Setup en la barra de men, seleccionando
Build Lisrel Syntax o Build SIMPLIS Syntax. La diferencia entre estas dos opciones
radica en la forma en la que despliega la sintaxis. La primera opcin es un poco
ms complicada, ya que no muestra directamente las ecuaciones que subyacen
al modelo sino nicamente los parmetros que se van a estimar; esto se hace en
forma matricial, por lo que si no se est familiarizado con el lenguaje de Lisrel
resultar ms difcil de leer. Simplis, por el contrario, s despliega las ecuaciones
por medio de los nombres de las variables. A continuacin se muestra el modelo
que se va a estimar y la sintaxis subyacente utilizando ambas notaciones.
69
La siguiente secuencia de instrucciones se obtiene con Simplis. Como
muestra el cdigo, los dos primeros renglones hacen referencia al ttulo y a
los comentarios. La tercera lnea indica la ubicacin del archivo modcua2h2.
dsf que contiene la informacin de la ubicacin de las matrices policrica y
asinttica. La cuarta lnea indica el tamao de muestra. La quinta corresponde
al nombre de las variables latentes. A partir de la sptima lnea y hasta la dci-
mo segunda se indican las trayectorias que van de las latentes a las observadas.
Vase que no aparece la trayectoria que va de compac a con_ent, de calesc a
pre_com y de capitec a ser_lav, ya que se fjaron los parmetros, lo que se puede
corroborar en el diagrama (las trayectorias aparecen de color gris claro y no en
azul como las otras). La lnea 29 indica que se est pidiendo que, una vez esti-
70
Cuaderno tcnico 4
mado el modelo, se despliegue nuevamente el diagrama. Las ltimas dos lneas
indican el mtodo de estimacin, los resultados que deseamos imprimir, como
residuos, ndices modifcados y efectos directos, indirectos y totales. Tambin
se puede pedir que despliegue todo por medio de All.
71
Con la sintaxis de Lisrel se obtiene la siguiente secuencia de instrucciones. Al
igual que en Simplis, la primera lnea hace referencia al ttulo. La segunda contie-
ne la especifcacin con respecto al nmero de variables observadas, tamao de
muestra, nmero de grupos (poblaciones a las que se aplicar el mismo modelo)
y el tipo de matriz que se usar (MA = matriz y KM = correlacin). La tercera
lnea es similar a la segunda de Simplis. La cuarta la ubicacin de la matriz de
varianzas-covarianzas asinttica (en este caso la matriz se guard en el archivo
asin2h2.acm). A partir de la siguiente lnea y hasta la 15, se especifca la forma
de las matrices que contienen los parmetros libres, parmetros fjos y nombre
de las variables. En particular, a partir de la 12 se indica cules son las trayecto-
rias que se van a estimar. Para poder especifcar que son parmetros libres, la
lnea debe comenzar con la instruccin FR (free) seguido de la lista de parme-
tros. Como ya se mencion, en este ejemplo se tienen 24 variables observadas.
Las siete primeras se asociaron con la nica variable latente dependiente (com-
pac) y las restantes 17 con alguna de las dos latentes independientes (calesc y
capitec); en particular, las cinco primeras se asociarn con calesc y las siguientes
12 con capitec, Vase que en el cdigo se hace referencia a LY, LX y GA. LY se
refere a la matriz que contiene las asociaciones entre variables latentes depen-
dientes y sus correspondientes observadas Y. LX es la matriz de coefcientes
entre latentes independientes y observadas X y GA entre latentes independien-
tes y latentes dependientes. En este ejemplo, tenemos una nica variable latente
dependiente (compac) asociada a siete variables, por lo que LY(1,1) a LY(7,1)
siempre muestra un uno en la segunda entrada y lo que vara es la primera, que
va de uno a siete. Por otro lado, como las Xs estn asociadas con latentes in-
dependientes, la numeracin tiene que volver a comenzar desde uno. De esta
forma LX(1,1) a LX(5,1) son las trayectorias que van de calesc a X
1
y hasta X
5

y LX(6,2) a LX(17,2) las que van de capitec (segunda latente independiente) a
X
6
y hasta X
17
. La instruccin VA indica qu parmetros se fjaron. En este caso,
LY(4,1), LX(2,1) y LX(7,2) tomarn el valor de uno, y se puede corroborar en
72
Cuaderno tcnico 4
el diagrama, ya que las fechas aparecen en gris y no en azul. Las ltimas dos
lneas solicitan el diagrama asociado (PD=Path Diagram) y en la salida referida
como OU (output) que se muestren los residuos (RS), los efectos indirectos
y totales (EF), la solucin estandarizada (SS) y los ndices modifcados (MI),
adems de indicar el tipo de mtodo de estimacin (ME) que en este caso fue
el de mnimos cuadrados ponderados (WLS). Aunque parece complicada la
notacin, dibujar correctamente el modelo evita estar revisando cada una de las
lneas que se despliegan.
Una vez que se verifc la sintaxis, se elige el botn Run Lisrel ubicado en la
parte superior de la pantalla. Automticamente se despliega el modelo estimado
y por medio de la opcin Window (de la barra de men) nos podemos mover
al archivo de sintaxis y al de salida. El diagrama que Lisrel o Simplis despliegan
despus de estimar el modelo muestra por default los valores de las estimacio-
73
nes de los parmetros; sin embargo, tambin es posible desplegar otros valores
como la solucin estandarizada, los valores t, etctera. Para hacer este cambio
se debe utilizar la opcin de Estimates que se encuentra arriba de la cuadrcula,
tal como se muestra a continuacin:
Como el documento que contiene la salida con los resultados es extenso, se
irn explicando los fragmentos ms importantes y la forma ms adecuada de
interpretarlos.
Las siguientes lneas permiten verifcar que se han ledo correctamente el
nmero de variables X, Y, , y el nmero de observaciones. Como se haba
comentado, el modelo consta de 24 variables observadas, de las cuales siete son
Y, 17 son X, una es latente dependiente (ETA) y dos son latentes independien-
tes (KSI). El nmero que fnalmente conform la muestra fue de 908 hombres
que tenan informacin en las 24 variables observadas (y no de 1075 como se
declar originalmente).
74
Cuaderno tcnico 4
Number of Input Variables 24
Number of Y - Variables 7
Number of X - Variables 17
Number of ETA - Variables 1
Number of KSI - Variables 2
Number of Observations 908
La especifcacin de los parmetros (parameter specifcations) permite revisar
que los parmetros que queremos estimar son los correctos. Siempre que apa-
rezca un nmero diferente de cero, indicar que es libre. En el ejemplo, se esti-
maron 51 parmetros. El parmetro 25 indica que se debe estimar la correlacin
entre calesc y capitec contenido en la matriz PHI.
Figura 10. Correlacin entre calesc y capitec
75
Figura 10.
La salida tambin especifca cuntas iteraciones se realizaron para llegar a
la solucin fnal (para este ejemplo fueron 24). Por otro lado, despliega los pa-
rmetros estimados. Por ejemplo, la primera entrada de LAMBDA-Y indica en
primer lugar el valor del coefciente de asociacin entre compac y theta (0.70),
debajo de este valor aparece entre parntesis el error estndar (0.04) y debajo de
ste el valor t (16.16). Los 51 parmetros resultaron estadsticamente signifcati-
vos (el valor t se ubica por fuera del intervalo (-2, 2)), por lo que se pueden consi-
derar parmetros diferentes de cero. Como se fjaron los parmetros que van de
compac a con_ent, de calesc a pre_com y de capiteco a ser_lav, stos aparecen
con un uno y consecuentemente no hay error estndar ni valor t. Por otro lado,
el signo que presenta el coefciente depende en gran medida de la forma en la
que se codifcaron las categoras de la variable. Por ejemplo, vase que cal_tar
presenta un coefciente positivo. Esta variable est categorizada de la siguiente
76
Cuaderno tcnico 4
forma: 1, defciente; 2, regular; 3, buena, y 4, excelente. En este caso es coheren-
te que a mayor calidad de la tarea entregada (mayor valor en la categora) mayor
sea su compromiso acadmico. Otro ejemplo es el coefciente asociado a ma_
tar, el cual es negativo. Esta variable est categorizada as: 1, ninguno; 2, menos
de la mitad; 3, la mitad; 4, ms de la mitad, y 5, todos. Como esta variable hace
referencia a la cantidad de maestros que llegaban tarde a clase en el ltimo ao
de secundaria, es perfectamente justifcado que a mayor cantidad de maestros
faltistas (mayor valor de la categora) menor sea la calidad de la escuela. Estos
dos ejemplos muestran cmo la forma de codifcar puede repercutir en el signo
del coefciente, por lo que se deber poner especial atencin en ello. Se reitera
que una de las asociaciones ms importantes de este modelo es la habilidad del
sustentante (theta), por lo que se har nfasis en algunos de sus resultados.
Figura 11. Habilidad del sustentante
77
Figura 11. Figura 11.
78
Cuaderno tcnico 4
Figura 11.
79
Posteriormente, se despliegan los ndices que permitirn evaluar la bondad
de ajuste del modelo. El valor p asociado a la ji-cuadrada (1374.97, p = 0.0)
aporta evidencia para decir que el modelo propuesto no est ajustando ade-
cuadamente a los datos. Los ndices de ajuste GFI y AGFI obtuvieron valores
superiores al 0.90, mientras que el RMSEA y el RMR fueron superiores al 0.05
(lo que no es deseable). En relacin con los ndices de ajuste de incremento, el
NFI, NNFI, CFI, IFI y RFI mostraron valores por debajo del 0.85. El ECVI
y el AIC indican que el modelo saturado es mejor en ajuste que el modelo que
se propuso, aunque el propuesto es mejor que el de independencia. Finalmente,
el CAIC, indica que el modelo propuesto es mejor en ajuste que el saturado y el
de independencia. Estos resultados, permiten concluir que el modelo propuesto
para la poblacin masculina no est ajustando adecuadamente a los datos, ya
que la mayora de los ndices mostraron valores inferiores al punto de corte
deseado. Cabe mencionar, que un modelo puede presentar parmetros muy
signifcativos y un ajuste muy pobre, parmetros no signifcativos y buen ajuste,
parmetros no signifcativos y ajuste pobre o parmetros muy signifcativos y
buen ajuste. En este caso, estamos ante el primer escenario.
80
Cuaderno tcnico 4
Goodness of Fit Statistics
Degrees of Freedom = 249
Minimum Fit Function Chi-Square = 1374.97 (P = 0.0)
Estimated Non-centrality Parameter (NCP) = 1125.97
90 Percent Confdence Interval for NCP = (1013.34 ; 1246.08)
Minimum Fit Function Value = 1.52
Population Discrepancy Function Value (F0) = 1.24
90 Percent Confdence Interval for F0 = (1.12 ; 1.37)
Root Mean Square Error of Approximation (RMSEA) = 0.071
90 Percent Confdence Interval for RMSEA = (0.067 ; 0.074)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.00
Expected Cross-Validation Index (ECVI) = 1.63
90 Percent Confdence Interval for ECVI = (1.50 ; 1.76)
ECVI for Saturated Model = 0.66
ECVI for Independence Model = 7.17
Chi-Square for Independence Model with 276 Degrees of Freedom = 6452.46
Independence AIC = 6500.46
Model AIC = 1476.97
Saturated AIC = 600.00
Independence CAIC = 6639.93
Model CAIC = 1773.34
Saturated CAIC = 2343.37
Normed Fit Index (NFI) = 0.79
Non-Normed Fit Index (NNFI) = 0.80
Parsimony Normed Fit Index (PNFI) = 0.71
Comparative Fit Index (CFI) = 0.82
Incremental Fit Index (IFI) = 0.82
Relative Fit Index (RFI) = 0.76
Critical N (CN) = 201.43
Root Mean Square Residual (RMR) = 0.11
Standardized RMR = 0.11
Goodness of Fit Index (GFI) = 0.95
Adjusted Goodness of Fit Index (AGFI) = 0.94
Parsimony Goodness of Fit Index (PGFI) = 0.79
Figura 12. Ajuste del modelo
81
Los residuos estandarizados son otra forma de evaluar el ajuste del modelo.
Lisrel despliega la matriz de residuos estandarizados como se muestra a conti-
nuacin. Los residuos no aportan mucha informacin si los errores no siguen
una distribucin normal. A pesar de que en este caso aproximadamente 24% de
ellos se ubicaron por fuera del intervalo deseado (-2,2), no los utilizaremos para
la evaluacin del modelo debido a que no se cumple el supuesto de normalidad.
Figura 13. Residuos estandarizados
82
Cuaderno tcnico 4
Figura 13.
83
Figura 13.
84
Cuaderno tcnico 4
Posteriormente, se despliegan en forma matricial los ndices modifcados.
Con respecto a las trayectorias entre factores independientes y variables obser-
vadas, se puede observar que el mayor decremento esperado en la ji-cuadrada se
podra dar si se considerara la trayectoria de capitec a ma_tar (una disminucin
de 91.28) y la de capitec a exi_esc (una disminucin de 51.27). Sin embargo, a
pesar de que Lisrel sugiere estos cambios, es el criterio del investigador el que
juega un papel importante para determinar si estas modifcaciones pueden sus-
tentarse tericamente.
Figura 14. ndices modificados Figura 14.
85
Otra forma de reportar los coefcientes asociados a las trayectorias del mo-
delo es por medio de valores estandarizados. Esto es deseable cuando se quiere
comparar la magnitud de los coefcientes. Cabe mencionar que las trayectorias
fjadas en uno cambian debido a esta estandarizacin; sin embargo, es recomen-
dable reportar el valor fjado (en este caso es de uno) para ser consistentes con
las especifcaciones iniciales.
Figura 15. Valores estandarizados Figura 15.
86
Cuaderno tcnico 4
Otra opcin que se despliega son los efectos indirectos y totales. En este
caso, nicamente tenemos efectos indirectos de los factores independientes ca-
lesc y capitec a las variables observadas asociadas al factor dependiente compac.
Estos se muestran matricialmente y, de igual forma que con los coefcientes, se
despliega el coefciente, el error estndar y el valor t. En este ejemplo, todos los
efectos indirectos resultaron estadsticamente signifcativos (diferentes de cero).
En particular, los efectos indirectos de calidad de la escuela (calesc) y capital
econmico (capitec) a la habilidad del sustentante (theta) fueron estadsticamen-
te signifcativos e indican que a mayor calidad de la escuela y a mayor capital
econmico, mayor es la habilidad del sustentante.
Figura 16. Efectos indirectos y totales
87
A manera de conclusin, podemos mencionar que el ajuste de este modelo
fue muy pobre considerando la magnitud de los ndices, a pesar de que las va-
riables asociadas a cada uno de los factores presentaron fuertes asociaciones, en
particular para la variable de inters habilidad del sustentante (theta).
Presentado en una poblacin masculina, este modelo se estim para una po-
blacin femenina. Se presenta la salida del modelo y algunos comentarios. Para
este ejemplo, la muestra fnal se constituy por 971 mujeres, aunque la base era
originalmente de 1144. El programa requiri de 38 iteraciones para llegar a la
solucin fnal y, al igual que en el primer modelo, los 51 parmetros resultaron
estadsticamente signifcativos (diferentes de cero).
Los ndices de bondad de ajuste mostraron los siguientes resultados. El valor
p asociado a la ji-cuadrada (2005.20, p = 0.0) aport evidencia en contra del
modelo propuesto, lo que indicara que el modelo no est ajustando adecuada-
mente a los datos. Sin embargo, los ndices GFI, AGFI, NFI, NNFI, CFI, IFI y
RFI presentaron valores superiores al 0.90. ECVI, AIC y CAIC indicaron que
el modelo propuesto es mejor que el de independencia pero no que el saturado.
Estos valores en conjunto aportan evidencia para concluir que el modelo ajusta
relativamente bien a los datos.
Aproximadamente, 30% de los residuos estandarizados estaban fuera del
intervalo (-2, 2); sin embargo, este resultado no se utilizar para evaluar el ajuste
del modelo debido a que no se cumple el supuesto de normalidad de los errores
como en el caso del modelo para poblacin masculina.
Los ndices modifcados mostraron que el mayor decremento en la ji-cua-
drada se dara si se considerara la trayectoria entre capitec y exi_esc, ya que se
registrara una disminucin de aproximadamente 74.56 en la ji-cuadrada.
Todos los efectos indirectos de calesc y capitec a las variables Y resultaron
estadsticamente signifcativos (diferentes de cero); especfcamente, los que
desembocan a la habilidad del sustentante (theta) indican que a mayor calidad
de la escuela y a mayor capital econmico mayor es la habilidad del sustentante.
88
Cuaderno tcnico 4
Se puede concluir, con respecto a este modelo para poblacin femenina, que
el ajuste fue bueno, adems de obtener parmetros estadsticamente signifcati-
vos. Esto sugiere, adems, que el modelo propuesto tiene mejores resultados en
poblacin femenina que en masculina.
Figura 17. Modelo con tres factores en poblacin femenina
89
90
Cuaderno tcnico 4
Figura 17.
91
Figura 17.
92
Cuaderno tcnico 4
Figura 17.
93
Figura 17.
94
Cuaderno tcnico 4
Figura 17.
95
96
Cuaderno tcnico 4
Algunas recomendaciones finales
1. Procrese guardar los archivos en carpetas que no tengan nombres muy
largos. En caso de no poder evitarlo, siempre se debe verifcar en el cdigo
del programa (sintaxis) que la direccin no aparezca incompleta y, en su
caso, se deber completar la secuencia.
2. Tngase presente que cuando se utilice el mtodo de estimacin de mni-
mos cuadrados ponderados (WLS) y el de mxima verosimilitud robusto, se
deber calcular previamente la matriz de varianzas-covarianzas asinttica.
3. Siempre que el modelo contenga variables categricas, se tiene que calcular
la matriz de correlaciones policricas.
4. Al momento de plantear un modelo, tngase presente cules son parme-
tros estimables y cules no, para evitar problemas de identifcabilidad.
5. Deben generarse bases de datos que contengan nicamente las variables
que se van a utilizar en el anlisis. De preferencia se ordenarn las variables
de tal forma que consecutivamente se muestren las que fungirn como X y
luego las Y o viceversa, ya que esto har ms fcil la revisin de la sintaxis.
6. Procrese hacer uso del comando Help.
97
Bibliografa
Bollen, K. (1989). Structural Equations with Latent Variables, 1a. ed., New York:
John Wiley & Sons.
Boomsma, A. (1985). Nonconvergence, improper solutions and starting values
in Lisrel maximum likelihood estimation, Psychometrika, 50, 229-242.
DuToit, M. & DuToit S. (2001) Interactive Lisrel: Users Guide, 2a. ed., Lincol-
nwood, IL: Scientifc Software International, Inc.
Everitt, B., S. (1984). An introduction to latent variable models, 1a. ed., New York:
Chapman and Hall.
Jreskog, K. G. (2001). Lisrel 8: Users Reference Guide, 2a. ed., Lincolnwood, IL:
Scientifc Software International, Inc.
Hgglund, G. (1985). Factor analysis by instrumental variable method, Psycho-
metrica, 47, 209-222.
Jreskog, K. G. (1973). A general method for estimating a linear structural
equation system. En A. S. Goldberger & O. D. Duncan (eds.), Structural
Equations Models in the Social Sciences, pp. 85-112, New York: Academic Press.
Keesling, M. G. (1972). Maximum Likelihood Approaches to Causal Analysis. Ph.D.
dissertation.: University of Chicago: Department of Education.
Loehlin, J. C. (1992). Latent variable models: an introduction to factor, path and structural
analysis, 2a. ed., Mahwah, NJ: Lawrence Erlbaum Associates Publishers.
Muthn, B. (1977). Some results on using summed raw scores and factor scores
from dichotomous item in the estimation of structural equations models.
Unpublished Technical Report, University of Uppsala, Sweden. Recuperado
en enero del 2009, de http://www.gseis.ucla.edu/faculty/muthen/articles/
Muthen_Unpublished_01.pdf
Quiroga, A, .M. (1992). Studies of the Polychoric Correlation and Other Correlation Mea-
sures for Ordinal Variables. PhD Dissertation: Uppsala University: Department
of Statistics.
98
Cuaderno tcnico 4
Srbom, D. (1974). A general method for studying differences in factor means
and factor structures between groups. Brithish Journal of Mathematical and Sta-
tistical Psycholog y, 27, 229-239.
Wiley, D. E. (1973). The identifcation problem for structural equation models
with unmeasured variables. En A. S. Goldberger & O. D. Duncan (eds.), Stru-
crural Equations Models in the Social Sciences, pp. 69-83, New York: Academic Press.
Willet, J., B, & Sayer, A. G. (1994). Using covariance structure analysis to detect
correlates and predictors of individual change over time, Psychological Bulletin,
116: 363-381.
Wright, S. (1934). The method of path coeffcients, Annals of Mathematical Sta-
tistics, 5: 161-215.
Yang-Wallentin, F. (1997). Non-linear structural equation models: Simulation
studies of the Kenny-Judd model. Studia Statistica Upsaliensia, 4, Uppsala:
University of Uppsala.
El Centro Nacional de Evaluacin para la Educacin Superior es una asociacin civil sin fnes
de lucro constituida formalmente el 28 de abril de 1994, como consta en la escritura pblica
nmero 87036 pasada ante la fe del notario 49 del Distrito Federal. Sus rganos de gobierno
son la Asamblea General, el Consejo Directivo y la Direccin General. Su mxima autoridad es
la Asamblea General, cuya integracin se presenta a continuacin, segn el sector al que perte-
necen los asociados, as como los porcentajes que les corresponden en la toma de decisiones:
Asociaciones e instituciones educativas (40%): Asociacin Nacional de Universidades e Instituciones
de Educacin Superior, A.C. (ANUIES); Federacin de Instituciones Mexicanas Particula-
res de Educacin Superior, A.C. (FIMPES); Instituto Politcnico Nacional (IPN); Instituto
Tecnolgico y de Estudios Superiores de Monterrey (ITESM); Universidad Autnoma del
Estado de Mxico (UAEM); Universidad Autnoma de San Luis Potos (UASLP); Universi-
dad Autnoma de Yucatn (UADY); Universidad Nacional Autnoma de Mxico (UNAM);
Universidad Popular Autnoma del Estado de Puebla (UPAEP); Universidad Tecnolgica de
Mxico (UNITEC).
Asociaciones y colegios de profesionales (20%): Barra Mexicana Colegio de Abogados, A.C.; Colegio
Nacional de Actuarios, A.C.; Colegio Nacional de Psiclogos, A.C.; Federacin de Colegios y
Asociaciones de Mdicos Veterinarios y Zootecnistas de Mxico, A.C.; Instituto Mexicano de
Contadores Pblicos, A.C.
Organizaciones productivas y sociales (20%): Academia de Ingeniera, A.C.; Academia Mexicana de
Ciencias, A.C.; Academia Nacional de Medicina, A.C.; Fundacin ICA, A.C.
Autoridades educativas gubernamentales (20%): Secretara de Educacin Pblica.
Ceneval, A.C., EXANI-I, EXANI-II son marcas registradas ante la Secretara de Co-
mercio y Fomento Industrial con el nmero 478968 del 29 de julio de 1994. EGEL, con
el nmero 628837 del 1 de julio de 1999, y EXANI-III, con el nmero 628839 del 1 de
julio de 1999.
Inscrito en el Registro Nacional de Instituciones Cientfcas y Tecnolgicas del Consejo
Nacional de Ciencia y Tecnologa con el nmero 506 desde el 10 de marzo de 1995.
Organismo Certifcador acreditado por el Consejo de Normalizacin y Certifcacin de
Competencia Laboral (CONOCER) (1998).
Miembro de la International Association for Educational Assessment.
Miembro de la European Association of Institutional Research.
Miembro del Consortium for North American Higher Education Collaboration.
Miembro del Institutional Management for Higher Education de la OCDE.
La publicacin de esta obra la realiz
el Centro Nacional de Evaluacin
para la Educacin Superior, A.C.
Se termin de imprimir el 17 de abril de 2009
en los talleres de Winkilis, Bugambilias 131,
Col. El Rosario, Mxico, D.F., C.P. 09930,
con un tiraje de 500 ejemplares

04 Sistemadeecuacionesestructurales

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

04 Sistemadeecuacionesestructurales

Cargado por

Copyright:

Formatos disponibles

Sistema de ecuaciones

También podría gustarte