Está en la página 1de 104

Sistema de ecuaciones

estructurales:
una herramienta de investigación

4
Sistema de ecuaciones
estructurales:
una herramienta de investigación

Cuaderno técnico 4
Sistema de ecuaciones estructurales:
una herramienta de investigación
Cuaderno técnico 4

Abigaíl Manzano Patiño


Salvador Zamora Muñoz

Revisión técnica:
Lucía Monroy Cazorla
Mauricio Arce Orozco

Sistema de ecuaciones estructurales:


una herramienta de investigación
Cuaderno técnico 4

D.R. © 2009, Centro Nacional de Evaluación


para la Educación Superior, A.C. (Ceneval)
Av. Camino al Desierto de los Leones 19,
Col. San Ángel, Deleg. Álvaro Obregón,
C.P. 01000, México, D.F.
www.ceneval.edu.mx

Diseño: Mónica Cortés Genis


Formación: Alvaro Edel Reynoso Castañeda

Abril de 2009

Impreso en México • Printed in México


Directorio

Dirección General
Rafael Vidal Uribe

Dirección General Adjunta de los EGEL


Jorge Hernández Uralde

Dirección General Adjunta de los EXANI


José O. Medel Bello

Dirección General Adjunta de Programas Especiales


Rocío Llarena de Thierry

Dirección General Adjunta Técnica y de Investigación


Lucía Monroy Cazorla

Dirección General Adjunta de Operación


Francisco Javier Apreza García Méndez

Dirección General Adjunta de Difusión


Javier Díaz de la Serna Braojos

Dirección General Adjunta de Administración


Francisco Javier Anaya Torres

Dirección de Procesos Ópticos y Calificación


María del Socorro Martínez de Luna

Dirección de Tecnologías de la Información


y las Comunicaciones
Francisco Manuel Otero Flores
Índice

Prefacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Antecedentes históricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Áreas de aplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Relaciones causales entre variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Variables latentes y variables manifiestas . . . . . . . . . . . . . . . . . . . . . . . . . 15
Elementos de los modelos de ecuaciones estructurales . . . . . . . . . . . . . . . 16
Tipos de parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Tipos de modelos de ecuaciones estructurales . . . . . . . . . . . . . . . . . . . . . 19
Identificabilidad del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Métodos de estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Modelos con variables discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Bondad de ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Efecto total, directo e indirecto entre variables . . . . . . . . . . . . . . . . . . . . . 39
Lisrel (LInear Structural relations) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Introducción a Lisrel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
La pantalla principal de Lisrel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Prelis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Crear la base desde Prelis Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Importar la base desde un archivo externo . . . . . . . . . . . . . . . . . . . . . . . . 47
Datos faltantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Obtención de la matriz de correlaciones Pearson,
policóricas y asintótica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Dibujando el diagrama que describe al modelo . . . . . . . . . . . . . . . . . . . . 54
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Índice de tablas

Tabla 1.
Notación básica en los modelos de EE . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Tabla 2.
Funciones de ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Tabla 3.
Medidas de correlación entre variables con distintas escalas . . . . . . . . . . . 34

Índice de figuras

Figura 1.
Modelo recursivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Figura 2.
Modelo no recursivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Figura 3.
Modelo factorial confirmatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Figura 4.
Modelo de regresión estructural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Figura 5.
Modelo mimic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Figura 6.
Modelo de crecimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Figura 7.
Correlaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Figura 8.
One way path . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Figura 9.
Multi-segment path . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Figura 10.
Correlación entre calesc y capitec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Figura 11.
Habilidad del sustentante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Figura 12.
Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Figura 13.
Residuos estandarizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Figura 14.
Índices modificados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Figura 15.
Valores estandarizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Figura 16.
Efectos indirectos y totales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Figura 17.
Modelo con tres factores en población femenina . . . . . . . . . . . . . . . . . . . 88
Prefacio

E l Centro Nacional de Evaluación para la Educación Superior (Ceneval) es


una institución de carácter eminentemente técnico. A lo largo de tres lustros
su actividad esencial ha sido promover la calidad de la educación mediante eva-
luaciones válidas, confiables y pertinentes de los aprendizajes.
Primordialmente, evalúa los conocimientos y habilidades adquiridos por los
individuos en los procesos de enseñanza-aprendizaje, formales o no forma-
les, de los sistemas educativos. Así contribuye a la toma de decisiones funda-
mentadas. De hecho, con sus servicios de evaluación atiende instituciones de
educación media superior y superior, autoridades educativas, organizaciones
profesionales y otras instancias públicas y privadas y, desde luego, al destinatario
final –y el más importante– de sus pruebas: el propio sustentante.
Con la serie Cuadernos técnicos el Centro promueve también el uso de herra-
mientas de análisis en círculos cada vez más amplios. El propósito de estos
títulos es contribuir a elevar la calidad de la educación mexicana y fomentar una
auténtica cultura de la evaluación.
El desarrollo de modelos que incorporan variables latentes y variables me-
didas –objeto de estudio del presente texto– se ha incrementado de forma es-
pectacular. Este tipo de modelos tienen aplicación en diversas disciplinas, como
la psicología (depresión en adolescentes, adicciones y problemas del compor-
tamiento), la sociología (estudios acerca de la salud ocupacional, redes sociales,
ambientes laborales), la mercadotecnia (análisis de satisfacción del consumidor,
diseño y desarrollo de nuevos productos), entre otras. En lo concerniente a la
investigación educativa, los modelos de ecuaciones estructurales se aplican en
estudios de motivación para lectura y aprendizaje, usos de las nuevas tecnolo-
gías para la enseñanza, etcétera.
Sistema de ecuaciones estructurales… tiene el propósito de promover una re-
flexión más profunda sobre estas valiosas herramientas de investigación.

Sistema de ecuaciones estructurales: una herramienta de investigación 9


Antecedentes históricos

E l primer antecedente de un modelo de ecuaciones estructurales se remonta


a 1934, año en el que el biómetra Sewall Wright da a conocer el modelo de
trayectoria (path analysis) sobre las relaciones de tamaño en mediciones óseas.
Para Wright “éste no era un método para descubrir causas, sino más bien era
un método aplicado a modelos causales ya formulados con base en un conoci-
miento y consideración teórica”. Esta técnica permitía descomponer la varianza
y covarianza de las variables involucradas, en función de los parámetros de un
sistema de ecuaciones simultáneas y tenía como fin estudiar el efecto directo e
indirecto entre estas variables. A diferencia de los métodos matriciales emplea-
dos en la actualidad, él utilizaba diagramas de trayectoria en lugar.
No obstante su importancia, este modelo fue ignorado en biología, socio-
logía y psicología. No es sino hasta los años sesenta y principios de los setenta
que Blalock, Boundon, Duncan y otros sociólogos reconocen el potencial del
análisis de trayectoria y las técnicas relacionadas de “correlación parcial”, como
herramientas para analizar datos no experimentales. Este redescubrimiento del
análisis de trayectoria en la sociología se propagó a la ciencia política y a otras
ramas de las ciencias sociales.
En la segunda mitad del siglo xx varios estadísticos se vieron interesados
en los retos que presentaba la estimación de estos modelos. D.N. Lawley, T.W.
Anderson, K.G. Jöreskog, M.W. Browne, A. Satorra, D. Sörbom y B. Muthén,
entre otros, dan respuesta a la gran cantidad de desafíos que se derivan de los
procesos para estimar estos modelos de ecuaciones estructurales.
Un paso decisivo ocurre cuando Jöreskog (1973), Keesling (1972) y Wiley
(1973) desarrollan un modelo general de ecuaciones estructurales e incorpo-
ran diagramas de trayectoria y otras características del análisis de trayectoria,
conocido como modelo Lisrel (linear structural relations) o modelo jkw. Además
de facilitar la difusión del análisis de trayectoria, presenta las ecuaciones que
se derivan de las covarianzas entre las variables, a través de operaciones matri-
ciales en lugar de que se “lean” del diagrama de trayectoria, y proporciona una

10 Cuaderno técnico 4
descomposición más clara de los efectos directos, indirectos y totales. Lisrel
incorpora modelos con variables latentes y variables medidas, fundamentales
en las técnicas contemporáneas de ecuaciones estructurales.
El desarrollo de modelos con esta combinación de variables –latentes y me-
didas– se ha incrementado de forma espectacular. Jöreskog extendió el análisis
factorial exploratorio al factorial confirmatorio, desarrolló el modelo factorial
de segundo orden, el análisis factorial multi-grupo y el ya citado modelo general
de ecuación estructural Lisrel. Además, desarrolló métodos para la estimación y
prueba de dichos modelos para datos transversales, longitudinales, multi-grupo
y multinivel.
La influencia de Jöreskog no sólo se limita a los desarrollos propios. Varios
de sus estudiantes de doctorado han realizado importantes contribuciones. Por
ejemplo, Sörbom (1974) extiende el modelo multi-grupo para incluir medias en
las variables latentes; Muthén (1977) introduce métodos para incluir variables
observadas categóricas; Hägglund (1985) contribuye con el método de mínimos
cuadrados por medio de estimación de dos estados (two-state last-square methods);
Quiroga (1992), por su parte, realiza estudios de robustez con correlaciones
policóricas para desviaciones del supuesto de normalidad, mientras que Yang-
Wallentin (1997) desarrolla métodos para estimar relaciones no lineales. Los
avances recientes en modelos de ecuaciones estructurales comprenden exten-
siones para estimaciones en datos que provienen de muestras complejas, mo-
delos lineales generalizados y series de tiempo.

Sistema de ecuaciones estructurales: una herramienta de investigación 11


Áreas de aplicación

E n el ámbito de la psicología, este tipo de modelos se aplica principalmente


en estudios sobre depresión en adolescentes, adicciones y problemas del
comportamiento. En sociología, sus aplicaciones comprenden estudios acerca
de la salud ocupacional, redes sociales, ambientes laborales y otros. En merca-
dotecnia abarca, sólo por citar algunos, los análisis de satisfacción del consu-
midor, beneficios de los medios de comunicación en los negocios, así como
diseño y desarrollo de nuevos productos. En lo concerniente a la investigación
educativa, los modelos de ecuaciones estructurales se aplican en estudios de
motivación para lectura y aprendizaje, usos de las nuevas tecnologías para la
enseñanza, etcétera. En medicina se usan en estudios de trastornos del sueño,
servicios de salud en la población, epidemiología ambiental, entre otros. Aquí
damos cuenta de las principales áreas de aplicación, pero existen muchas más
en las que el uso de este tipo de modelos empieza a ser una práctica común.

12 Cuaderno técnico 4
Relaciones causales entre variables

N o se pretende aquí fomentar una discusión exhaustiva sobre causalidad. El


propósito es modesto: promover una reflexión más profunda sobre este
importantísimo elemento, presente en los modelos que se describen.
Un elemento fundamental en los modelos de ecuaciones estructurales es
la presencia de relaciones causales entre las variables que los componen. Las
relaciones de causalidad se establecen en diversas áreas del conocimiento, en
ciencias, en humanidades y muchos otros campos. Sin embargo, existen varias
connotaciones del término causalidad.
De acuerdo con la definición general de Bollen (1989), consideremos una
variable y1, que está aislada de toda influencia excepto de la de una segunda va-
riable x1. Si un cambio en y1 proviene de un cambio en x1, entonces x1 es causa
de y1. La definición de causa tiene tres componentes: aislamiento, asociación y
dirección de la influencia.
Al observar los elementos en las relaciones causales, se aprecia que lo que
hace casi imposible tener absoluta certeza de que una variable es causa de otra
es la posibilidad de afirmar que y1 está aislada de cualquiera otra causa, ex-
cepto de x1. Aislamiento es un ideal no asequible. Podemos decir que existe
un aislamiento cuando x1 y y1 están en un “vacío” que excluye cualquier otra
influencia. Mucho del debate sobre el estatus causal de una relación inicia con
la interrogante sobre si la asociación entre y1 y x1 no se debe a estos otros fac-
tores. Sin la condición de aislamiento de y1, nunca tendremos la certeza de que
x1 causa a y1. Varios estudios experimentales, cuasi experimentales y observa-
cionales, intentan aproximarse a estas condiciones de aislamiento, por medio de
alguna forma de procesos de control o de aleatorización.
La asociación es la segunda condición para establecer la causalidad. Cuando
una supuesta causa y su efecto están aislados de otras influencias, podrían estar
asociados. Una asociación bivariada no es condición necesaria ni suficiente para
una relación causal. La asociación, junto con otros factores, sí.

Sistema de ecuaciones estructurales: una herramienta de investigación 13


Bollen (1989) presenta varios escenarios relacionados con modelos de ecua-
ciones estructurales, en los que resulta difícil determinar la asociación entre las
variables que componen un modelo. Los problemas van desde la propia deter-
minación de la existencia de la asociación entre las variables, los casos en los
que las técnicas estadísticas para evaluarla son inadecuadas y los problemas que
provoca la multicolinealidad en la estimación de estas asociaciones.
El componente final de una relación causal es la dirección causal. La plausi-
bilidad de una asociación causal inicia con la determinación de la dirección co-
rrecta. La variable que produce la causa requiere una prioridad temporal como
una condición de causalidad. La supuesta causa debe preceder al efecto, es decir
que la variable explicativa tiene primicia causal.
Si debe existir un intervalo entre la causa y el efecto que ésta produce, ¿qué
tan largo debe ser este intervalo? En estudios epidemiológicos, por ejemplo, es
importante determinar cuánto tiempo se debe estar expuesto a un riesgo para
desarrollar una enfermedad. Nuevamente referimos al lector a Bollen (1989)
para intentar esclarecer la dirección causal.
En síntesis, hemos tomado una definición de causalidad orientada a los
modelos de ecuaciones estructurales, pues se asume necesario contar con tres
condiciones: aislamiento, asociación y dirección de la causalidad para establecer una
relación causal. Cada una de estas condiciones es difícil de obtener; sobre todo
la certeza de que una causa y su efecto estén aislados de cualquier otra influen-
cia. Por ello debemos ver a los modelos únicamente como una aproximación
a la realidad. Las pruebas estadísticas sólo podrán descartar modelos, jamás
probarán modelos o relaciones causales dentro de ellos. Los problemas para
demostrar el aislamiento, la asociación y la dirección causal son muy añejos en
el entorno de las distintas áreas de la ciencia.

14 Cuaderno técnico 4
Variables latentes y variables manifiestas

E n muchas disciplinas relacionadas con las ciencias sociales es usual intentar


medir la inteligencia, motivación, eficiencia, percepción, habilidad verbal, et-
cétera –fenómenos de una gran complejidad–, a partir de percepciones, opinio-
nes, indicadores y variables relativas o aproximadas. Este tipo de variables recibe
un nombre genérico: variables latentes. La naturaleza de estas variables cuestiona
la posibilidad de medirlas pues, a diferencia de muchos fenómenos donde es
posible crear condiciones de laboratorio para reproducirlos, los fenómenos aso-
ciados a variables latentes carecen no sólo de la posibilidad de medirlos sino,
en múltiples ocasiones, de una definición precisa. Cualquier entidad hipotética
de difícil definición dentro de una teoría científica puede representarse a través
de una variable latente –en muchas áreas denominada constructo–, la cual no se
puede observar o manipular de forma directa.
Las variables manifiestas se pueden medir de manera directa y representan
características observables de algún fenómeno subyacente, al contrario de las
latentes. Una característica importante de estas variables es que sirven para evi-
denciar o definir a las variables no observadas o latentes.
La forma de modelar un fenómeno que requiere representar relaciones entre
variables latentes y variables medidas o manifiestas es a través de los modelos de
ecuaciones estructurales.

Sistema de ecuaciones estructurales: una herramienta de investigación 15


Elementos de los modelos de ecuaciones estructurales

U n modelo de ecuaciones estructurales puede representarse por medio de


un diagrama de trayectorias y un sistema de ecuaciones. En general, es
recomendable comenzar por representarlo gráficamente, lo cual facilita la escri-
tura de las ecuaciones que describen a dicho modelo. Existe un consenso para
la representación de estos modelos. Así, una variable observada se expresa por
medio de un cuadrado o rectángulo, una variable latente con un círculo o elipse,
y la asociación y la correlación entre dos variables se manifiestan por medio de
una flecha unidireccional (→) y bidireccional (←→), respectivamente. Las va-
riables dependientes son fácilmente identificables: reciben al menos una flecha.
De las independientes sólo salen flechas, pero no entran. La tabla 1 muestra la
notación básica para representar los modelos en términos de ecuaciones.

Tabla 1. Notación básica en los modelos de EE

Símbolo
Variable expresado en Descripción
forma matricial

Variable observada dependiente


Variable observada independiente
Coeficiente entre una variable observada o entre una
variable latente y una observada
Error asociado a Y
Error asociado a X
Variable latente independiente
Variable latente dependiente
Error asociado a η
Coeficiente entre variables latentes dependientes
Coeficiente entre una variable latente independiente
y una dependiente
Matriz de covarianza asociada a ξ

16 Cuaderno técnico 4
En modelos en donde sólo se incluyen variables observadas (modelo de
trayectorias) algunas veces se usan las matrices B y Γ en lugar de Λ. En el caso
de los errores, se utiliza ζ en lugar de ε para simplificar la notación. Lo anterior
es conveniente si dichos modelos ajustan con Lisrel.

Sistema de ecuaciones estructurales: una herramienta de investigación 17


Tipos de parámetros

E n los modelos de ecuaciones estructurales hay tres tipos de parámetros:


libres, fijos y de restricción. Los libres, que deberán estimarse en el proceso,
son los siguientes: las varianzas que corresponden a las variables independien-
tes, las covarianzas entre variables independientes, todos los coeficientes que
conectan a las variables latentes con sus respectivas variables observadas, los
que conectan a latentes con latentes y los que conectan a observadas con ob-
servadas. A los fijos se les asigna de inicio un valor constante sin ser parámetros
por estimar en el modelo. Los de restricción son aquellos sobre los que se expresa
una conjetura acerca de sus valores. Esencialmente, esta presunción se establece
en términos de una hipótesis, por lo que se igualan a un valor particular (cero,
por ejemplo), o se asume que son iguales a otro u otros parámetros del modelo.

18 Cuaderno técnico 4
Tipos de modelos de ecuaciones estructurales

D e acuerdo con su estructura y con la naturaleza de las variables que contie-


nen, hay varios tipos de modelos de ecuaciones estructurales: de trayecto-
ria, factorial confirmatoria, factorial de segundo orden, de regresión estructural,
mimic, de crecimiento, entre otros.
El análisis de trayectoria, el modelo más simple, sólo involucra variables ob-
servadas. Es similar a un modelo de regresión lineal, aunque la diferencia radica
en que en éstos se puede estimar el efecto indirecto que tiene una variable sobre
otra, lo que no puede hacerse con el de regresión lineal. Hay dos tipos de mode-
los de trayectoria: recursivos y no recursivos. En los modelos recursivos (figura 1)
no es posible que haya causalidad recíproca (si hay una trayectoria de Y1 a Y2
no puede haber una de Y2 a Y1) ni ciclos ni correlación entre los errores; en un
modelo no recursivo (figura 2), sí.

Figura 1. Modelo recursivo Figura 2. Modelo no recursivo

γ21 γ11
X1 γ11 X1 Y1 ζ1
γ21
β21
ζ1 Y1 Y2 ζ2 β21 β12
γ12
γ12 γ22
X2 γ22 X2 Y2 ζ2

Sistema de ecuaciones estructurales: una herramienta de investigación 19


La ecuación que describe el modelo recursivo es de la siguiente forma

Y = BY + ΓX+ ζ

Esto es:
Y1 = γ11 X1 + γ12 X2 + ζ1
Y2 = β21 Y1 + γ21 X1 + γ22 X2 + ζ2

De forma matricial se escribe como:

( )(
Y1
Y2 =
0
β21
0
0 )( ) (Y1
Y2
γ11
+ γ
21
γ12
γ22 )( ) ( )
X1
X2 +
ζ1
ζ2

El modelo factorial confirmatorio permite explicar la correlación entre varia-


bles latentes y la asociación entre cada latente y sus correspondientes variables
observadas. Como su nombre lo indica, está orientado a confirmar la estructura
sugerida por medio del modelo.

Figura 3. Modelo factorial confirmatorio

31

ξ1 21 32 ξ3
ξ2

λ11 λ21 λ31 λ42 λ52 λ62 λ73 λ83

X1 X2 X3 X4 X5 X6 X7 X8

δ1 δ2 δ3 δ4 δ5 δ6 δ7 δ8

20 Cuaderno técnico 4
La ecuación asociada a este modelo es:

X = Λxξ+δ

X1 λ11 0 0 δ1
X2 λ21 0 0 δ2
X3 λ31 0 0 δ3
ξ1
X4 0 λ42 0 δ4
= ξ2 +
X5 0 λ52 0 δ5
ξ3
X6 0 λ62 0 δ6
X7 0 0 λ73 δ7
X8 0 0 λ83 δ8

El modelo de regresión estructural difiere del factorial confirmatorio en


que entre las variables latentes existe asociación y no sólo correlación, lo que
permite identificar dos submodelos de manera natural. Uno de ellos, que suele
denominarse modelo estructural, establece la asociación entre variables latentes,
mientras que el otro está formado por la asociación entre variables latentes y
observadas.

Sistema de ecuaciones estructurales: una herramienta de investigación 21


Figura 4. Modelo de regresión estructural

δ1 X1 λx11 λy11 Y1 ε1
ζ1

λx21 γ11 λy21


δ2 X2 ξ1 η1 Y2 ε2

λx31 β21 γ21 λy31


δ3 X3 Y3 ε3
ζ2 η2

λy42 λy52 λy62

Y4 Y5 Y6

ε4 ε5 ε6

Modelo estructural:

η= Bη + ΓX + ζ

Modelo de medición:

Y = ΛX η + ε
X = ΛY ξ + δ

El modelo mimic (multiple indicators and multiple causes of a single latent variable)
es un caso especial del modelo de regresión estructural.

22 Cuaderno técnico 4
Figura 5. Modelo mimic

X1

ζ1
X2 Y1 ε1

X3 η1 Y2 ε2

X4 Y3 ε3

X5

Las ecuaciones que lo describen son:

η = ΓX+ζ
Y=Λyη+ε

El modelo de crecimiento (Latent Growth Curve Model) se utiliza con datos


de tipo longitudinal. Para que este tipo de modelo funcione adecuadamente se
deberá garantizar que se cumplan los siguientes requerimientos: todos los in-
dividuos deberán contar con información en cada uno de los tiempos o etapas
involucrados en el modelo, el espaciamiento entre un tiempo (o etapa) y otro
debe ser similar en todos los individuos, la variable de respuesta debe ser conti-
nua, el número de periodos debe ser mayor a dos y el tamaño de muestra debe
ser al menos de 200 en cada uno de los tiempos (Boomsma, 1985; Boomsma y
Sayer, 2001).

Sistema de ecuaciones estructurales: una herramienta de investigación 23


Figura 6. Modelo de crecimiento

Intercepto Pendiente

Xt1 Xt2 Xt3 Xt4

24 Cuaderno técnico 4
Identificabilidad del modelo

D esde que en el aula cursamos álgebra elemental enfrentamos problemas


de identificabilidad de un modelo, concretamente cuando trabajamos con
ecuaciones simultáneas. Una ecuación de la forma 2x - 3y = 4 no tenía solución
única y su solución dependía de asignar un valor particular a alguna de las in-
cógnitas (x o y) y encontrar el valor correspondiente de la otra. Dicho en los
términos, x y y son nuestros parámetros, y fijamos uno de ellos, para encontrar
solución de la ecuación o del sistema. También recordamos que si teníamos otra
ecuación que no fuera linealmente dependiente de la primera, podríamos encontrar
la solución sin necesidad de asignar ningún valor a nuestras incógnitas. Retoma-
remos más adelante, algunas de estas condiciones para garantizar identificabili-
dad en los modelos de ecuaciones estructurales.
En un modelo no identificable es imposible obtener de manera única el
valor de cada uno de los parámetros libres. Las principales razones por las que
se da este problema se deben a que se estipulan dentro del modelo parámetros
que por regla general no son estimables. Un ejemplo es cuando en un modelo
de regresión estructural se incluye una correlación entre dos variables depen-
dientes. En el caso de modelos que contienen variables latentes es importante
no olvidar fijar la escala de cada uno de ellos para evitar este problema. Otra
característica que puede generar conflictos es cuando hay más parámetros libres
que ecuaciones y por lo tanto uno o varios parámetros quedan expresados en
términos de otros, o bien cuando se obtienen valores de parámetros que son
inadmisibles como varianzas negativas.
Para determinar si un modelo es identificable bastará con verificar ciertas
reglas. Una de ellas es aplicable a todos los tipos de modelos, mientras que el
resto varían dependiendo el tipo.
La regla más sencilla y general es la regla t. Para utilizarla sólo se necesita co-
nocer el número de parámetros libres y de variables observadas, y bastará con
que se satisfaga la siguiente desigualdad:

Sistema de ecuaciones estructurales: una herramienta de investigación 25


(p+q)(p+q+1)
t≤
2

donde t es el número de parámetros libres y p + q es el número de variables


observadas. Esta regla es necesaria mas no suficiente para garantizar la identi-
ficabilidad del modelo.
Algunas reglas pueden ser aplicables a un modelo de trayectorias: regla de la B
nula, regla recursiva, regla de condición de orden y regla de condición de rango; a modelos de
análisis confirmatorio o derivados de éste: regla de tres variables observadas y regla de
dos variables observadas; o bien, a modelos de regresión estructural: regla de los dos
pasos y regla mimic.
Regla de la B nula. Aunque no se establezcan asociaciones entre variables
dependientes en modelos de trayectorias, y por lo tanto la matriz B sea cero, el
modelo es identificable.
Regla recursiva. Se aplica a los modelos recursivos y sólo verifica que no haya
correlación entre los errores asociados a las variables dependientes.
Regla de condición de orden. Su propósito es revisar la identificabilidad en cada
una de las ecuaciones asociadas al modelo. Una condición necesaria para la
identificabilidad de una ecuación es que el número de variables excluidas sea al
menos p-1, donde p representa el número de variables dependientes.
Regla de condición de rango. Al igual que la regla de orden, se aplica a cada una de
las ecuaciones. Para poder aplicar esta regla es necesario formar una nueva ma-
triz C de la forma [(I-B)|-Γ ], donde I es la matriz identidad (con valores de uno
en la diagonal y lo demás cero). Para verificar la identificabilidad de la i-ésima
ecuación, se borran todas las columnas en C en las que no hay un cero en el
i-ésimo renglón. Las columnas no borradas formarán una nueva matriz Ci. Una
condición suficiente y necesaria para que la i-ésima ecuación sea identificable es
que el rango1 de Ci sea igual a p-1.

26 Cuaderno técnico 4
Para ilustrar la regla de condición de orden, considérese el modelo expresado
por medio de las siguientes ecuaciones.

Y1=β12Y2 + γ11X1 + ζ1 ...(1)


Y2=β21Y1 + γ22X2 + ζ2 ...(2)

Hay dos variables dependientes (Y1 y Y2) y dos independientes (X1 y X2).
Si se aplica la regla de condición de orden para la ecuación uno, se cumple que
por lo menos exista una variable excluida de la ecuación (esto es, Y1 y X2) y lo
mismo sucede con la ecuación dos.
Para aplicar la regla de condición de rango usando este ejemplo, primero se
obtendrá la matriz C.

(I-B)= ( 10 01 ) -( β0 β0 ) = (-β1
21
12
21
-β12
1 )
Si se junta a (I-B) con -Γ se obtiene:

C= ( -β1 21
-β12 -γ11 0
1 0 -γ22 )

1
El rango de una matriz es el número de filas o columnas linealmente independientes. Una fila
o columna es linealmente dependiente de otra cuando es posible establecer una combinación
lineal entre ellas. Por ejemplo, si f1 = 2f2 + 3f3 entonces se dice que la fila uno es linealmente
dependiente de la fila 2 y la fila 3. Por el contrario, una fila o columna es linealmente indepen-
diente de otra u otras cuando no se puede establecer una combinación lineal entre ellas.

Sistema de ecuaciones estructurales: una herramienta de investigación 27


Para verificar a la ecuación uno, se deberán borrar las columnas uno, dos y
tres (ya que no contienen al cero en el primer renglón) de esta forma:

C1 = ( -γ0 )
22

Como p- 1 = 1 y el rango de C1 es uno, entonces se cumple la identificabi-


lidad para la ecuación uno. El procedimiento para la ecuación dos es análogo.
Regla de tres variables observadas. Para un modelo con un sólo factor, una con-
dición suficiente para su identificabilidad es que tenga asociadas al menos tres
variables observadas, con cargas factoriales diferentes de cero y que la matriz
de varianzas y covarianzas asociada a los errores δ( Θδ ) sea diagonal. Para mo-
delos con más de un factor se deben de considerar tres especificaciones: que
cada factor tenga asociadas por lo menos tres variables observadas, que cada
renglón de ΛX posea un sólo elemento diferente de cero y que Θδ sea diagonal.
La condición dos se puede traducir al hecho de que si un factor tiene asociadas
tres variables, éstas no están asociadas a otro factor, mientras que la tres indica
que no hay correlación entre los errores asociados a las variables observadas.
Regla de dos variables observadas. Esta regla aplica en dos casos. El primero de
ellos requiere que se satisfagan la segunda y tercera condiciones de la regla de
tres variables observadas y que la matriz Φ sea diferente de cero. El segundo
caso difiere del primero con respecto a Φ ya que puede suceder que algunos
valores de está matriz sean cero. En ambos casos, con tener dos variables obser-
vadas por cada variable latente es suficiente para que el modelo sea identificable.
Regla de los dos pasos. Esta regla consta de dos pasos: el primero requiere ver al
modelo como un factorial confirmatorio: X y Y se expresan sólo como X; η y ξ
como ξ. La manera de identificar este nuevo modelo es por medio de las reglas
aplicables a un confirmatorio. Una vez que se ha determinado que es identifica-
ble se procede al segundo paso. Éste involucra únicamente a la parte del modelo

28 Cuaderno técnico 4
en donde se observan las asociaciones entre latentes (lo que se denominó como
modelo estructural). De esta forma se reescribe al modelo como uno de varia-
bles observadas en donde η es ahora Y y ξ es X y se procede a utilizar una de las
reglas de identificabilidad para modelos de trayectoria. Si la identificabilidad se
cumple en ambos pasos, es suficiente para considerar al modelo en su totalidad
como identificable.
Regla mimic. Sólo es aplicable en los modelos mimic. Establece que si el nú-
mero de variables observadas Y es mayor o igual que dos y el de observadas X
es mayor o igual que uno, y se fija uno de los coeficientes que van de η a Y, es
suficiente para que el modelo sea identificable.

Sistema de ecuaciones estructurales: una herramienta de investigación 29


Métodos de estimación

E l proceso de estimación de un modelo de ecuaciones estructurales es crucial


debido a que permite obtener de manera única el valor estimado que tendrá
cada parámetro libre.
La hipótesis básica en un modelo de ecuaciones estructurales se reduce a
probar que la matriz de varianzas y covarianzas poblacional es igual a la matriz
de varianzas y covarianzas asociada al modelo teórico, esto es:

Σ=Σ(θ)

donde Σ es la matriz poblacional y Σ(θ) es la matriz asociada al modelo pro-


puesto. Aunque en la práctica es improbable que se dé la igualdad como tal, el
objetivo será encontrar θ̂, de tal forma que Σ sea lo más parecido a Σ( θ̂ ). Par-
tiendo del hecho de que no es posible conocer explícitamente los valores de la
matriz de varianzas y covarianzas poblacional (si se conociera no tendría senti-
do plantearse siquiera un modelo), se utiliza a la matriz de varianzas-covarianzas
muestral (S) como estimador de Σ.
La diferencia entre estas dos matrices (S-Σ( θ̂ )) se denomina residuo e indica
la discrepancia entre lo observado por medio de los datos y las estimaciones
arrojadas por el modelo.
La estimación se lleva a cabo por medio de un proceso iterativo cuyo obje-
tivo es minimizar el valor de una función. Esta función, denominada de ajuste
(F), se escribe en términos de las matrices S y Σ( θ̂ ). La manera de expresar a F
varía según el método de estimación que se utilice. F siempre es mayor o igual a
cero y sólo es cero si se cumple que S=Σ( θ̂ ), es decir que el modelo propuesto
ajusta perfectamente a los datos.
Los métodos de estimación más empleados son máxima verosimilitud (ml),
mínimos cuadrados no ponderados (uls), mínimos cuadrados ponderados
(wls) y mínimos cuadrados generalizados (gls).

30 Cuaderno técnico 4
El método de máxima verosimilitud es quizá el más empleado y trabaja bajo
el supuesto de normalidad de los datos. Recientemente se ha comprobado (Bo-
llen, 1989) que bajo pequeñas desviaciones de normalidad este método puede
ser adecuado. Otro método que también opera bajo el supuesto de normalidad
es el de mínimos cuadrados generalizados. Este método y el de mínimos cua-
drados no ponderados son análogos al método de ols (ordinary least square) em-
pleado en regresión lineal, aunque el gls se pondera por una matriz de pesos.
El método de mínimos cuadrados ponderados, también conocido como mé-
todo de distribución asintóticamente libre, se puede utilizar cuando se viole el
supuesto de normalidad de los datos. De hecho, es imprescindible si el modelo
contiene una o más variables categóricas y por lo tanto se trabaja con matrices
policóricas, poliseriales y tetracóricas. Este método requiere particularmente
que la muestra sea considerablemente grande (n > 250, Willet y Sayer, 1994).

En la tabla 2 se presentan las funciones de ajuste para estos cuatro métodos.

Tabla 2. Funciones de ajuste

Método de estimación Función de ajuste

Máxima verosimilitud FML = log|Σ (θ )|+ tr (SΣ-1 ( θ )) – log|S|– (p + q)

Mínimos cuadrados no ponderados FULS = (½ ) tr [(S – Σ ( θ ))2 ]

Mínimos cuadrados generalizados FGLS = (½ ) tr ({[S – Σ ( θ )] W-1 }2 )

Mínimos cuadrados ponderados o FWLS = (½ ) tr {[S – Σ ( θ )] V-1 }2


de distribución asintóticamente libre

Sistema de ecuaciones estructurales: una herramienta de investigación 31


donde tr representa la traza, la cual se define como la suma de los elementos
de la diagonal principal de una matriz. Por ejemplo, sea A una matriz de 3x3
de la forma:

A= ( aa 11

21
a12
a22 )
la traza de A, esto es, tr(A) = a11 + a22

32 Cuaderno técnico 4
Modelos con variables discretas

E n las aplicaciones comunes de los modelos de ecuaciones estructurales se


asume que las variables medidas tienen una escala continua, lo que justifica,
al menos en principio, los supuestos de distribución normal de los datos, así
como el uso de la matriz de correlaciones de Pearson. Sin embargo, en muchas
áreas relacionadas con las ciencias sociales, las variables de interés generalmente
presentan escalas discretas, ya sean de conteo, nominales u ordinales (principal-
mente estas dos últimas). En esta situación, como comentamos en el párrafo
anterior, es necesario construir esta matriz de correlaciones considerando la
escala de medición de las variables involucradas en el cálculo de cada entrada
de esta matriz. La tabla 3 presenta el tipo de correlación que es conveniente
calcular de acuerdo con el orden de medición de las dos variables involucradas.

Tabla 3. Medidas de correlación entre variables con distintas escalas

Escala de medición Continua Ordinal Dicotómica


Continua Pearson Poliserial Punto biserial
Ordinal Policórica Policórica
Dicotómica Tetracórica

Cada una de estas variables discretas provienen de un proceso de discreti-


zación de una variable continua. Es decir, se asume que subyace una variable
latente continua, con distribución normal. Recordemos que la mayoría de las
variables ordinales de uso común (nivel socioeconómico, nivel de satisfacción
de un servicio, evaluación de la calidad de un producto, etcétera) provienen de
discretizar variables continuas. Entonces, cuando se desee construir un modelo
de ecuaciones estructurales con este tipo de variables, tendremos que trabajar
con matrices policóricas, poliseriales, tetracóricas o, lo más común, con una ma-
triz de correlaciones mixta, que contenga varias de las correlaciones anteriores.

Sistema de ecuaciones estructurales: una herramienta de investigación 33


Un aspecto importante: cuando se utiliza el tipo de correlación respetando
la escala de las variables involucradas, generalmente se obtienen correlaciones
más grandes que si se utilizan las correlaciones de Pearson, y debemos recordar
que un buen principio es tener una estructura de correlación fuerte entre las
variables que componen nuestro modelo.

34 Cuaderno técnico 4
Bondad de ajuste del modelo

L a etapa en la que se lleva a cabo la evaluación del modelo propuesto es fun-


damental para determinar si dicho modelo describe de manera apropiada al
fenómeno objeto de estudio.
Como ya se mencionó, la hipótesis básica que se contrasta es que la matriz
de varianzas y covarianzas muestral es igual a la matriz de varianzas y covarian-
zas conformada con los parámetros del modelo (S=Σ( θ )). A diferencia de la
metodología clásica de regresión, en la cual el principal interés se enfoca en
rechazar la hipótesis nula (Ho: β=0) en ecuaciones estructurales el interés radica
en no rechazarla para garantizar que el modelo propuesto ajusta adecuadamente
a los datos.
Las diferentes formas de evaluar el modelo deben ser valoradas de manera
global; todas serán indicadores del grado de ajuste del modelo. Basar nuestro
juicio sobre lo adecuado del modelo en una sola prueba, puede generar conclu-
siones erróneas.
Prueba ji-cuadrada (χ2). Esta prueba se usa para contrastar la hipótesis básica.
Se le conoce con este nombre, ya que si el modelo es correcto y ajusta adecuada-
mente a los datos, entonces T, el estadístico de prueba, se distribuye como una
ji-cuadrada con (t (t+1) / 2) - p grados de libertad (donde t = número de pará-
metros y p = número de variables observadas). Este estadístico se escribe así:

T = (N-1) Fmin

donde N es el tamaño de muestra y Fmin es el valor mínimo que toma la función de


ajuste una vez que se estimaron los parámetros. El criterio para aceptar la hipóte-
sis nula es que el valor de T sea menor al valor en tablas de una ji-cuadrada con
los grados de libertad mencionados y a un nivel de significancia α. Otra forma
es observando que el p-value es mayor que el α. Una limitación de esta prueba
es que es susceptible ante cambios en el tamaño de muestra, por lo que para
muestras grandes T tiende a incrementarse, lo que aumenta la frecuencia con

Sistema de ecuaciones estructurales: una herramienta de investigación 35


que se rechaza Ho, a pesar de que esto no refleje la realidad. Esta es una razón
por la cual no se recomienda usar como único criterio de bondad de ajuste a
esta prueba, sino más bien como complemento de otros índices de ajuste.
Índices de ajuste. Hay dos tipos de índices: los de ajuste absoluto y los de incre-
mento. Los primeros evalúan directamente el ajuste del modelo, mientras que
los de incremento comparan al modelo propuesto con el modelo de indepen-
dencia, en el cual se asume que no hay asociaciones entre las variables. Los índi-
ces de ajuste absoluto son: el índice de bondad de ajuste (gfi = Goodness of Fit Index),
el índice ajustado de bondad de ajuste (agfi = Adjusted Goodness of Fit Index), el índice
de aproximación de la raíz de cuadrados medios del error (rmsea = Root Mean Square
Error of Aproximation) y el índice de la raíz del cuadrado medio del residuo (rmr).
El índice gfi puede interpretarse como una medida que determina la pro-
porción de varianza explicada por el modelo (como la R2 en regresión lineal). Si
además se consideran los grados de libertad y el número de variables observa-
das del modelo, se obtiene el índice agfi. El valor que toman estos dos índices
se encuentra entre cero y uno (aunque en casos aislados puede tomar valores
negativos). En ambos casos, valores cercanos a uno determinan que el modelo
tiene muy buen ajuste. Uno de los índices más populares es el rmsea, que sólo
puede tomar valores positivos. Un valor menor a 0.05 indica que el ajuste del
modelo es bueno aunque es más deseable uno cercano a cero. El rmsea tiene
asociada la prueba de hipótesis:

Ho: RMSEA ≤ 0.05 vs Ha: RMSEA > 0.05

Si el pclose (así se le denomina dentro de la paquetería estadística) es mayor al


nivel de significancia α entonces hay evidencia para rechazar a Ho. Una limita-
ción de este índice es que, como su expresión involucra al tamaño de muestra,
para muestras pequeñas tiende a sobreestimar el ajuste del modelo. El índice
rmr es similar en corte al rmsea: los valores más deseables se encuentran por

36 Cuaderno técnico 4
debajo de 0.05 y entre más cercano a cero es mayor la evidencia de buen ajuste.
Los índices de ajuste de incremento son: índice de ajuste normado (nfi = Nor-
med Fit Index), índice de ajuste no normado (nnfi o tli = Non Normed Fit Index),
índice de ajuste comparativo (cfi = Comparative Fit Index), índice incremental de ajuste
(ifi o bl89 = Incremental Fit Index), índice relativo de ajuste (rfi = Relative Fit Index),
índice esperado de validación cruzada (ecvi = Expected Cross Validation Index) y criterio
de información de Akaike (aic = Akaike Information Criterion).
El nfi se calcula por medio de la diferencia del valor de la ji-cuadrada aso-
ciada al modelo de independencia con respecto a la del modelo propuesto.
Una limitación de este índice es que no toma en cuenta los grados de libertad,
de manera que no es posible valorar la complejidad del modelo ni tampoco el
tamaño de muestra. El nnfi es una variante del nfi aunque aquel sí considera
los grados de libertad y el tamaño de muestra. Los índices cfi, ifi y rfi tienen
variaciones con respecto al nfi pero siempre bajo la misma idea de incluir en la
expresión al modelo de independencia versus el modelo propuesto. En general,
todos estos índices toman valores entre cero y uno, y valores cercanos a uno
indicarán que el modelo tiene muy buen ajuste.
El ecvi permite cuantificar el cambio que se produce al comparar al modelo
propuesto con el modelo de independencia y saturado. Lo deseable es que el ecvi
asociado al modelo propuesto sea el más pequeño con respecto a los otros dos.
El aic es un índice que toma en cuenta la complejidad del modelo y el grado
de ajuste; al igual que el ecvi compara al modelo con los otros dos ya mencio-
nados. Lo atractivo de estos dos índices es que, cuando se cuenta con varias
versiones del modelo original, se pueden comparar entre sí por medio de los
valores obtenidos del ecvi y aic y utilizarlos para elegir al que tenga el mejor
ajuste, prefiriendo a aquel cuyos índices en conjunto sean los de menor valor.
Un punto de corte aceptable para los índices gfi, agfi, nfi, nnfi, cfi, ifi
y rfi es de 0.9.

Sistema de ecuaciones estructurales: una herramienta de investigación 37


El test de los multiplicadores de Lagrange –conocido en Lisrel como índices modi-
ficados–, así como el test de Wald, se usan para cuantificar la contribución que
tiene un parámetro en el modelo propuesto. El test de los multiplicadores de
Lagrange muestra el decremento provocado en la ji-cuadrada al considerar un
nuevo parámetro libre (por ejemplo, una nueva trayectoria antes no impuesta).
Por el contrario, el test de Wald muestra el incremento en la ji-cuadrada al fijar en
cero un parámetro (semejante a eliminar el parámetro del modelo). A diferencia
de los índices de ajuste, en los cuales existe un punto de corte sugerido para
determinar que el modelo es bueno, en estas dos pruebas no los hay, por lo que
el criterio del investigador juega un papel importante en la toma de decisiones
para considerar nuevos parámetros sugeridos por medio de las dos pruebas a
favor del modelo y tomando siempre en cuenta, que al modificar un parámetro
puede afectar otras partes del modelo ya sea en sentido positivo o negativo,
esto es, puede hacer que el ajuste del modelo mejore o empeore con respecto al
modelo originalmente propuesto.
Cuando se desea evaluar el ajuste de un segmento particular del modelo, los
índices de ajuste no nos aportan información al respecto, para lo cual podemos
utilizar la matriz de residuos estandarizados. Cada una de las entradas de esta matriz
cuantifica la discrepancia que hay entre lo observado por medio de los datos y
las estimaciones que el modelo produce. Lo deseable es obtener residuos estan-
darizados cercanos a cero; sin embargo, un rango aceptable es entre -2 y 2. En
ecuaciones estructurales no es posible realizar análisis de residuos análogos a
los que se hacen con la metodología clásica de regresión lineal.
Finalmente, otra forma de evaluar si un parámetro libre es estadísticamente
significativo es por medio de su valor t. Para obtener a t se divide el valor esti-
mado del parámetro entre su error estándar. Si t se encuentra por fuera de -2 y
2, entonces el parámetro es significativo al 5%, y puede considerarse diferente
de cero a ese nivel de significancia.

38 Cuaderno técnico 4
Efecto total, directo e indirecto entre variables

U no de los atractivos de sem es que permite estimar el efecto indirecto y


total que puede tener una variable sobre otra y no sólo el directo como en
regresión lineal.
Hay tres tipos de efecto: a) el directo es la influencia que tienen una variable
sobre otra, que se da de manera directa dentro del diagrama de trayectorias (por
medio de la flecha que une a dos variables); b) el indirecto es la influencia que
tiene una variable sobre otra, pero en cuya trayectoria hay al menos otra variable
intermedia que las une, y c) el total, que es la suma del efecto directo y el indirec-
to, permite cuantificar el cambio que se observa en la variable en que se produjo
el efecto (la que recibe la flecha), inducido por un cambio en la variable que lo
causó (variable de la que sale la flecha), independientemente de los mecanismos
por los cuales se haya producido dicho cambio.

Sistema de ecuaciones estructurales: una herramienta de investigación 39


Lisrel (LInear Structural relations)

D iversos paquetes estadísticos sirven para ajustar este tipo de modelos. Al-
gunos fueron desarrollados específicamente para este fin, como AMOS,
EQS, Lisrel y M-PLUS; otros incluyen únicamente un módulo particular para
realizar esta tarea. Dentro de estos últimos destacan r, s-plus, sas, spss, Stata,
Systat, entre otros.
Lisrel se mantiene a la vanguardia en el desarrollo de las rutinas computa-
cionales para introducir los desarrollos recientes en estos modelos. Para ilustrar
el ajuste de algunos modelos de ecuaciones estructurales, en el ámbito de la
evaluación educativa, haremos uso de este paquete.

40 Cuaderno técnico 4
Introducción a Lisrel

L a primera versión de Lisrel (versión 3) apareció en 1975 y es atribuido a Karl


Jöreskog. Lisrel es el acrónimo de “LInear Structural RELations”, aunque
en la actualidad hablar de Lisrel es sinónimo de sem (Structural Equation Mo-
deling). Sin embargo, no fue hasta 1998 cuando apareció la primera versión
interactiva de Lisrel (versión 8.2 para Windows). La primera versión del mó-
dulo Prelis (PREprocessor for Lisrel) se lanzó en 1986. Este módulo ha ido
evolucionando hasta convertirse en una herramienta exploratoria de los datos
que serán usados posteriormente en Lisrel, como el cálculo de la matriz de co-
rrelaciones policóricas cuando los datos son categóricos, el cálculo de la matriz
de varianzas-covarianzas asintótica, análisis descriptivo de los datos, etcétera.

Sistema de ecuaciones estructurales: una herramienta de investigación 41


La pantalla principal de Lisrel

L a pantalla inicial de Lisrel permite acceder a la barra de menú de opciones


por medio del cual se podrá ingresar a la ayuda, abrir archivos, importarlos...
Como se observa en la pantalla siguiente, hay iconos que no están habilita-
dos; esto cambia una vez especificado el tipo de proyecto que se va a usar. Un
proyecto es el tipo de archivo de trabajo.

La opción File permite abrir documentos o comenzar un nuevo proyecto,


importar datos en otros formatos (por ejemplo spss) e imprimir. Cuando se
elige esta opción aparecen otras.

La opción New contiene cinco tipos de archivo (o proyectos), de los cuales


se debe elegir uno. Son:

42 Cuaderno técnico 4
Syntax Only (.pr2, .ls8, .spl)
prelis Data (.pr2)
simplis Project (.spj)
lisrel Project (.lpj)
Path diagram (.pth)

Cuando se está familiarizado con la notación de las variables y las matrices


y se es capaz de escribir las ecuaciones e instrucciones tal como el paquete lo
requiere, se recomienda usar el proyecto de sintaxis (Syntax Only). Por medio de
éste, se pueden escribir programas para Prelis o para Lisrel, ya sea para calcular
una matriz de correlaciones, o bien para obtener las ecuaciones del modelo y
estimarlo. Si no se está familiarizado con Lisrel existen, por fortuna, otras op-
ciones que permiten, de manera más sencilla, realizar análisis descriptivo de los
datos, calcular matrices, etcétera. La opción de Prelis Data despliega una hoja en
la que se podrá capturar la base con la que se trabajará. Los archivos de Prelis
siempre se guardan con la extensión .psf.
Lisrel Project y Simplis Project sirven para escribir las ecuaciones subyacentes al
modelo de ecuaciones y los archivos con los que trabajan, tienen extensión .lpj
y .spj, respectivamente.
Path diagram permite dibujar el modelo de ecuaciones y guarda los archivos
con extensión .pth

Sistema de ecuaciones estructurales: una herramienta de investigación 43


Prelis

P relis es un módulo incluido en Lisrel que sirve para preparar los datos que se-
rán usados cuando se lleve a cabo la construcción del modelo de ecuaciones
estructurales, o bien para hacer otro tipo de análisis estadístico diferente a sem.
Para poder trabajar los datos en Prelis es necesario disponer de una base con ex-
tensión .pr2. Hay dos formas de obtenerla: a) capturando directamente los datos
por medio de la opción Prelis Data, y b) importando una base que se encuentre
en otro tipo de formato.

44 Cuaderno técnico 4
Crear la base desde Prelis DATA

E n la pantalla principal de Lisrel elija File → New → Prelis Data. Inmediata-


mente aparecerá la siguiente pantalla

La opción Data, en la parte izquierda superior de la pantalla, permitirá inser-


tar los nombres de las variables. Data → Define Variable nos despliega una nueva
pantalla; para poder insertar el nombre de la variable se elegirá la opción Insert.
En una nueva ventana (Add Variables) se escribirá el nombre de la variable y se
oprimirá Ok. Este procedimiento se hará según el número de variables que se
desee insertar. Una vez que se han terminado de definir todas las variables se
oprimirá Ok en la pantalla Define variables.

Sistema de ecuaciones estructurales: una herramienta de investigación 45


Para insertar el número de casos se elegirá nuevamente Data → Insert case.

Una vez elegido el número de casos, en una ventana parecida a Excel se po-
drán ir capturando los datos. En principio, siempre aparece en ceros. Una vez
capturada la información se debe guardar la base por medio de File → Save o
con el icono que muestra un diskete (la extensión debe ser .psf).

46 Cuaderno técnico 4
Importar la base desde un archivo externo

T ambién es posible capturar el archivo como spss, texto, ascii, Excel, sas.
Para importar la base se deberá elegir de la pantalla principal las siguientes
opciones File → Import Data in Free Format o File → Import External Data in
Other Format, lo que depende del tipo de archivo. Como se despliega una nueva
ventana se deberá buscar la ubicación de la base que se desea importar y elegir
abrir. Aparecerá una pantalla con la base importada, la cual ha sido guardada
automáticamente con el mismo nombre pero con extensión .psf.

Sistema de ecuaciones estructurales: una herramienta de investigación 47


Datos faltantes

A veces, cuando se importa una base o se captura directamente algunos suje-


tos o casos no cuentan con información en alguna de las variables. Es posi-
ble declarar estos valores como datos faltantes. Esta opción de Missing values se
ubica en la misma ventana en donde se insertan las variables y se puede declarar
un valor diferente de dato faltante para cada variable. Por ejemplo, si la variable
sexo tuviera valores de 1 y 2, un dato faltante podría ser declarado con un 9,
pero si por ejemplo otra variable con más dígitos –digamos edad– tuviera un
rango entre 0 y 100, entonces el dato faltante podría ser 999, por conveniencia.

48 Cuaderno técnico 4
Obtención de la matriz de correlaciones Pearson,
policóricas y asintótica

C uando la base de datos es grande, conviene emplear la matriz de correla-


ciones en lugar de trabajar con la base original. Para poder obtener esta
matriz se deberá utilizar Prelis. Será necesario entonces abrir una base de datos
con extensión .psf, para que de esta forma se activen nuevos iconos y opciones
en la parte superior de la pantalla principal, tal como se muestra enseguida:

Estas nuevas opciones permitirán realizar diferentes tipos de análisis esta-


dísticos, como regresiones múltiples, análisis de factores, análisis multinivel,
imputación de datos, gráficas, calcular variables a partir de otras, realizar trans-
formaciones u obtener correlaciones, entre otras cosas.
Cuando algunas de las variables de un modelo de ecuaciones estructurales
son categóricas no es posible trabajar con correlaciones de Pearson, por lo que se
tiene que calcular la matriz de correlaciones policóricas. Una vez abierta la base de

Sistema de ecuaciones estructurales: una herramienta de investigación 49


la que se leerán los datos (con extensión .psf), seleccione Statistics → Output options.
Automáticamente aparecerá una ventana Output. En la parte superior izquierda
se encuentra el recuadro Moment matrix en el cual se tendrá que elegir la opción
Correlations. En caso de que se desee guardar la matriz en un archivo, se deberá
elegir la opción Save to file y debajo de esta opción escribir el nombre del archivo
que deberá guardarse con extensión .cor. También por medio de esta ventana
se puede calcular la matriz de varianzas-covarianzas asintótica (Asymptotic Cova-
riance Matrix), indispensable si se utiliza el método de estimación de mínimos
cuadrados ponderados (wls) o el de máxima verosimilitud robusto. Al igual que
la matriz de correlaciones, ésta se puede guardar con extensión .acm. Para cerrar
la ventana se elegirá Ok. Cabe mencionar que cuando se calcula la matriz de
correlaciones, Prelis es capaz de determinar si todas las variables son continuas
o solo algunas, por lo que en caso de que todas sean continuas, las correlaciones
que calculará serán de Pearson y en caso contrario la correspondiente (policó-
rica, poliserial o tetracórica), además de que en el archivo de salida especificará
qué tipo de correlación obtuvo.

50 Cuaderno técnico 4
Automáticamente aparecerá un nuevo archivo que contiene la salida comple-
ta: código de instrucciones para obtener la matriz, ubicación de la base de datos
que utilizó Prelis para leer la información, así como estadísticas descriptivas de
las variables (frecuencias en caso de variables no continuas), la matriz de corre-
laciones policóricas, entre otras cosas. Este archivo generalmente es guardado
con el mismo nombre de la base de datos que utilizó pero con extensión .out.
También, por default, Prelis creará un archivo con extensión .dsf que deberá ser
usado cuando se construya el modelo, ya que contiene la información del nombre
de las variables, así como la ubicación de los archivos que contienen a las matrices
que se calcularon. El siguiente cuadro muestra una porción de la salida para el
ejemplo que se estará utilizando a lo largo de la construcción del modelo. La base
que se utilizó (modcua2h2.psf) contiene 24 variables y sólo una de ellas (theta)
es continua. Como no se declara explícitamente cuál variable es categórica y cuál
continua, el programa impone un límite máximo de categorías; si se rebasa el nú-
mero, el paquete declarará a esa variable como continua y desplegará en la salida
un Warning en el que informa que la variable será tratada como continua, tal como
se muestra en el ejemplo. Esta salida despliega, entre otras cosas, el número de
casos faltantes por variable, gráfica de frecuencias y medidas de tendencia central
(en caso de que la variable sea continua), tipo de correlación que se calculó según
el par de variables y, por último, la matriz de correlaciones.

Sistema de ecuaciones estructurales: una herramienta de investigación 51


Figura 7. Correlaciones ►

52 Cuaderno técnico 4
Figura 7.

Sistema de ecuaciones estructurales: una herramienta de investigación 53


Dibujando el diagrama que describe al modelo

A ntes de explicar la forma en la que se debe dibujar el modelo, se dará una


breve explicación sobre el ejemplo que se presentará y analizará.
Las hipótesis que sustenta este modelo son tres: a) la calidad de la escuela y el
capital económico familiar tienen una asociación con el compromiso académico
que adquiere un estudiante; b) la calidad de la escuela y el capital económico
tienen un efecto indirecto, mediado por el compromiso académico, sobre la ha-
bilidad del sustentante evaluada mediante un examen, y c) la calidad de la escuela
y el capital económico están correlacionadas entre sí. De esta forma, el modelo
es de tipo regresión estructural y está conformado por tres variables latentes y
24 variables observadas.

Variables latentes:
η= compromiso académico (comaca)
ξ1 = calidad de la escuela (calesc)
ξ2= capital económico (capiteco)

Variables observadas que miden al compromiso académico:


Y1 = habilidad del sustentante (theta)
Y2 = faltar a la escuela (con_fal)
Y3 = llegar tarde a las clases (con_tar)
Y4 = no entrar a las clases estando en la escuela (con_ent)
Y5 = días a la semana que hacia tareas o estudiaba (dia_est)
Y6 = promedio de horas al día dedicadas a estudiar o hacer tareas fuera del
horario escolar (hor_tar)
Y7 = calidad de las tareas entregadas (cal_tar)

Variables observadas que miden a la calidad de la escuela:


X1 = nivel de exigencia de la escuela secundaria (exi_esc)

54 Cuaderno técnico 4
X 2 = porcentaje de compañeros que logró una excelente preparación en la se-
cundaria (pre_com)
X3 = preparación de los maestros que impartían clases en la secundaria (pre_ma)
X4 = maestros que llegaban tarde a clase en el último año de secundaria (ma_tar)
X5 = faltas frecuentes de maestros en el último año de la secundaria (ma_falt)

Por último, variables que miden al capital económico:


X6 = horno de microondas en casa (ser_mic)
X7 = lavadora en casa (ser_lav)
X8 = suscripción a periódicos o revistas en casa (ser_sus)
X9 = dvd en casa (ser_dvd)
X10 = computadora en casa (ser_pc)
X11 = televisor en casa (ser_tv)
X12 = automóvil en casa (ser_auto)
X13 = reproductor de mp3 para uso personal (ser_mp3)
X14 = teléfono celular para uso personal (ser_tec)
X15 = vacaciones dentro de la República Mexicana en los últimos dos años
(vva_rp)
X16 = vacaciones fuera del país en los últimos dos años (vva_fp)
X17 = número de estados de la República que ha visitado en los últimos dos
años (edo_rep)

De esta forma, X1 a X5 estarán asociadas con la primera variable latente


independiente (ξ1) y X6 a X17 con la segunda latente independiente (ξ2); Y1 a Y7
estarán asociadas con la única variable latente dependiente η. Ambas (calesc
y capitec) están correlacionadas entre sí y tienen asociación con compac. Este
modelo se aplicó individualmente para hombres y mujeres, por lo que las bases
estuvieron conformadas por un tamaño de muestra de 1075 y 1144, respectiva-

Sistema de ecuaciones estructurales: una herramienta de investigación 55


mente. El método de estimación fue mínimos cuadrados ponderados (wls), ya
que todas las variables observadas, con excepción de X1, son categóricas.
Existen varios caminos para especificar y estimar el modelo de ecuaciones
estructurales. El más sencillo es dibujar el modelo y permitir que Lisrel escri-
ba de forma autónoma el código del programa que detalla las asociaciones,
correlaciones y parámetros que conformarán el modelo teórico. Para dibujar
el diagrama es necesario especificar a Lisrel que queremos trabajar con un pro-
yecto Path diagram.
En la ventana principal, abrir File → New → Path diagram. Aparecerá una
ventana que pedirá el nombre con el cual se guardará el diagrama con extensión
.pth (por ejemplo, modelo2hom2.pth).
Al activar la opción de Path diagram o abrir un archivo .pth se muestra la
siguiente pantalla:

56 Cuaderno técnico 4
La parte superior es muy parecida, pero no igual, a la pantalla principal de
Lisrel. La barra de menú contiene las opciones File, Edit, Setup, Draw, View, Ima-
ge, Output, Window y Help.
File cuenta con las mismas características del File de la pantalla principal,
aunque aquí es posible exportar un diagrama a otros tipos de formato como .gif
y .wmf. Edit permite hacer modificaciones al modelo. Setup introduce la infor-
mación con respecto a los datos como ubicación de la base, número de casos,
tipo de matriz con la que se va a trabajar, etc. En Draw se dibujan las variables,
las trayectorias, correlaciones y se pueden escribir notas dentro del diagrama.
View permite modificar el aspecto de la pantalla cuadriculada (área en donde
se dibujará el modelo) y los iconos que aparecen en la parte superior, elegir qué
resultados se mostrarán en el diagrama (parámetros estimados, solución estan-
darizada, valores t, entre otros) y especificar (opcional) el tipo de modelo que
se va a dibujar. Image ayuda a cambiar el aspecto del diagrama. Con Output es
posible escoger el tipo de método de estimación, el contenido de la corrida y las
matrices que se quieran guardar en un archivo independiente. Para comenzar a
construir el modelo, utilizaremos principalmente Setup, Draw y Output.

Al elegir Setup → Title and Comments aparece la siguiente ventana:

Sistema de ecuaciones estructurales: una herramienta de investigación 57


En ella se escriben el título y los comentarios del modelo; aunque es opcio-
nal, es recomendable hacerlo para que en el caso de correr varias versiones del
mismo modelo sea más fácil identificar con cuál se está trabajando. El botón
Next es de mucha utilidad, ya que permite acceder a las otras ventanas que se
activan dentro de la misma opción (este botón también tiene la misma utilidad
en Output), pero sin tener que estar eligiendo una por una. Como en nuestro
ejemplo hay tres variables latentes o factores, se especificará el título según lo
muestra la ventana anterior.
Group names es una ventana opcional. Se utiliza cuando hay varias submues-
tras para las cuales se quiere correr el mismo modelo.

58 Cuaderno técnico 4
La tercera ventana, Labels, sirve para especificar cuáles serán las variables
observadas y latentes que describirán al modelo.

Para incluir las variables observadas se elige la opción Add/read variables del
cuadro izquierdo (Observed variables) y las latentes por medio del cuadro derecho
(Latent variables). Sin embargo, la diferencia entre estos dos radica en que por
medio del primero se deberán leer las variables observadas de una base en par-
ticular, mientras que en el otro únicamente se puede escribir el nombre con el
cual se identificará una variable latente.
Al elegir la opción izquierda aparece una nueva ventana Add/read variables.
Con el botón Browse se busca el archivo que contiene la información de las
variables que intervendrán en el modelo. Se puede elegir un archivo creado en
Prelis o en Lisrel. En general, el más usado es el del segundo. Este archivo tiene
extensión .dsf y, como se mencionó, contiene la información del nombre de las
variables y la ubicación de las matrices que se obtuvieron por medio de Prelis.

Sistema de ecuaciones estructurales: una herramienta de investigación 59


Una vez que aparece en el recuadro en blanco del File name la ubicación y
nombre del archivo del cual se leerán las variables observadas, se sabrá que
efectivamente se leyó la información, pues aparecerán los nombres de las va-
riables de la base solicitada dentro del cuadro derecho en la ventana Labels. El
nombre de las variables latentes se introduce manualmente:

60 Cuaderno técnico 4
En el cuadro de la izquierda se despliegan los nombres de las variables ob-
servadas que conformarán al modelo y en el de la derecha, los nombres de las
latentes: compac, calesc y capiteco (siguiendo ese orden).
Finalmente, si se desea borrar una variable latente se hace clic en el número
del costado izquierdo de la variable seguido de la tecla supr del teclado.
La siguiente ventana es Data. En ella se debe especificar el tamaño de la
muestra (Number of observation) y la matriz que se va a analizar, recordando que
cuando se calcule la matriz policórica o asintótica, la matriz que se va a analizar
será de correlaciones. Esta ventana es la última opción del Setup, por lo que
ahora se deberá oprimir Ok.

Sistema de ecuaciones estructurales: una herramienta de investigación 61


Para verificar que se han incluido, los nombres de las variables se aprecian
en la parte izquierda de la pantalla cuadriculada. Para que una variable aparez-
ca dentro de la cuadrícula en forma de figura, se debe arrastrar con ayuda del
mouse. Cuando el modelo contiene variables observadas X y Y, así como la-
tentes dependientes e independientes, se deberá especificar en dónde aparecen
los nombres de las variables, cuáles de ellas son Y (variables observadas asocia-
das a latentes dependientes) y eta (así se les denomina en Lisrel a las latentes
dependientes). Las que no se especifiquen se tomarán como X (observadas) y
como latentes independientes (no observadas). Para este ejemplo, únicamente
las variables theta y cal_tar son Y´s, y por lo tanto aparece un tache enseguida
de los nombres y compac es la única eta (variable latente dependiente).

62 Cuaderno técnico 4
Por medio de la opción Draw o de la paleta de dibujo (en general se activa
automáticamente), que tienen las mismas seis opciones, se podrán trazar las
trayectorias (flechas unidireccionales →) y correlaciones (flechas bidireccionales
←→) entre variables, además de escribir texto y fijar parámetros.

Select (primer icono en la paleta) permite seleccionar uno o más objetos del
diagrama para moverlos, alinearlos, cambiarles el color, el tipo de fuente, etcétera.
One-way path (segundo icono) sirve para dibujar la trayectoria (asociaciones)
entre las variables. Para dibujar una trayectoria, se debe seleccionar esta opción
y colocar el mouse en la variable de la cual saldrá la flecha, arrastrarlo con el bo-
tón izquierdo apretado hasta llegar a la variable que recibirá la trayectoria. Esto
se hace para cada una de las trayectorias del modelo. Si se quiere desactivar ese
icono, se deberá seleccionar Select y dar clic con el botón izquierdo del mouse
dentro de la cuadrícula. Esto aplica para cualquier opción de la paleta.

Sistema de ecuaciones estructurales: una herramienta de investigación 63


Figura 8. One way path

Multi-segment path (tercer icono) tiene la misma finalidad del segundo icono,
pero permite dibujar la flecha en segmentos.

Figura 9. Multi-segment path

Error covariance or factor correlation (cuarto icono) sirve para dibujar las correlacio-
nes entre variables o errores. Para ello se procede igual que con las trayectorias.
Plain text (quinto icono) sirve para insertar texto al diagrama. Una vez activa-
do este icono se deberá dibujar un rectángulo arrastrando el botón izquierdo del
mouse y escribiendo el texto dentro de la figura trazada. Para cambiar la fuente
o el color del texto se utiliza el botón derecho del mouse y se selecciona Options.

64 Cuaderno técnico 4
Por último, Zoom (sexto icono) permite reducir o incrementar el tamaño del
diagrama.
Cuando el modelo incluye variables latentes, es necesario fijar la escala de
cada una de ellas (para que el modelo no tenga problemas de identificabilidad).
Esto se logra fijando en un valor específico (Lisrel los fija en 1) a alguna de
las trayectorias que van de la variable latente a una de las observadas. Así, por
ejemplo, si el modelo contiene tres variables latentes se deberán fijar tres trayec-
torias, una por cada una de ellas. Para realizar esto, se selecciona con el botón
izquierdo del mouse la trayectoria deseada y se utiliza el botón derecho para se-
leccionar la opción Fix. Deberá cambiar de color la flecha dentro del diagrama,
lo que permite verificar que efectivamente se fijó ese parámetro.
En el ejemplo se decidió fijar en uno las trayectorias que van de compac a
con_ent, de calesc a pre_com y de capiteco a ser_lav. En los dos primeros casos
fue arbitraria la decisión, en la tercera trayectoria se fijó debido a que contar con
lavadora presentó la menor variabilidad en la respuesta.

Sistema de ecuaciones estructurales: una herramienta de investigación 65


Una vez dibujado el modelo se debe especificar el método de estimación y
lo que queremos que despliegue el archivo de salida. Para ello se elige Output →
Lisrel Outputs. Esta selección despliega tres opciones Estimations, Selections y Save.

Al elegir Estimations aparece la siguiente ventana:

66 Cuaderno técnico 4
La ventana despliega todos los métodos disponibles para estimar los pa-
rámetros, así como otras opciones relacionadas con el número de iteraciones
permitidas para llegar a la solución final, etcétera. En general estas opciones no
se modifican a menos que exista un problema de convergencia, por lo que no es
necesario hacer cambios en esta sección. La siguiente ventana, Selections, muestra
las opciones que queremos que despliegue en el archivo de salida. Se pueden
elegir algunas o todas por medio de Print all. La parte inferior de esta ventana
permite invocar al modelo, si así se desea.

Sistema de ecuaciones estructurales: una herramienta de investigación 67


La tercera ventana, Save, permite salvar en archivos separados matrices, índi-
ces de bondad de ajuste, valores t, entre otras cosas.

Cuando se termina de dibujar el modelo y de especificar el método de esti-


mación y opciones de salida, se debe pedir que se muestre la sintaxis que subyace
al modelo. Esto se hace por medio de Setup en la barra de menú, seleccionando
Build Lisrel Syntax o Build simplis Syntax. La diferencia entre estas dos opciones
radica en la forma en la que despliega la sintaxis. La primera opción es un poco
más complicada, ya que no muestra directamente las ecuaciones que subyacen
al modelo sino únicamente los parámetros que se van a estimar; esto se hace en
forma matricial, por lo que si no se está familiarizado con el lenguaje de Lisrel
resultará más difícil de leer. Simplis, por el contrario, sí despliega las ecuaciones
por medio de los nombres de las variables. A continuación se muestra el modelo
que se va a estimar y la sintaxis subyacente utilizando ambas notaciones.

68 Cuaderno técnico 4
La siguiente secuencia de instrucciones se obtiene con Simplis. Como
muestra el código, los dos primeros renglones hacen referencia al título y a
los comentarios. La tercera línea indica la ubicación del archivo modcua2h2.
dsf que contiene la información de la ubicación de las matrices policórica y
asintótica. La cuarta línea indica el tamaño de muestra. La quinta corresponde
al nombre de las variables latentes. A partir de la séptima línea y hasta la déci-
mo segunda se indican las trayectorias que van de las latentes a las observadas.
Véase que no aparece la trayectoria que va de compac a con_ent, de calesc a
pre_com y de capitec a ser_lav, ya que se fijaron los parámetros, lo que se puede
corroborar en el diagrama (las trayectorias aparecen de color gris claro y no en
azul como las otras). La línea 29 indica que se está pidiendo que, una vez esti-

Sistema de ecuaciones estructurales: una herramienta de investigación 69


mado el modelo, se despliegue nuevamente el diagrama. Las últimas dos líneas
indican el método de estimación, los resultados que deseamos imprimir, como
residuos, índices modificados y efectos directos, indirectos y totales. También
se puede pedir que despliegue todo por medio de All.

70 Cuaderno técnico 4
Con la sintaxis de Lisrel se obtiene la siguiente secuencia de instrucciones. Al
igual que en Simplis, la primera línea hace referencia al título. La segunda contie-
ne la especificación con respecto al número de variables observadas, tamaño de
muestra, número de grupos (poblaciones a las que se aplicará el mismo modelo)
y el tipo de matriz que se usará (MA = matriz y KM = correlación). La tercera
línea es similar a la segunda de Simplis. La cuarta la ubicación de la matriz de
varianzas-covarianzas asintótica (en este caso la matriz se guardó en el archivo
asin2h2.acm). A partir de la siguiente línea y hasta la 15, se especifica la forma
de las matrices que contienen los parámetros libres, parámetros fijos y nombre
de las variables. En particular, a partir de la 12 se indica cuáles son las trayecto-
rias que se van a estimar. Para poder especificar que son parámetros libres, la
línea debe comenzar con la instrucción FR (free) seguido de la lista de paráme-
tros. Como ya se mencionó, en este ejemplo se tienen 24 variables observadas.
Las siete primeras se asociaron con la única variable latente dependiente (com-
pac) y las restantes 17 con alguna de las dos latentes independientes (calesc y
capitec); en particular, las cinco primeras se asociarán con calesc y las siguientes
12 con capitec, Véase que en el código se hace referencia a LY, LX y ga. LY se
refiere a la matriz que contiene las asociaciones entre variables latentes depen-
dientes y sus correspondientes observadas Y. LX es la matriz de coeficientes
entre latentes independientes y observadas X y ga entre latentes independien-
tes y latentes dependientes. En este ejemplo, tenemos una única variable latente
dependiente (compac) asociada a siete variables, por lo que LY(1,1) a LY(7,1)
siempre muestra un uno en la segunda entrada y lo que varía es la primera, que
va de uno a siete. Por otro lado, como las X´s están asociadas con latentes in-
dependientes, la numeración tiene que volver a comenzar desde uno. De esta
forma LX(1,1) a LX(5,1) son las trayectorias que van de calesc a X1 y hasta X5
y LX(6,2) a LX(17,2) las que van de capitec (segunda latente independiente) a
X6 y hasta X17. La instrucción va indica qué parámetros se fijaron. En este caso,
LY(4,1), LX(2,1) y LX(7,2) tomarán el valor de uno, y se puede corroborar en

Sistema de ecuaciones estructurales: una herramienta de investigación 71


el diagrama, ya que las flechas aparecen en gris y no en azul. Las últimas dos
líneas solicitan el diagrama asociado (PD=Path Diagram) y en la salida referida
como ou (output) que se muestren los residuos (RS), los efectos indirectos
y totales (EF), la solución estandarizada (SS) y los índices modificados (MI),
además de indicar el tipo de método de estimación (ME) que en este caso fue
el de mínimos cuadrados ponderados (WLS). Aunque parece complicada la
notación, dibujar correctamente el modelo evita estar revisando cada una de las
líneas que se despliegan.

Una vez que se verificó la sintaxis, se elige el botón Run Lisrel ubicado en la
parte superior de la pantalla. Automáticamente se despliega el modelo estimado
y por medio de la opción Window (de la barra de menú) nos podemos mover
al archivo de sintaxis y al de salida. El diagrama que Lisrel o Simplis despliegan
después de estimar el modelo muestra por default los valores de las estimacio-

72 Cuaderno técnico 4
nes de los parámetros; sin embargo, también es posible desplegar otros valores
como la solución estandarizada, los valores t, etcétera. Para hacer este cambio
se debe utilizar la opción de Estimates que se encuentra arriba de la cuadrícula,
tal como se muestra a continuación:

Como el documento que contiene la salida con los resultados es extenso, se


irán explicando los fragmentos más importantes y la forma más adecuada de
interpretarlos.
Las siguientes líneas permiten verificar que se han leído correctamente el
número de variables X, Y, η, ξ y el número de observaciones. Como se había
comentado, el modelo consta de 24 variables observadas, de las cuales siete son
Y, 17 son X, una es latente dependiente (eta) y dos son latentes independien-
tes (ksi). El número que finalmente conformó la muestra fue de 908 hombres
que tenían información en las 24 variables observadas (y no de 1075 como se
declaró originalmente).

Sistema de ecuaciones estructurales: una herramienta de investigación 73


Number of Input Variables 24
Number of Y - Variables 7
Number of X - Variables 17
Number of ETA - Variables 1
Number of KSI - Variables 2
Number of Observations 908

La especificación de los parámetros (parameter specifications) permite revisar


que los parámetros que queremos estimar son los correctos. Siempre que apa-
rezca un número diferente de cero, indicará que es libre. En el ejemplo, se esti-
maron 51 parámetros. El parámetro 25 indica que se debe estimar la correlación
entre calesc y capitec contenido en la matriz phi.

Figura 10. Correlación entre calesc y capitec ►

74 Cuaderno técnico 4
Figura 10.

La salida también especifica cuántas iteraciones se realizaron para llegar a


la solución final (para este ejemplo fueron 24). Por otro lado, despliega los pa-
rámetros estimados. Por ejemplo, la primera entrada de lambda-Y indica en
primer lugar el valor del coeficiente de asociación entre compac y theta (0.70),
debajo de este valor aparece entre paréntesis el error estándar (0.04) y debajo de
éste el valor t (16.16). Los 51 parámetros resultaron estadísticamente significati-
vos (el valor t se ubica por fuera del intervalo (-2, 2)), por lo que se pueden consi-
derar parámetros diferentes de cero. Como se fijaron los parámetros que van de
compac a con_ent, de calesc a pre_com y de capiteco a ser_lav, éstos aparecen
con un uno y consecuentemente no hay error estándar ni valor t. Por otro lado,
el signo que presenta el coeficiente depende en gran medida de la forma en la
que se codificaron las categorías de la variable. Por ejemplo, véase que cal_tar
presenta un coeficiente positivo. Esta variable está categorizada de la siguiente

Sistema de ecuaciones estructurales: una herramienta de investigación 75


forma: 1, deficiente; 2, regular; 3, buena, y 4, excelente. En este caso es coheren-
te que a mayor calidad de la tarea entregada (mayor valor en la categoría) mayor
sea su compromiso académico. Otro ejemplo es el coeficiente asociado a ma_
tar, el cual es negativo. Esta variable está categorizada así: 1, ninguno; 2, menos
de la mitad; 3, la mitad; 4, más de la mitad, y 5, todos. Como esta variable hace
referencia a la cantidad de maestros que llegaban tarde a clase en el último año
de secundaria, es perfectamente justificado que a mayor cantidad de maestros
faltistas (mayor valor de la categoría) menor sea la calidad de la escuela. Estos
dos ejemplos muestran cómo la forma de codificar puede repercutir en el signo
del coeficiente, por lo que se deberá poner especial atención en ello. Se reitera
que una de las asociaciones más importantes de este modelo es la habilidad del
sustentante (theta), por lo que se hará énfasis en algunos de sus resultados.

Figura 11. Habilidad del sustentante ►

76 Cuaderno técnico 4
Figura 11. ► Figura 11. ►

Sistema de ecuaciones estructurales: una herramienta de investigación 77


Figura 11.

78 Cuaderno técnico 4
Posteriormente, se despliegan los índices que permitirán evaluar la bondad
de ajuste del modelo. El valor p asociado a la ji-cuadrada (1374.97, p = 0.0)
aporta evidencia para decir que el modelo propuesto no está ajustando ade-
cuadamente a los datos. Los índices de ajuste GFI y AGFI obtuvieron valores
superiores al 0.90, mientras que el RMSEA y el RMR fueron superiores al 0.05
(lo que no es deseable). En relación con los índices de ajuste de incremento, el
NFI, NNFI, CFI, IFI y RFI mostraron valores por debajo del 0.85. El ECVI
y el AIC indican que el modelo saturado es mejor en ajuste que el modelo que
se propuso, aunque el propuesto es mejor que el de independencia. Finalmente,
el CAIC, indica que el modelo propuesto es mejor en ajuste que el saturado y el
de independencia. Estos resultados, permiten concluir que el modelo propuesto
para la población masculina no está ajustando adecuadamente a los datos, ya
que la mayoría de los índices mostraron valores inferiores al punto de corte
deseado. Cabe mencionar, que un modelo puede presentar parámetros muy
significativos y un ajuste muy pobre, parámetros no significativos y buen ajuste,
parámetros no significativos y ajuste pobre o parámetros muy significativos y
buen ajuste. En este caso, estamos ante el primer escenario.

Sistema de ecuaciones estructurales: una herramienta de investigación 79


Figura 12. Ajuste del modelo

Goodness of Fit Statistics

Degrees of Freedom = 249


Minimum Fit Function Chi-Square = 1374.97 (P = 0.0)
Estimated Non-centrality Parameter (NCP) = 1125.97
90 Percent Confidence Interval for NCP = (1013.34 ; 1246.08)

Minimum Fit Function Value = 1.52


Population Discrepancy Function Value (F0) = 1.24
90 Percent Confidence Interval for F0 = (1.12 ; 1.37)
Root Mean Square Error of Approximation (RMSEA) = 0.071
90 Percent Confidence Interval for RMSEA = (0.067 ; 0.074)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.00

Expected Cross-Validation Index (ECVI) = 1.63


90 Percent Confidence Interval for ECVI = (1.50 ; 1.76)
ECVI for Saturated Model = 0.66
ECVI for Independence Model = 7.17

Chi-Square for Independence Model with 276 Degrees of Freedom = 6452.46


Independence AIC = 6500.46
Model AIC = 1476.97
Saturated AIC = 600.00
Independence CAIC = 6639.93
Model CAIC = 1773.34
Saturated CAIC = 2343.37

Normed Fit Index (NFI) = 0.79


Non-Normed Fit Index (NNFI) = 0.80
Parsimony Normed Fit Index (PNFI) = 0.71
Comparative Fit Index (CFI) = 0.82
Incremental Fit Index (IFI) = 0.82
Relative Fit Index (RFI) = 0.76

Critical N (CN) = 201.43

Root Mean Square Residual (RMR) = 0.11


Standardized RMR = 0.11
Goodness of Fit Index (GFI) = 0.95
Adjusted Goodness of Fit Index (AGFI) = 0.94
Parsimony Goodness of Fit Index (PGFI) = 0.79

80 Cuaderno técnico 4
Los residuos estandarizados son otra forma de evaluar el ajuste del modelo.
Lisrel despliega la matriz de residuos estandarizados como se muestra a conti-
nuación. Los residuos no aportan mucha información si los errores no siguen
una distribución normal. A pesar de que en este caso aproximadamente 24% de
ellos se ubicaron por fuera del intervalo deseado (-2,2), no los utilizaremos para
la evaluación del modelo debido a que no se cumple el supuesto de normalidad.

Figura 13. Residuos estandarizados ►

Sistema de ecuaciones estructurales: una herramienta de investigación 81


Figura 13. ►

82 Cuaderno técnico 4
Figura 13.

Sistema de ecuaciones estructurales: una herramienta de investigación 83


Posteriormente, se despliegan en forma matricial los índices modificados.
Con respecto a las trayectorias entre factores independientes y variables obser-
vadas, se puede observar que el mayor decremento esperado en la ji-cuadrada se
podría dar si se considerara la trayectoria de capitec a ma_tar (una disminución
de 91.28) y la de capitec a exi_esc (una disminución de 51.27). Sin embargo, a
pesar de que Lisrel sugiere estos cambios, es el criterio del investigador el que
juega un papel importante para determinar si estas modificaciones pueden sus-
tentarse teóricamente.

Figura 14. Índices modificados ► Figura 14.

84 Cuaderno técnico 4
Otra forma de reportar los coeficientes asociados a las trayectorias del mo-
delo es por medio de valores estandarizados. Esto es deseable cuando se quiere
comparar la magnitud de los coeficientes. Cabe mencionar que las trayectorias
fijadas en uno cambian debido a esta estandarización; sin embargo, es recomen-
dable reportar el valor fijado (en este caso es de uno) para ser consistentes con
las especificaciones iniciales.

Figura 15. Valores estandarizados ► Figura 15.

Sistema de ecuaciones estructurales: una herramienta de investigación 85


Otra opción que se despliega son los efectos indirectos y totales. En este
caso, únicamente tenemos efectos indirectos de los factores independientes ca-
lesc y capitec a las variables observadas asociadas al factor dependiente compac.
Estos se muestran matricialmente y, de igual forma que con los coeficientes, se
despliega el coeficiente, el error estándar y el valor t. En este ejemplo, todos los
efectos indirectos resultaron estadísticamente significativos (diferentes de cero).
En particular, los efectos indirectos de calidad de la escuela (calesc) y capital
económico (capitec) a la habilidad del sustentante (theta) fueron estadísticamen-
te significativos e indican que a mayor calidad de la escuela y a mayor capital
económico, mayor es la habilidad del sustentante.

Figura 16. Efectos indirectos y totales

86 Cuaderno técnico 4
A manera de conclusión, podemos mencionar que el ajuste de este modelo
fue muy pobre considerando la magnitud de los índices, a pesar de que las va-
riables asociadas a cada uno de los factores presentaron fuertes asociaciones, en
particular para la variable de interés habilidad del sustentante (theta).
Presentado en una población masculina, este modelo se estimó para una po-
blación femenina. Se presenta la salida del modelo y algunos comentarios. Para
este ejemplo, la muestra final se constituyó por 971 mujeres, aunque la base era
originalmente de 1144. El programa requirió de 38 iteraciones para llegar a la
solución final y, al igual que en el primer modelo, los 51 parámetros resultaron
estadísticamente significativos (diferentes de cero).
Los índices de bondad de ajuste mostraron los siguientes resultados. El valor
p asociado a la ji-cuadrada (2005.20, p = 0.0) aportó evidencia en contra del
modelo propuesto, lo que indicaría que el modelo no está ajustando adecuada-
mente a los datos. Sin embargo, los índices GFI, AGFI, NFI, NNFI, CFI, IFI y
RFI presentaron valores superiores al 0.90. ECVI, AIC y CAIC indicaron que
el modelo propuesto es mejor que el de independencia pero no que el saturado.
Estos valores en conjunto aportan evidencia para concluir que el modelo ajusta
relativamente bien a los datos.
Aproximadamente, 30% de los residuos estandarizados estaban fuera del
intervalo (-2, 2); sin embargo, este resultado no se utilizará para evaluar el ajuste
del modelo debido a que no se cumple el supuesto de normalidad de los errores
como en el caso del modelo para población masculina.
Los índices modificados mostraron que el mayor decremento en la ji-cua-
drada se daría si se considerara la trayectoria entre capitec y exi_esc, ya que se
registraría una disminución de aproximadamente 74.56 en la ji-cuadrada.
Todos los efectos indirectos de calesc y capitec a las variables Y resultaron
estadísticamente significativos (diferentes de cero); específicamente, los que
desembocan a la habilidad del sustentante (theta) indican que a mayor calidad
de la escuela y a mayor capital económico mayor es la habilidad del sustentante.

Sistema de ecuaciones estructurales: una herramienta de investigación 87


Se puede concluir, con respecto a este modelo para población femenina, que
el ajuste fue bueno, además de obtener parámetros estadísticamente significati-
vos. Esto sugiere, además, que el modelo propuesto tiene mejores resultados en
población femenina que en masculina.

Figura 17. Modelo con tres factores en población femenina ►

88 Cuaderno técnico 4
Figura 17. ► Figura 17. ►

Sistema de ecuaciones estructurales: una herramienta de investigación 89


Figura 17. ►

90 Cuaderno técnico 4
Figura 17. ►

Sistema de ecuaciones estructurales: una herramienta de investigación 91


Figura 17. ►

92 Cuaderno técnico 4
Figura 17. ►

Sistema de ecuaciones estructurales: una herramienta de investigación 93


Figura 17. ►

94 Cuaderno técnico 4
Figura 17. ► Figura 17. ►

Sistema de ecuaciones estructurales: una herramienta de investigación 95


Algunas recomendaciones finales

1. Procúrese guardar los archivos en carpetas que no tengan nombres muy


largos. En caso de no poder evitarlo, siempre se debe verificar en el código
del programa (sintaxis) que la dirección no aparezca incompleta y, en su
caso, se deberá completar la secuencia.
2. Téngase presente que cuando se utilice el método de estimación de míni-
mos cuadrados ponderados (wls) y el de máxima verosimilitud robusto, se
deberá calcular previamente la matriz de varianzas-covarianzas asintótica.
3. Siempre que el modelo contenga variables categóricas, se tiene que calcular
la matriz de correlaciones policóricas.
4. Al momento de plantear un modelo, téngase presente cuáles son paráme-
tros estimables y cuáles no, para evitar problemas de identificabilidad.
5. Deben generarse bases de datos que contengan únicamente las variables
que se van a utilizar en el análisis. De preferencia se ordenarán las variables
de tal forma que consecutivamente se muestren las que fungirán como X y
luego las Y o viceversa, ya que esto hará más fácil la revisión de la sintaxis.
6. Procúrese hacer uso del comando Help.

96 Cuaderno técnico 4
Bibliografía

Bollen, K. (1989). Structural Equations with Latent Variables, 1a. ed., New York:
John Wiley & Sons.
Boomsma, A. (1985). Nonconvergence, improper solutions and starting values
in Lisrel maximum likelihood estimation, Psychometrika, 50, 229-242.
DuToit, M. & DuToit S. (2001) Interactive Lisrel: User’s Guide, 2a. ed., Lincol-
nwood, IL: Scientific Software International, Inc.
Everitt, B., S. (1984). An introduction to latent variable models, 1a. ed., New York:
Chapman and Hall.
Jöreskog, K. G. (2001). Lisrel 8: User´s Reference Guide, 2a. ed., Lincolnwood, IL:
Scientific Software International, Inc.
Hägglund, G. (1985). Factor analysis by instrumental variable method, Psycho-
metrica, 47, 209-222.
Jöreskog, K. G. (1973). A general method for estimating a linear structural
equation system. En A. S. Goldberger & O. D. Duncan (eds.), Structural
Equations Models in the Social Sciences, pp. 85-112, New York: Academic Press.
Keesling, M. G. (1972). Maximum Likelihood Approaches to Causal Analysis. Ph.D.
dissertation.: University of Chicago: Department of Education.
Loehlin, J. C. (1992). Latent variable models: an introduction to factor, path and structural
analysis, 2a. ed., Mahwah, NJ: Lawrence Erlbaum Associates Publishers.
Muthén, B. (1977). Some results on using summed raw scores and factor scores
from dichotomous item in the estimation of structural equations models.
Unpublished Technical Report, University of Uppsala, Sweden. Recuperado
en enero del 2009, de http://www.gseis.ucla.edu/faculty/muthen/articles/
Muthen_Unpublished_01.pdf
Quiroga, A, .M. (1992). Studies of the Polychoric Correlation and Other Correlation Mea-
sures for Ordinal Variables. PhD Dissertation: Uppsala University: Department
of Statistics.

Sistema de ecuaciones estructurales: una herramienta de investigación 97


Sörbom, D. (1974). A general method for studying differences in factor means
and factor structures between groups. Brithish Journal of Mathematical and Sta-
tistical Psycholog y, 27, 229-239.
Wiley, D. E. (1973). The identification problem for structural equation models
with unmeasured variables. En A. S. Goldberger & O. D. Duncan (eds.), Stru-
crural Equations Models in the Social Sciences, pp. 69-83, New York: Academic Press.
Willet, J., B, & Sayer, A. G. (1994). Using covariance structure analysis to detect
correlates and predictors of individual change over time, Psychological Bulletin,
116: 363-381.
Wright, S. (1934). The method of path coefficients, Annals of Mathematical Sta-
tistics, 5: 161-215.
Yang-Wallentin, F. (1997). Non-linear structural equation models: Simulation
studies of the Kenny-Judd model. Studia Statistica Upsaliensia, 4, Uppsala:
University of Uppsala.

98 Cuaderno técnico 4
El Centro Nacional de Evaluación para la Educación Superior es una asociación civil sin fines
de lucro constituida formalmente el 28 de abril de 1994, como consta en la escritura pública
número 87036 pasada ante la fe del notario 49 del Distrito Federal. Sus órganos de gobierno
son la Asamblea General, el Consejo Directivo y la Dirección General. Su máxima autoridad es
la Asamblea General, cuya integración se presenta a continuación, según el sector al que perte-
necen los asociados, así como los porcentajes que les corresponden en la toma de decisiones:

Asociaciones e instituciones educativas (40%): Asociación Nacional de Universidades e Instituciones


de Educación Superior, A.C. (ANUIES); Federación de Instituciones Mexicanas Particula-
res de Educación Superior, A.C. (FIMPES); Instituto Politécnico Nacional (IPN); Instituto
Tecnológico y de Estudios Superiores de Monterrey (ITESM); Universidad Autónoma del
Estado de México (UAEM); Universidad Autónoma de San Luis Potosí (UASLP); Universi-
dad Autónoma de Yucatán (UADY); Universidad Nacional Autónoma de México (UNAM);
Universidad Popular Autónoma del Estado de Puebla (UPAEP); Universidad Tecnológica de
México (UNITEC).

Asociaciones y colegios de profesionales (20%): Barra Mexicana Colegio de Abogados, A.C.; Colegio
Nacional de Actuarios, A.C.; Colegio Nacional de Psicólogos, A.C.; Federación de Colegios y
Asociaciones de Médicos Veterinarios y Zootecnistas de México, A.C.; Instituto Mexicano de
Contadores Públicos, A.C.

Organizaciones productivas y sociales (20%): Academia de Ingeniería, A.C.; Academia Mexicana de


Ciencias, A.C.; Academia Nacional de Medicina, A.C.; Fundación ICA, A.C.

Autoridades educativas gubernamentales (20%): Secretaría de Educación Pública.

• Ceneval, A.C.®, EXANI-I®, EXANI-II® son marcas registradas ante la Secretaría de Co-
mercio y Fomento Industrial con el número 478968 del 29 de julio de 1994. EGEL®, con
el número 628837 del 1 de julio de 1999, y EXANI-III®, con el número 628839 del 1 de
julio de 1999.
• Inscrito en el Registro Nacional de Instituciones Científicas y Tecnológicas del Consejo
Nacional de Ciencia y Tecnología con el número 506 desde el 10 de marzo de 1995.
• Organismo Certificador acreditado por el Consejo de Normalización y Certificación de
Competencia Laboral (CONOCER) (1998).
• Miembro de la International Association for Educational Assessment.
• Miembro de la European Association of Institutional Research.
• Miembro del Consortium for North American Higher Education Collaboration.
• Miembro del Institutional Management for Higher Education de la OCDE.
La publicación de esta obra la realizó
el Centro Nacional de Evaluación
para la Educación Superior, A.C.
Se terminó de imprimir el 17 de abril de 2009
en los talleres de Winkilis, Bugambilias 131,
Col. El Rosario, México, D.F., C.P. 09930,
con un tiraje de 500 ejemplares

También podría gustarte