Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ECUACIONES ESTRUCTURALES
Y VARIABLES NO OBSERVADAS
Francisco Alvira Martn y Marina Pea Fernndez
Las variables utilizadas en un diseo de investigacin pueden clasificarse en
cuatro grupos (L. Kisch, 1975):
1. Variables explicativas: Aquellas variables cuyas relaciones se quieren
investigar. Abarcan tanto a las variables propiamente explicativas
como a las variables explicadas.
2. Variables controladas: Variables que estn autnticamente controla-
das y variables que no interfieren en las interrelaciones entre las va-
riables explicativas del primer grupo.
3. Variables no controladas con relaciones funcionales con la(s) varia-
ble(s) independiente(s), pero no con la(s) variable(s) dependiente (s).
4. Variables no controladas que guardan relaciones funcionales tanto
con la(s) variable(s) independiente(s) como con la(s) variable(s) de-
pendiente(s) (1).
Uno de los objetivos esenciales de todo diseo de investigacin es lograr
que el grupo 4 sea un conjunto vaco y, en cualquier caso, que sea mximo
1
El trmino "variable" se utiliza como contraposicin a "constante" y no como
contraposicin a "atributo"; por otra parte, lo que se llaman variable(s) indepen-
diente (s) abarca tanto a variables exgenas como a variables predeterminadas.
RS
3/78 pp. 187-208
FRANCISCO ALVIRA MARTIN Y MARINA PENA FERNANDEZ
el nmero de variables del grupo 2. En los diseos experimentales se logra
que desaparezcan las variables del grupo 4, a la vez que las variables del
grupo 3, mediante la aleatorizacin de los sujetos sobre los tratamientos.
En los diseos no experimentales, la aleatorizacin no es posible por defi-
nicin. Es necesario aceptar supuestos simplificadores para rechazar las ex-
plicaciones alternativas. La plausibilidad terico-emprica de estos supuestos
depender de cada diseo en concreto.
Esta visin clsica de la dicotoma experimentacin/no experimentacin
ha sido puesta en entredicho, tanto desde la experimentacin como desde la
no-experimentacin.
Desde la experimentacin, las investigaciones de Orne (1962) y Rosen-
thal (1963) sobre los efectos del experimentador y la reactividad de los
sujetos experimentales ponen en cuestin la no necesidad de supuestos sim-
plificativos en experimentacin.
Desde la no experimentacin, A. D. Miller (1971) ha puesto de relieve
la similitud de la lgica del experimento y de la lgica de los diseos no ex-
perimentales.
El experimento ms simple puede representarse utilizando un esquema de
tres variables en la forma en que se presenta en el grfico 1.
GRFICO 1
Representacin esquemtica de un experimento con una variable
independiente y una dependiente
-> X
Z es el tratamiento manipulado por el experimentador; X es el cons-
tructo terico que se supone causa de Y, e Y, la variable dependiente
2
.
2
Esta es la interpretacin que presenta Miller; sin embargo, parece ms lgico
pensar que "Z" fuera el constructo terico (variable independiente) y "X" el in-
dicador de "Z" (en este caso el tratamiento operativo empleado por el experimen-
tador). En cualquier caso la lgica general y los problemas que se plantean no se
ven alterados por esta diferencia. Seguir, por tanto, la presentacin de Miller.
188
PATH ANLISIS, MODELOS DE ECUACIONES ESTRUCTURALES
Tal y como estn representadas las relaciones en el esquema, se desta-
can muy claramente los dos supuestos bsicos de la lgica experimental:
a) que Z no es causa de Y, sino slo a travs de X (Z no es causa
directa de Y);
b) que Z no guarda relacin alguna con ninguna de las causas no me-
didas de Y que no hagan sentir su efecto sobre sta exclusivamente
a travs de X.
La validez de los dos supuestos es independiente de la existencia o no
de otras variables relacionadas con (causa de) X e Y, siempre que stas
no estn relacionadas con Z.
El supuesto b) tiene su basamento emprico en la asignacin aleatoria de
los sujetos experimentales a los tratamientos. A su vez, esta asignacin
aleatoria es slo posible porque el experimentador manipula los tratamientos;
es decir, controla qu, cundo, cmo, dnde y sobre quin recaern. Cada
sujeto experimental recibe, por tanto, un valor de Z no predeterminado con
anterioridad, dada la aleatorizacin. De aqu se sigue que estos valores de Z
no dependern de otras causas no medidas de Y excepto por azar.
El a), sin embargo, es un supuesto que carece de contrastacin emprica
directa. Se da por supuesto a no ser que haya dos tratamientos, Zi y Z2. Caso
que los haya, es posible intentar refutar que bien Zi, bien Z2, influyen direc-
tamente en Y. (Vase A. D. Miller, 1971, pgs. 280 y sigs.)
3
.
En la investigacin no experimental, la ausencia de aleatorizacin y ma-
nipulacin lleva consigo que:
1. La hiptesis de que X causa Y se debilita, puesto que no hay un or-
den temporal entre las variables.
2. La no relacin entre Z y otras causas no medidas de Y no puede
darse por desecontada sin ms. Deben apuntarse datos que corrobo-
ren la plausibilidad de este supuesto.
Significa esto la imposibilidad de investigar relaciones causales por m-
todos no experimentales? La respuesta, obviamente, es no. Lo que significa
3
Miller sugiere para ello la comprobacin de que estimando la ecuacin
(y bx> = f + gZ, + hZ
2
por el mtodo de mnimos cuadrados, se obtenga g = h = 0. El coeficiente b es el
correspondiente coeficiente de regresin de Y en X pero utilizando no los valores
empricos reales de esta ltima variable, sino los valores predichos partiendo de
Z, y Z
2
, o sea X. Tal como est estimado b, g y h, tienen que ser iguales a 0 si
realmente no hay influencia directa de Z
v
y Z
2
en Y.
189
FRANCISCO ALVIRA MARTIN Y MARINA PEA FERNANDEZ
es que la investigacin no experimental controlar en mucha menor medida
posibles explicaciones alternativas y estar ms dependiente de la teora
sustantiva correspondiente. Pero la plausibilidad de los supuestos simplifica-
tivos es una cuestin de grado y no absoluta.
... Por muy elaborado que sea un diseo, siempre hay que llevar a cabo
ciertos supuestos simplifica ti vos. En especial, y en algn momento, hay
que presuponer que los efectos de las variables no controladas (tipo 4)
son pequeos. La aleatorizacin ayuda a dejar fuera parte de estas
variables, pero la plausibilidad de este tipo especfico de supuesto sim-
plificador es siempre cuestin de grado. Quiero subrayar este hecho
para hacer hincapi en la semejanza subyacente entre la lgica para
realizar inferencias causales desde diseos experimentales y desde dise-
os no experimentales (Blalock, 1964, pg. 26).
PATH ANLISIS Y MODELOS RECURSIVOS
La investigacin no experimental puede aproximarse a la experimental
partiendo de modelos causales en los que se introduzcan las variables nece-
sarias para refutar aquellas relaciones entre variables no derivadas de la
teora. La teora seala tambin el orden temporal de las variables, aunque
en este caso el empleo de diseos longitudinales, as como el empleo de va-
riables desfasadas en el tiempo (lagged), ayuda a controlar alternativas expli-
cativas de tipo temporal.
La publicacin del libro de Blalock Causal Inferences in non-experimental
Research marca un hito en el camino de mejorar la utilizacin de los diseos
no experimentales. Las ideas de Blalock, junto con el artculo de Duncan
en 1964 sobre el path anlisis, replantean el tema de la causalidad con datos
no experimentales en sociologa, retomando la polmica desde la biologa,
la bioestadstica y la econometra.
El modelo recursivo causal incluye todas las posibles relaciones entre
4
Como pone de relieve A. S. Goldberger (1971) en el modelo clsico, un con-
junto de indicadores (Y) estn determinados linealmente por un conjunto de va-
riables no observadas (X) que son los factores comunes y un conjunto de trmi-
nos de error no observables (V). De forma matricial,
y la matriz de varianza/covarianza
2 = E (Y Y') = p 0 p' +
donde E (X X') 0 E (X V) = 0
E <VV) = 6 diagonal.
190
PATH ANLISIS, MODELOS DE ECUACIONES ESTRUCTURALES
las variables del modelo, de forma que la relacin entre cada par de varia-
bles sea unidireccional, es decir, causal.
Si nos centramos en un modelo de cuatro variables, Xi, X2, X
3
y X4, de
las cuales Xi es una variable exgena (no X determinada por el modelo) y
el resto variables endgenas (determinadas por el modelo), el sistema de
relaciones causales existentes entre las variables se expresa grfica y anal-
ticamente.
Grficamente: El sistema de relaciones causales se presenta a travs de
un diagrama en el cual la influencia causal entre las variables intervinientes
en el modelo se expresa mediante flechas unidireccionales. La causalidad no
explicada por el modelo (variable error o residuos) debe tambin estar repre-
sentada por una flecha unidireccional.
Analticamente: El sistema de relaciones causales viene expresado por
un conjunto de ecuaciones estructurales de las cuales se deducen los coefi-
cientes path.
X2 =
X3 = p32X2
X
4
= p43X3
P31X1
p42X2
p4lX|
Los coeficientes path (pj) expresan de forma matemtica la relacin cau-
sal entre las variables integrantes del modelo midiendo el grado de variacin
producida en la variable dependiente por cada una de las variables indepen-
dientes, permaneciendo las otras constantes.
Miden, por tanto, el poder explicativo que tienen las variables indepen-
dientes sobre la variable dependiente y la evaluacin matemtica del grado de
error medir el porcentaje de influencia causal que queda sin explicar por
las variables independientes.
191
FRANCISCO ALVIRA MARTIN Y MARINA PEA FERNANDEZ
Es necesario tambin determinar los residuos (medidas de error implcitos
en las variables endgenas). Este error expresa la variacin total producida
en la variable dependiente, pero no causada por el resto de las variables.
MTODOS DE ESTIMACIN
El mtodo de las variables instrumentales
Este mtodo parte de tres supuestos en el proceso de estimacin:
a) Las variables contenidas en el modelo aparecen en forma estandarizada
E(
Xi
) = 0
i = 1, 2, 3, 4
E(x
2
.\ = 1
b) La variable exgena Xi no est correlacionada con ninguno de los
residuos (son independientes)
E(x,e
2
) = E(xie
3
) = E(x,e
4
) = 0
c) No existe correlacin entre los residuos y las variables endgenas pre-
predeterminados anteriormente en el modelo
E(x
2
e
3
) = E(x
2
e
4
) = E(x
3
e
4
) = 0
En base a estos tres supuestos, el mtodo consiste en multiplicar cada
ecuacin del modelo por diferentes variables del mismo y hallar los valores
esperados de las ecuaciones resultantes y expresar este ltimo resultado en
forma de correlaciones y de coeficientes path.
Si utilizamos las variables X3 como variable instrumental en la ecua-
cin X4, obtenemos
X4X3 = p43X
3
X3 + p42X
2
X3 + p4lXlX3 + 4X3
y hallando la esperanza matemtica tendramos:
E(x
4
x
3
) = p43E(x
3
)
2
+ p42E(x
2
x
3
) + p4iE(xix
3
) + E(e
4
x
3
)
al estar las variables estandarizadas:
E( XXJ) = rij
E(
Xi
)
2
= 1
E(xiej) = O
192
PATH ANLISIS, MODELOS DE ECUACIONES ESTRUCTURALES
Utilizando las diferentes variables del modelo, el sistema de ecuaciones
resultante quedar de la forma siguiente:
ri2 = P12
rn = p3i + p32ri2
r23 = p3iri2 + p32
ri4 = p4i + p42ri2 + p43ri3
r24 = p4iri2 + p42 + p43r23
r34 = p4iri3 + p42r23 + p43
Resolviendo los coeficientes path pij en trminos de coeficientes de corre-
lacin rij, tendremos:
para la primera ecuacin,
p21 = Ti2
para la segunda ecuacin,
(ru ri2r23)
P 3 1 =
(1-r
2
^
v x 1
12
te ruto).,
**' a-4)
para la tercera ecuacin
1 ri
2
ru
siendo P = tn 1 ta
ru r23 1
ri4 r n ri3
r24 1 r23
T34 r23 1
P41 =
p
193
FRANCISCO ALVIRA MARTIN Y MARINA PENA FERNANDEZ
r
2
4
La regla de la multiplicacin de Wrigh seala que la correlacin entre
X y Xj, donde Xj aparece ms tarde que X en el modelo, es igual al pro-
ducto de los coeficientes path directos e indirectos a lo largo del path des-
de Xj para atrs y hacia adelante en un solo paso. El logaritmo que facilita
las ecuaciones que relacionan las correlaciones y los coeficientes path es:
en donde i y j son dos variables del modelo especfico y q implica
a todas las variables de las que salen paths directos hacia X.
El mtodo de los mnimos cuadrados simple (OLS) es lo suficientemente
conocido como para no necesitar una explicacin. Simplemente sealar que
es necesario llevar a cabo tantas regresiones mltiples como ecuaciones haya
en el modelo objeto de investigacin.
MODELOS NO RECURSIVOS
En primer lugar cabe interpretar los modelos no recursivos simplemente
como modelos relacinales que definen distribuciones conjuntas de posibili-
dades de ocurrencia de variables dependientes condicionadas a las variables
predeterminadas. Puede, asimismo, hablarse simplemente de que todas las
variables predeterminadas conjuntamente causan las variaciones de las varia-
bles dependientes del modelo. Este es el sentido que tendra, segn Strotz y
Wold, la idea cotidiana de que las disponibilidades alimenticias determinan
la poblacin de peces existentes. Pero en este tipo de causalidad no sabramos
qu tipos de peces dependen de otros peces, ni las interacciones entre ellos.
194
PATH ANLISIS, MODELOS DE ECUACIONES ESTRUCTURALES
Tambin cabe hablar de dos posibilidades ms, siempre segn los autores
anteriores:
crculos causales o causacin recproca;
bicausalidad.
En el primer caso se trata realmente de variables operando en el tiempo.
Si tenemos el siguiente sistema:
p(t) = ai + biq(t) + cizi(t) + vi(t)
q(t) = a
2
+ b
2
q(t) + C2Z2U) + v
2
(t)
entonces realmente estaremos ante una de estas dos posibilidades, u otras
parecidas
te
t
r
t
con lo cual realmente slo existe causacin recproca porque hemos observa-
do el sistema en condiciones de equilibrio (estudio sectorial y no longitu-
dinal).
En el segundo caso bicausalidad, tal como sealan los autores, tam-
poco se da causacin recproca. Lo que debe deducirse de todo esto es que
la bicausalidad o causacin recproca es ms aparente que real.
La interpretacin causal de un coeficiente en cualquiera de estos
dos modelos en equilibrio debe de buscarse en el modelo dinmico
subyacente, que ser una nocin de causalidad similar a la usada en
el laboratorio (R. H. Strotz y H. O. Wold, 1960: 426).
Problemas de estimacin.En los modelos y sistemas no recursivos se
plantea, de una manera ms tajante que en los recursivos, el problema de la
estimacin. Este problema est condicionado por el de la identificacin del
sistema. Desde el punto de vista de la identificacin slo existen tres po-
sibilidades:
1. El modelo est subidentificado.
2. El modelo, est exactamente identificado.
3. El modelo est sobreidentificado.
195
FRANCISCO ALVIRA MARTIN Y MARINA PENA FERNANDEZ
El primer caso implica que el sistema de ecuaciones que determina el
modelo no ofrece suficiente informacin para ser resuelto y para estimarse
por tanto los diferentes coeficientes. En los otros dos casos se tiene sufi-
ciente informacin para hallar las soluciones de las ecuaciones. La nica
diferencia entre el 2 y el 3 estriba en que en este ltimo caso existe un
supervit de informacin a favor de dicha solucin.
De una manera ms estricta se dice que un sistema de ecuaciones est
identificado si cumple dos condiciones:
La condicin de orden: Si el nmero de variables predeterminadas
excluidas de una ecuacin es igual o mayor al nmero de variables
endgenas en la ecuacin menos uno, decimos que dicha ecuacin
est identificada.
La condicin de rango: Que cada ecuacin del modelo sea distinta de
todas las dems y de las posibles combinaciones lineales de stas.
Slo si se cumplen ambas condiciones para todas las ecuaciones se puede
hablar de identificacin del sistema.
La estimacin de los coeficientes del sistema de ecuaciones slo es
posible cuando el modelo est identificado (exactamente o sobreidentifica-
do). En el caso de subidentificacin no existe suficiente informacin y, por
tanto, o se incorpora nueva informacin al modelo o se imponen nuevas
restricciones, que es exactamente igual.
Los mtodos de estimacin existentes, tal y como son enumerados en la
literatura, son:
1. Mnimos cuadrados indirectos.
2. Variables instrumentales.
3. Mxima verosimilitud informacin limitada.
4. Mxima verosimilitud informacin completa.
5. Mnimos cuadrados bietpicos.
6. Mnimos cuadrados trietpicos.
7. Punto fijo.
(Vanse J. Kmenta, 1971; R. Karns, 1974; C. Dagun y E. M. Bee de
Dagun, 1971, entre otros.)
Los mtodos de mnimos cuadrados indirectos y variables instrumentales
slo pueden ser utilizados cuando el sistema est exactamente identificado,
mientras que los dems mtodos pueden utilizarse tanto en el caso de sobre-
identificacin como de exacta identificacin. Utilizando este criterio (identi-
196
PATH ANLISIS, MODELOS DE ECUACIONES ESTRUCTURALES
ficacin exacta o en exceso) junto con el de si el mtodo de estimacin tiene
en cuenta toda la informacin del sistema o no, se llega al cuadro siguiente:
Exactamente
identificado
Sobreidentificado
Estimacin de
ecuaciones una a una
Variables instrumen-
tales.
Mnimos cuadrados
indirectos.
- Mnimos cuadrados
bietpicos.
Mxima verosimili-
tud con informacin
parcial.
Mnimos cuadrados
trietpicos.
Mxima verosimili-
tud con informacin
completa.
Punto fijo.
Estimacin de
todo el sistema
Claramente, ciertos mtodos de estimacin no son adecuados en determi-
nadas ocasiones (sobreidentificacin); pero de los que s lo son, cmo
elegir el ms adecuado? Karns (1974) y Kmenta (1971) ofrecen razones te-
ricas y empricas al respecto. Ambos sealan que para sistemas sobreidenti-
ficados que no utilizan la informacin de todo el modelo, el mtodo de m-
nimos cuadrados bietpicos parece ligeramente superior al de mxima vero-
similitud.
En todo lo que respecta a los diferentes mtodos de modelos sobreidenti-
ficados e informacin completa, los datos existentes no permiten deducir
nada sobre cada uno de ellos respecto a los dems, pero s como bloque
respecto a los mtodos que no usan toda la informacin. Contrariamente a
lo que cabra pensar resultan ms eficientes los mtodos de informacin
parcial. Esto se debe ante todo a la vulnerabilidad de los otros mtodos
ante errores de especificacin del modelo, algo relativamente frecuente en
ciencias sociales. As, Karns puede concluir diciendo:
Como conclusin, el actual tratamiento de los estimadores de los
sistemas no recursivos y la presentacin de los resultados de la investi-
gacin por el mtodo Montecarlo, sugieren que el mtodo de mnimos
cuadrados bietpicos es el ms til para los cientficos sociales
(R. Karns, 1974: 31).
197
FRANCISCO ALV1RA MARTIN Y MARINA PENA FERNANDEZ
EL MODELO DE KARL JORESKOG
La no recursividad y el empleo de coeficientes estructurales acercan el
anlisis multivariable desarrollado alrededor del path anlisis a las nece-
sidades realmente sentidas por los investigadores al hacer ms realistas los
modelos.
El progresivo afianzamiento del enfoque constructivista en el estudio de
la relacin teora /observaciones, as como la escasa fuerza explicativa de la
mayora de los modelos multivariables desarrollados dentro de las teoras
apuntadas en este artculo, han llevado a un progresivo inters por el pro-
blema del error de medicin, error tanto aleatorio como sistemtico.
En el grfico, Xi, X
2
, Yi e Y
2
son las variables efectivamente observa-
das. Lo que interesa al investigador es, sin embargo, la relacin entre X e Y,
que son constructos tericos no observados directamente (vanse Costner,
1969; N. K. Namboodiri, L. F. Crter y H. M. Blalock, 1975, y A. S. Gold-
berger y O. D. Duncan, 1973). Cada uno de estos constructos tericos se
mide a travs de dos indicadores distintos y el modelo permite error en
la medicin (e), pero este error es un error aleatorio, no sistemtico. Se
asume qu los indicadores son efectos y no causas de los constructos, pues
son las variaciones de estos ltimos lo que origina variaciones en los indi-
cadores, y no al revs.
GRFICO 2
Un modelo de dos indicadores con variables no observadas
198
PATH ANLISIS, MODELOS DE ECUACIONES ESTRUCTURALES
El modelo del grfico 2 es un modelo sobreidentificado, pues hay cinco
coeficiestes que estimar (a, b, c, d, e) y se dispone de seis correlaciones para
su estimacin (cada variable observada con las cuatro restantes). En base a
esta sobre identificacin, Costner establece un criterio de asistencia del
modelo como
7X1Y11X2Y2 = 7X1Y
2 7
X
2
Yi
lo que equivale a
(badMcae) = (bae)(cad)
ba
2
cde = ba
2
cde
* Si el criterio de consistencia es aplicable, entonces los coeficientes sern
estimables unvocamente. Este enfoque de indicadors mltiples ha sido exten-
dido a ms de dos constructos tericos, a ms de dos indicadores y a mo-
delos longitudinales. Asimismo se han estudiado modelos en los que se da
cabida al error sistemtico no aleatorio (vanse C. E. Werts, R. L. Linn y
K. G. Joreskog, 1971; D. R. Heise, 1969; H. M. Blalock, 1971; D. E. Wi-
ley, 1973; Karl G. Joreskog, 1973, y H. L. Costner y R. Schoenberg, 1973).
Si en el modelo del frfico 2 nos olvidamos de la relacin entre X e Y,
es decir, del coeficiente a, para cada constructo terico X e Y la estima-
cin de b, c, d y e se transforma simplemente en un caso especial del modelo
clsico del anlisis factorial
!
.
A diferencia de ste, sin embargo, la especificacin de ciertas relaciones
funcionales entre observables y factores comunes, as como de las interre-
laciones entre los factores, llevan a lo que se denomina anlisis factorial con-
firmatorio. De aqu a la formulacin de un modelo estructural para los
propios factores no hay ms que un paso, y esto es precisamente lo que
lleva a cabo el modelo general y estructcral de covarianza de Joreskog.
Este modelo general se transform posteriormente en el programa LISREL
(Joreskog y Van Thillo, 1972). El mtodo y modelo de LISREL permite el
uso de constructos hipotticos o variables latentes, as como el empleo
de indicadores mltiples observados para cada variable no observada; per-
mite asimismo el manejo tanto de errores en las ecuaciones (residuos...)
como en las variables observadas (medicin u observacin).
Se parte de dos vectores de variables aleatorias rf y
!
, que representan,
respectivamente las variables dependientes e independientes verdaderas, y
del siguiente sistema de relaciones estructurales
199
FRANCISCO ALVIRA MARTIN Y MARINA PEA FERNANDEZ
donde p y F son matrices de coeficientes y es un vector de trminos de
error. Se asume que tanto n como y estn estandarizadas y asimismo
que y S; son ortogonales, siendo p una matriz no singular.
Los vectores observados sern Y' y X* y no "n e , de modo que Y y X
son las variables observadas, y "n y , las verdaderas variables o constructos
tericos. Sean 0 y <[ > las matrices de varianzas/covarianzas de y , res-
pactivamente, y 9 y 08 las matrices diagonales de errores de Y y X,
respectivamente; entonces, dado que
Y = f A
y
77 siendo Ji = E(Y)
X = =E( X)
y A y
e
A *> l
as m
atrices de regresin de Y en *1, y X en > la matriz de
varianzas/covarianzas de Z.
Donde Z = (Y',X')' ser:
\
Como se ve, los elementos de S son funcin de las matrices
A
y
, Ax^r, * , * , e
8
y e