Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ecuaciones Estructurales
Ecuaciones Estructurales
239
Metodologa en la investigacin
sobre discapacidad. Introduccin al
uso de las ecuaciones estructurales
VI Simposio Cientfico SAID, 2008
Salamanca 5 y 6 de junio de 2008
Manuela Crespo
Marta Bada
Benito Arias
(Coordinadores)
Depsito Legal:
S. 1.436-2008
ISBN:
978-84-691-5852-4
Metodologa en la investigacin
sobre discapacidad.
estructurales
Metodologa en la investigacin
sobre discapacidad.
Introduccin al uso de las ecuaciones
estructurales
VI Seminario Cientfico
SAID, 2008
ISBN: 978-84-691-5852-4
Depsito Legal: S. 1.436-2008
Imprime KADMOS
Salamanca, 2008
ndice
Presentacin ......................................................................................................
Prlogo ..............................................................................................................
11
1. Introduccin a la metodologa SEM: Concepto y propsitos fundamentales. Begoa orgaz Baz ......................................................................................................
13
29
43
75
121
141
127
177
193
PreSeNtACIN
10
presentaCin
PrLOgO
Con sumo gusto prologo esta obra coordinada por Miguel ngel Verdugo, a quien agradezco enormemente este ofrecimiento, y patrocinada por el INICO de la Universidad de Salamanca. Con su publicacin se pone de manifiesto el inters y empeo del Instituto Universitario de Integracin en la Comunidad por la investigacin en el mbito de la discapacidad
y, como lgica consecuencia, por la formacin metodolgica de los investigadores, pieza
clave para augurar una produccin cientfica de prestigio.
Prueba clara de este inters son los clsicos Seminarios Cientficos de Actualizacin
Metodolgica que el INICO viene organizando bianualmente desde 1998, y que han tratado
monogrficamente temticas sumamente relevantes desde una perspectiva metodolgica. es
una iniciativa magnfica, digna de todo encomio, y nos congratulamos por ella, con la seguridad de que, en un razonable plazo de tiempo, empezar a producir sus frutos.
Buena parte de los contenidos de esta obra corresponden a las contribuciones presentadas al VI Seminario Cientfico: Actualizacin Metodolgica en Investigacin sobre Discapacidad (SAID 2008), que en la actual edicin versa monogrficamente sobre Introduccin a la
metodologa de ecuaciones estructurales en la investigacin sobre discapacidad, dirigido en
esta edicin por mis estimados colegas Marta Bada y Benito Arias.
el inters del tema propuesto para la edicin de 2008 es de elevada relevancia en todos
aquellos estudios en los cuales se dispone de un marco terico consistente y se pretende(n)
contrastar una o varias hiptesis que habitualmente se fundamentarn en relaciones de causalidad. Si de forma ciega el lector tuviese delante de sus ojos el ttulo de este Seminario
Cientfico, seguro que se interesara sobremanera, por lo sugerente de la expresin, e incluso
de desafiante en su sentido ms positivo. Se trata de un feliz enclave estadstico-psicomtrico
que tiene un uso y aplicabilidad crecientes en muchos mbitos de la investigacin, y por supuesto, en concreto, en el de la investigacin sobre discapacidad.
La obra se nutre en buena medida de las conferencias/ponencias del VI Seminario Cientfico antes mencionado, y configuran una masa crtica integrada de elevado nivel metodolgico, de lo cual me congratulo con gran satisfaccin. Por una parte, se presentan los trabajos
Introduccin a la metodologa SEM: Concepto y propsitos fundamentales e Introduccin a
los modelos de ecuaciones estructurales, que introducen al lector sobre las cuestiones esenciales que deben conocerse en el mbito de las ecuaciones estructurales; est tambin el captulo Modelos de medida y anlisis factorial confirmatorio, que pretende poner en contacto
al investigador interesado con los fundamentos tericos de esta tcnica analtica, de forma
que sea capaz de realizar una lectura crtica de trabajos en los cuales se utilice, y adems
aprenda a aplicarla. Y est el trabajo Desarrollo de un ejemplo de anlisis factorial confirmatorio con LISREL, AMOS y SAS, que ofrece un primer desarrollo conceptual, y una exposicin
12
prlogo
14
METODOLOGIA
EXPERIMENTAL
METODOLOGIA
NO EXPERIMENTAL
Relaciones de causalidad
CONTROL
EXPERIMENTAL
MODELOS
CAUSALES
A continuacin abordaremos cmo se hace frente en estos modelos a los tres criterios
citados anteriormente. en cuanto al primero, la asociacin entre las variables, puede ser satisfecho tanto en la Metodologa experimental como en la No experimental. en la Metodologa
15
experimental, se pueden observar los cambios en la variable dependiente, cuando se introducen diferentes niveles de la variable independiente. en la Metodologa No experimental,
las tcnicas estadsticas como la Correlacin y el Anlisis de regresin ponen en evidencia la
existencia o no de asociacin.
en relacin con el segundo criterio, la estrategia experimental es la nica que garantiza
plenamente este requisito de precedencia temporal de la causa al efecto, puesto que introduce variaciones sistemticas en uno o varios aspectos de la causa variable independiente o
factor, y observa posteriormente las variaciones concomitantes en uno o varios aspectos del
efecto variable dependiente. en el contexto no experimental, donde los datos son generalmente recogidos en un nico momento temporal, es difcil establecer el orden temporal
de los eventos sobre la base de la evidencia emprica solamente, se requiere la existencia o
disponibilidad de una perspectiva conceptual o una teora plausible que permita la especificacin de la direccionalidad de las relaciones.
Por ltimo, una de las condiciones ms importantes es el supuesto de no espuriedad,
que establece que, una relacin entre dos variables es no espuria slo si no se da una
tercera variable que sea causa de ambas. La Metodologa experimental, debido a su propia
estructura de control, es la nica que garantiza una relacin causal, ya que elimina la presencia de otras variables concomitantes, que podran constituir posibles causas explicativas.
Los procedimientos de control aseguran que quede eliminada la posibilidad de un factor
causal comn. en resumen, el control asegura la validez interna y sta permite establecer relaciones causales. en la Metodologa No experimental, estas variables pueden ser eliminadas
como posibles causas sobre la base de un modelo terico que establezca que estas variables
son irrelevantes al proceso causal, o bien mediante el control estadstico, si la teora en principio no la descarta.
en conclusin y en relacin con el tema de la causalidad, en la Metodologa No experimental se debe hacer frente fundamentalmente a dos aspectos, la determinacin de la
direccin y la posible existencia de relaciones espurias. Para afrontar estos problemas, en esta
metodologa se realiza una cuidadosa revisin de hiptesis alternativas y el ajuste de modelos con varias ecuaciones, modelos causales, que implican y se basan, de alguna manera, en
la idea de causalidad. La aplicacin de estos modelos, como tcnica para realizar inferencias
causales a partir de simples correlaciones, ha de basarse prioritariamente en la teora. Por
ello, como ya mencionamos, en estos modelos causales, la teora adquiere una especial relevancia. en definitiva, el anlisis causal a partir de datos correlacionales no permite descubrir
causas, sino que se limita a evaluar modelos causales elaborados por el investigador basndose en una teora o modelo terico, y, an cuando se hayan controlado todas las posibles
variables que tericamente podran ser consideradas de confundido, no hay completa seguridad de haber descartado totalmente la espuriedad (Asher, 1983).
DeL MODeLO De regreSIN A LOS MODeLOS De eCUACIONeS eStrUCtUrALeS
Una vez planteado el objetivo de estos modelos desarrollaremos como surgen y evolucionan desde los modelos ms simples, lo que permite una ms fcil y rpida comprensin
de los modelos ms complejos. Partiendo del modelo ms sencillo el Modelo de regresin
Lineal Simple, basado en el Modelo Lineal general, incrementando la complejidad del mismo, e incorporando las aportaciones del Modelo de Medida podemos llegar a los complejos
Modelos de ecuaciones estructurales o de estructuras de Covarianza.
16
ANLISIS REGRESIN
Estadstica
ANLISIS FACTORIAL
Psicometra
MODELO DE
ECUACIONES
SIMULTNEAS
MODELO DE MEDIDA
Relacin causal
Error de medida
Indicadores y Constructos
Econometra
Psicometra
Biometra
ANLISIS DE VAS
(Path Analysis)
ANLISIS FACTORIAL
CONFIRMATORIO
y tcnicas Lineal
de diferentes
campos.
de modelos
Comenzaremos por el Modelo
de Regresin
Simple
en el que se trata de explicar
una variable dependiente o criterio en funcin de una nica variable independiente o predictora, siendo ambas variables susceptibles de observacin, y se asume que son medidas sin
error. en este modelo no podemos hablar de relaciones causa-efecto.
este modelo presenta bastantes limitaciones porque en las investigaciones actuales y, sobre todo en la investigacin aplicada no experimental, raramente se analiza la relacin entre
un nico predictor yVARIABLES
un criterio.EXGENAS
en la mayora de las VARIABLES
ocasiones, ENDGENAS
para explicar una determiOBSERVABLES
OBSERVABLES
nada variable criterio se
utiliza un conjunto de variables predictoras,
todas ellas observables,
como en el caso anterior, siendo necesario el planteamiento de un Modelo de Regresin
Lineal Mltiple.
X2
Y2
1
1
este tipo de explicaciones tan sencillas,
que se pueden obtener
a partir del Modelo de
regresin, Simple o Mltiple, nicamente permiten el conocimiento de una parcela muy re-
17
que tratan de conocer y entender una realidad compleja y multideterminada, y por lo tanto
ANLISIS FACTORIAL
ANLISIS REGRESIN
precisa explicaciones de nivel ms amplio y complejo. en la mayora de las ocasiones, nos
Estadstica
Psicometra
encontramos con conjuntos de variables predictoras y criterios relacionadas entre s.
As por ejemplo, nos encontramos con los denominados efectos mediadores o indirectos
de determinadas variables. Se dice que una variable ejerce un efecto mediador cuando transmite el efecto de una
variable
MODELO
DE independiente sobre la dependiente, es decir, se encuentra
dentro de la secuencia
causal de dos variables. Y MODELO
se denomina
efecto indirecto al que ejerce
ECUACIONES
DE MEDIDA
la variable independiente
sobre la dependiente a travs de la variable mediadora. en los esSIMULTNEAS
tudios en los que se Relacin
analizan
estos efectos, una vez queError
se ha
encontrado relacin entre dos
causal
de medida
y Constructos
variables, se incluye una tercera en el anlisis de la Indicadores
relacin entre
las dos primeras con el fin
de mejorar la comprensin
de la relacin o determinar si dicha relacin es espuria.
Econometra
Psicometra
VARIABLES EXGENAS
OBSERVABLES
VARIABLES ENDGENAS
OBSERVABLES
X1
Y1
X2
Y2
18
dgenas, en tanto que las exgenas no son explicadas por otras variables dentro del modelo,
es decir, sus causas no se representan en el modelo porque se consideran desconocidas, y las
relaciones entre ellas no se analizan. en este modelo tanto las variables exgenas como las
endgenas son variables observables.
Kenny (1979) diferencia entre variables puramente exgenas, cuya variabilidad no es
explicada por el modelo, y variables que s son explicadas en alguna medida por el modelo, a partir de aquella ecuacin en la que figuran como endgenas, pero que en otra u otras
ecuaciones pueden actuar como exgenas; como ya hemos sealado estos modelos admiten
que una misma variable sea a la vez explicativa y explicada en dos ecuaciones distintas. Por
ello, mientras el Anlisis de regresin nicamente permite estudiar efectos directos, es decir,
la conexin entre el determinante y determinado se concibe como nica y sin intermediarios,
estos modelos permiten tambin analizar efectos indirectos de una variable sobre otra a travs de una o ms variables mediadoras, es decir, determinaciones mediadas.
Adems, estos modelos permiten especificar y contrastar modelos causales que reflejan
supuestas o hipotetizadas asociaciones espurias. estas relaciones espurias se representan especificando causas comunes. en el ejemplo, Y1 e Y2 tienen dos causas comunes X1 y X2. el
coeficiente de vas que representa el efecto directo de Y1 sobre Y2 controla las causas comunes. Si el valor de este coeficiente es 0 o prximo a 0, podramos considerar que la relacin
entre Y1 e Y2 es espuria; si por el contrario, este coeficiente es elevado, se puede rechazar la
hiptesis de espuriedad.
en definitiva, el objetivo de este tipo de Modelos Multiecuacionales es comprobar en
qu medida los datos de la muestra apoyan los efectos directos e indirectos entre variables
observadas o indicadores hipotetizados por un modelo terico. Para ello, se analizan simultneamente mltiples relaciones de dependencia a partir de los coeficientes de vas (path
coefficients) entre variables observadas: mltiples variables independientes (variables exgenas) y mltiples variables dependientes (variables endgenas), lo que permite modelizar
relaciones complejas.
No obstante, la mayora de las variables de inters terico y con las que se trabaja en la
mayora de los casos en las Ciencias Comportamentales y Sociales no pueden ser observadas
directamente, son los llamados constructos tericos, factores, variables latentes, etc. que son
inferidas a partir de la medida de unos indicadores. Y es en este punto donde se encuentra
una de las principales limitaciones del Anlisis de Vas, que utiliza una nica medida o indicador por cada constructo que se incluye en el modelo. esto obliga al investigador a optar
entre las diferentes medidas del mismo constructo por una sola para incluirla en el modelo, y
es poco realista esperar que un constructo terico pueda ser medido adecuadamente por un
nico indicador, ste no reflejar las diferentes facetas del constructo, lo cual implicar que
la medida no ser vlida.
Adems, ese indicador del constructo se ver afectado por los errores de medida, lo que
significa que no ser fiable (Asher, 1983). Y, como ya hemos dicho, una de las condiciones de
aplicacin tanto de los Modelos de regresin como de los Modelos de ecuaciones Simultneas o Anlisis de Vas es que las variables, sobre todo las exgenas, estn medidas sin error.
Una posible solucin es utilizar mltiples indicadores para cada constructo. Un conjunto de
medidas ser ms fiable que una nica medida y evaluarn diferentes facetas del constructo
lo que incrementar la validez.
en este punto, se hace necesario plantear un Modelo de Medida (Long, 1983a) en el
que se especifican las relaciones que se hipotetizan entre los constructos tericos que en estos modelos se denominan variables latentes y sus correspondientes indicadores o variables
19
MODELO DE MEDIDA
VARIABLES EXGENAS
VARIABLES ENDGENAS
INDICADORES
OBSERVABLES
VARIABLES LATENTES
INDICADORES
NO OBSERVABLES
OBSERVABLES
X1
X2
[1
K1
X3
X4
X5
X6
[2
K2
20
de ecuaciones Simultneas pero esta tcnica, como ya hemos sealado, no permite incorporar
diferentes indicadores del mismo constructo e incluye nicamente variables observables. Por
ello, se necesita un modelo que combine o integre las caractersticas del Modelo de Medida
y Modelo de ecuaciones Simultneas. este modelo es el Modelo de Ecuaciones Estructurales
o Modelo de Estructuras de Covarianza en el que es posible especificar un modelo hbrido
que incorpora un componente estructural, como un Modelo de ecuaciones Simultneas, que
trata de estudiar o probar hiptesis sobre los efectos directos e indirectos, pero ahora entre las
variables latentes o factores; y un componente de medida, como un Modelo de Medida, que
analiza las relaciones entre las variables observables o indicadores y las latentes o factores.
este modelo hbrido es un Anlisis de Vas con variables latentes que no son medidas
directamente sino inferidas a travs de variables observadas o indicadores, es decir, distingue
entre variables observadas o indicadores y variables latentes o constructos que se presupone
miden los indicadores (Bollen, 1989). en este modelo, se formulan explicaciones causales
sobre las variables latentes a partir de las relaciones observadas entre los indicadores. Y, por
otra parte, tiene en cuenta la fiabilidad de las medidas, ya que incorpora o incluye los errores
de medida en el modelo, lo que permite controlarlos directamente. Lo cual constituye importante ventaja sobre el Modelo de ecuaciones Simultneas que no tiene en cuenta los posibles
errores de medida cuando evalan las relaciones causales entre las variables.
Figura 5. ejemplo de Modelo de ecuaciones estructurales
INDICADORES
VARIABLES LATENTES
INDICADORES
OBSERVABLES
NO OBSERVABLES
OBSERVABLES
X1
X2
Y1
[1
K1
Y2
X3
Y3
X4
Y4
X5
[2
K2
X6
Y5
Y6
VARIABLES EXOGENAS
VARIABLES ENDOGENAS
LATENTES
LATENTES
21
22
Condicin de orden
Condicin de rango
s
q
u
e
d
a
Estimacin de los
parmetros del Modelo
d
e
Comprobacin de supuestos
Eleccin de matriz de entrada
Coeficientes de vas
Cargas factoriales
Coeficientes estructurales
Evaluacin del
Ajuste del Modelo
Buen Ajuste
Validacin
del Modelo
E
s
p
e
c
i
f
i
c
a
c
i
Mal Ajuste
Interpretacin
de los Resultados
La fase de Especificacin del Modelo tiene como objeto plantear un modelo estadstico,
que sirva de puente
entre la teora y los datos. Para ello, a partir de las teoras existentes en
Figura 6. Proceso de Modelado Estadstico en la evaluacin los Modelos Causales.
el campo de estudio y de investigaciones previas, se propone un modelo terico o modelos
alternativos que se van a contrastar, es decir, se determina qu variables se van a incluir en el
modelo, y cmo se relacionan estas variables, es decir, los parmetros de inters. en general,
supone tomar importantes decisiones, acerca de qu variables intervienen en el fenmeno
o aspecto de la realidad que se est estudiando, qu relaciones existen entre estas variables,
y la direccin y magnitud de estas relaciones. Una vez tomadas estas decisiones, se especifican, en el diagrama de secuencias de relaciones de dependencia o diagrama de paso, y
matemticamente mediante las correspondientes ecuaciones, la naturaleza y la forma de las
relaciones entre las variables planteadas por la teora o el modelo terico.
en el Modelo de Ecuaciones Simultneas en el diagrama de paso se especifica qu variables se van a incluir en el modelo y la direccin de los efectos causales entre ellas. en estos
30
23
modelos, se plantean relaciones no causales y relaciones causales que expliquen las covarianzas de las variables exgenas y endgenas.
entre las relaciones no causales, se incluyen relaciones que se estiman pero no se
analizan, como relaciones entre variables exgenas, se asume que estas dos variables covaran pero se desconoce porqu covaran o si tienen causas comunes; y relaciones entre las
perturbaciones, que reflejan el supuesto de que las variables endgenas comparten al menos
una causa comn que se ha omitido en el modelo. Por lo tanto, la ausencia de estas asociaciones en el diagrama de paso refleja el supuesto de independencia de las posibles causas no
incluidas. Llegados a este punto nos podemos preguntar, es posible plantear en el diagrama
de paso la relacin entre una perturbacin y una variable exgena? Desde el punto de vista
terico es posible, y esta relacin implicara la presencia de una variable omitida que causa
tanto la variable exgena como la endgena. en otras palabras, parte de la covarianza de las
variables exgena y endgena es espuria debida a una causa comn. No obstante, normalmente en estos modelos se asume que las variables exgena y las perturbaciones no estn
relacionadas, son independientes. Y las relaciones espurias que se plantean, especificando
causas comunes, representan que al menos parte de la correlacin observada entre las dos
variables endgenas se presupone espuria.
entre las relaciones causales se incluyen los efectos unidireccionales - directos e indirectos-. Para representar estos efectos se especifican en el modelo los coeficientes de vas
(path coefficient). Y, por ltimo, los errores que en este caso se denominan perturbaciones
(disturbances) y representan los efectos combinados de todas las posibles variables exgenas que podran afectar a una variable endgena, pero que han sido omitidas, es decir, que
no han sido medidas e incluidas en el modelo.
en la especificacin del Modelo de Medida hay que tener en cuenta tres aspectos. en
primer lugar, que cada indicador recibe dos influencias, por una parte la del factor o constructo que se supone que mide, y, por otra, del trmino de error de medida. Las relaciones
entre las variables observables o indicadores y las variables latentes se especifican a partir
de unos coeficientes que en este caso se denominan cargas factoriales (factor loading), y
representan, como ya hemos dicho, los efectos de las variables latentes o factores sobre los
indicadores. estos coeficientes se representan en un sistema de ecuaciones que reciben el
nombre de ecuaciones factoriales. en segundo lugar, los trminos de error que se incluyen,
representan los errores aleatorios del tipo estimado por los coeficientes de fiabilidad, es decir,
los errores de medida de las variables observables y todas las fuentes de varianza residual
que no estn explcitamente representadas en el modelo, es decir, otros aspectos que mide el
indicador adems del factor. estos trminos de error de medida se asume que son independientes entre s y de los factores. Y, en tercer lugar, tambin se pueden incluir asociaciones
entre las variables latentes que se estiman pero no se analizan en el modelo.
en el Modelo de Ecuaciones Estructurales hay que tener en cuenta que habr que especificar por una parte el componente de medida y por otra el componente estructural. este modelo est compuesto por tres sistemas de ecuaciones. Primero, dos sistemas de ecuaciones
factoriales en los que se especifican las cargas factoriales correspondientes al componente
de medida de las variables exgenas y endgenas. Y el tercero, un sistema de ecuaciones estructurales en el que se especifican los coeficientes estructurales que se incluyen en el componente estructural donde se plantean los efectos de las variables latentes exgenas sobre las
variables latentes endgenas.
en este caso, se incorporan al modelo las perturbaciones correspondientes a cada una
de las variables endgenas latentes, y los errores de medida correspondientes a todas y cada
una de las variables observables o indicadores. Por lo tanto, y a diferencia del Modelo de
24
ecuaciones Simultneas, las perturbaciones de las variables endgenas representan o incluyen nicamente las posibles fuentes de variacin o causas omitidas de las variables endgenas, y no los errores de medida, que ahora s se representan en el modelo.
Una vez que se ha especificado el modelo, se aborda el problema de la Identificacin
del Modelo que es sin duda uno de los aspectos ms arduos y difciles en este tipo de modelos, pero absolutamente imprescindible para poder llevar a cabo las fases siguientes. De un
modo muy general, la identificacin del modelo se traduce en la exigencia de que el nmero
de parmetros a estimar ha de ser igual o inferior al nmero de unidades de informacin de
que disponemos en la matriz de varianzas-covarianzas obtenida a partir de los datos muestrales, lo que se denomina condicin de orden. este aspecto estara en relacin con la necesidad de plantear modelos parsimoniosos. Adems, en los Modelos con variables latentes
se aade la condicin de que cada factor o variable latente ha de ser medida por tres o ms
indicadores, y como no son medidas directamente se les ha de asignar una escala de medida
o mtrica, lo que se denomina condicin de rango.
Por lo que respecta al Modelo de ecuaciones estructurales, la evaluacin de si el modelo
es identificado y la subsecuente estimacin se ha de realizar separadamente para cada submodelo, siguiendo los pasos que hemos sealado en cada caso, y teniendo en cuenta que se
precisa un Modelo de Medida vlido antes de evaluar el componente estructural. Por ello, se
sigue lo que se denomina modelado en dos pasos. el primer paso consiste en buscar un Modelo de Medida aceptable, y una vez encontrado, el segundo paso es abordar la evaluacin
del Modelo estructural.
en caso de seguir adelante con un modelo no adecuadamente identificado no se podrn
obtener estimaciones nicas de los parmetros a partir de los datos obtenidos en la matriz de
covarianzas muestral, sino que se detendr el proceso de estimacin o se producirn resultados ilgicos.
Una vez que se comprueba que el modelo est identificado, se ha de comprobar si el
modelo es apropiado para los datos particulares a los que se va a aplicar, es decir, es necesario comprobar si los datos cumplen los supuestos y las condiciones de aplicacin del
modelo, lo que se denomina fase de diagnstico (Apodaka y Pez, 1992). en estos Modelos,
los supuestos son bsicamente los mismos que en los Modelos de regresin salvo dos excepciones: la primera se refiere a las perturbaciones o errores, que aunque en ambos casos
generalmente se asume que las variables exgenas son independientes de las perturbaciones,
en estos modelos se pueden plantear correlaciones entre variables exgenas y las perturbaciones de otras variables endgenas a las que afectan las primeras; y la segunda excepcin es
que en estos modelos se asume normalidad multivariada de las variables observadas endgenas y exgenas.
en la siguiente fase, se plantear la Estimacin de los Parmetros del Modelo o coeficientes planteados en los diagramas de paso a partir de los datos obtenidos en las variables
observadas en la muestra del estudio, concretamente a partir o bien de la matriz de varianzas-covarianzas o bien de la matriz de correlaciones. Habr que optar por una matriz u otra
en funcin de si el objetivo prioritario de la investigacin es la contrastacin de un modelo
terico o el anlisis de las relaciones individuales entre las variables.
en estos modelos, los mtodos de estimacin de parmetros ms utilizados son aquellos que asumen la normalidad multivariada. en concreto, el ms utilizado es el de Mxima
Verosimilitud (ML) que realiza una estimacin simultnea de todos los coeficientes de forma
iterativa hasta que las diferencias entre las covarianzas basadas en las estimaciones y las
covarianzas observadas son mnimas. Otros procedimientos de estimacin que tambin se
25
utilizan son los de Mnimos Cuadrados generalizados (gLS) y Mnimos Cuadrados no Ponderados (ULS).
La ltima y definitiva fase del proceso ser la Evaluacin del Ajuste del Modelo. en este
ltimo paso, se trata de comprobar la compatibilidad entre el modelo propuesto y la informacin emprica recogida, es decir, en qu medida el modelo terico propuesto es apoyado por
los datos muestrales obtenidos. Ser el momento de examinar las estimaciones infractoras
(errores estndar elevados, coeficientes estandarizados que sobrepasan la unidad, correlaciones elevadas entre dos estimaciones, etc.). tambin habr que tener en cuenta unas medidas
o ndices de la calidad del ajuste modelo en su conjunto, como son las medidas de ajuste
absoluto o global, las de ajuste incremental y las de parsimonia.
Las medidas de ajuste absoluto evalan el ajuste global del modelo, sin tener en cuenta
el posible sobreajuste. De ellas, quiz el estadstico y la prueba de significacin ms utilizada en estos modelos sea chi-cuadrado. Sin embargo, este estadstico presenta dos problemas,
primero como ndice no tiene un lmite superior, y, por lo tanto, su valor no se puede interpretar de una forma estandarizada; y, segundo, como prueba de significacin es muy sensible
al tamao de la muestra. Por ello, se han propuesto (Jreskog, 1974, 1977; Jreskog&Srbom,
2001) otros ndices de ajuste estandarizados que oscilan entre 0 y 1, y que son menos sensibles al tamao de la muestra como el ndice de Bondad de Ajuste (gFI: goodness of Fit
Index), anlogo en su significado e interpretacin al coeficiente de determinacin del Anlisis de regresin; y otros ndices basados en los residuos como el residuo Cuadrtico Medio
(rMr o rMSr: root Mean Square residual) o error de Aproximacin Cuadrtico Medio
(rMSeA: root Mean Square error of Aproximation).
Por su parte, las Medidas de Ajuste Incremental o Comparativo, como su nombre indica, comparan el modelo propuesto con el modelo de independencia o de ausencia de relacin entre las variables. Se han propuesto adems, del ndice Ajustado de Bondad de ajuste
(AgFI), que es una correccin del ndice gFI, otros ndices (Bentler, 1988, 1995): el ndice
de Ajuste Comparativo (CFI: Comparative Fit Index), el ndice de Ajuste Normalizado (NFI:
Bentler-Bonnet Normed Fit Index ) y el ndice de Ajuste No Normalizado (NNFI: BentlerBonnet Non-Normed Fit Index). todos ellos indican la proporcin de mejora que supone el
ajuste global del modelo propuesto en relacin con el modelo nulo en el que se asume que
las variables observadas no estn relacionadas. Por esta razn, estos ndices se denominan
ndices de incremento del ajuste.
Por ltimo, las Medidas de Ajuste de Parsimonia, que evalan la calidad del ajuste del
modelo en funcin del nmero de coeficientes estimados para conseguir dicho nivel de ajuste
(Akaike, 1987). Cuanto mejor ajuste pueda conseguirse con un menor nmero de coeficientes mayor confianza se puede tener en que los resultados no son producto del sobreajuste de
los datos. en este caso, se compara el modelo propuesto con un modelo sobreidentificado o
saturado, en el que se plantean todas las posibles relaciones entre las variables. este ltimo
tipo de medida se utiliza sobre todo para la comparacin de modelos alternativos. Se considera como mejor ndice de parsimonia el Criterio de Informacin de Akaike (AIC: Akaike
Information Criterion), adems de las modificaciones de los estadsticos e ndices anteriores
como: el ndice basado en la chi-cuadrado normalizada (NC: Normed Chi-Squared), el
ndice de Ajuste Parsimonioso (PFI: Parsimonius Fit Index), basado en el ndie NFI, o el ndice de Calidad de Ajuste de Parsimonia (PgFI: Parsimony goodness of Fit Index), a su vez
basado en el ndice gFI.
Como cada uno de estos ndices refleja un aspecto particular del ajuste del modelo, un
buen valor de un ndice no indica por s solo un buen ajuste. es necesario revisar los resultados de diferentes ndices que aportan informaciones complementarias. en resumen, para
26
poder hablar de un buen ajuste, la prueba de significacin chi-cuadrado sobre el ajuste del
modelo ha de ser no significativa; los ndices de bondad de ajuste que indican la proporcin
absoluta o relativa de covarianza observada explicada (gFI, AgFI, NFI, NNFI, CFI) han de ser
superiores a 0,90; y los ndices basados en las residuos estandarizados (rMr, rMSA) inferiores a 0,10.
No obstante, hay que tener en cuenta tres limitaciones de estos ndices. Primero, sus
valores indican nicamente el ajuste global del modelo. Puede darse el caso de que algunas
partes del modelo se ajusten mal a los datos, incluso aunque el valor del ndice general sea
bueno. Segundo, los ndices de ajuste no indican si los resultados son tericamente significativos. Por ejemplo, los signos de algunos coeficientes pueden ser de signo contrario al esperado, e incluso aunque los valores de ajuste sean buenos, estos resultados anmalos han de
ser explicados. Finalmente, unos buenos ndices de ajuste no indican que el poder predictivo
del modelo sea tambin elevado. Por ejemplo, las perturbaciones de modelos con ndices de
ajuste buenos pueden ser elevadas, lo que significa que el modelo refleja la relativa ausencia
de validez predictiva entre las variables.
Ser el momento de examinar las relaciones individuales planteadas (los coeficientes de
determinacin de cada ecuacin estructural, los coeficientes estructurales estandarizados y la
significacin estadstica de los parmetros estimados), porque aunque las medidas de ajuste
del modelo en su conjunto indiquen que es aceptable, algunas relaciones planteadas pueden
carecer de sentido. Para ello, es necesario revisar las diferentes partes especficas del modelo
a partir de los residuos de las correlaciones, que son las diferencias entre las correlaciones
observadas y las implicadas en el modelo. Una regla que se utiliza en estos modelos es que
valores absolutos de los residuos de las correlaciones superiores a 0,10 sugieren que el modelo no explica bien la correlacin observada asociada.
Si despus de esta fase, el modelo especificado inicialmente es apoyado por los datos
muestrales, procederemos a su Validacin e Interpretacin de acuerdo con las hiptesis propuestas y la teora de partida, y lo utilizaremos para tomar decisiones o realizar previsiones
en la variable (Apodaka y Pez, 1992).
en caso contrario, se reformula el modelo inicial para encontrar un modelo con un
mejor ajuste, pero siempre teniendo en cuenta la teora de la que se parte inicialmente. Se
sigue el procedimiento de Bsqueda de Especificacin con el fin de detectar los errores de
especificacin que hemos cometido. estos errores pueden ir en dos lneas, por una parte, la
inclusin en el modelo de una relacin irrelevante, que puede ser detectada a partir de las
pruebas de significacin de los coeficientes estructurales; y, por otra, la omisin de variables
relevantes, que puede determinarse a partir los residuos estandarizados y de los ndices de
modificacin. No obstante, destacar que adems del criterio estadstico de la significacin,
para la eliminacin o inclusin de las relaciones entre variables se ha de tener en cuenta el
inters terico o sustantivo. As, aunque una relacin no sea significativa estadsticamente
si su inters terico es suficiente debera mantenerse en el modelo; y del mismo modo, este
criterio terico ha de primar para incluir nuevas relaciones, slo se incluirn aquellas que
adems de ser significativas tengan un significado sustantivo y prctico.
en conclusin, y como hemos podido comprobar, la fase de mayor importancia es la de
especificacin del modelo, ya que los modelos lineales son bastante robustos a las violaciones de los supuestos con dos excepciones, el error de especificacin y el de medida. La plausibidad del desarrollo de las fases posteriores depende de una correcta especificacin, aspecto ste que est en manos del investigador, que ha de establecer el diagrama de secuencias de
relaciones de dependencia o diagrama de paso y, posteriormente y en funcin de este diagrama, especificar los parmetros que se han de estimar. La hiptesis del investigador se expresa
27
en la forma de una serie de ecuaciones. estas ecuaciones definen los parmetros del modelo,
que corresponden a las relaciones que se plantean entre las variables y que el programa estadstico (AMOS:Analysis of Moment Structure (Arbukle, 1997), eQS:Structural EQuations
Program (Bentler, 1995) o LISreL:Linear Structural Relationship (Jreskog&Srbom, 2001))
estimar con los datos de la muestra.
en resumen, una caracterstica de este enfoque es que se centra en la teora y su contraste, integrando distintos mtodos multivariantes. el anlisis causal no permite descubrir
causas, ni trata de establecer relaciones de causalidad entre variables, sino que se limita a
evaluar modelos causales elaborados por el investigador basndose en una teora o modelo
terico, y establecer su plausibilidad comparndolos con otros modelos alternativos. Cuando
dos o ms modelos son congruentes con un conjunto de datos, la decisin acerca de cual de
los modelos o patrones es ms plausible se apoya en la teora que est en la base del modelo,
no en los datos. nicamente se puede concluir que un conjunto de relaciones observadas
son consistentes con un determinado modelo causal propuesto, pero no se puede descartar
que exista otro modelo que reproduzca las relaciones observadas.
en definitiva, el requerimiento fundamental se sita a dos niveles: a nivel terico, debe
haber una base suficientemente slida que justifique el paso de relaciones de covarianza a
relaciones causa-efecto; y a nivel metodolgico, el investigador debe ser capaz de especificar matemticamente modelos que representen de forma adecuada los mecanismos tericos
involucrados en los datos, decidiendo qu parmetros se han de fijar a partir de la teora y
cules han de estimarse a partir de los datos.
reFereNCIAS BIBLIOgrFICAS
Akaike, H. (1987). Factor analysis and AIC. Psychometrika, 52, 317-332.
Apodaka, P. y Paez, D. (1992). Los modelos estructurales: posibilidades y limitaciones. en D. Paez, J.
Valencia, J.F. Morales, B. Sarabia y N.Ursua (eds.), Teora y Mtodos en Psicologa Social (pp.
249-287). Barcelona: Anthropos.
Arbuckle, J. (1997). AMOS Users Guide. Version 3.6. Chicago, IL: Smallwaters Corporation.
Asher, H.B. (1983). Causal modeling (2nd. ed.). Sage University Paper Series on Quantitative Applications in the Social Sciences, 07-003. Beverly Hills, CA: Sage.
Bentler, P. M. (1988). Comparative fit indices in structural models. Psychological Bulletin, 107, 238246.
Bentler, P. M. (1995). EQS Structural Equations Program Manual. encino, CA: Multivariate Software.
Blalock, H.M., jr. (ed.) (1985). Causal models in the Social Sciences (2nd. ed.). New York, NY: Aldine
Publishing Company.
Bollen, K.A. (1989). Structural Equations with Latent Variables. New York, NY: John Wiley & Sons.
Cook, t.D. y Campbell, D.t. (1986). the casual assumptions of quasi-experimental practice. Synthese,
68, 141-160.
Dez Medrano, J. (1992). Mtodos de anlisis causal. Cuadernos metodolgicos, n 3. Madrid: Centro
de Investigaciones Sociolgicas.
gmez Benito, J. (1986). Los modelos causales como metodologa de validez de constructo. Barcelona: Alamex.
28
Jreskog, K.g. (1974). Analyzing psychological data by structural analysis of covariance matrices. en
r.C. Atkinson, D.H. Krantz, r.D. Luce y P. Suppes (eds.), Contemporary developments in Mathematical Psychology.Volume II (pp. 1-56). San Francisco: Freeman.
Jreskog, K.g. (1977). Structural equations models in the Social Sciences: Specification, estimation
and testing. en P.r. Krishnaiah (ed.), Applications of Statistics (pp.265-287). Amsterdam: NorthHolland.
Jreskog, K.g.&Srbom (2001). LISREL VIII. Analysis of Linear Structural Relationships by Maximum
Likelihood and Least Squares Methods. Users Guide. Lincolnwood, IL : Scientific Software International.
Kenny, D.A. (1979). Correlation and casuality. New York, NY: John Wiley & Sons.
Kline, r.B. (1998). Principles and Practice of Structural Equation Modeling. New York, NY: guilford
Press.
Long, J.S. (1983a). Confirmatory Factor Analysis. Sage University Paper Series on Quantitative Applications in the Social Sciences, 07-033. Beverly Hills, CA: Sage.
Long, J.S. (1983b). Covariance Structure Models: An Introduction to LISREL. Sage University Paper Series on Quantitative Applications in the Social Sciences, 07-034. Beverly Hills, CA: Sage.
Lpez Feal, r. (1982). Los modelos causales asociados a estructuras de covarianza: Una va para la
unificacin de los dos mtodos de la psicologa cientfica. Anuario de Psicologa, 2, 2-23.
Maruyama, g.M. (1998). Basics of Structural Equation Modeling. London, UK: SAge.
Mueller, r.O. (1997). Structural equation modeling: Back to basics. Structural Equation Modeling, 4,
353-369.
Mulaik, S.A. (1986). toward a synthesis of deterministic and probabilistic formulations of causal relations by functional relation concept. Philosophy of Science, 53, 313-332.
Schumacker, r.e. & Lomax, r.g. (1996). Beginners guide to Structural Equation Modeling. Mahwah,
NJ: Lawrence erlbaum Associates.
Visauta, B. (1986). Tcnicas de Investigacin Social. Modelos Causales. Barcelona: Hispano europea.
CONFIrMAtOrIO
INtrODUCCIN
el Anlisis Factorial se refiere a un grupo de tcnicas de anlisis de datos diseadas para
identificar factores o dimensiones inobservables empricamente y que pueden explicar las
relaciones que existen entre un grupo de variables observadas. Cada uno de esos factores o
dimensiones constituyen un constructo y las variables observadas que estn relacionadas con
l son sus indicadores.
Como planteamiento terico general podramos decir que nos encontramos con un
conjunto de variables manifiestas u observadas empricamente (puntuaciones en tems, tests
o cualquier otro tipo de fuente de variacin) y otro conjunto de variables latentes (inobservables empricamente) que son lo que llamamos factores o constructos. Se supone que esos
constructos son los que determinan o causan el comportamiento de los sujetos en las variables observadas (por eso cuando, en un diagrama, establecemos un posible modelo de
relaciones entre variables manifiestas y latentes, las flechas parten de las latentes y llegan
hasta las manifiestas). Los factores seran en este sentido como las variables independientes
de la regresin mltiple, con la diferencia de que son latentes, por lo que hay que estimar su
nmero y caractersticas; y para hacerlo utilizamos las tcnicas del Anlisis Factorial (Borsboom, Mellenbergh y van Haerden, 2004).
Los orgenes de estas tcnicas, en su formalizacin conceptual, se remontan a principios
del siglo pasado cuando Spearman (1904) los desarrolla para probar su teora del factor general de la inteligencia. Sin embargo, debido a la complejidad de los clculos exigidos por estas
tcnicas, no es hasta bien entrada la segunda mitad del siglo XX cuando su uso se generaliza
continuando su auge en la actualidad gracias, principalmente, al fcil acceso de los investigadores al uso de los ordenadores y al desarrollo de programas informticos asequibles.
Dentro de la investigacin psicolgica podramos clasificar en tres grandes grupos los
tipos de estudios para los que se emplea el Anlisis Factorial (thompson, 2004):
estudios de evidencias acerca de la validez de constructo de los instrumentos de medida.
estudios diseados para el desarrollo de teoras sobre constructos psicolgicos (gran
cantidad de teoras de la inteligencia y de la personalidad se han desarrollado con la
ayuda del Anlisis Factorial).
30
31
F1
F2
Fk
F1
F2
Fk
x1
x2
x3
x4
x5
e1
x1
e2
x2
e3
x3
e4
x4
e5
x5
x6
xp
e6
x6
ep
xp
e1
e2
e3
e4
e5
e6
ep
F1
x1
xe11
F2
F1x2
xe22
F3
x3
x4F2
x5
xe33
xe44
xe55
x6
F3
xe66
xp
xepp
observadas
1 ye2
4 y e56 por otra) las correlaciones
entre
e1
e3 parte,ey4 los errores
e5
ep
2 por una
los trminos de error se pueden contemplar como parte del modelo que se somete a
prueba.
todas estas diferencias
pueden de
resumirse
la clasificacin
que la mayora de los auFigura 2. Ejemplo
Anlisis en
Factorial
Confirmatorio
24
tores establecen de las tcnicas multivariantes (Hair, Anderson, tatham y Black, 1999)
en las
que incluyen tanto al AFe como al AFC:
el AFe se contempla como una tcnica multivariante especialmente indicada para el
estudio de las relaciones de interdependencia (modelo correlacional) entre un conjunto de variables.
24
32
Por el contrario, el AFC se enmarca dentro de los Modelos de Ecuaciones Estructurales (generalmente conocidos por las siglas en ingls, SeM) como una tcnica multivariante diseada para el estudio de las mltiples relaciones de dependencia (modelos
causales) entre diferentes conjuntos de variables dependientes e independientes.
Dentro de estos modelos, tambin conocidos como modelos de estructuras de covarianza, el AFC se refiere especficamente al llamado Modelo de Medida que trata
de explicar de qu manera un conjunto de variables medidas empricamente son un
reflejo de otras variables latentes, es decir, no observables empricamente (Martnez
et al., 2006).
en esta pequea charla introductoria del AFC pretendemos poner al interesado en contacto con los fundamentos tericos de esta tcnica sin entrar en los entresijos ms formales ni
especificaciones tcnicas que exigen un cierto dominio de lgebra de matrices y teoras estadsticas de cierta complejidad. Perseguimos dos grandes objetivos: (a) facilitarles la lectura
crtica y la comprensin de aquellos problemas de investigacin que se recogen en la literatura cientfica y en los que se usa este tipo de tcnicas y (b) ayudarles a empezar a aprender
a aplicarlas. Para una mayor profundidad del tema recomendamos lecturas tales como los
trabajos de Bohrnstedt (1983), Bollen (1989), Long (1983), o Batista y Coenders (2000).
Iniciaremos la especificacin del modelo con una mencin especial a la matriz de varianzas-covarianzas y la eleccin de la matriz de anlisis. en segundo lugar, desarrollaremos
aspectos relacionados con la identificacin del modelo. Posteriormente, pasaremos al punto
central de estimacin de los parmetros del modelo detenindonos especficamente en el
procedimiento de Mxima Verosimilitud por ser el ms utilizado entre los investigadores.
Continuaremos con la evaluacin del ajuste de los modelos para terminar con la reespecificacin de los modelos y la comparacin de modelos anidados.
ANLISIS FACtOrIAL CONFIrMAtOrIO
1.
Como hemos dicho anteriormente, en el AFC tratamos de probar una hiptesis. esta
hiptesis consiste en el planteamiento de un modelo terico que recoja las relaciones especficas que se establecen entre factores comunes (variables latentes), factores nicos (errores)
y medidas empricas (variables empricas medidas u observadas). estas expectativas deben
plasmarse en un modelo que establezca aquellos parmetros que deben ser estimados (de
todos los posibles que se puedan estimar).
A modo de ejemplo, supongamos la figura siguiente:
en este ejemplo disponemos de 8 variables empricas (x1 x8). Suponemos que esas variables pueden explicarse, en parte, a partir de 3 factores latentes (F1 F3) y lo que no explican esos factores constituye lo que se conoce como error (factores nicos o unicidad de cada
variable: e1 e8). en teora, podramos estimar (liberar) un total de 63 parmetros: 24 + 3 +
8 + 28; en este desglose: 24 son las posibles saturaciones de las 8 variables en los 3 Factores
comunes; 3 son las posibles correlaciones entre esos 3 Factores; 8 son los diferentes valores
de las unicidades (e) y 28 las posibles covarianzas entre esos factores nicos o unicidades
(8x7/2). De estos 63 posibles parmetros, en la especificacin del ejemplo, sin embargo, slo
hemos liberado (para que sean estimados) 20 parmetros: 8 + 1 + 8 + 3; es decir, 8 saturaciones de las variables en los 3 factores (2 variables saturan el factor 1, 3 el factor 2 y otras 3 el
factor 3); slo especificamos una relacin significativa entre los factores 2 y 3; contemplamos
33
F1
x1
e1
F2
x2
e2
x3
e3
x4
e4
F3
x5
x6
e5
x7
e6
e7
x8
e8
34
donde x es un vector p.1 de puntuaciones diferenciales (distancia a su respectiva media) en las variables observadas; x (Lambda) es una matriz p.k de saturaciones de las
p variables en los k factores comunes; (Ksi) es un vector k.1 (tambin con puntuaciones diferenciales) de factores comunes y (delta) es un vector p.1 de factores nicos (componentes especficos y del error de cada una de las variables observadas).
Desarrollando esta ecuacin matricial, junto con las matrices de varianzas-covarianzas
de los factores comunes (matriz (Fi) de coeficientes ) y de los factores nicos (matriz
(Zeta) de coeficientes ), aplicndola a nuestro ejemplo, tendramos lo siguiente (ver tabla 1):
tabla 1. Desarrollo de la ecuacin matricial correspondiente al ejemplo planteado
O11 0 0
21 0 0
0 O32 0
0
O 42 0
0
O
52 0
0 0
O63
0 0
O
73
O
83
/
x
x1
x
2
x3
x4
x5
x6
x
7
x8
I11
0
G 1
G
2
G 3
[1
[ G 4
2
G
[ 3
5
G 6
G
7
G 8
[
G
I
33
I 22
I
32
)
T11
T
21 T
22
0
0
0
0
0
0
0
0
0
0
0
0
T
33
0
T 44
T
54 T
55
T
66
T
77
T
86
T
88
1. Desarrollo
de laecuacin,
ecuacin matricial
correspondiente
al ejemplo
Con Tabla
la aplicacin
de esta
junto con
las matrices Fi
y Zeta, planteado
se establece una
matriz terica Sigma () de varianzas-covarianzas deducidas a partir del modelo propuesto.
en la medida en que esta matriz se ajuste a la matriz emprica de varianzas-covarianzas (S) de
las variables observadas podremos afirmar que el modelo factorial propuesto es bueno.
A la hora de elegir la matriz para el anlisis de los datos podemos optar entre la matriz
de varianzas-covarianzas o la matriz de correlaciones. Aunque en el fondo son lo mismo (no
35
olvidemos que una matriz de correlaciones no es ms que una matriz de varianzas-covarianzas tipificadas, o lo que es lo mismo, una correlacin es una covarianza tipificada), la estimacin de los parmetros del modelo puede variar segn se elija una u otra. La mayora de los
autores no se ponen de acuerdo en cul es la mejor como punto de partida. Desde un punto
de vista ms pragmtico, nosotros recomendamos partir de la matriz de varianzas-covarianzas si tenemos en cuenta que la mayora del software comercial que ejecuta estos anlisis
permite la flexibilidad de operar tanto con la matriz de covarianzas como con la de correlaciones, con lo que partiendo de la matriz de covarianzas, siempre podremos transformarla en
matriz de correlaciones, mientras que si partimos de la matriz de correlaciones directamente
nunca podremos transformar a la de covarianzas.
As, tal y como hemos planteado con anterioridad, si queremos hacer una valoracin
del ajuste del modelo, dado que este ajuste se realiza comparando la matriz de covarianzas
reproducida o terica con la emprica, parece lo ms lgico que se use para el anlisis la matriz de covarianzas. Posteriormente, si interesa un anlisis de las relaciones (pesos factoriales)
que existen entre los factores y las variables observadas, lo indicado ser operar con la matriz
de correlaciones porque al estar tipificada facilita la interpretacin.
2.
Aunque la mayor parte del software disponible en la actualidad aporta siempre informacin sobre el grado de identificacin del modelo antes de proceder a la estimacin de los parmetros, es interesante que comprendamos en qu consiste este paso de la identificacin si
tenemos en cuenta que, en el caso de encontrarnos con un modelo no identificado, deberemos imponer las restricciones pertinentes al nmero de parmetros liberados para conseguir
un modelo sobreidentificado (que es el que en la prctica podemos someter a prueba).
La identificacin tiene que ver con el concepto de grados de libertad. Para entendernos
de una forma sencilla diremos que a cada parmetro que propongamos para su estimacin
(liberemos para ser calculado) le corresponde un grado de libertad. en nuestro ejemplo, tal
y como dijimos anteriormente, hemos liberado 20 parmetros, por lo que consumimos 20
grados de libertad. esos grados de libertad hay que deducirlos del total posible de grados de
libertad disponibles segn nuestros datos empricos y que vienen dados por el nmero de
combinaciones que permitan las variables empricas u observadas en funcin de la matriz
v(v + 1)
. en nuestro ejemplo, si plantea2
mos un anlisis con 8 variables observadas, el nmero de grados de libertad disponibles es de
36 (8x9/2). Pues bien, los grados de libertad con los que operamos en este modelo concreto
vienen dados por la diferencia entre los grados de libertad disponibles, y los consumidos en
funcin del nmero de parmetros especificados. en nuestro caso, el modelo que sometemos
a prueba tendra 16 grados de libertad (36 disponibles menos 20 consumidos).
Cuando los grados de libertad del modelo son negativos, es porque definimos un modelo con un nmero de parmetros que exceden los grados de libertad disponibles, dando lugar
a los llamados modelos No Identificados (los parmetros pueden tomar infinitos valores con
lo que se hace imposible su estimacin). Si los grados de libertad del modelo fuesen 0, es decir, el nmero de parmetros propuesto coincide con los grados de libertad disponibles, nos
encontraramos con un modelo Saturado. La particularidad de este modelo es que reproduce
exactamente los datos empricos que se estn analizando. No cumple su cometido de simplificacin de los datos observados y es un modelo nico, sin alternativa de ningn tipo. Slo
cuando los grados de libertad del modelo es un nmero mayor que 0, nos encontramos con
36
un modelo Sobreidentificado. esto implica que el modelo propuesto es uno ms entre varios
modelos posibles alternativos. Cabran varias soluciones para los mismos datos y en esta situacin es cuando tiene objeto plantear el anlisis de los datos para comprobar si la solucin
propuesta (el modelo que sometemos a prueba) minimiza las diferencias entre la matriz de
varianzas y covarianzas emprica y la terica que se deduce del modelo propuesto.
Como vemos, en el caso de que el programa informtico utilizado nos informe de un
modelo no identificado, es tarea del investigador (siempre que desde el punto de vista terico
se justifique) redefinir el modelo propuesto imponiendo restricciones a algunos parmetros
liberados en el modelo previo hasta conseguir un modelo sobreidentificado.
Debido a que los factores propuestos en el modelo son variables latentes, como ya
hemos apuntado con anterioridad, su mtrica (escala de medida) est indeterminada. en
esta fase de la identificacin del modelo hay que especificar, tambin, la mtrica de esas
variables. generalmente se escogen escalas de medida fciles de interpretar. en el AFC
suelen seguirse dos procedimientos: el primero de ellos consiste en fijar, para cada factor
propuesto, un valor para uno de sus coeficientes (es decir el correspondiente a una de las
variables asociadas a ese factor). generalmente se atribuye el valor 1 a ese coeficiente, con
el fin de escalar las variables latentes en valores similares a los tipificados para los coeficientes de correlacin; la variable elegida para fijar ese valor es indiferente aunque la mayora
de los autores recomiendan que sea la que, a priori, se suponga que sea un mejor reflejo
del factor definido. el segundo procedimiento consiste en fijar la varianza de los factores en
un nmero adecuado dentro de la matriz de varianzas-covarianzas de los factores. el valor
preferido es la unidad, ya que as nos dejar una matriz de varianzas-covarianzas de los
factores con unos en la diagonal (varianzas) y con coeficientes de correlacin fuera de la
diagonal (covarianzas). Con cada procedimiento se obtienen las mismas estimaciones, por
lo que es indiferente usar una u otra solucin; si bien algunos autores consideran que, con
vistas a contrastar la teora, el segundo procedimiento (estimar directamente la varianza del
constructo) es ms recomendable.
3.
37
38
Como hemos apuntado, el grado de ajuste se evala comparando la semejanza existente entre las matrices de varianzas-covarianzas del modelo y muestral. existen multitud de
pruebas estadsticas de Bondad de Ajuste y aunque han sido objeto de mltiples estudios en
la literatura especializada (Jreskog y Srbom, 1979; Bentler, 1990; Bollen, 1990; Bollen y
Long, 1993), no se ha llegado a un consenso sobre cul o cules de los indicadores estadsticos son los mejores. Incluso los autores no se ponen de acuerdo en cul es el valor de cada
indicador que supone un buen ajuste. Nuestra recomendacin es que se evale el ajuste del
modelo basndose en varios indicadores y prestando especial atencin a las limitaciones de
cada uno de ellos
La evaluacin del ajuste se puede clasificar en dos grandes aproximaciones: globales
e Individuales. Los ndices de ajuste globales evalan el grado de ajuste del modelo en su
conjunto. Los ndices individuales, lo que aportan es una evaluacin particular de los parmetros del modelo de medida. Pasamos a continuacin a describir muy someramente los ms
importantes.
A) evaluacin del ajuste del modelo conjunto:
1. Medidas de ajuste absoluto: tratan de determinar el grado en que el modelo propuesto predice la matriz de correlaciones o covarianzas observadas:
1.1. Prueba de significacin estadstica de 2. Histricamente fue el primer indicador
propuesto para evaluar el grado de ajuste entre los modelos. Para concluir un ajuste adecuado hay que aceptar Ho (p > .05; ptimo: .10 < p < .20) lo que indica que las diferencias entre
las matrices observadas y estimadas no son estadsticamente significativas. esto no garantiza
la identificacin del modelo correcto, podra haber otro mejor. Muy sensible al tamao de
la muestra (ideal entre 100 y 200). Si n>200 se tiende a rechazar Ho y si n<100 se tiende
a aceptar Ho incluso sin ser significativa ninguna relacin del modelo. Por ello se requiere
complementar con otros ndices de ajuste.
1.2. Otros ndices de bondad de ajuste absolutos: ndice de Bondad de Ajuste (goodness
of Fit Index, GFI). representa el grado de ajuste conjunto pero no est ajustado por los grados
de libertad. No hay un umbral absoluto de aceptabilidad, su valor oscila entre 0 y 1, siendo
1 el valor ptimo; Residuo Cuadrtico Medio (root Mean Square residual RMSR) y Error de
Aproximacin Cuadrtico Medio (root Mean Square error of Approximation, RMSEA). rMSr
y rMSeA analizan la discrepancia entre las matrices de correlaciones estimada y observada.
rMSr la mide en trminos de la muestra y rMSeA en trminos poblacionales. La evaluacin
del ajuste se basa en el anlisis de los residuos o errores (cuanto ms bajos mejor). No hay
umbrales de aceptabilidad. Intentan corregir la tendencia del estadstico Chi cuadrado de
rechazar cualquier modelo especificado cuando la muestra es grande. rMSeA es preferible a
rMSr cuando las muestras son grandes (aceptables entre .05 y .08)
2. Medidas de Ajuste Incremental: evalan el ajuste incremental del modelo propuesto
comparado con un modelo nulo (modelo de un nico factor sin error de medida). todos ellos
aceptables en torno a .90. Los ms importantes son el ndice de Tucker-Lewis (TLI) o los Indices de Bentler-Bonett, tanto el de Ajuste Normalizado (Normed Fit Index, NFI) como el de
Ajuste No Normalizado (Non-Normed Fit Index, NNFI).
39
Otros ndices en la misma lnea de los anteriores son los de Bollen: ndice de Ajuste Relativo (RFI) e ndice de Ajuste Incremental (IFI) y el de Bentler: ndice de Ajuste Comparado
(CFI).
3. Medidas de Ajuste de Parsimonia: relacionan la calidad del ajuste del modelo con
el n de coeficientes estimados necesarios para conseguir ese nivel de ajuste. Son ndices
que penalizan a los modelos en funcin del nmero de parmetros liberados. Cuanto ms
parmetros, ms decrecen estos indicadores. Por eso reciben el nombre de parsimoniosos.
No existe ninguna prueba de significacin estadstica, su uso se limita a la comparacin entre
modelos. Son un tipo de indicadores de ajuste que tienen su razn de ser cuando se plantean
modelos alternativos al que se trata de probar. Los ms importantes son los siguientes:
ndice de Bondad de Ajuste Incremental (Adjusted goodness of Fit Index, AGFI). Para
que sea adecuado su valor debe ser superior a 0,90 (es un ndice que oscila entre 0
y 1)
2 Normalizado. Son valores aceptables los comprendidos entre 1 y 2 3 (incluso 5
siendo menos estrictos). Si obtenemos valores inferiores a 1, es que el modelo puede
estar sobreajustado. Si se encuentran valores mayores que el umbral superior, es que
el modelo no es verdaderamente representativo de los datos observados y es necesario su mejora. Sin embargo, es una medida poco fiable y es necesario complementarla con otros ndices de bondad de ajuste.
ndice de Bondad de Ajuste de Parsimonia (Parsimony goodness of Fit Index, PGFI):
Puede oscilar entre 0 y 1. Cuanto ms alto mayor parsimonia, es decir mejor ajuste.
ndice de Ajuste Normalizado de Parsimonia de James-Mulaik-Brett (Parsimony Normed of Fit Index, PNFI). Cuanto ms bajo mejor. Cuando se comparan dos modelos
alternativos se proponen valores de .06 a .09 para que sean indicativos de diferencias
sustanciales entre modelos.
B) Ajuste del modelo de medida. evaluacin de los constructos estimados.
1. examen de las ponderaciones estimadas de los indicadores: Se trata de valorar la
significacin estadstica de los parmetros de los modelos. en los Programas informticos
los valores de los parmetros estimados suelen aparecer con su significacin estadstica representada por la probabilidad asociada. Si esa probabilidad es p<.01 .05 (para los niveles
de confianza del 99% del 95% respectivamente), las variables estn significativamente
relacionadas con sus constructos especficos, verificando las relaciones propuestas entre los
indicadores y los constructos. Si p>.05 se puede eliminar el indicador o intentar trasformarlo
para un mejor
ajuste del
constructo.
- Fiabilidad
Compuesta:
Concepto similar al de Fiabilidad Psicomtrica. Viene a
2. estimacin de la Fiabilidad del constructo y del porcentaje de la varianza extrada:
reflejar
grado en queespecificados
los indicadores
o variables
observadas
son consistentesde los
evaluacin de
si loselindicadores
son
suficientes
en su representacin
constructos.
en su medida del constructo latente tal y como el modelo se ha especificado
Fiabilidad Compuesta: Concepto similar al de Fiabilidad Psicomtrica. Viene a refle(mnimo
recomendado
jar el grado en
que los
indicadores=o.70).
variables observadas son consistentes en su medida del
constructo latente tal y como el modelo se ha especificado (mnimo recomendado = .70).
e es el peso factorial tipificado (parmetro) del error de cada una de esas variables observadas.
Varianza extrada: Porcentaje de la varianza de los indicadores que interviene en la
explicacin del constructo. (mnimo recomendado = 50% ; si es inferior, se deben explorar
ponderaciones adicionales de estos indicadores sobre los otros constructos, siempre que se
justifique desde el punto de vista terico)
donde
es
extrada
para
un un
constructo
donde
es la
la proporcin
proporcindedevarianza
varianzacomn
comn
extrada
para
constructo determinado, o porcentaje
de
varianza
explicado
por
ese
factor
o
constructo.
donde
es la proporcin de varianza comn extrada para un constructo
determinado,
o
porcentaje
de varianza
explicado
esevariable
factor o observada
constructo. en un constructo
R es el peso factorial tipificado
(parmetro)
depor
cada
determinado, o porcentaje de varianza explicado por ese factor o constructo.
o factor determinado.
R es el peso factorial tipificado (parmetro) de cada variable observada en un
p es el nmero de variables que definen ese constructo o factor.
R es el peso factorial tipificado (parmetro) de cada variable observada en un
constructo
o factor
3.
evaluacin
de ladeterminado
relacin propuesta entre los constructos y entre los errores. Si en el
modelo sometido
a
prueba
hemos
especificado relacin entre los constructos (en nuestro
constructo o factor
determinado
ejemplo,
envariables
la figura que
3, recordemos
que establecimos
p es plasmado
el nmero de
definen ese constructo
o factor. una posible relacin entre el
factor 2 y el factor
3)
o
entre
algunos
trminos
de
error
(en
nuestro
ejemplo relaciones entre
p es el nmero de variables que definen ese constructo
o factor.
e1 y e2, e4 y e5, y e6 y e8), deberemos analizar tambin su significacin. Si alguna de estas re3.- Evaluacin de la relacin propuesta entre los constructos y entre los errores.
laciones no fuese significativa convendra redefinir el modelo eliminando esas relaciones no
3.-volviendo
Evaluacina de
la relacin
entre los constructos y entre los errores.
analizarlo
de propuesta
nuevo. relacin
Sisignificativas
en el modelo ysometido
a prueba
hemos especificado
entre los constructos (en
Si en el modelo sometido a prueba hemos especificado relacin entre los constructos (en
nuestro
ejemplo, plasmado
la figura
3, recordemos
establecimos
una posible
5. Reespecificacin
delen
modelo
y comparacin
deque
modelos
anidados
nuestro ejemplo, plasmado en la figura 3, recordemos que establecimos una posible
terminar
esta
exposicin,
a dedicar
lneas
la reespecificacin
relacinPara
entre
el factor
2 ybreve
el factor
3) o entrevamos
algunos
trminosunas
de error
(ena nuestro
de modelos.
reespecificar
un
modelo
significa
someter
a
prueba
otro
u
otros
relacin entre el factor 2 y el factor 3) o entre algunos trminos de error
(en alternativos.
nuestro
e5, y e6 y del
e8), ajuste
deberemos
analizar inicial
tambin
ejemplo
relaciones
generalmente
se entre
hace ecuando
del modelo
nosues buena. De
1 y e2, ela
4 yvaloracin
hecho,ejemplo
la mayora
de losentre
Programas
alternativasanalizar
al modelo
sometido
a
, e4 y e5, y eofrecen
tambin
su
relaciones
e1 y e2informticos
6 y e8), deberemos
significacin.
Si alguna
de estas relaciones
no fuese significativa
convendra
el que inicialprueba aportando
sugerencias
de modificacin
(liberar algn
nuevo redefinir
parmetro
Si alguna de estas
relaciones
no fuese
convendra
redefinir
el
mente significacin.
no se haba contemplado)
y cmo
afectaran
esassignificativa
modificaciones
al ajuste
del modelo
modelo
eliminando
esas
relaciones
no
significativas
y
volviendo
a
analizarlo
de
nuevo.
alternativo. Normalmente, esas sugerencias no suelen alterar el nmero de factores de la
modelo
eliminando
esas relaciones
y volviendo aentre
analizarlo
de nuevo.obserestructura
inicial
y se limitan
a alterar no
lassignificativas
relaciones (parmetros)
las variables
vadas y los factores establecidos a priori. estos modelos alternativos establecen una relacin
5. REESPECIFICACIN DEL MODELO Y COMPARACIN DE
de anidamiento con el modelo original. Diramos que el primer modelo (que se supone que
5. REESPECIFICACIN DEL MODELO Y COMPARACIN DE
libera menos
parmetros
que el alternativo) est anidado en el segundo y as sucesivamente
MODELOS
ANIDADOS
en un proceso parsimonioso. en este tipo de situacin es frecuente redefinir ese modelo con
MODELOS ANIDADOS
los cambios sugeridos para mejorar su ajuste.
19 de factores
Sin embargo, cuando reespecificamos un modelo inicial alterando el nmero
o constructos, en realidad lo que hacemos es someter a prueba un nuevo modelo de medida
19
que poco o nada tiene que ver con el original.
41
un corpus terico subyacente que la sustente. todo lo que sea alterar el modelo sometido a
prueba significa estrictamente alterar la hiptesis de partida y puede ocurrir que la bsqueda
de modelos ms ajustados a los datos empricos que manejamos altere sustancialmente el
objetivo inicial por el que se recabaron esos datos y por el que se realiz ese AFC.
Con esto no queremos decir que sistemticamente deban rechazarse las prcticas de
reespecificacin de modelos. en los modelos de ecuaciones estructurales es una prctica
bastante habitual. Lo nico que queremos es subrayar la necesidad de que cuando se vaya a
reespecificar un modelo, se justifique plenamente este proceder desde el punto de vista terico. Si no tenemos especial cuidado en esto estaremos, a la postre, convirtiendo el Anlisis
Factorial Confirmatorio en un mero Anlisis Factorial exploratorio, y como hemos insistido,
los modelos que se someten a prueba pueden ser infinitos con lo que la reespecificacin puede llegar a convertirse en un crculo demasiado vicioso.
reFereNCIAS BIBLIOgrFICAS
Batista, J.M., y Coenders, g. (2000). Modelos de ecuaciones estructurales. Madrid: Hesprides.
Bentler, P.M. (1990). Comparative fit indexes in structural models. Psychological Bulletin, 107, 238246.
Bohrnstedt, g.W. (1983). Measurement. en P.H. rossi, J.D. Wrigth y A.B. Anderson (eds.), Handbook
of survey research (pp. 69-121). New York: Academic Press.
Bollen, K.A. (1989). Structural ecuations with latent variables. New York: Wiley.
Bollen, K.A. (1990). Overall fit in covariance structure models. two types of sample size effects. Psychological Bulletin, 197, 256-259.
Bollen, K.A. y Long, J.S. (1993). Testing structural equation models. Newbury Park, CA: Sage.
Borsboom, D., Mellenbergh, g.J., y van Haerden (2004). the concept of validity. Psychological Review,
111, 1061-1071.
Hair, J.F., Anderson, r.e., tatham, r.L., Black, W.C. (1999). Anlisis Multivariante (5 ed.). Madrid:
Prentice Hall Iberia.
Jreskog, K.g. y Srbom, D. (1979). Advances in factor analysis and structural equation models. Cambridge, MA: Abt Associates.
Long, J.S. (1983). Confirmatory factor analysis. Newbury Park, CA: Sage
Martnez, M.r., Hernndez, M.J., Hernndez, M.V. (2006). Psicometra. Madrid: Alianza editorial.
Mulaik, S.A. (1972). The foundations of factor analysis. New York: Mcgraw-Hill.
Pedhazur, e.J. y Pedhazur, L. (1991). Measurement, Design and Analysis. Hillsdale, N.J.: Lawrence erlbaum Associates.
Prez-gil, J.A., Chacn, S., y Moreno, r. (2000). Validez de constructo: el uso del anlisis factorial exploratorio-confirmatorio para obtener evidencias de validez. Psicothema, 12-2, 442-446.
Spearman, C. (1904). the proof and measurement of association between two things. American Journal
of Psychology, 15, 201-293.
thompson, B. (2004). Exploratory and confirmatory factor analysis. Washington DC: American Psychological Association.
INtrODUCCIN
Los modelos de ecuaciones estructurales nacieron de la necesidad de dotar de mayor
flexibilidad a los modelos de regresin. en palabras de Bollen (1989):
Podemos mirar estos modelos de diversos modos. Son ecuaciones de regresin con supuestos menos restrictivos, que permiten errores de medida tanto en las variables criterio (independientes) como en las variables dependientes. Consisten en anlisis factoriales que permiten
efectos directos e indirectos entre los factores. Habitualmente incluyen mltiples indicadores y
variables latentes. resumiendo, engloban y extienden los procedimientos de regresin, el anlisis
economtrico y el anlisis factorial. (Pgina V).
44
CONCePtOS BSICOS
en la base de los modelos estructurales se encuentra el concepto de causalidad que, en
este contexto, tiene un significado especial. Por otra parte, existe un acuerdo generalizado
en representar estos modelos de manera grfica, siguiendo una serie de convenciones. Antes
de entrar a discutir con detalle las caractersticas de los modelos de ecuaciones estructurales
vamos a revisar brevemente estas dos cuestiones.
El concepto de causalidad
el concepto de causalidad ha sido discutido ampliamente por filsofos y cientficos, sin
que exista un acuerdo unnime sobre su alcance. Aqu vamos a acotar su significado al tema
que nos ocupa.
Intuitivamente, entendemos que existe causalidad cuando la aparicin de un fenmeno
(la causa) determina, en mayor o menor medida, la aparicin de un segundo fenmeno (el
efecto). As por ejemplo, decimos que la fatiga es efecto del exceso de ejercicio, por lo que
pensamos que el exceso de ejercicio causa fatiga. Adems, si realmente existe causalidad, la
desaparicin de la causa, implicar la desaparicin del efecto.
en el plano cientfico, slo se admite la formulacin de la causalidad a partir de la manipulacin experimental de las variables que se pretende relacionar (Campbell y Stanley,
1963). Para determinar el efecto de la variable X sobre la variable Y deberemos manipular
diversos niveles (intensidades) del estmulo X, para cuantificar su efecto (o ausencia de ste)
sobre la variable de respuesta Y. Slo despus de esta manipulacin, preferiblemente a travs
de varios experimentos repetidos, podremos asegurar la causalidad de X sobre Y, as como su
magnitud.
Por desgracia, en la mayora de las ciencias sociales es imposible llevar a cabo un estudio de tipo experimental cuando se pretende estudiar la relacin jerrquica entre variables.
De hecho, incluso en el terreno experimental se recurre al control estadstico de las variables,
cuando el control experimental excede el alcance del experimentador, como sucede en los
diseos de bloques, o en el anlisis de covarianza (anCoVa).
Los trabajos de Boudon (1965) y Duncan (1966) propusieron una nueva posibilidad de
acercamiento a la causalidad, el anlisis de dependencias o anlisis de rutas (path analysis).
en este tipo de anlisis se estudia una teora causal mediante la especificacin de todas las
variables importantes para dicha teora. Posteriormente, se pueden derivar las relaciones entre los efectos causales a partir de la teora causal para, en ltimo trmino, estimar el tamao
de estos efectos.
La generalizacin lgica del anlisis de rutas fueron los modelos de ecuaciones estructurales y el contraste de teoras o lo que es lo mismo, de modelos causales. La lgica de estos
modelos se basa en que, a partir de la teora que fundamenta el modelo, ser posible derivar
las medidas de covariacin entre las variables a partir de los efectos causales del modelo. Si
la teora es correcta, las medidas de covariacin derivadas del modelo y las medidas de covariacin obtenidas a partir de los datos debern ser iguales.
Por tanto, la causalidad contenida en los modelos estructurales debe entenderse en el
sentido de control estadstico y no en el sentido determinista de la manipulacin experimental.
La estructuracin causal de las relaciones tericas es una manera de resumir nuestro
conocimiento de un fenmeno y permite un abordaje racional lgico en su estudio. Adems,
45
como sealan Dillon y goldstein (1984), las teoras y su formulacin provienen de fuera de
la estadstica. Si no existe una teora consistente y explcita, poco sentido tiene analizar o
intentar interpretar, ni tan siquiera una correlacin o una media.
Precisamente esta necesidad de teoras explcitas es lo que confiere valor a los modelos
causales. Para poner a prueba los modelos estructurales, el investigador deber especificar
con sumo detalle las variables de inters y el tipo de relaciones existentes entre las variables.
Si no se incluyen en el modelo todas las variables relevantes para el tema investigado o las
relaciones se definen de manera errnea o, lo que es ms comn, las relaciones entre las variables se encuentran medidas con escasa precisin, ser difcil conseguir el ajuste buscado
entre la teora y los datos.
Bien es cierto que muchos estudios en los que se utilizan estos modelos abusan de un
excesivo ajuste y reajuste de las posibles relaciones tericas, a partir de los indicios de falta
de ajuste matemtico que aparecen en los datos. estos modelos sobre-manipulados suelen
ser muy inestables y pierden sus buenas propiedades de ajuste cuando se utilizan otras
muestras para su rplica. Por desgracia los estudios de replicacin son escasos, por lo que
es recomendable mantener un cierto escepticismo cuando en un estudio no se nos informe
detalladamente de las manipulaciones que hayan podido sufrir los datos.
en cualquier caso, no est de ms recordar que el hecho de que se cumplan todas las
propiedades estadsticas deseables en los ejemplos que se proponen en esta monografa, no
quiere decir que sea sencillo obtener modelos como estos. Por el contrario, el desarrollo de
un modelo estructural suele ser bastante laborioso.
el proceso de construccin y desarrollo de teoras causales mediante la utilizacin de
modelos de ecuaciones estructurales puede resumirse en el siguiente cuadro.
46
Miguel
ruiz daz
Figura 1. Diagrama de flujo para contrastar
hiptesis
causales de datos no experimentales
Teora
Contrastable
Recoleccin
de los datos
Interpretacin
y consecuencias
Correccin de una
teora rechazada
Correlaciones y
covarianzas entre
variables observables
Formulacin
de un modelo
Simplificacin
de la teora
Contrastacin
de la teora
Identificacin
Derivacin de las
correlaciones y covarianzas
a partir del modelo
Estimacin
de los efectos
Muestreo
50
47
Las variables que representan los errores de cualquier tipo de variable dependiente se
representan sin rectngulos ni crculos. (Aunque algunos programas los dibujan como
variables latentes).
Las relaciones entre variables de tipo covariante (las correlaciones y las covarianzas)
se representan como vectores curvos con una flecha en cada extremo.
Cualquier efecto estructural se representa como una flecha recta, cuyo origen es la
variable predictora y cuyo final, donde se encuentra el extremo de la flecha, es la variable dependiente.
Se utilizan letras griegas para denominar a las variables latentes (, ).
Se utilizan letras latinas para denominar a las variables observables (x, y).
Se utilizan letras griegas para denominar los efectos de unas variables sobre otras (,
, , etc.), si bien cada tipo de efecto utiliza un smbolo determinado (ver ms adelante).
en cada smbolo de una relacin se indican, mediante subndices, las variables implicadas en l. el primer subndice corresponde a la variable dependiente y el segundo
subndice indica la variable predictora para ese efecto.
Cualquier variable que reciba efecto de otras variables del modelo deber incluir
tambin un trmino de error.
tabla 1. Letras
griegas
utilizadas
en los diagramas
estructurales
Tabla
1. Letras
griegas utilizadas
en los diagramas
estructurales
[
K
Ksi
Beta
Phi
Theta
Sigma
Delta
Epsilon
Psi
Zeta
Eta
Ksi
Eta
Lambda
Ejemplo 1 J
Gamma
Beta
Phi
Theta
Sigma
Lambda
Gamma
Delta
Epsilon
H
\
]
Psi
Zeta
H1
J1 1
y
H1
1
1
Figura 3. Modelo
de regresin lineal mltiple
1
Las variables dependiente (y1) ex1independiente1 (x
) son observables. La variable depen1
Figura 3. Modelo de regresin lineal mltiple
diente est afectada por un error de medida (1), mientras que la variable independiente est
y1
H1 reflejada
I2 1 de la variable independiente sobre la dependiente
medida sin error. el efecto
viene
J
por un vector cuyo parmetro es 1 1.x2este modelo
carece de variables latentes, si bien el error
11
x1
J1 2 latente.
puede considerarse tcnicamente
como una variable
Ejemplo 2
H1
x2
J1 2
x1 un modelo
G1 representa
el siguiente diagrama
de
O1 1regresin mltiple con dos variables predictoras.
Figura 4. Modelo de anlisis factorial confirmatorio
G2
G1
x1
G2
O1 1
x3
G3
x2
O2 1
x2
O2 1
[1
O3 1
[1
J1 1
y1
x1
48
H1
J1 1
x1
y1
I2 1
H1
Ksi
Beta
Delta
[
E
G
Figura
4.
Modelo
de
anlisis
factorial
confirmatorio
Eta
Epsilon independientes. Cada
La variableK dependiente
recibe
efecto de lasH dos variables
I el Phi
efecto est representado por su parmetro correspondiente (i j ). La covarianza entre las dos
Lambda
Theta
Psi
O
T
\
variables predictoras
como un Ovector
curvo
de doble punta. Su parmetro (2 1)
x1
G1 se representa
11
corresponde a la
entre
Gammaobservada
Sigmax1 y x2. ]
Zeta
J covarianza
6
Siguiendo el modelo de regresin mltiple
O2 1 lineal clsico, las variables predictoras care[1
x2
G2
cen de error de medida.
O3 1bivariante afecta a dicha variable dependiente,
2. Modelo
medida
(1) dedelaregresin
variablelineal
dependiente,
El error deFigura
pero la variacin es aleatoria e independiente de la de la propia variable dependiente. Por
J1 1 una variable ms del modelo, encerrada en un
x3
G3
ello no se acostumbra
a representarla
como
la variable dependiente
es tambin
rectngulo o un crculo. El errorxde
y1
H1 independiente de las
1
variables predictoras, por lo que no manda flecha hacia ninguna de ellas. El error de medida
recoge las fluctuaciones en la variable dependiente que no son atribuibles a las variables del
modelo. No es una variable observable. Algunos programas como el AMOS la representan
Figura
3. Modelo
de regresin lineal
mltipleen un crculo. Tambin es relativamente
latente
(no observable)
encerrada
como una variable
frecuente que las variables de error no se representen en el diagrama para simplificar la representacin del modelo cuando existen mltiplesJ1variables,
o incluso que slo se represente
1
x
1
la flecha del efecto del error, pero no se representa el smbolo de la variable.
Ejemplo 3
y1
I2 1
H1
x2
J1 2
El siguiente diagrama representa un modelo factorial
con tres variables y un factor latente.
Figura 4. Modelo
anlisis
confirmatorio
Figura 4.de
Modelo
de factorial
anlisis factorial
confirmatorio
G1
x1
G2
x2
51
O1 1
O2 1
[1
O3 1
G3
x3
En este modelo existe un nico factor, representado por una variable latente (1) que no
es observable. Este factor latente es estimado por tres indicadores observables (x1, x2 y x3),
por lo que reciben su efecto del factor latente.
En el texto se utilizan letras minsculas para las variables observadas por dos motivos: por encontrarse la variable en escala diferencial y por ser variables aleatorias que pertenecen a un vector.
51
49
Las variables observables no son indicadores perfectos del factor latente, por lo que
tendrn un cierto grado de error, representado por sus trminos correspondientes i. Como
veremos, este trmino de error no es exactamente lo mismo que la unicidad de la variable
correspondiente, aunque est estrechamente relacionado con ella.
El factor latente no tiene error, por lo que no recibe ninguna flecha de efecto.
En el mismo grfico podran representarse simultneamente las correlaciones entre las
variables observables, mediante flechas curvas.
Como hemos visto, la representacin de diversos modelos causales es relativamente
simple, utilizando las convenciones mencionadas ms arriba. Los nombres de los parmetros
del modelo (las letras griegas de las flechas) se concretarn a medida que sea necesario y el
desarrollo de la monografa lo permita.
El concepto de ajuste
Para entender la fundamentacin de los modelos de ecuaciones estructurales, es necesario reorientar nuestro conocimiento de lo que significa el concepto de ajuste de un modelo.
En regresin lineal, cuando hablamos de las estimaciones de los parmetros, escogemos
aquellas estimaciones que mejor ajustan el modelo a los datos, en el sentido de que minimizan los errores de prediccin cometidos con el modelo para el conjunto de sujetos de la
muestra (en el mtodo de mnimos cuadrados). Por el contrario, en los modelos de ecuaciones estructurales, lo que se pretende ajustar son las covarianzas entre las variables, en vez de
buscar el ajuste de los casos. En lugar de minimizar la diferencia entre los valores pronosticados y los observados a nivel individual, se minimiza la diferencia entre las covarianzas
muestrales y las covarianzas pronosticadas por el modelo estructural. Este es el motivo por el
que tambin se han denominado modelos de estructura de covarianza (covariance structure
models; Long, 1983). En el caso que nos ocupa, los residuos son la diferencia entre las covarianzas observadas y las covarianzas reproducidas (pronosticadas) por el modelo estructural
terico.
El ajuste de un modelo se puede recoger en una hiptesis fundamental, que propone
que, si el modelo es correcto y conociramos los parmetros del modelo estructural, la matriz
de covarianzas poblacional podra ser reproducida exactamente a partir de la combinacin
de los parmetros del modelo. La idea de ajuste se resume en la siguiente ecuacin
H0 : = ()
(1)
COV( x, y ) VAR ( x)
(3)(3)
Dado que no existe confusin posible, se han eliminado los subndices por simplicidad.
VAR ( y ) E( y 2 ) E( y ) 2
>
@ E J x H 2JxH E J x E H
E x E H J VAR ( x) VAR (H)
E ( Jx H) 2
J
E( y 2 )
(4)
50
COV
(3)
,,yy))Trabajando,
VAR
((xx)) por simplicidad en diferenciales,
COV((x(2).
de la matriz en funcin de la ecuacin
x
VAR
( y ) COV ( x, y )
VAR
2), ya que el valor esperado
(3) es
sabemos que VAR(x)=E(x2)-E(x)2=E(x
de x, en diferenciales,
( x, y ) VAR ( x)
COV
cero. La varianza de la variable y puede
expresarse como
E( y 2 ) E( y ) 2 E( y 2 )
EE((yy22))EE(2(yy))22 EE2((yy222)) 2
E ( Jx H)
E J2 x2 H2 2JxH E J22 x22 E H22
EE2((JJxx2 2HH))22 E
2JxH E J 2x 2 E H 2
22 JJ 2xx22
2HH 2
VAR ( y ) JE(Ey x) E
EJ( yVAR
)
(Ey )H2E
( x2)JxHVARE(HJ) x E H
2
2
2
JJ 2EE xx 2 E
H 2 J 2VAR2 ((xx))VAR
(H )
E ( Jx H) 2E H E J 2Jx 2VAR
H 2JxHVARE(HJ)2 x 2 E H 2
2
donde hemos utilizado las propiedades
trmino
para(Hsimplificar
la igualdad.
J 2 E x 2 E Hdel
J 2 VAR (error
x) VAR
)
VAR ( y )
VAR
VAR((yy))
>>>
>
@@@
@
(4)
(4)
(4)
(4)
(4)
(5)
(5)
(5)
(5)
(5)
expresiones
J VAR ( x)
Sustituyendo en la ecuacinJ E3xlas
derivadas que hemos obtenido en las
ecuaciones 4 y 5, llegamos a la matriz
J 2 VAR ( x) VAR (H) J VAR ( x)
(6)
J 22VAR ( x) VAR (H) J VAR ( x)
( x) (VAR
VAR((xx))
(6)
J VAR
x) (H) JVAR
J VAR
(6)(6)
((xx))
VAR
((xx))
2 JJVAR
VAR
VAR
(6)
VAR ( x)
J VAR ( x)
que no es ms que la matriz de varianza-covarianza poblacional escrita en funcin de los parmetros del modelo. A esta matriz tambin se la denomina la matriz de covarianza implcita.
) y COV
( x,ayexpresar
)
VAR ( y(1)
Podemos sustituir ahora en la ecuacin
volver
la hiptesis bsica como
H 0 : VAR
((yy)) COV
((xx,,yy))
VAR
COV
H
COV( x, y ) VAR ( x)
H00 :: COV
((xx,,yy)) VAR
(7)
COV
VAR((x(xx,))y )
2
( y()x) COV
JVAR
(7)
VAR
VAR
(
)
VAR
(
)
H
J
x
(7)
2
H 0 : J 2VAR ( x) VAR (H) JVAR ( x) ( )
((Hx) ) JVAR
VAR((xx)) ( )
J VAR
(JxVAR
, (yx)) (VAR
VAR
COV
)
x
(7)(7)
((xx))
VAR
((xx)) ( )
2 JJVAR
VAR
VAR
J VAR ( x) VAR (H) J VAR ( x)
( )
VAR ( x)
J VAR ( x)
3
32 12
3
sera difcil comprobar la igualdad de los
estimar los parmetros del modelo
(8)
XX31trminos.
OO3211
[[2 GG13Cmo
(8)
2
3
O32
es un problema que ha necesitado que Xse432 desarrollen
42[ 2 G 4 programas informticos para poder ser
XX4 OO4221[[21 GG42
resuelto y que veremos ms adelante. X 543 O5332
42[ 2
(8)
G54
3 G
XX5 OO53[[32GG53
X 54 estructurales
O5342[32 G54 se basan en una hiptesis similar a
Los diferentes modelos de ecuaciones
51
que las igualdades derivadas de estas ecuaciones, que se encuentran en la matriz de covarianza implcita, tambin debern ser lineales.
Este planteamiento de entender los modelos de ecuaciones estructurales como modelos
tericos que representan una estructura propuesta en funcin de unos parmetros, no es tan
novedosa como cabra pensar. En los modelos factoriales, como ya hemos visto, uno de los
criterios de la bondad del modelo factorial es su capacidad para reproducir la matriz de correlaciones que se est analizando. De hecho, el trmino matriz de correlaciones reproducida del anlisis factorial exploratorio hace referencia a un planteamiento similar al propuesto
en la hiptesis de la ecuacin (1).
NOTACIN
La notacin que utilizaremos en este captulo es la desarrollada por Jreskog (1973, 1977),
Wiley (1973) y Keesling (1972), popularizada posteriormente por la utilizacin del lisrel.
Se denomina modelo completo a un sistema de ecuaciones estructurales, es decir, un
conjunto de ecuaciones lineales que expresan las relaciones entre las variables. Las ecuaciones contienen variables aleatorias y parmetros estructurales (que expresan las relaciones
entre las variables).
Las variables aleatorias pueden ser de tres tipos: observables, latentes y de error. Las
variables observables, o indicadores, son aquellas cuya variabilidad y relaciones con
otras variables observables pueden ser cuantificadas a partir de las medidas obtenidas
del mundo real. Son variables observables las preguntas de un cuestionario, las variables socio-demogrficas de una encuesta y los ndices economtricos.
Las variables latentes, no observables o factores, son variables cuya medida directa
es imposible de obtener y que debe ser inferida a partir de su relacin con variables
observables que sean sus indicadores. La inteligencia, el nivel socioeconmico, el
autoritarismo o los factores comunes de un modelo factorial son variables latentes.
Los errores de medida son variables aleatorias no observables que aglutinan todos los
efectos no considerados en el sistema y que puedan estar afectando a la medida de
la variable a la que influyen. Estas variables son equivalentes al trmino error de un
modelo de regresin.
Las variables que son causa de otras variables y cuya variabilidad se asume que es causada por otras variables no consideradas en el modelo se denominan variables exgenas (las
independientes). Puesto que las relaciones entre las variables exgenas (sus correlaciones)
no son tomadas en cuenta dentro del modelo, no se intenta explicar sus interrelaciones. Las
variables cuya variacin es explicada por las variables exgenas, o por otras variables del sistema, se denominan variables endgenas (las dependientes).
Las variables exgenas se representan como X si son observables y como si son latentes.
Las variables endgenas observables se representan como Y mientras que las endgenas latentes se representan como .
Los errores de medida de las variables observables exgenas se representan como
, los de las variables observables endgenas como y los errores que afectan a las
variables latentes endgenas se representan como . Las variables latentes exgenas
nunca estn afectadas por un error.
52
Los coeficientes de regresin que representan la relacin de una variable latente (endgena o exgena) con sus indicadores se representa mediante , acompaada de un
subndice que indique el tipo de variable (X o Y) si fuera necesario distinguirlos.
Los efectos de una variable endgena sobre otra endgena se representan por un coeficiente , los efectos de una variable exgena sobre otra endgena se representan
por un coeficiente .
Las covarianzas entre los errores de medida se representan como , acompaado del
subndice o , segn al error que se refieran. Las covarianzas entre variables latentes
exgenas se representan como .
Las covarianzas entre los errores de variables endgenas latentes se representan como
. Por ltimo, las relaciones entre variables observables exgenas se representan mediante lneas curvas con una flecha en cada extremo.
Estas convenciones se acompaan de las mencionadas en la pgina 47 para confeccionar los grficos de efectos del modelo.
Familiarizarse con esta nueva terminologa requiere alguna prctica. Para ejemplificar
representaremos el modelo propuesto por Bagozzi (1980).
Ejemplo 4
El modelo que recogemos a continuacin fue propuesto por Bagozzi (1980) y se discute
tambin en Jreskog y Srbom (1989) y Dillon y Goldstein (1984). El modelo pretende explicar la relacin entre la satisfaccin y el rendimiento del equipo de veentas de una empresa.
Figura 5. Representacin
estructural del Modelo de Bagozzi
Figura 5. Representacin estructural del Modelo de Bagozzi
1
d1
d2
d3
x1
z2
1
Motivacin
de Logro
x2
x3
1
1
y2
Satisfaccin
con el trabajo
y3
Autoestima
d4
x4
Rendimiento
d5
x5
e2
1 Inteligencia
Verbal
z1
y1
e3
53
En la figura 5 se muestra un diagrama estructural con los nombres de las variables latentes y los efectos pertinentes para definir el modelo. En la figura 6 se muestra el mismo
diagrama utilizando la nomenclatura desarrollada anteriormente para la denominacin de
los parmetros y de las variables latentes.
Figura 6. Modelo estructural de la satisfaccin
G
O
X
X
O
X
O
J
K
I
I
G
[
E
O
E
[
G
G
X
O
X
O
O
I
[
J
K
Y
H
Y
H
]
]
O
H
J
El modelo final propuesto por el autor contiene tres variables latentes exgenas (1, 2 y
Figura 7. Relacin de covariacin
3), as como dos variables latentes endgenas (1 y 2). Estas variables representan medidas
perfectas de sus respectivos
conceptos o constructos. Cada
una de estas variables latentes es
Inteligencia
Rendimiento
estimada por sus correspondientes indicadores, o medidas, las X y las Y.
Las variables latentes corresponden a los conceptos
1 = Motivacin de Logro
Figura
2 = Autoestima
ligada
a la Tarea
8. Relacin de
tipo causal
3 = Inteligencia Verbal
N de fumadores
1 = Rendimiento
del vendedor
Cantidad de humo
2 = Satisfaccin Laboral
Figura 9. Relacin esprea
La Motivacin de logro est medida por dos indicadores, X1 = una escala tipo Likert de
4 preguntas y X2 = una escala tipo Likert de 4 preguntas. La Autoestima ligada a la tarea se
encuentra medida por dos indicadores, X3=una escala de 3 tems y X4=una escala de 3
elementos. La Inteligencia verbal se encuentraInteligencia
medida por un nico indicador, X5=la puntuacin obtenida en una escala de 30 tems emparejados. El Rendimiento de los vendedores
se cuantifica mediante un indicador Y1=el volumen de ventas anual de cada individuo en
Edad
dlares. La Satisfaccin
laboral est medida por dos indicadores, Y2=la puntuacin en una
escala de 4 tems y Y3=la puntuacin en una escala de 4 preguntas tipo Likert.
Como puede observarse en la figura 5, cada
variable latente manda una flecha a su inEstatura
dicador o indicadores correspondientes, como si se tratara de un modelo factorial, en el que
53
54
la variable latente (el concepto) fuera el factor y los indicadores los tems observables del
factor.
Adems, el modelo propone una serie de rutas causales muy especficas, que han sido
determinadas a partir de la teora. La Motivacin de logro influye slo sobre la Satisfaccin
laboral y tanto las Habilidades verbales como la Autoestima afectan solamente al Rendimiento. A su vez, tanto el Rendimiento como
la (Satisfaccin
una sobre la otra mediante
y ) COV ( x,influyen
y)
VAR
es no recursivo, ya que ambas variables latentes(3)enlos efectos correspondientes. El modelo
COV( x, y ) VAR ( x)
dgenas influyen una sobre la otra. Si una de las ij fuera igual
a 0, esa flecha no existira y
el modelo sera recursivo.
Cuando se estudia un modelo como el de la figura 5, se acostumbra a descomponer los
conjuntos de ecuaciones estructurales que lo especifican en dos niveles de anlisis, el mode2
VAR ( y ) y E
) E( yde
) 2 medida.
E( y 2 )
lo de las variables latentes
el( ymodelo
>
@ E J x H 2JxH E J x E H
J E x E H J VAR ( x) VAR (H)
FORMULACIN DE UN MODELO
E ( Jx H) 2
2
(4)
Para poder estimar los parmetros de un modelo es necesario definir primero sus ecuaciones. Tradicionalmente era necesario escribir primero las ecuaciones estructurales, para
luego proceder con laCOV
comprobacin
( x, y ) E( xy )de la identificabilidad, la estimacin y la verificacin
programas
de estimacin permiten code las propiedades del modelo. En la actualidad los
2
2
>
@
E
x
(
J
x
H
)
E
J
x
x
H
E
J
x
E xH del diagrama causal,
(5)
menzar con la formulacin grfica del modelo, mediante la elaboracin
2
para luego proceder con las distintas
anlisis.
El modelo causal es la representacin
Jdel
J E xfases
VAR
( x)
grfica de las ecuaciones estructurales.
El conjunto de ecuaciones estructurales que definen un modelo puede llegar a ser muy
extenso. Para organizar estas ecuaciones se recurre a la agrupacin de las mismas en dos subconjuntos denominados el modelo de
medida y el modelo de las variables latentes. Ambos
J 2 VAR ( x) VAR (H) J VAR ( x)
(6)
y recogen todas las relaciones contempladas
subconjuntos se complementan
por el modelo.
VAR ( x)
J VAR ( x)
Modelo de Medida
El modelo de medida es el que contiene las ecuaciones correspondientes a las relaciones entre las variables latentes y lasVAR
variables
observables
( y ) COV
( x, y ) que constituyen sus correspondien
H 0 :
tes indicadores.
COV( x, y ) VAR ( x)
(7)Se
En el modelo de medida tendremos
tantas ecuaciones como variables observables.
J 2 VAR ( x) VAR (H) J VAR ( x)
acostumbra a agrupar las ecuaciones
en dos conjuntos, uno para
las
( )variables exgenas y
VAR ( x) la notacin
VAR ( x)se asume que las variables es ParaJsimplificar
otro para las variables endgenas.
tn medidas en su forma diferencial, respecto a la media.
En el modelo de la figura 5, las ecuaciones que definen el modelo de medida sern, para
las variables exgenas:
X 1 O11[1 G 1
X 2 O21[1 G 2
(8)(8)
X 3 O32[ 2 G 3
X 4 O42[ 2 G 4
X 5 O53[ 3 G 5
y para las variables endgenas:
Y1 O11K1 H 1
Y2 O22K 2 H 2
Y3 O32K 2 H 3
55
(9)
(9)
Estas
ecuaciones pueden expresarse de manera ms compacta utilizando la notacin
matricial. El conjunto de ecuaciones (8) puede expresarse como
/xx x[
+ d
Xx =
(10)
(10)
donde x es un vector q1 que contiene las variables aleatorias correspondientes a las variables observables; x es una matriz de orden qn que contiene las saturaciones de las variables observables en las variables latentes independientes; es un vector, de dimensiones n1,
(11)
y y (exgenas);
(11)
y y
El modelo de variables latentes, el modelo de ecuaciones estructurales propiamente
(11)oby y a las relaciones entre las variables no
dicho, contiene las ecuaciones correspondientes
servables. Es el modelo que vincula las variables hipotetizadas, haciendo corresponder las
variables independientes con las dependientes.
K1 E12 K
[ 2 J 13[ 3 ]1
(13)
2 Jde
12
Las ecuaciones estructurales del
modelo
la figura 2 sern
(12)
K 2 E 21K1 J 21[1 ] 2
K1 E12 K2 J 12 [ 2 J 13[ 3 ]1
(12)
(12)
K 2 E 21K1 J 21[1 ] 2
o alternativamente como
(14)
K1 E12 K2
J12 [ 2 J13[3 ]1
(12b)
(12b)
E21K1 K2 J 21[1 ] 2
K1 E12 K2 J12 [ 2 J13[3 ]1
(12b)
En notacin matricial, puede
Eexpresarse
Jcomo
21K1 K2
21[1 ] 2
[1
E12 K1 0 J 12 J 13 ]1
1
+
(13)
bh
=
x
[ 2
(15)
1 K2 J 21 0
0 ] 2
E 21
[ 3 endgenas; es un vector
donde es un vector m1 que contiene las variables latentes
es una matriz
mm que contiene los
n1 que contiene las variableslatentes exgenas;
(13)una
coeficientes de regresin de las variables endgenas sobre las variables endgenas; es
matriz mn que contiene los coeficientes de regresin de las variables exgenas sobre las va contiene
los errores de regresin que resultan
(13)2de
riables endgenas; y es un vector m1 que
(14)
(14)
y
K1 E12
K2 J 12
[ 2 daz
J 13[ 3 ]1
miguel
ruiz
56
K2
E 21K1 J 21[1 ] 2
(11)
(12)
predecir las variables endgenas a partir de las exgenas. Se asume que las variables latentes
contenidas en y no estn correlacionadas y cualquier relacin entre ellas debe de estar
contenida en los pesos de regresin correspondientes. Adems, se asume que la matriz no
es singular.
K1 E12 K2 J12 [ 2 J13[3 ]1
(12b)
En algunos textos, la ecuacin
E21estructural
K1 K2 J 21(13)
[1 se
] 2expresa de manera ligeramente diferente, reorganizando los trminos para que las variables endgenas figuren sin coeficientes en el
lado izquierdo de la ecuacin. De manera que
h = bh +x +
(14)
Ejemplo 5
(14)
Veamos de manera explcita las matrices que genera el modelo del ejemplo 4. El modelo
estructural matricial es
[1
E12 K1 0 J 12 J 13 ]1
1
[ 2
(15)
(15)
1 K2 J 21 0
0 ] 2
E 21
[
3
0
G1
x1 O11 0
ecuaciones
por las
est definido
medida
Mientras que el modelo de
00 [1 G12
x12 OO1121 00
xxx231 OO02111 O0032 00 [12 GGG231
xx42 O0021 OO042 00 [[[31 GG 42
32
2 3
3
x
0
O
x
0
0
O
x453 0 O 4232 053 [[32 GGG453
xxx4 00 O0
0 [ 3 GG4
42 x O 53
5
5
x
0
0
O
53
x 5
G 5
x y
1
y12
yyy231
yyy 2
3
y
y 3
(16)
(16)
(16)
(16)
H
O11 x0
K1 1
O011 O022 H12
(17)
K
032 12 HHH31
O0011 OO22
KK1 2
(17)(17)
00 OO 222 HH 2
y 32 K
3
(17)
0 O 2 H
y 32 3
y
Las matrices que faltan para completar ely modelo son: la matriz de varianza covarianza
entre las variables latentes exgenas,
I11
(18)
II1121 I 22
I2232 I33
11 I
(18)(18)
III2131
(18)
II 21 II 22 I
31
32
33
trminos
la matriz
de varianza-covarianza entre los
de
error
de las variables latentes endge
I
31 I32 I33
nas
\
11
\1121 \ 22
\
\
\ 2111 \ 22
\ 21 \ 22
(19)
(19)
(19)
11
II21
II 11
21
31
I
21
31
I
31
I 22
II32
I33
22
I32
I33
22
I32 I33
\11
\21
\ 22
11
\
\
\ 22
21
11
\
21 \ 22
(18)
(18)
(18)
57
(19)
(19)
(19)
(19)
la matriz
de varianza-covarianza de los errores de medida de las variables independientes
T G 11
T0G 11 T G
22
G T00G 11 T0G 22 T G 33
(20)
(20)
G 00 T00G 22 T0G 33 T G
(20)
44
G 00
(20)
00 T00G 33 T0G 44 T G 55
0
0
0 T0G 44 T G 55
0
0
0
0 T G 55
11
H T0H 11 T H 22
(21)
(21)
H T00H 11 T0H 22 T H
(21)
33
H 0 T0H 22 T H
(21)
33
0 T H 33 de los errores de medida son diaEn este ejemplo las matrices de varianzas-covarianzas
0
gonales, ya que no se hipotetiza ninguna relacin entre las variables observables que no sea
3
debida al modelo de las variables latentes.
3
TIPOS DE RELACIONES
En las tcnicas multivariantes estamos acostumbrados a estudiar la relacin simultnea
de diversas variables entre s. En estas tcnicas las relaciones entre variables dependientes e
independientes son todas del mismo nivel o de las mismas caractersticas. En un modelo de
ecuaciones estructurales podemos distinguir distintos tipos de relaciones. Entender estos distintos tipos de relaciones puede ser de gran ayuda a la hora de formular los modelos a partir
de las verbalizaciones en lenguaje comn. A continuacin vamos a discutir estos tipos de
relaciones, siguiendo el esquema propuesto por Saris y Stronkhorst (1984).
Covariacin vs Causalidad
Decimos que dos fenmenos covaran, o que estn correlacionados, cuando al observar
una mayor cantidad de uno de los fenmenos tambin se observa una mayor cantidad del
otro fenmeno que covara con el primero. De igual forma, a niveles bajos del primer fenmeno se asocian niveles bajos del segundo. As, por ejemplo, cuando decimos que inteligencia y rendimiento correlacionan entre si, esperamos que los sujetos con un mayor nivel de
inteligencia manifiesten un mejor rendimiento y viceversa. Sin embargo, ya hemos enfatizado que covariacin y causalidad no son la misma cosa. Cuando se observa una alta relacin
(covariacin) entre dos variables, no debemos interpretarla como una relacin causal entre
ambas. Pueden existir otras variables que no hemos observado y que potencien o atenen
esta relacin. Por ejemplo, en la relacin existente entre inteligencia y rendimiento, es esperable que exista tambin la influencia positiva del tiempo dedicado al estudio sobre el rendimiento y el nmero de horas de estudio puede afectar a la relacin de la inteligencia con el
rendimiento (potenciando o atenuando la relacin original). Un ejemplo tal vez ms claro es
el propuesto por Saris. Si recolectamos datos sobre el nmero de vehculos y el nmero de
58
X
G
6. Modelo
de la satisfaccin
Otro nivel Figura
de anlisis
es laestructural
causalidad.
Si recogemos informacin Ysobre el Hnmero
de
O
J
fumadores en una habitacin y la
cantidad
[ de humo
la habitacin, observaremos
existente en
O
G covariacin
X O entre
que existe una alta
ambas variables. Parece razonable dar un paso ms en
G
X
H la canla interpretacin
del resultado
de la covariacin y argumentar,
que
Y
K
O
Oconceptualmente,
J
[
tidad de fumadores causa la cantidad
de
humo
y
que
los
cambios
en
la
cantidad
de
fumadoO I
H
Y
I
res causarn un Gcambio en la cantidad de humo observada en la habitacin.
X
E K
O la covariacin observada
X
perspectiva
desde
a laO]causalidad
atribuida a dos
El cambio Gde
I
H buena
Y
variables lo lleva a cabo elIinvestigador,
que es quien hipotetiza
Es una
E la causalidad.
[
Eexplcitos respecto
costumbre que las verbalizaciones, o enunciados,
sean
al tipo de relacin
]]
G
X dos Ovariables.
que deseamos Gprobar
entre
Ejemplo 6
G
X
O
I[
J
E
K
O
] Y
H
I en este
Los ejemplos que hemos
expuesto
apartado pueden representarse
mediante la
Y
H
J aqu.K
X
G
representacin grfica
que
hasta
hemos desarrollado
O
[
[
O
Figura 7. Relacin de covariacin
Figura 7. Relacin de covariacin
Inteligencia
Rendimiento
Inteligencia
Rendimiento
8. Relacin
de tipo causal
Por elFigura
contrario,
la relacin
causal entre el nmero de fumadores y la cantidad de humo
la representaremos como un vector que apunte de la causa hacia el efecto.
N de fumadores
Cantidad de humo
Figura 8. Relacin
de tipo causal
Figura 8. Relacin de tipo causal
N de fumadores
Relacin esprea
Cantidad de humo
Inteligencia
Una relacin causal bsica o una relacin de covariacin involucran a dos variables.
al menos tres variables. Una relacin
En una relacin esprea la relacin debe comprender
Inteligencia
Edad
esprea se refiere a la existencia de covariacin entre dos variables que es debida, total o parcialmente, a la relacin comn de ambas variables con una tercera. Por tanto, mientras que
la covariacin entre dos variables
puede ser muy elevada, su relacin causal puede ser nula.
Edad
Estatura
El ejemplo tpico es la covariacin entre estatura e inteligencia en preescolares. Si medimos
ambas variables a nios de preescolar es muy posible que encontremos una alta covariacin
entre ellas, sin embargo, a nadie se le ocurrir plantear
que la estatura causa la inteligencia.
Estatura
variables
Existe una tercera variable, el desarrollo del nio (la edad) que es causa de ambas 53
y que hace que se observe la covariacin. Grficamente se puede representar de la siguiente
forma.
53
N de fumadores
Cantidad de humo
introduccin a los modelos de ecuaciones estructurales
59
Inteligencia
Edad
Estatura
Inteligencia
Esfuerzo
Rendimiento
El efecto
entre
la variable
Inteligencia y el Rendimiento puede ser potenciado
Figuraindirecto
11. Relaciones
directa
e indirecta
(o atenuado) por la variable moduladora Esfuerzo.
La existencia de un efecto indirecto entre dos variables no anula la posibilidad de que
tambin exista un efecto
directo entre ellas. As, el ejemplo
Inteligencia
Esfuerzo que acabamos de utilizar puede
hacerse ms complejo de la siguiente forma.
Rendimiento
Inteligencia
60
Esfuerzo
Rendimiento
Inteligencia
Esfuerzo
Inteligencia
Esfuerzo
Rendimiento
Rendimiento
Una vez ms, ser el investigador quin debe explicitar el tipo de relaciones que su teo12. Relacin causal recproca
ra es capaz deFigura
justificar.
Figura 11. Relaciones directa e indirecta
Rendimiento
La relacin causal entre dos variables puede ser recproca o unidireccional. Cuando la
Esfuerzo
Figura 13.Inteligencia
Relacin causal la
condicionada
variable causa es a su vez efecto de la otra. Este tipo
relacin es recproca
Figura 10.(bidireccional)
Relacin causal indirecta
de relaciones se representa como dos flechas separadas orientadas en sentidos contrarios.
Permiso
paradefumar
Una relacin recproca es en definitiva
un bucle
retroalimentacin entre dos variables. La
relacin causal recproca
puede ser directa o indirecta,
otras variables antes de
Inteligencia
Esfuerzo implicando aRendimiento
cerrase el bucle.
Rendimiento puede representarse como
La relacin entre niveles altos de Ansiedad y el Rendimiento
un bucle recproco. A mayor ansiedad peor ser el rendimiento y cuanto ms empeore el ren11. Relaciones
directa e indirecta
dimiento msFigura
aumentar
la ansiedad.
N de fumadores
Cantidad de humo
Figura 12. Relacin causal recproca
Inteligencia
Esfuerzo
Rendimiento
Figura 14.Ansiedad
Modelo factorial de un factor con tres
indicadores
Figuracondicionada
Relacin causal
Relacin causal
x1 condicionada O1 1
G13.
1
Existen situaciones en las que la presencia (o valor) de una variable puede determinar la
Permiso para fumar Rendimiento
existencia de relacin entre otras dos
variables.O Este tipo de relaciones se denomina relacin
21
causal condicionada
y,
aunque
conceptualmente
asumibles, son[1difciles de formular en un
x2
G2
modelo causal. Una variable condicional determina el tamao del efecto existente entre otras
1
dos variables.Figura
Por ejemplo,
en causal
el ejemplo
de laO3relacin
entre el nmero de fumadores y la
12. Relacin
recproca
cantidad de humo existente en la habitacin, esta relacin podr observarse si est permitido
x3 contrario es difcil que a los fumadores se les llegue a perfumar en espaciosG3cerrados, caso
N de fumadores
Cantidad
de humo
Ansiedad
Rendimiento
mitir crear cantidad alguna de humo. Grficamente es fcil distinguir este tipo de relaciones
de las relaciones indirectas. En nuestro ejemplo,
Figura 13. Relacin causal condicionada
54
G1
x1
G2
x2
O1 1
O2 1
N de fumadores
O3 1
[1
Cantidad de humo
x3
G3
G1
x1
O1 1
54
61
62
y1
y2
21
0 1
1 0
0 0,
11
E21 0 0 0 , 0I
0 \ 22 , I11
0 0 0 \ 22
, I11
0 \ 22
]2
]2
]2
(22)
(22)
(22)
(22)
(23)
(23)
(23)
(23)
63
Donde se asume que COV(2, x1)=0, y algunos de los parmetros han sigo fijados a valores especficos (constantes) de 0 y 1.
El nmero de ecuaciones posibles es igual a n(n+1) = 3(3+1)=6 y el nmero de
parmetros por estimar es 3. El modelo cumple la condicin necesaria de identificacin.
Si no hubiramos impuesto restricciones sobre los parmetros, el nmero de parmetros
por estimar hubiera sido 8 (ya que, por definicin, 12=21 y 11=22= 0) y el modelo no
estara identificado.
Sin embargo, el hecho de que se cumpla esta regla necesaria para la identificacin no
quiere decir que las ecuaciones permitan obtener soluciones nicas para los parmetros.
Deben cumplirse otras condiciones suficientes para que los parmetros estn completamente
identificados. Por ello, conviene no plantear el problema de la identificacin desde la perspectiva del modelo global, sino ms bien desde la perspectiva de cada parmetro. Dado un
modelo particular, algunos de los parmetros pueden estar sobre-identificados, mientras que
otros pueden estar infra-identificados. A partir de la igualdad =(), Bollen (1989) plantea
la identificacin de una manera ms completa:
Si un parmetro desconocido de la puede ser expresado como una funcin de uno o ms
elementos de , ese parmetro estar identificado. Si todos los parmetros desconocidos de
estn identificados, entonces el modelo est identificado. (Pgina 89).
Una manera distinta de ver la identificacin es considerando dos vectores de parmetros, de dimensiones t1, 1 y 2, cada uno de ellos conteniendo valores particulares de .
A partir de ellos se pueden desarrollar las matrices de varianza-covarianza implcitas (1) y
(2), para cada una de las soluciones del vector. Si el modelo est identificado, todas las soluciones de 1 y 2 en las que (1)=(2), debern tener 1=2. Si existe un par de vectores
1 y 2 que cumplan que (1)=(2) mientras que 12, entonces no estar identificado.
Como ya hemos comentado, comprobar algebraicamente la identificacin, mediante
el desarrollo de las ecuaciones correspondientes, es prcticamente inviable, especialmente
cuando el modelo es suficientemente complejo o cuando el nmero de variables contenidas
en la matriz de varianza-covarianza es elevado. Para evitar este paso se aplican algunas reglas para tipos particulares de modelos que aseguran la identificabilidad. A continuacin se
mencionan dos de ellas.
Una regla suficiente de identificacin es la de nula. Cuando en un modelo las variables endgenas no influyen unas sobre otras la matriz = 0. Se puede demostrar que estos
modelos siempre estn identificados, asumiendo adems que no existen errores de medida y
que no existe correlacin entre las variables endgenas (xi) y los errores del modelo (j).
Otra regla suficiente es la de los modelos recursivos. Para un modelo recursivo la matriz
ser triangular y la matriz ser diagonal, si esto es as, el modelo estar identificado. En
ocasiones, para los modelos recursivos, es necesario reordenar las variables endgenas para
comprobar que estas reglas se cumplen. Esta condicin es suficiente pero no necesaria.
Existen otras reglas similares a estas, como la condicin de orden y la condicin de rango, cuya revisin excede el propsito de esta monografa. Para una exposicin ms detallada
consltese Bollen (1989), Fox (1984), Blalock (1971) o Bekker y Pollock (1986).
Memorizar estas reglas carece de sentido, y comprobar la aplicabilidad de algunas de
ellas puede resultar bastante complejo. La manera ms frecuente de proceder, por parte de
los analistas, es someter el modelo a su estimacin mediante los programas al uso y dejar
que estas reglas sean comprobadas directamente por el programa. Aunque no sea un proce-
Inteligencia
Esfuerzo
Rendimiento
64
Inteligencia
Esfuerzo
dimiento muy ortodoxo, s resulta tremendamente eficaz. Si a pesar de haber realizado una
especificacin cuidadosa y detallada del modelo, antes de su implementacin en el programa de estimacin, el resultado es que el modelo no est debidamente identificado, la manera
de proceder ms aconsejable es establecer restricciones sobre el modelo para de esta forma
ganar grados de libertad. Este proceso es lo que se ha denominado correccin terica o calieliminan aquellos efectos que no
bracin de la teora (Theory trimming). En este proceso se Rendimiento
son significativos desde un punto de vista conceptual o estadstico, por ejemplo, a partir de
los coeficientes de regresin. El problema que puede surgir es que los datos puedan dictar el
Figura
12. Relacin
causal recproca
modelo y no la propia
teora.
Otra posibilidad
es comenzar con submodelos sobreidentificados y contrastar la prdida de ajuste a medida que se van liberando parmetros.
Ansiedad
de
estimacinRendimiento
siguen procedimientos numEn cualquier caso, dado que
1 los programas E
21
ricos iterativos para encontrar la mejor estimacin de los parmetros, es una buena costumx11
y2
]2
Ey211 de cada parmetro
bre comprobar queFigura
el proceso
de estimacin
ha seguido
una trayectoria
13. Relacin
causal condicionada
montona, sin grandes
cambios bruscos
de unos valores
a otros,]antes
de
converger
en la
x1
y1
y2
2
solucin final (por ejemplo a travs de lasPermiso
derivadas
parciales
de
los
parmetros
aislados).
para fumar
Ejemplo 8
y1 x1
(22)
En este ejemplo se estudia cmo identificar
y 2 E 21 y1 un
] 2 modelo de medida con un solo factor
y
x
1
latente. En el ejemplo se utiliza un1 recurso
muy frecuente en la identificacin de
(22)los modelos
N deuna
fumadores
Cantidad
de
humo
y 2 lasEsaturaciones
y
]
que consiste en establecer
de
con
el
valor
unitario.
21 1
2
(23)
(23)
O3 1
x3
G3
La matriz de varianzas-covarianzas
para las tres variables observables es la
VAR x1
poblacional
54
siguiente:
,
VAR
xCOV
x
x
x
(24)
VAR
2
1
2
1
x3 , x2 VAR
x3
, x1 xCOV
COV x2 ,COV
x1 x3VAR
(24)
2
(24)
COVx , x COV x , x VAR x
3
1
3
2
3
La matriz de varianza-covarianza implcita (en diferenciales) tendr la forma general
E xxc
E xxc
E > x c cx c@
E > x c cx c@
x E ccx G
x E ccx G
xcx G
xcx G
(25)
(25)
(25)
G1
x1 Ode
introduccin a los modelos
estructurales
11[1ecuaciones
x2
65
O 21[1 G 2
x3 de
O 31[un
G3
Las ecuaciones estructurales del modelo
con tres indicadores, as como los
1 factor
(26)
supuestos del modelo son las siguientes:
COV[1 , xG1i O011, [1 para
G1 i 1, 2, 3
COV G i , xGx2j OO021, [[1 para
GG2 i z j
1
11 1
los parmetros
para
xG1 2
G 110
VAR G 2
0
x xxG2 3
x 210
0[
GI311
VAR
1
11
x xx32
x 3121
[
I11
(27)
VAR
0
0
G
G
31 1
x13
(27)
(27)
GG2 G VAR
0 G VAR0G 2
00
1
1
G
0 las matrices
0
VAR G3 en 27, obtenemos la
varianzas-covarianzas
contenidas
con
3 implcita,
Sustituyendo
la frmula
25,losque
determina
la construccin de la matriz de variansiguiente en
matriz
funcin de
parmetros
estructurales
zas-covarianzas
implcita,
con
las
matrices
contenidas
en 27,
obtenemos ladesiguiente
Sustituyendo en la frmula 25, que determina
la construccin
la matrizmatriz
de
funcin de los parmetros estructurales:
Sustituyendo en implcita,
la frmulacon
25, las
que matrices
determinacontenidas
la construccin
la matriz de
varianzas-covarianzas
en 27,deobtenemos
la
O211I11 implcita,
VAR G1 con las matrices contenidas en 27, obtenemos la
varianzas-covarianzas
2
(28)
siguiente matriz funcin
de
los
parmetros
estructurales
O 31O11I11
O 31O 21I11
O 31I11 VAR G 3
(28)
O211I11 de
2
2
O
O
I
O
I
G
VAR
O Ide21laVAR
conjunto de 6 (28)
bles (24) con los trminos
(28) obtenemos
el siguiente
11 matriz
11 G implcita
21 11
2
1
11 O11 O I
2
2 O O I
ecuaciones
O
I
G
VAR
21 11 G
31 11
3
O3121O1111I1111
O 21I1131 VAR
(28)
2
2
2
x
O
I
G
VAR
VAR
O
O
I
O
O
I
O
I
G
VAR
11
1 31 11
31 11 11
31 1121 de
11 varianzas-covarianzas
3 de
los elementos
las variables
Igualando
de1 la matriz
2
G 2 (28) obtenemos el siguiente
VAR x2 de Ola
21Imatriz
11 VAR
observables (24) con los trminos
implcita
2
conjunto de 6 ecuaciones VAR x3 O 31I11 VAR G 3
(29)
Igualando los elementos
de
la
matriz
de
varianzas-covarianzas
de
las
variables
COV x2 , x1 O 21O11I11
(29)
Igualando
de la
matriz
de varianzas-covarianzas
de las
variables
observables
(24) los
conelementos
losCOV
trminos
de
la
matriz
implcita
(28)
obtenemos
el
siguiente
x3 , x1 O 31O11I11
observables
con los trminos de la matriz implcita (28) obtenemos el siguiente
conjunto
de 6(24)
ecuaciones
COVx3 , x2 O 31O 21I11
conjunto de 6 ecuaciones
5
Con
lo
que
disponemos
de
6
ecuaciones
y
7
incgnitas.
El
sistema
no
est
Con lo que disponemos de 6 ecuaciones y 7 incgnitas. El sistema no est determinado.
Para poder obtener una solucin para los parmetros, debemos imponer al menos una resdeterminado. Para poder obtener una solucin para los parmetros, debemos imponer al
triccin. Habitualmente se acostumbra a fijar una de las saturaciones a 1 o bien fijar a 1 la
menos una restriccin. Habitualmente se acostumbra a fijar una de las saturaciones a 1 o
bien fijar a 1 la varianza del factor latente cuando se trabaja con la solucin
estandarizada (y por ello con la matriz de correlaciones).
5
5
determinado.
determinado. Para
Para poder
poder obtener
obtener una
una solucin
solucin para
para los
los parmetros,
parmetros, debemos
debemos imponer
imponer al
al
menos
menos una
una restriccin.
restriccin. Habitualmente
Habitualmente se
se acostumbra
acostumbra aa fijar
fijar una
una de
de las
las saturaciones
saturaciones aa 11 oo
bien
bien fijar
fijar aa 11 la
la varianza
varianza del
del factor
factor latente
latente cuando
cuando se
se trabaja
trabaja con
con la
la solucin
solucin
66
miguel ruiz daz
estandarizada
estandarizada (y
(y por
por ello
ello con
con la
la matriz
matriz de
de correlaciones).
correlaciones).
varianza del factor latente cuando se trabaja con la solucin estandarizada (y por ello con la
Imponiendo
la
= 1, la matriz de varianzas-covarianzas implcitas se
Imponiendo
la restriccin
restriccin OO11
11 = 1, la matriz de varianzas-covarianzas implcitas se
matriz de
correlaciones).
Imponiendo
la restriccin 11=1, la matriz de varianzas-covarianzas implcitas se simsimplifica
aa la
simplifica
la siguiente
siguiente
plifica a la siguiente
II1111 VAR
VARGG11
2
2
OO21II11
OO21II11 VAR
GG2
VAR
21 11
21 11
2
2
2
OO31II11
OO31OO21II11
OO31II11 VAR
VARGG33
31 11
31 21 11
31 11
(30)
(30)
(30)
Dando
lugar
las
siguientes
Dando
ecuaciones,
Dandolugar
lugaraaalas
lassiguientes
siguientes ecuaciones,
ecuaciones,
VAR
VARxx11 II1111 VAR
VARGG11
2
VAR
VARxx22 OO22121II1111 VAR
VARGG22
2
VAR
VARxx33 OO23131II1111 VAR
VARGG33
(31)
(31)
(31)
COV
COVxx22,, xx11 OO2121II1111
COV
COVxx33,, xx11 OO3131II1111
COV
COVxx33,, xx22 OO3131OO2121II1111
Operando
se
obtiene
siguiente conjunto
de
soluciones,
Operandose
seobtiene
obtiene el
el
dede
soluciones,
Operando
el siguiente
siguienteconjunto
conjunto
soluciones,
66
O 21
COV x2 , x3
COV x3 , x1
O 31
COV x2 , x3
COV x2 , x1
I11
COV x2 , x1 COV x3 , x1
COV x3 , x2
(32)
(32)
cI
y1
x1 ]1
I 1
(33)
(34)
(32)
(32)
(32)
(32)
2
1'
1
I 1 VAR
c G21 I VAR
x2I O21 I
(33)(33)
1'
cVAR
I G VAR x O2I
3
3
31
I 1 c 1 I 1' I 1
Si el modelo es correcto
poblacionales
son1conocidos,
entonces(33)
ser
y los parmetros
1
1
1'
1' I
c
c
I '
igual a ().
(33)
1
cI
y x ]
(34)
Ejemplo 9
I 1 c1 11 I 1 1' I 1
(33)
1'
cI
y1 x1 ]1
(34)
yy11 = xx11 + ]x11
(34)(34)
VAR ( y1 ) COV ( y1 , x1 )
La matriz de varianza-covarianza
(35) las
Donde 11 ha sido fijadoa 1.
poblacional para
VAR ( x1 )
COV ( x1 , y1 )
variables y1 y x1 es
y1 x1 ]1
(34)
VAR ( y1 ) COV ( y1 , x1 )
(35)
VAR ( y ) COV ( y , x )
VAR (1x1 )1
(35)
COV ( x1 , 1y1 )
(35)
VAR ( x1 )
COV ( x1 , y1 )
I \11 I11
y la matriz implcita en funcin de los
es ( y1 , x1 )
parmetros
( y111) COV
(36)
VAR
(35)
I11
I11
VAR ( x1 )
COV ( x1 , y1 )
I11 \11 I11
(36)(36)
I \
I
(36)
11I11 11 I1111
I11
I11
Asumiendo que el modelo es correcto y que los parmetros poblacionales son conocidos, cada elemento de deber ser igual
de la misma posicin de ().
\ elemento
I
I acada
11 11 11 ya que es igual, simultneamente
(36) a
sobreidentificado,
Obsrvese que el parmetro 11 est
I11
I11
y1 ) que
cov(
var(
COV(x1, y1) y a VAR(x1). Eso no quiere
decir
el yparmetro
tome dos valores diferentes,
1 , x1 )
(37)
S
sino que, en la poblacin la varianza cov(
de x1
y
la
covarianza
deben
ser iguales.
x1 , y1 )
var( x1 )
cov( y1 , x1 )
var( y1 )
S
var( x1 )
cov( x1 , y1 )
(37)(37)
7
La cual tomar valores concretos para una muestra dada.
7
A continuacin deberemos seleccionar valores para los parmetros del modelo, 11
y
\
I
I
\ 11
68
I11
I \ 11 I 11
(38)
11
I11 I\1111 I 11I 11
(38) (38)
I 11 \ 11 I11
II1111
(38)
I11
II1111\ \
I 11
11
11
(38)
(38)
I 11 I 11\ 11 II1111
I I 11
(38)
I
I11
11
I
Igualando la matriz implcita a la matriz
muestral
I 1111 obtenemos el siguiente conjunto de
I 11\
11 I 11
ecuaciones:
(38)
11
var(
y1I)11 I11 I\1111
var(
(39)(39)
var(
y1x)1 ) I 11I 11 \ 11
var( y1 ) I 11 \11
cov(
y1xy,11x)y)11) II1111
I1111
var(
(39)
var(
var(
\ \
11
11
var(
var(yx11)) II1111 \ 11
(39)
cov(var(
yvar(
x)1 ) II1111I 11
(39)
(39)
1 , xx11)
var(
x
)
(39)
I
El problema de la estimacin es cov(
ahora
y1 ,obtener
x1 ) I1111 unos
valores adecuados para los parme 11
11
11 \
cov(
cov(
yvar(
x,1xy)111)) I 11II
1y,1parecida
a la matriz S.
tros del modelo, de forma que sea lo
ms
posible
cov( y1 , x1 ) I11
var( x1 ) I11
(39)
Ms adelante comentaremos los mtodos posibles para estimar los valores de los par6
cov( y1 , x110
) I 11
matriz de covarianza muestral
metros. Por ahora, a modo ilustrativo, supongamos
que la
S
(40)es
6 6 4
10
S 10 6
(40)
610 466
S10
(40)
(40)
(40)
SS 106 64
(40)
S 6 6 4 4
(40)
6 4
10
6
S3 7 estimaciones
3 para
Adems, hemos decidido que las mejores
posibles son 7 para I11 y (40)
7
10
7
6
4
\ 11 . Por tanto, la matriz de covarianza
ser
implcita
(41)
7 7
7
7 37 7 7 10
7 3 7 10 7
(41)
710 777
(41)
777 3 3 777 10
(41)
(41)
7 73 77 107 77
(41)
7 7 7 7 7 7 7 7
(41)
7 7
77 3 77 10
7 los residuos obtenidos de intentar
(41)
710 por
6 la
7 matriz
1
10
07 implcita.
sustituir la matriz de covarianzas muestrales
Esta matriz nos indicar
7
7
S
(42)
lo prximas que se encuentran las matrices
610
7 S 6y
47. 7En
nuestro
01 13caso:
10
S 10 10 6 7 0 1
(42)
710
10 466777 010 311
SS10
(42)
610
(42)
(42)
SS 106107 6477 01 13
(42)
(42)
6
7
4
7
1
3
6
7
4
7
1
3
6 7 4 7 1 3
10
10 hemos
6 7 utilizado
que
0 1permiten
S
(42)
10
57
(43)
5 5
mando su valor.
5
10
10 5
(43)
Supongamos ahora que las estimaciones
510que
555 seleccionamos para los parmetros
10
(43)son
55 estos parmetros es
(43)
\ 11implcita reproducida
I11 =5 y \ 11 = 5. La matriz
105 por
(43)
5 5 5 5
(43)
5 5
10
5
(43)
(43)
0
1
5
5
S
(44)
0 1 11
S
(44)
Aunque en este caso el ajuste tampoco es 1perfecto,
el nuevo conjunto de valores para
1
los parmetros parece que dan lugar a un mejor ajuste a la matriz S.
8
Cuando las matrices que se desea comparar son de reducidas dimensiones, como8en el
ejemplo, la matriz residual ofrece una sensacin bastante clara de la bondad de las estima8
88
ciones de los parmetros que se seleccionan en cada ocasin. Sin embargo, es ms frecuente
8
utilizar una funcin que d como resultado un nico escalar y que resuma el ajuste de todos
8
\ 1
69
log 6 tr S
FML
1
log S ( p q)
(45)
(45)
Es fcil demostrar que esta funcin de ajuste cumple la tercera propiedad del apartado
anterior. Si S=(), la funcin FML se reduce a
FML
log S tr I log S ( p q )
(46)
(46)
como tr(I)=p+q, entonces FML toma el valor cero. Luego la funcin de hecho alcanzar un
2
valor de cero slo cuando el ajuste Fes perfecto.
1
(47)
2 tr S 6 T
ULS
Una vez definida la funcin de ajuste el problema se centra en obtener un mnimo absoluto para la funcin. Para ello bastar con obtener las derivadas primera y segunda respecto
al vector de parmetros . Sin embargo, obtener analticamente estas derivadas puede ser
2
1
se recurre
a mtodos numricos de estimacin.(47)
Es decir,
prcticamente imposible, por lo queFULS
2 tr S 6 T
2
1
1
mtodos que de manera iterativa
van
sustituyendo
los
valores
de
los
parmetros
por
valores
FGLS
(48)
`
2 tr ^ S 6 T W
tales que la funcin se aproxime rpidamente a su mnimo. Algunos mtodos numricos de
>
>
>
El trmino Mxima verosimilitud se expresa en Ingls como Maximum Likelihood que, abreviado, se acostum2
bra a escribir como ML.
1
1
FGLS
tr
>^ S 6 T W ` @
FML S, log tr S
1
log S ( p q)
(48)
(49)
70
FML
log S tr I log S ( p q )
(46)
Adems del mtodo de mxima verosimilitud existen otros mtodos de estimacin que
son utilizados con cierta frecuencia.
El mtodo de mnimos cuadrados no ponderados (Unweighted Least Squares, ULS) utiliza como funcin de ajuste la funcin:
FULS
1
2
>
tr S 6 T
(47) (47)
>
FML S, log tr S
1
log S ( p q)
(49)
FML
log S tr I log S ( p q )
(46)
71
estimacin FML y no es invariante respecto a la escala de 2medida, con lo que las soluciones
1
Tvarianza-covarianza
FULS
(47)
obtenidas de analizar la matriz de correlaciones
y la 6de
diferirn.
2 tr S
>
El mtodo de mnimos cuadrados generalizados (Generalized Least Squares, GLS) pondera la funcin de ajuste por los inversos de las varianzas y covarianzas de las variables. Su
funcin de ajuste es
FGLS
1
2
tr
>^ S 6 T W ` @
1
(48)
(48)
donde la matriz W es una matriz de constantes o cualquier matriz positiva definida. La eleccin ms habitual es W-1=S-1. Cuando W-1= I, FULS es un caso particular de FGLS. Este mtodo
de ajuste es preferible cuando la distribucin de las variables observadas se desva de la normalidad.
FGLS es invariante respecto a la escala y da lugar a1 estimaciones consistentes de distribu permite
FML S, conocidas,
log trloSque
log S realizar
( p q ) contrastes estadsticos
(49)
cin multinormal con covarianzas
sobre los valores de los parmetros. Cuando la distribucin de las variables observables es
demasiado apuntada o demasiado aplanada (leptocrtica o platicrtica, respectivamente)
la estimacin de los errores tpicos de estimacin puede ser inadecuada y el estadstico de
Esto es debido a que la matriz de varianbondad de ajuste global puede ser inapropiado.
FML obtencin y, caso de encontrarnos
X 2 esNde
1difcil
(50)
za-covarianza asinttica de los estimadores
distribuciones anmalas, la derivacin de los errores tpicos puede ser incorrecta. Si este es
el caso, puede estimarse la matriz asinttica W de manera externa al propio programa de estimacin (por ejemplo con el programa prelis) y utilizar esta estimacin previa en el proceso
1
log 6 tr S 1 log S 2( p q)
(45)
de estimacin de la funcinFML
de ajuste.
tr[ (T)S I ]
1
GFI ML
(51)
2
tr[ 1 (T)S ]
ESTADSTICOS DE BONDAD DE AJUSTE
>
1
de
tr log
(STlos
)(Sparmetros
FML una
log S
tr I
p q )
(46)
Una vez que se ha obtenido
estimacin
del modelo se debern
GFIULS
(52)
1
2
efectuar diagnsticos sobre la adecuacin de la solucin
tr S y la bondad del modelo.
2
En cuanto a la adecuacin de la solucin, se debe comprobar la significacin de los parmetros estimados y las propiedades de las estimaciones. As por ejemplo, se debe comprobar que no existen casos Heywood, es decir, parmetros que toman valores impropios, como
puedan ser varianzas negativas o correlaciones mayores que 1 o menores que -1. Tambin
2
ser sintomtico un parmetro estimado con
un signo contrario
al esperado por la teora que
1
FULS
(47)
2 tr S 6 T
justifica el modelo.
>
>
Chi-cuadrado
El estadstico de bondad de ajuste chi-cuadrado es una derivacin directa de la propia
funcin de ajuste de mxima verosimilitud.
FML S, log tr S
X2
1
log S ( p q)
N 1FML
(49)
(49)
(50)
FULS
FULS
72
tico.
1
21
2
>>
@@
tr S 6T 2
tr S 6 T
2
>>^^
(47)
(47)
`` @@
1 2
1
FGLS
(48)
21 tr S 6 T W 1
FGLS
tr
S
6
T
W
(48)
2
Ponderando la funcin de ajuste por el tamao muestral se obtiene el siguiente estads2
X2= (N 1) FML
(50)
GFI
Jreskog y Srbom (1986) propusieron los estadsticos GFI (Goodness of Fit Index, Estadstico de bondad de ajuste) y AGFI (Adjusted
of Fit Index, Estadstico de bondad
X 22 N Goodness
(50)
N 11FFML
X
(50)
ML
de ajuste corregido).
Los estadsticos de bondad de ajuste GFI para las funciones de ajuste de mxima verosimilitud y mnimos cuadrados ordinarios son las siguientes:
GFI ML
GFI ML
tr[ 11(T)S I 2]
1 tr[ (T)S 2I ]
1 tr[ 1 (T)S 2]
tr[ 1 (T)S ]
>>
(51)
(51)(51)
@@
2
tr 11(T) S 2
GFIULS 1 tr (T)2 S
(52)(52)
GFIULS 1
(52)
tr
S
2
tr S
Estos estadsticos cuantifican la cantidad de varianza y covarianza contenida en la matriz S que es pronosticada por (). Los valores del estadstico GFI son habitualmente muy
elevados y se suele exigir que al menos alcancen el valor 0,9 para ser indicativos de un buen
ajuste.
AGFI
9
9
El estadstico de bondad de ajuste corregido AGFI corrige el estadstico GFI por los grados de libertad del modelo y por el nmero de variables contenidas en el mismo. Este estadstico busca corregir la excesiva benignidad del estadstico GFI.
El estadstico AGFI para las estimaciones de mxima verosimilitud y mnimos cuadrados
ordinarios son los siguientes.
AGFI
AGFI ML
ML
qq qq
11 >1 GFI @
11
1 GFI ML
ML
22 gl
gl
(53)
(53)(53)
AGFI
AGFIULS
ULS
qq qq
11 >1 GFI @
11
1 GFIULS
ULS
22 gl
gl
(54)
(54)(54)
El estadstico AGFI favorece los modelos que, con igual ajuste global, contienen un menor nmero de variables y, por ello, son ms simples. Tanto el estadstico GFI como el AGFI
alcanzan su valor mximo de 1 cuando todos los residuos son nulos.
73
REFERENCIAS BIBLIOGRFICAS
Arbuckle, J. L. (1997). Amos Users Guide. Version 3.6. Chicago: SmallWaters Corporation.
Arbuckle, J. L. & W. Wothke (1999). Amos 4.0 Users Guide. Chicago: SmallWaters Corporation.
Bagozzi, R. P. (1980). Performance and satisfaction in an industrial sales force: An examination of their
antecedents in simultaneity. Journal of Marketing, 44: 65-77.
Bekker, P. A. & D. S. G. Pollock (1986). Identification of lineal stochastic models with covariance restrictions. Journal of Econometrics, 31: 179-208.
Bentler, P. M. (1985). Theory and implementation of EQS: A structural equations program. Los Angeles:
BMDP Statistical Software.
Blalock, H. M., Jr. (Ed.) (1971). Causal Models in the Social Sciences. Chicago: Aldine Publishing Co.
Bollen, K. (1989). Structural Equations with Latent Variables. New York: John Wiley & sons.
Boudon, R. (1965). A method of linear causal analysis: Dependence analysis. American Sociological
Review, 30: 365-373.
Browne, M. W. (1984). Asymptotic distribution free methods in analysis of covariance structures. British Journal of Mathematical and Statistical Psychology, 37: 62-83.
Campbell, D. y J. Stanley (1973). Diseos Experimentales y Cuasiexperimentales en la Investigacin
Social. Buenos Aires: Amorrortu.
Dillon, W. R. & M. Goldstein (1984). Multivariate Analysis: Methods and Applications. New York: John
Wiley & sons.
Duncan, O. D. (1966) Path analysis: Sociological examples. American Journal of Sociology, 72: 1-12.
Fischer, F. M. (1966). The identification problem in Econometrics. New York: McGraw-Hill.
Fox, J. (1984). Linear Statistical Models and Related Methods, New York: Wiley.
Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., Tatham, R. L. (2006). Multivariate Data Analysis
(6th Editiion). Upper Saddle River, NJ: Pearson Prentice-Hall
Johnson, R. A. & D. W. Wichern (1982). Applied Multivariate Statistical Analysis. Englewood Cliffs:
Prentice-Hall.
Johnston, J. (1972). Econometric Methods. New York: McGraw-Hill.
Johnston, J. (1984). Econometric Methods. New York: McGraw-Hill.
Jreskog, K. G. (1973) A general method for estimating a linear structural equation system, pp. 85-112
in A. S. Goldberger and O. D. Duncan (eds.) Structural Equation Models in the Social Sciences.
New York: Seminar.
Jreskog, K. G. (1977). Structural equation models in the social sciences: especification, estimation
and testing. In P. R. Krishnaiah (Ed.), Applications of Statistics. Amsterdam: Noth-Holland, pp.
265-287.
Jreskog, K. G. & D. Srbom (1986). LISREL VI: Analysisi of Linear Structural Relationships by Maximum
Likelihood and Least Squares Methods. Mooresville, IN: Scientific Software, Inc.
Jreskog, K. G. & D. Srbom / SPSS (1988). LISREL 7: A guide to the Program and Applications. 2nd ed.
Chicago, IL: SPSS.
Keesling, W. (1972). Maximum likelihood approaches to causal flow analysis. Ph D. dissertation University of Chicago.
Long, J. S. (1983a). Confirmatory Factor Analysis: A Preface to LISREL. Sage University Paper Series on
Quantitative Applications in the Social Sciences, 007-033. Newbury Park, CA: Sage.
74
Long, J. S. (1983b) Covariance Structure Models: An introduction to LISREL. Sage University Paper series on Quantitative Applications in the Social Sciences, 07-034. Beverly Hills and London: Sage
Pubns.
Long, J. S. (1990). Covariance Structure Models: An Introduction to LISREL. Sage University Paper Series on Quantitative Applications in the Social Sciences, 007-034. Newbury Park, CA: Sage.
MacLeod C. M., R. A. Jackson & J. Palmer (1986). On the Relation between Spatial Ability and Field
Dependence. Intelligence, 10, 141-151.
Saris, W. E. & L. H. Stronkhorst (1984). Causal Modelling in Non-Experimental Research. Amsterdam:
Sociometric Research.
SPSS (1990). SPSS LISREL 7 and PRELIS: Users Guide and Reference. Chicago, IL: SPSS.
SPSS (1993). SPSS LISREL 7 and PRELIS: Users Guide and Reference. Chicago, IL: SPSS.
Warren, R.D., J.K. White & W.A. Fuller (1974). An errors-in-variables analysis of managerial role performance. Journal of the American Statistical Association, 69, 886-893.
Wiley, D. E. (1973) The identification problem for structural equation models with unmeasured variables, pp. 69-83 in A. S. Goldberger and O. D. Duncan (eds.) Structural Equation Models in the
Social Sciences. New York: Seminar.
INTRODUCCIN
El presente trabajo tiene por objeto revisar las principales caractersticas del anlisis
factorial confirmatorio y desarrollar de forma detallada un ejemplo de anlisis con los programas informticos LISREL v. 8.8 (Scientific Software International, 2006), AMOS v. 6.0 (SPSS,
2006) y SAS v. 9.1.3 (The SAS Institute, 2006).
El anlisis factorial confirmatorio (AFC, en adelante) se ha convertido en los ltimos
aos en uno de los procedimientos de anlisis ms utilizados en investigacin en ciencias
sociales. El AFC es un procedimiento de anlisis encuadrado en los modelos de ecuaciones
estructurales (SEM, Structural Equation Models), cuyo propsito se centra en el estudio de los
modelos de medida, esto es, en analizar las relaciones entre un conjunto de indicadores o variables observadas y una o ms variables latentes o factores. Los indicadores pueden ser, por
ejemplo, los tems de un test, las puntuaciones obtenidas por los sujetos en distintas escalas
o los resultados provenientes de instrumentos de clasificacin conductual. A diferencia de lo
que sucede en el anlisis factorial exploratorio (uno de cuyos objetivos tiene que ver con la
determinacin del nmero de factores que subyacen a los datos, y se permite que todos los
indicadores saturen en todos los factores, y que todos los factores estn correlacionados), una
caracterstica esencial del AFC es que el investigador debe concretar de antemano todos los
aspectos relevantes del modelo, aspectos que deben estar slidamente fundamentados en la
teora previa y en la evidencia conocida. As, deben especificarse con anterioridad al anlisis, qu factores y qu indicadores forman el modelo, qu indicadores presentan saturaciones
en cada factor, si existe o no relacin entre los factores, y as sucesivamente. El AFC es, en
consecuencia, una estrategia sumamente til en el mbito de la prueba de hiptesis y la confirmacin de teoras.
En algunas ocasiones, sin embargo, el AFC no tiene un carcter tan estrictamente confirmatorio. Muchas autoridades en la materia (vid., por ejemplo, Arbuckle, 2000; Cribbie, 2007; Hancock, 1999; Loehlin, 2004) han abundado
en la concepcin de los modelos SEM como meramente exploratorios en aquellos casos en que no existen modelos
previos claramente establecidos, ni la teora es suficientemente slida.
76
benito arias
En la Figura 1 se presenta un ejemplo simple de AFC. Los indicadores estn representados por la letra X, los errores de medida por e, y los factores por A y B. La hiptesis puesta a
prueba por el modelo es la siguiente: X1, X2, X3, X4 y X5 miden el factor A; X6, X7, X8, X9 y X10
miden el factor B; ambos factores covaran; los errores de medida son independientes.
Cada indicador (X1-X10) es una variable continua (excepcionalmente ordinal) que tiene
dos causas: por una parte, un factor nico subyacente que el indicador se supone que mide
y, por otra, cualesquiera otras fuentes nicas de causacin que estn representadas por el
trmino de error (e). Los errores de medida son independientes entre s y con respecto a los
factores y todas las asociaciones entre los factores (e.g., correlacin entre A y B) figuran en el
modelo como no analizadas.
Las flechas desde los factores a los indicadores indican los efectos causales (i.e., saturaciones factoriales) de los factores sobre las variables observadas y, en general, se interpretan
como coeficientes de regresin (no estandarizados en la primera figura, estandarizados en la
segunda). Los indicadores que se suponen causados por los factores A y B son variables enFigura 2. Diagrama de flujo con los pasos a seguir en un AFC
dgenas toda vez que son influenciadas (directa o indirectamente) por las variables incluidas
en el modelo, en tanto que los factores son variables exgenas (i.e., son siempre variables
independientes y por tanto no pueden estar influidas por ninguna otra variable del modelo).
Las flechas que vinculan los errores de medida (e1 a e10) con los respectivos indicadores representan el efecto combinado de cualquier fuente de influencia (distinta a los factores) sobre
las variables manifiestas. Puesto que sus causas nos son desconocidas, los errores de medida
se consideran en el AFC como variables exgenas, y reflejan dos clases de varianza nica:
por una parte, el error aleatorio y, por otra, la varianza sistemtica debida a otros elementos
que el indicador mide adems del factor subyacente, tales como los efectos de un particular
mtodo de medida.
CMO LLEVAR A CABO UN AFC: PREPARACIN DE LOS DATOS Y CONDICIONES
PREVIAS
En la Figura 2 (modificada a partir de Boomsna, 2000) se sintetizan los pasos bsicos
36 a
seguir para llevar a cabo un AFC.
77
78
benito arias
Tabla 1. Condiciones necesarias para realizar un AFC
Tabla 1. Condiciones necesarias para realizar un AFC
Condicin
Observaciones
1. Nivel de medida
3. Normalidad y outliers
4. Homocedasticidad
5. Datos perdidos
6. Tipo de relaciones
7. Multicolinealidad
Ausencia de multicolinealidad.
8. Variables relevantes
Modelo supraidentificado.
10.
Nmero
mnimo
observaciones
parmetro a estimar.
menos 4 o 5).
Conviene, una vez preparados los datos para su anlisis, realizar una serie de comprobaciones para evitar problemas potenciales. En la Tabla 1 se sintetizan un conjunto de requisitos
(Arbuckle, 2000; Diamantopoulos y Siguaw, 2000; Hatcher, 2006; Jreskog, 1993; Jreskog
y Srbom, 1996a, 1996b) que deben cumplirse para poder llevar a cabo un AFC relativos al
nivel de medida, nmero mnimo de valores por indicador, distribucin, tipo de relaciones,
multicolinealidad, identificacin del modelo, nmero mnimo de observaciones, nmero de
indicadores por cada variable latente, etc.
Como se pone de manifiesto en las condiciones expresadas en la Tabla 1, el AFC es una
tcnica de anlisis ciertamente exigente. Haremos en los prrafos que siguen algunos comentarios adicionales a lo expuesto en dicha tabla:
1. La exigencia de nivel de medida intervalar o continuo de los indicadores podra atenuarse, de modo que es posible usar indicadores medidos en escala ordinal (como
sucede, por ejemplo, con las escalas probabilsticas sumatorias tipo Likert), si bien en
este caso debera optarse por el uso de mtodos de estimacin apropiados (en ningn
caso ML).
Figura 3. Ejemplo de outliers univariados (aparecen con los signosyen el grfico)
2. Se recomienda que el nmero mnimo de valores de cada indicador sea 4, con el fin
de aumentar la probabilidad de que la distribucin de los datos se acerque a la normalidad.
37 multiva3. La distribucin de los datos debera cumplir con el requisito de normalidad
riada, toda vez que la mayora de los mtodos de estimacin SEM exigen el cumpli
miento de esta condicin. Ello implica que a) todas las distribuciones univariadas son
normales; b) la distribucin conjunta de cualquier par de variables es normal bivariada y c) todos los dispersigramas (scatterplots) son lineales y presentan homocedas-
79
1. Nivel de medida
2. Valores
porde
indicador
indicadores
deberan tener
un mnimo
de 4 valores. los datos (i.e.,
Una
forma
solucionar laLos
falta
de normalidad
consiste
en transformar
las puntuaciones
operacin
matemtica
3. Normalidad originales
y outliers se convierten
Distribucinmediante
normal de una
los datos,
control de
outliers. en nuevos valores 4.
que
pueden
tener
una
distribucin
ms
prxima
a
la
normal).
Las
transformaciones son
Homocedasticidad
Correccin mediante normalizacin o transformaciones.
tiles para el control de outliers. Entre las transformaciones posibles para tratar de remediar la
adecuadoBabin,
de los datos
perdidos.
5. Datos
perdidos
Tratamiento
asimetra
figuran
las siguientes (vid.
Hair, Black,
Anderson,
& Tatham, 2006; Tabach1/2
6. Tipo
de 2001):
relaciones
Relaciones
lineales
y aditivas.
logartmica
(log
X),
o
funcin
inversa
(1/X). Para solventar
nick &
Fidell,
X , funcin
10
1/3
,
funcin
seno,
inversa (e.g., 1/X,
problemas
de
curtosis,
pueden
utilizarse
funciones
como
X
7. Multicolinealidad
Ausencia de multicolinealidad.
2
3
1/Y), o transformaciones polinomiales (X , X ). En trminos generales, se recomienda probar
Variables relevantes
Inclusin dentro del modelo de todas las variables relevantes.
todas8.las
transformaciones mencionadas
hasta llegar a aquella que mejor funcione con una
9. Identificacin
del modelo
Modelo supraidentificado.
distribucin
particular.
Otra alternativa
es utilizar puntuaciones normalizadas (normal scores
directamente
el programa
Desde una
prctica,
podemos
calculadas
10. Nmero
mnimoende
Al menos PRELIS).
150 observaciones,
o perspectiva
5 observaciones
por cada
juzgar el impacto potencial de una transformacin calculando la razn entre la media y la
observaciones
parmetro a estimar.
desviacin tpica de la variable (los efectos de la transformacin sern previsiblemente mayo11. Indicadores
por variable
Preferible
disponer de ms de 2 (lo ideal es disponer de al
res cuando
dicha razn
sea inferior
a 4.00).
latente
o 5).
de los outliers merecemenos
algn4 comentario
adicional. Se trata de casos muy diferenEl caso
Nmero
indicadores extrema
El nmero
mximo
de indicadores
no debera
exceder
de 20-30.
tes al12.
resto
(condepuntuacin
en una
variable),
alejados
en torno
a 3 DT
o ms de la
media.
La
forma
ms
sencilla
de
detectar
outliers
univariados
es
transformar
las
puntuaciones
13. Varianzas relativas
Ausencia de matrices ill-scaled
originales a puntuaciones tpicas (z) y examinar los valores superiores a |3.00| (pueden detectarse
tambin con facilidad construyendo un grfico de caja box-and-whisker para cada
variable). En la Figura 3 puede verse un ejemplo de outliers univariados.
Figura 3. Ejemplo de outliers univariados (aparecen con los signos m y en el grfico)
Los outliers multivariados son casos con puntuaciones extremas en dos o ms variables
(i.e., alejados de la media entre 2 y 3 DT). La deteccin de outliers multivariados es ms
complicada que la deteccin de univariados. En general, se utiliza la distancia de Mahalanobis al cuadrado (D2), que indica la distancia en unidades de DT entre un conjunto de
37
puntuaciones (vector) para un caso individual y las medias de la muestra para todas las va2
2
riables
(centroides). Con muestras grandes, D se distribuye aproximadamente como con
2
tantos grados de libertad como nmero de variables. Un valor de D con un p bajo puede
80
benito arias
18
16
15
14
18
12
19
10
27
6
17 8
2824
10
6
3 9
2 4
11237
25145
2220
13 21
12
26
0
0
6
Cuantil ji-cuadrado
10
12
Figura
4. Ejemplo
de deteccin de outliers
(losaspecto
nmeros corresponden
al nmero
4. La
falta
de homocedasticidad
es multivariados
asimismo un
relacionado
con la normalide caso)
dad multivariada, y una forma sencilla
y til de evaluarla es mediante el examen de
dispersigramas
bivariados. La heterocedasticidad puede ser causada por una falta de
normalidad en X o Y, de modo que existe ms error aleatorio en unos niveles de X o
Y
que en otros (por ejemplo, una prueba de habilidad cognitiva podra ser fiable en
sujetos con nivel alto y no fiable en sujetos con nivel bajo). La forma ms frecuente
2. Ejemplo de matriz de es
observaciones
(varianzas
fondo gris)
de corregirTabla
la heterocedasticidad
llevar a cabo
unaentransformacin
de las puntuaX2
X3
X4
X5
X1
ciones (e.g. normalizacin en PRELIS). Debe advertirse, sin embargo, que esta estraX1
V11
tegia puede ser tilXpara corregir
la heterocedasticidad debida a la no normalidad,
V 22
V 21
2
pero no resultar tan
corregir
X3 til Vpara
V 32
V 33la heterocedasticidad debida a fiabilidades
31
diferentes en X e Y. X4
V 42
V 43
V 44
V 41
X
V 52
V 53
V 54
V 55
V 51
5
en la
investigacin
tiene
que ver con los casos perdidos
5. Un problema omnipresente
(missing data). Es incuestionable que todas las investigaciones han de enfrentarse al
problema de los datos perdidos debidos a fallos del equipo o la instrumentacin,
mortalidad (e.g., en investigaciones longitudinales), negativa de los sujetos a contestar o dificultad para hacerlo, tendencias extremas sistemticas de las respuestas que
Tabla 3. Notacin
(en LISREL)
un modelo
de dos variables
latentes y 10
indicadores
convierten
en intiles
losdedatos
recopilados,
o cualquier
otra
causa. Lo sorprendente
Nombre
Matriz informa
Tipo adecuadamente
Descripcin sobre cmo ha tratado
N
es
que casiParmetro
ningn estudio
los datos
Regresin
Saturacionesfactoriales
8
LambdaX (pese
Ox
perdidos
a ser, /insistimos,
un
problema
crucial
en
la
investigacin).
Se han
x
desarrollado
para el tratamiento
de los datos perdidos,
as como
Varianza
Varianzasycovarianzasdeerror
10
ThetaDelta G diferentes
4Gmtodos
programas informticos que implementan
distintos
procedimientos
de
imputacin.
covarianza
La decisin a tomar (e.g., desechar los casos perdidos, utilizar algn mtodo de
Varianza
Varianzas y covarianzas de los 3
Phi
I
)
imputacin) depende de factores tales como el tamao de la muestra, el nmero de
covarianza factores
casos perdidos y si son o no sistemticos .
Totalparmetrosaestimar
21
Para mayor informacin sobre el tratamiento de datos perdidos, puede consultarse McKnight, McKnight,
Sida38
niy, & Figueredo (2007).
81
6. El modelo supone relaciones lineales y aditivas entre las variables (debe advertirse,
en este punto, que es posible someter a prueba modelos no lineales, pero este asunto sobrepasa el objetivo del presente trabajo).
7. Los datos deben estar libres de multicolinealidad. La multicolinealidad tiene lugar
cuando variables diferentes miden de hecho el mismo constructo, lo que implica
una correlacin muy elevada entre ellas (del orden de .90 o superior). Esto supone
que ciertas operaciones matemticas se tornan imposibles o muy inestables (e.g.,
ocasionan matrices de covarianza singulares) debido a que algunos denominadores
se aproximan a cero. Existen dos modos principales de detectar la multicolinealidad: a) examinar la matriz de correlaciones y detectar variables con rxy>.90; b)
calcular la correlacin mltiple al cuadrado R2smc entre cada variable y todas las dems: valores superiores a .90 sugieren multicolinealidad. Es asimismo conveniente
considerar, en este sentido, dos conceptos relacionados con la multicolinealidad:
la tolerancia y el VIF o factor de inflacin de la varianza. La tolerancia se calcula
mediante la frmula t = 1- R2smc , e indica la proporcin de la varianza estandarizada total que es nica (i.e., no explicada por todas las dems variables). Valores de
t<.10 indican colinealidad. Por su parte, el VIF o factor de inflacin de la varianza
se obtiene mediante la frmula VIF = 1/(1- R2smc), es decir, la razn entre la varianza
total estandarizada y la varianza nica: si VIF>10, la variable puede ser redundante.
Debe recordarse, finalmente, que la multicolinealidad puede tambin suceder entre
variables latentes (cuando la correlacin entre ellas es tan alta que bien podra pensarse que no son variables diferentes).
8. El modelo debera incluir aquellas variables que resultaran relevantes, omitiendo el
resto. En otras palabras, el modelo debera ser lo ms parsimonioso posible.
9. El modelo debera ser supraidentificado (i.e., con grados de libertad positivos, lo que
equivale a que el nmero de datos u observaciones sea mayor que el de parmetros
a estimar).
10. El nmero mnimo de observaciones disponibles debera ser en torno a 150 o, al
menos, 5 observaciones por cada parmetro a estimar. Se prefieren muestras grandes, especialmente si se han de realizarse modificaciones en el modelo.
11. Se requiere disponer al menos de 3 indicadores por cada variable latente. Si bien
es cierto que, desde el punto de vista tcnico, bastaran 2 indicadores por factor,
deberan usarse al menos 3 para evitar problemas de identificacin y convergencia.
Puede consultarse informacin sobre efectos de interaccin y no lineales en SEM en Schumaker y Marcoulides
(1998).
Carece de sentido mantener en un anlisis variables que presenten multicolinealidad. Si, por ejemplo, se detectara que X e Y son redundantes, se debera optar por a) eliminar una de ellas o b) combinarlas en una nueva variable
compuesta (e.g., el total reemplazara a X e Y). Un caso nada infrecuente ocurre cuando se incluye el total como variable. Imaginemos que tenemos un cuestionario de 10 tems: si incluimos el total como variable en el anlisis, aunque las
correlaciones bivariadas entre cada tem y el total no sean muy altas, la correlacin mltiple entre el total y los 10 tems
es 1.00 (con lo que hemos alcanzado el caso mximo de multicolinealidad!)
No est demasiado claro, en la metodologa SEM, qu significa muestra grande. Grosso modo, se considera
(Kline, 2005, p. 15) que la muestra es pequea si tiene menos de 100 sujetos, media si tiene de 100 a 200 sujetos,
y grande si la integran ms de 200 sujetos. En el estudio de Breckler (1990) citado en Kline, 2005, p. 15 sobre 72
artculos que utilizaron metodologa SEM, la media fue de 198 sujetos, con un rango de 40 a 8650 casos. El 22% de tales
estudios utilizaron menos de 100 sujetos. Con todo, debe tenerse en cuenta que el nmero de sujetos no es una cuestin
que pueda decidirse en trminos absolutos, dado que depende de la complejidad (i.e., parmetros a estimar) del modelo. Por otra parte, en SEMMET (http://bama.ua.edu) el asunto ha sido objeto de una amplsima discusin, y pueden consultarse cientos de entradas al respecto, con comentarios de autoridades tan sealadas en este campo como K. Bollen, L.
Hayduk, S. Mulaik, E. Rigdon, P. Barrett, etc.
82
benito arias
13. Por ltimo, conviene examinar las varianzas relativas. Las matrices de covarianza
con una ratio entre el valor mximo y el valor mnimo superior a 10.00 son ill-sca16
que analizaremos
led y pueden18ocasionar problemas en los anlisis. En el ejemplo
ms adelante (vid. Tabla 5), la razn equivale a 2061.875/491.042=4.199, por lo
16
que no tenemos el problema mencionado.
15
14
18
19
10
Dos son las condiciones
bsicas para identificar un modelo AFC. En primer lugar, el
nmero de parmetros a estimar ha de ser igual
o inferior al nmero de observaciones (di12
8
27
cho de otro modo, el nmero de grados de libertad
del modelo ha de ser igual o superior a
26
0); en segundo lugar todas
las variables latentes
(i.e., factores y errores de medida) deberan
6
17 8
tener una escala, lo que implica por lo
general
asignar el valor de 1.00 (ULI, Unit Loading
2824
10
6 especificacin e X =1.0 asigna a e
Identification). As, en 4la Figura 1, 3la
una mtrica que
9
1
1
1
2 4
7
corresponde a la de la varianza
nica
de
X
.
La
misma
estrategia
se
utiliza
para escalar los
1123
1
25145
2
2220
factores, de modo que A113X
21 =1.0 y BX =1.0 . Para calcular el nmero de observaciones se
6
1
sigue la frmula
0
0
n =Cuantil
v(vji-cuadrado
+ 1) / 2
6
10
12
Parmetro
Matriz
Tipo ULI (Unit Loading
Descripcin
N Identifica Nombre
Una descripcin
detallada de
las restricciones
Identification) y UVI (Unit Variance
tion) puede consultarse en Kline, 2005 (pp. 170-171).
LambdaX
Ox
/ x
Regresin
Saturacionesfactoriales
8
ThetaDelta
G
4G
Varianza
Varianzasycovarianzasdeerror
10
covarianza
Phi
I
)
Varianza
covarianza
factores
Tabla 2. Ejemplo de matriz de observaciones (varianzas en fondo gris)
X2
X3
X4
X5
X1
desarrollo de un ejemplo
factorial
confirmatorio
con lisrel, amos y sas
83
X1 de Vanlisis
11
X2
V 22
V 21
X3
V 32
V 33
V 31
21 parmetros a estimar por
el modelo
(1 covarianza
entre los factores, 2 varianzas de los
X4
V 42
V 43
V 44
V 41
factores, 10 varianzas de los
de los factores sobre los
X5errores
V 52
Vy538 efectos
V 54 directos
V 55
V 51de medida
Parmetro
Matriz
Tipo
Descripcin
N
LambdaX
Ox
/ x
Regresin
Saturacionesfactoriales
8
ThetaDelta
G
4G
Varianza
Varianzasycovarianzasdeerror
10
covarianza
Phi
I
)
Varianza
covarianza
factores
Totalparmetrosaestimar
21
38
El objetivo del AFC es obtener estimaciones de cada uno de los parmetros del modelo
de medida (saturaciones factoriales, varianzas y covarianzas de los factores, varianzas y, en
su caso, covarianzas de los errores de medida) que configuran una matriz (S) que reproduzca
lo ms fielmente posible la matriz ( S ) observada. El mtodo ms comn de estimacin es
del de mxima verosimilitud (ML, Maximum Likelihood), siempre que se cumpla la serie de
supuestos a que ms arriba hemos hecho referencia, tales como disponer de una muestra de
tamao suficiente, medicin de los indicadores al menos en nivel intervalar, o distribucin
normal multivariada de los indicadores de las variables latentes. En el caso de que no se
cumpla el supuesto de normalidad multivariada, conviene usar el mtodo de mxima verosimilitud robusta (MLM, Maximum Likelihood Mean Adjusted; Bentler, 1995). Si uno o ms de
los indicadores es categrico (o si la ausencia de normalidad es extrema), habr de optarse
por otros mtodos de estimacin tales como mnimos cuadrados ponderados (WLS, Weighted
Least Squares), mnimos cuadrados ponderados diagonalizados (DWLS, Diagonal Weighted
Least Squares), mnimos cuadrados ponderados robustos (WLSMV, Weighted Least Squares
Mean and Variance Adjusted) o mnimos cuadrados no ponderados (ULS, Unweighted Least
Squares). En estos casos, el uso del mtodo ML puede producir estimaciones atenuadas de
las relaciones entre los indicadores (en especial cuando existen efectos suelo o techo),
conducir a la formacin de pseudofactores (artefactos producidos por la dificultad o el carcter extremo de los tems), producir errores estndar incorrectos o estimaciones errneas de
los parmetros, llegar a resultados imprecisos si parte de una matriz de correlaciones en lugar
de covarianzas (Brown, 2006).
Lamentablemente, los paquetes estadsticos de propsito general (e.g., SPSS, SYSTAT, STATISTICA, etc.) no
permiten la evaluacin directa (va men o sintaxis) de la normalidad multivariada de los datos. S se puede llevar a
cabo con facilidad mediante el programa PRELIS, o utilizando macros (e.g., en SPSS o SAS). En SAS puede utilizarse la
macro multnorm.sas (http://support.sas.com/kb/24/983.html). En SPSS, la macro normtest.sps (http://www.columbia.
edu/~ld208/normtest.sps).
Una referencia bastante completa de los mtodos de estimacin puede consultarse en Brown (2006), pp. 387 y
ss.
84
benito arias
Observaciones
NiveldesignificacindeF
Elvalordep(F2)deberasersuperiora.05
RaznF2/gl
Deberaserinferiora2.00
CFIyNNFI
Deberansersuperioresa.95;mejorcuantomsprximosa1.00
Valoresdet
Losvaloresabsolutosdeberansersuperioresa1.96
Saturaciones
Superioresa.30
Residuos
Distribucinnormal,simtricaentornoa0,pocosresiduossuperiores
a|2.00|
Fiabilidadcompuesta
Las fiabilidades compuestas de las VL deberan ser superiores a .60
(preferiblemente,superioresa.70)
Varianzamediaextractada
LasVMEdelasVLdeberansersuperioresa.50
Validezdiscriminante
Se debera demostrar la VD entre pares de factores a travs de la
pruebadediferenciasdeF2,losintervalosdeconfianzaylavarianza
extractada
RMSEA
SRMR
Inferiora.08,mejormientrasmsprximoa.00
DESARROLLO DE Tabla
UN EJEMPLO
DE AFC y desviaciones tpicas de los indicadores
5. Matriz de correlaciones
a1
a2
a3
a4
a5
c1
c2
c3
c4
c5
El ejemplo que
expone a continuacin es una rplica del siguiente artculo: Williams,
a1 se1,000
0,822 1,000
T. O., Eaves, R. C.,a2& Cox,
C. (2002). Confirmatory factor analysis of an instrument designed
a3
0,852 0,839 1,000
a4
0,814 0,831 0,779
1,000
a5
0,840 0,846 0,910
0,819 1,000
Existe entre los
expertos
una notable controversia
en torno a este requerimiento. El lector interesado puede
c1
0,582 0,637 0,643
0,580 0,680 1,000
consultar la lista SEMNET
(http://bama.au.edu).
c2
0,634 0,660 0,662
0,623 0,704 0,731 1,000
Root0,607
Mean0,628
Square 0,603
Residual;
GFI:0,784
Goodness
Index; AGFI: Adjusted Goodness of Fit
10 SRMR: Standardized
c3
0,605
0,673
0,757of Fit
1,000
Index; PGFI: Parsimonyc4GFI;0,587
RMSEA:
Root 0,622
Mean Square
Approximation;
ECVI:1,000
Expected cross-validation Index;
0,575
0,570 Error
0,674 of0,750
0,758 0,703
CAIC: Consistent Akaikec5Information
Criterion;
Bayes0,716
Information
CFI: Comparative
0,674 0,662
0,685BIC:0,659
0,724 Criterion;
0,782 0,771
0,789 1,000 Fit Index; TLI: TuckerLewis Index; NFI: Normed
Index;
PNFI:36,247
Parsimony
NFI;
RNI: Relative
Noncentrality
Index;26,994
PCFI: Parsimony ComparaDT Fit
45,145
43,956
45,102
45,408
25,110 27,235
32,976 29,245
a1
2038,035
1631,766
1393,567
1657,299
1721,830
659,795
779,519
a2
a3
a4
a5
1932,163
1336,871 1313,809
1647,164 1273,261 2034,216
1688,292 1498,401 1677,767 2061,875
702,969 585,019 656,527 775,118
790,448 653,734 764,755 871,211
c1
630,518
500,128
c2
741,767
c3
c4
c5
85
Caracterstica
Residuos
NiveldesignificacindeF2
RaznF2/gl
Fiabilidadcompuesta
CFIyNNFI
Observaciones
Distribucinnormal,simtricaentornoa0,pocosresiduossuperiores
Elvalordep(F2)deberasersuperiora.05
a|2.00|
Deberaserinferiora2.00
Las fiabilidades compuestas de las VL deberan ser superiores a .60
Deberansersuperioresa.95;mejorcuantomsprximosa1.00
(preferiblemente,superioresa.70)
Valoresdet
Losvaloresabsolutosdeberansersuperioresa1.96
LasVMEdelasVLdeberansersuperioresa.50
86 Varianzamediaextractada
benito arias
Saturaciones
Superioresa.30
Validezdiscriminante
Se debera demostrar la VD entre pares de factores a travs de la
Residuos
Distribucinnormal,simtricaentornoa0,pocosresiduossuperiores
2
pruebadediferenciasdeF
,losintervalosdeconfianzaylavarianza
tores) arousal afectivo y arousal
cognitivo. Se sometieron
a prueba cuatro modelos14:
a|2.00|
a)
modelo unidimensional; b) modelo
bidimensional de 2 factores correlacionados, c) modelo
extractada
Fiabilidadcompuesta
Las fiabilidades compuestas de las VL deberan ser superiores a .60
bidimensional de 2 factores no correlacionados y d) modelo jerrquico con un factor de seRMSEA
Inferior
a .08 (preferiblemente, inferior a .06); el modelo debera
(preferiblemente,superioresa.70)
gundo orden. Los anlisis parten de
la matriz de covarianzas entre los indicadores o variables
rechazarsesiRMSEA>.10
observadas
(incluida por los autores
en el texto del artculo). En las Tablas 5 y 6 se reproduVarianzamediaextractada
LasVMEdelasVLdeberansersuperioresa.50
cen, respectivamente,
(tambin
incluida
enfactores
el texto)
y de de
covarianSRMR
Inferiora.08,mejormientrasmsprximoa.00
Validezdiscriminantela matriz de
Secorrelaciones
debera demostrar
la VD entre
pares de
a travs
la
zas entre los 10 parcels o miniescalas.
2
pruebadediferenciasdeF ,losintervalosdeconfianzaylavarianza
extractada y desviaciones tpicas de los indicadores
Tabla 5. Matriz de correlaciones
RMSEA
a1
a2
a3
a4
a5
c1
c2
c3
c4
c5
rechazarsesiRMSEA>.10
a1
1,000
a2
0,822 1,000
SRMR
Inferiora.08,mejormientrasmsprximoa.00
a3
0,852 0,839 1,000
a4
0,814 0,831 0,779
1,000
a5
0,840 0,846 0,910
0,819 1,000
c1
0,582 0,637 0,643
0,580 0,680 1,000
c2
0,634 0,660 0,662
0,623 0,704 0,731 1,000
Tabla
5. Matriz de correlaciones
y desviaciones tpicas de los indicadores
c3
0,605 0,607 0,628
0,603 0,673 0,784 0,757 1,000
a1
a2
a3
a4
a5
c1
c2
c3
c4
c5
c4
0,587 0,575 0,622
0,570 0,674 0,750 0,758 0,703 1,000
a1
1,000
c5
0,674 0,662 0,685
0,659 0,716 0,724 0,782 0,771 0,789 1,000
a2
0,822 1,000
DT 45,145 43,956 36,247 45,102 45,408 25,110 27,235 32,976 29,245 26,994
a3
0,852 0,839 1,000
a4
0,814 0,831 0,779
1,000
0,840 0,846 0,910
0,819 1,000
Como msa5arriba
hemos
sealado,
llevar adecabo
el anlisis, es indiferente partir de
Tabla 6.0,643
Matriz0,580
depara
covarianzas
los indicadores
c1
0,582 0,637
0,680 1,000
la matriz de
(con las
(oba1 correlaciones
a3
a4desviaciones
a5 0,704 tpicas
c10,731 incluidas)
c2
c3 o de la
c4de covarianzas
c5
c2 a20,634 0,660
0,662
0,623
1,000
a1 2038,035
c3 caso
0,605 no0,607
0,628
0,603 0,673
0,784De
0,757
1,000el anlisis podra realizarse
viamente,
en este
es preciso
incluir
las DT).
hecho,
a2 1631,766
c4 1932,163
0,587
0,575originales.
0,622
0,570
0,674 0,750
0,758 de
0,703
1,000
directamente
sobre
los datos
Asismismo,
la matriz
datos
puede incorporarse al
a3 1393,567
1313,8090,685
c5 1336,871
0,674 0,662
0,659 0,716 0,724 0,782 0,771 0,789 1,000
conjunto
de
comandos
del
programa
o
almacenarse
en
un
fichero
independiente.
a4 1657,299
1273,261
2034,216
DT 1647,164
45,145 43,956
36,247
45,102 45,408 25,110 27,235 32,976 29,245 26,994
a5 1721,830 1688,292 1498,401 1677,767 2061,875
c1
659,795 702,969 585,019 656,527 775,118 630,518
Tabla 6. Matriz de covarianzas de los indicadores
c2
779,519 790,448 653,734 764,755 871,211 500,128 741,767
Tabla 6. Matriz de covarianzas de los indicadores
c3
899,912 879,179 750,037 897,441 1008,287 648,935 679,970 1087,409
a1
a2
a3
a4
a5
c1
c2
c3
c4
c5
c4
775,235 739,157 659,867 751,860 895,616 550,476
603,95 677,865 855,272
a1 2038,035
c5
821,170 785,419 669,951 802,825 877,681 491,042 574,775 686,391 622,830 728,674
a2 1631,766 1932,163
a3 1393,567 1336,871 1313,809
39
a4 1657,299 1647,164 1273,261 2034,216
a5 1721,830 1688,292 1498,401 1677,767 2061,875
c1 659,795 702,969 585,019 656,527 775,118 630,518
c2
779,519 790,448 653,734 764,755 871,211 500,128 741,767
c3
899,912 879,179 750,037 897,441 1008,287 648,935 679,970 1087,409
c4
775,235 739,157 659,867 751,860 895,616 550,476
603,95 677,865 855,272
c5
821,170 785,419 669,951 802,825 877,681 491,042 574,775 686,391 622,830 728,674
A. Modelo unidimensional
39
Construmos, en primer lugar, un modelo de un solo factor (i.e., todos los indicadores
saturan en un factor nico, vid. Figura 5). Cuando la teora no ha especificado claramente el
nmero de constructos, conviene comenzar sometiendo a prueba un modelo unidimensional, toda vez que, si los resultados conducen a la aceptacin de dicho modelo, carece de
sentido plantear modelos ms complejos. Incluso si la teora se decantara por un nmero
determinado de factores, debera determinarse en qu medida un modelo unidimensional es
plausible. Comenzaremos, pues, sometiendo a prueba el modelo unidimensional. La sintaxis
14 Los autores nicamente sometieron a prueba los modelos aqu denominados como (a), (c) y (d). Inclumos, por
su inters, uno ms, el modelo (b), de dos factores correlacionados.
87
en SIMPLIS se muestra en la Tabla 7. Los comandos utilizados son los siguientes: OBSERVED
VARIABLES (listado de variables observadas, A1-A5 para los parcels afectivos y C1-C5 para
los cognitivos); LATENT VARIABLES (en este caso, nicamente tendremos la variable latente
AROUSAL); escribimos a continuacin los datos de la matriz de covarianzas; especificamos
seguidamente el tamao de la muestra (N=216) y las relaciones entre las variables manifiestas y la variable latente, fijando a 1.0 la saturacin no estandarizada de la primera variable en
el factor. Puesto que partimos de 10 indicadores, tenemos un total de 55 observaciones para
estimar un total de 20 parmetros (1 varianza del factor, 10 varianzas de error y 9 saturaciones factoriales). El modelo es, pues, sobreidentificado con 35 grados de libertad.
Figura 5. Modelo AFC unifactorial
Figura
Modelopara
AFCelunifactorial
Tabla 7. Sintaxis
en5.simplis
modelo unidimensional
Tabla 7. Sintaxis en SIMPLIS para el modelo unidimensional
Variables
TablaObserved
7. Sintaxis
en SIMPLIS para el modelo unidimensional
A1 A2 de
A3 A4
A5 C1 C2 C3Williams
C4 C5
!Matriz
covarianzas
Eaves & Cox, modelo A (Unidimensional)
Latent Variables
Variables
Observed
A1 AROUSAL
A2 A3 A4 A5 C1 C2 C3 C4 C5
Covariance Matrix
Latent Variables
2038.035
AROUSAL
1631.766 1932.163
Covariance Matrix
2038.035
1657.299 1647.164 1273.261 2034.216
1631.766
1932.163
1721.830
1688.292 1498.401 1677.767 2061.875
659.7951336.871
702.969 585.019
656.527 775.118 630.518
1393.567
1313.809
779.5191647.164
790.448 653.734
764.755
871.211 500.128 741.767
1657.299
1273.261
2034.216
899.9121688.292
879.179 750.037
897.441
1008.287
648.935 679.970 1087.409
1721.830
1498.401
1677.767
2061.875
821.170 785.419 669.951 802.825 877.681 491.042 574.775 686.391 622.830 728.674
775.235
739.157 659.867 751.860 895.616 550.476 603.950 677.865 855.272
A1 = 1*AROUSAL
821.170
785.419 669.951 802.825 877.681 491.042 574.775 686.391 622.830 728.674
A2 = AROUSAL
A3 = Size
AROUSAL
Sample
is 216
A4 = AROUSAL
Relationships
= AROUSAL
A1 A5
= 1*AROUSAL
C1 = AROUSAL
A2 = AROUSAL
C2 = AROUSAL
A3 = AROUSAL
C3 = AROUSAL
A4 = AROUSAL
C4 = AROUSAL
A5 C5
= AROUSAL
= AROUSAL
C1 OPTIONS
= AROUSAL
wp rs ss sc mi nd=2
C2 Path
= AROUSAL
Diagram
of Problem
C3 End
= AROUSAL
C4 = AROUSAL
40
C5 = AROUSAL
OPTIONS wp rs ss sc mi nd=2
Path Diagram
End of Problem
40
88
benito arias
15
B. Modelo de dos factores correlacionados
El segundo modelo que sometemos a prueba es un modelo de dos factores correlacionados. Para escalar los factores, fijamos a 1.0 las saturaciones no estandarizadas de A1 y C1 a
los factores AFECT y COGNI respectivamente (vid. Figura 6). Al igual que en el primer modelo, tenemos un total de 55 observaciones para estimar un total de 21 parmetros (1 covarianza entre los factores, 2 varianzas de los dos factores, 10 varianzas de error y 8 saturaciones
factoriales, como se puede observar en la Tabla 9). El modelo es, pues, sobreidentificado con
34 grados de libertad.
Figura 6. Modelo AFC de dos factores correlacionados
15 Advertir el lector si se toma el trabajo de contrastar la solucin LISREL con las ofrecidas por otros programas
SEM como EQS, AMOS o SAS que tanto el valor RMSEA como el resto de los ndices parciales de ajuste son ligeramente
diferentes
en LISREL. La razn estriba en que
LISREL, con el mtodo de estimacin de mxima verosimilitud, no utiliza el
Minimum
Fit Function Chi-Square sino el Normal Theory Weighted Least Squares Chi-Square en el clculo (vid. Tabla
19
Advertir el lector si se toma el trabajo de contrastar la solucin LISREL con las ofrecidas por otros
8). As, el valor RMSEA de la Tabla 8 es el resultado de [(630.65-35)/(35*(216-1))]1/2=0.2813, en tanto que el valor RMSEA obtenido
enSEM
EQS, AMOS
o SAS AMOS
resulta de
[(409.68-35)/(35*(216-1))]
=0.2231.
Es este
valor
que ofrecen,
programas
como EQS,
o SAS
que tanto el valor 1/2
RMSEA
como
el ltimo
resto de
loselndices
precisamente, los autores del artculo que aqu se comenta (sus anlisis se realizaron con AMOS).
parciales de ajuste son ligeramente diferentes en LISREL. La razn estriba en que LISREL, con el
mtodo de estimacin de mxima verosimilitud, no utiliza el Minimum Fit Function Chi-Square sino el
Normal Theory Weighted Least Squares Chi-Square en el clculo (vid. Tabla 8). As, el valor RMSEA
de la Tabla 8 es el resultado de [(630.65-35)/(35*(216-1))]1/2=0.2813, en tanto que el valor RMSEA
obtenido en EQS, AMOS o SAS resulta de [(409.68-35)/(35*(216-1))] 1/2=0.2231. Es este ltimo valor el
. . .
desarrollo de un ejemplo
de anlisis
factorial
Goodness
of Fit
Indexconfirmatorio
(GFI) = 0.63 con lisrel, amos y sas
89
Figura 6. Modelo AFC de dos factores correlacionados
PHI
Parameter Specifications
LAMBDA-X
AFECT
COGNI
--------------AFECT
COGNI
AFECT
9
--------------COGNI
10
11
A1
0
0
A2
1
0
THETA-DELTA
A3
2
0
A1
A2
A3
A4
A5
A4
3
0
19
Advertir el lector si se toma el trabajo de contrastar la solucin LISREL con las ofrecidas por otros
---------------A5
4
0
13
14 el resto
15 de los16ndices
C1SEM como EQS,
0
programas
AMOS o 0SAS que tanto el12valor RMSEA
como
C2
0
5
parciales C3
de ajuste son ligeramente
diferentes
en LISREL.
C1 La razn
C2 estriba
C3 en queC4LISREL,
C5con el
0
6
---------------C4
0
7
mtodo de
estimacin
de
mxima
verosimilitud,
no
utiliza
el
Minimum
Fit
Function
Chi-Square
17
18
19
20
21sino el
C5
0
8
Normal Theory Weighted Least Squares Chi-Square en el clculo (vid. Tabla 8). As, el valor RMSEA
Tabla 10.
LISREL
para
el modelo deendos
correlacionados
La sintaxis
enSintaxis
LISRELenque
puede
consultarse
lafactores
Tabla 10,
tiene las siguientes especifiTITLE MODELO B1 WILLIAMS EAVES & COX MODELO DE DOS FACTORES CORRELACIONADOS
que
ofrecen,
precisamente,
los
autores
del
artculo
que
aqu
se
comenta
anlisisde
se sujetos);
realizaron MA=CM
con
caciones: DA
DANI=10
(datos);
NI=10
(nmero de indicadores); NO=216 (sus
(nmero
NO=216
MA=CM
LA una matriz de covarianzas). LA indica las etiquetas de las variables observadas
AMOS).
(se analiza
A1 A2 A3 A4 A5 C1 C2 C3 C4 C5
(A1-C5); MO
41
CM (modelo a prueba); NX=10 (nmero de variables X del modelo); NK=2 (nmero
[ESCRIBIR
AQU LA MATRIZ
DE COVARIANZAS,
VID. TABLA 6]es simtrica y sus parme(la matriz
de varianza-covarianza
de variables
)16; PH=SY,FR
MO NX=10 NK=2 PH=SY,FR LX=FU,FR TD=SY,FR
tros libres);
LX=FU,FR (la matriz x de saturaciones factoriales es completa y sus parmetros
LK
libres); TD=SY,FR
(la matriz de varianzas y covarianzas de error es simtrica y sus parmeAFECT COGNI
PA
LX
tros libres). Se especifican a continuacin las variables independientes latentes del modelo:
0 0
LK (AFECT,
1 0COGNI). Seguidamente, se especifican las matrices de los parmetros a estimar
(utilizando1 00 para los parmetros fijos y 1 para los libres). La primera matriz de parmetros es
1 0
el comando PA LX, a la que sigue la lista de valores de los elementos fijos de
LX () mediante
1 0
la matriz. 0As,
0 la lnea VA 1.0 LX(1,1) LX(6,2) indica al programa que el parmetro se fija a 1.0
en la fila 01, 1columna 1 de la matriz, y en la fila 6, columna 2. Se especifica a continuacin
0 1
PA TD (matriz
0 1 ) en la que todos los parmetros son fijos con excepcin de las varianzas de
error, y PA0 PF
1 (matriz ) en la que todos los parmetros a estimar son libres. Finalmente, se
VA
1.0
LX(1,1)de
LX(6,2)
opciones
salida OU: ME=ML indica que el mtodo de estimacin ser el de
establecen las
PA TD
mxima verosimilitud;
RS (el programa ofrecer los residuos, residuos estandarizados, grfico
1
0 1 de covarianzas o correlaciones ajustadas); MI (ndices de modificacin); SC (soQQ y matriz
0 0 1
lucin completamente
estandarizada) y ND=2 (nmero de decimales en los resultados).
0 0 0 1
0 0 0 0 1
0 0 0 0 0 1
0 0 0 0 0 0 1
0 0 0 0 0 0 0 1
0 0 0 LISREL,
0 0 0 las
1 variables son variables latentes independientes (exgenas, no explicadas por otras
16 En 0la 0notacin
0 0 0 en
0 contraposicin
0 0 0 0 1 a las variables o variables latentes dependientes (endgenas o explicadas por
variables del0modelo),
PA PH
otras variables del modelo).
1
1 1
OU ME=ML RS MI SC ND=2
A1
A2
A3
A4
A5
C1
C2
C3
C4
C5
90
0
1
2
3
4
0
0
0
0
0
0
0
0
0
0
0
5
6
7
8
COGNI
10
11
THETA-DELTA
A1
A2
------12
13
A3
---14
A4
---15
A5
---16
C1
C2
------benito arias
17
18
C3
---19
C4
---20
C5
---21
Tabla 10. Sintaxis en lisrel para el modelo de dos factores correlacionados17
TITLE MODELO B1 WILLIAMS EAVES & COX MODELO DE DOS FACTORES CORRELACIONADOS
DA NI=10 NO=216 MA=CM
LA
A1 A2 A3 A4 A5 C1 C2 C3 C4 C5
CM
[ESCRIBIR AQU LA MATRIZ DE COVARIANZAS, VID. TABLA 6]
MO NX=10 NK=2 PH=SY,FR LX=FU,FR TD=SY,FR
LK
AFECT COGNI
PA LX
0 0
1 0
1 0
1 0
1 0
0 0
0 1
0 1
0 1
0 1
VA 1.0 LX(1,1) LX(6,2)
PA TD
1
0 1
0 0 1
0 0 0 1
0 0 0 0 1
0 0 0 0 0 1
0 0 0 0 0 0 1
0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 1
0 0 0 0 0 0 0 0 0 1
PA PH
1
1 1
OU ME=ML RS MI SC ND=2
17 Advertir el lector si se toma el trabajo de contrastar la solucin LISREL con las ofrecidas por otros programas
SEM como EQS, AMOS o SAS que tanto el valor RMSEA como el resto de los ndices parciales de ajuste son ligeramente
diferentes en LISREL. La razn estriba en que LISREL, con el mtodo de estimacin de mxima verosimilitud, no utiliza el
Minimum Fit Function Chi-Square sino el Normal Theory Weighted Least Squares Chi-Square en el clculo (vid. Tabla
8). As, el valor RMSEA de la Tabla 8 es el resultado de [(630.65-35)/(35*(216-1))]1/2=0.2813, en tanto que el valor RMSEA obtenido en EQS, AMOS o SAS resulta de [(409.68-35)/(35*(216-1))] 1/2=0.2231. Es este ltimo valor el que ofrecen,
precisamente, los autores del artculo que aqu se comenta (sus anlisis se realizaron con AMOS).
91
Tabla 11. Resumen de resultados del modelo de dos factores correlacionados
Degrees of Freedom = 34
Degrees of Freedom = 34
Minimum Fit Function Chi-Square = 88.47 (P = 0.00)
Minimum Fit Function Chi-Square = 88.47 (P = 0.00)
Normal Theory Weighted Least Squares Chi-Square = 85.11 (P = 0.00)
Normal Theory Weighted Least Squares Chi-Square = 85.11 (P = 0.00)
. . .
. . .
Root Mean Square Error of Approximation (RMSEA) = 0.084
Root Mean Square Error of Approximation (RMSEA) = 0.084
90 Percent Confidence Interval for RMSEA = (0.062 ; 0.11)
90 Percent Confidence Interval for RMSEA = (0.062 ; 0.11)
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.0076
P-Value for Test of Close Fit (RMSEA < 0.05) = 0.0076
. . .
. . .
Normed Fit Index (NFI) = 0.98
Normed Fit Index (NFI) = 0.98
Non-Normed Fit Index (NNFI) = 0.99
Non-Normed Fit Index (NNFI) = 0.99
Comparative Fit Index (CFI) = 0.99
Comparative Fit Index (CFI) = 0.99
. . .
. . .
Standardized RMR = 0.022
Standardized RMR = 0.022
Goodness of Fit Index (GFI) = 0.93
Goodness of Fit Index (GFI) = 0.93
Tabla 12.
12. ndices
ndices de
de modificacin
modificacin del
Tabla
del modelo
modelo de
de dos
dos factores
factorescorrelacionados
correlacionados
Tabla 12. ndices de
modificacinIndices
del modelo
dos factores correlacionados
Modification
fordeLAMBDA-X
Modification Indices
AFECT for LAMBDA-X
COGNI
AFECT
COGNI
----------------------------A1
- 1.02
A1
- 1.02
A2
0.16
A2
- 0.16
A3
1.28
A3
- 1.28
A4
0.02
A4
- 0.02
A5
4.97
A5
- 4.97
C1
0.00
- C1
0.00
- C2
0.51
C2
0.51
- C3
0.69
C3
0.69
C4
1.78
- C4
1.78
- C5
1.74
C5
1.74
- -
.
Podra
considerarse
el
modelo
unifactorial
F2
Modelo
GL
p
Modelo
GL
p
como una versin restringida
del modeloF de 2 factores
fijando
a 1.0 la correlacin entre
Unifactorial
409.68
35
0.000
ellos (lo que sera lo mismo
que
reemplazar
ambos
factores
por
un
nico factor). Los resulUnifactorial 409.68 35
0.000
2
tados de la prueba de diferencias
de
(vid.
Tabla
13)
ponen
de
manifiesto
que la diferencia
Bifact. corr. 88.47
34
0.000
Bifact.
corr.
88.47
34
0.000
entre el ajuste del modelo bifactorial y el unifactorial es estadsticamente significativa).
Diferencia
321.21 1
0.000
Diferencia
321.21 1
0.000
Figura 7. Modelo AFC de dos factores correlacionados (solucin estandarizada)
43
43
Tabla 14. Salida en LISREL del anlisis del modelo de dos factores correlacionados
DATE:
3/27/2008
A2
A3
A4
A5
C1
C2
C3
C4
C5
92
- - - - 0.00
0.51
0.69
1.78
benito
arias
1.74
0.16
1.28
0.02
4.97
- - - - - -
Tabla 13. Diferencias y significacin de los valores c2 en los dos primeros modelos
Tabla 13. Diferencias y significacin de los valores 2 en los dos primeros modelos
Modelo
F2
GL
Unifactorial
409.68
35
0.000
34
0.000
Diferencia
0.000
321.21
La solucin final (estimaciones estandarizadas) para el modelo analizado se representa grficamente en la Figura 7. Comentamos a continuacin con algn detalle la salida en
SIMPLIS y LISREL para este modelo (Tabla 14). Incluiremos la salida completa en formato
SIMPLIS, a la que aadiremos algunos fragmentos de la salida en LISREL para ilustrar las diferencias entre ambos formatos.
43
Se muestra, en primer lugar, la cabecera del programa y se reproduce a continuacin
toda la sintaxis utilizada (variables observadas y latentes, matriz de correlaciones o de covarianzas, relaciones
entre las variables, etc.).
Figura 7. Modelo AFC de dos factores correlacionados (solucin estandarizada)
Tabla 14. Salida en lisrel del anlisis del modelo de dos factores correlacionados
Tabla 14. Salida en LISREL del anlisis del modelo de dos factores correlacionados
DATE:
3/27/2008
TIME: 19:36
L I S R E L
8.80
BY
Karl G. Jreskog & Dag Srbom
This program is published exclusively by
Scientific Software International, Inc.
7383 N. Lincoln Avenue, Suite 100
Lincolnwood, IL 60712, U.S.A.
93
Tabla 14 (cont.). Reproduccin de la sintaxis
A1 A2 A3 A4 A5 C1 C2 C3 C4 C5
Latent Variables
AFECT COGNI
Covariance Matrix
2038.035
1631.766 1932.163
C1 = 1*COGNI
C2 = COGNI
C3 = COGNI
C4 = COGNI
C5 = COGNI
OPTIONS wp rs ef ss sc mi nd=2
Path Diagram
End of Program
Sample Size =
216
A continuacin se calcula la matriz de covarianzas en el caso de que los datos de entrada hayan sido correlaciones; si han sido covarianzas, el programa se limita a reproducir la
matriz. En la salida en formato LISREL se especifican los parmetros a estimar.
45
94
benito arias
A1
A2
A3
A4
A5
C1
C2
C3
C4
C5
A1
A2
A3
A4
A5
A1
A2
A3
A4
A5
---------------------------------------- ------- -------- -------- -------A1 2038.04
2038.04
A2 1631.77 1932.16
1631.77 1932.16
A3 1393.57 1336.87 1313.81
1393.57 1336.87 1313.81
A4 1657.30 1647.16 1273.26 2034.22
1657.30 1647.16 1273.26 2034.22
A5 1721.83 1688.29 1498.40 1677.77 2061.88
1721.83 1688.29 1498.40 1677.77 2061.88
C1
659.79
702.97
585.02
656.53
775.12
659.79
702.97
585.02
656.53
775.12
C2
779.52
790.45
653.73
764.75
871.21
779.52
790.45
653.73
764.75
871.21
C3
899.91
879.18
750.04
897.44 1008.29
899.91
879.18
750.04
897.44 1008.29
C4
775.24
739.16
659.87
751.86
895.62
775.24
739.16
659.87
751.86
895.62
C5
821.17
785.42
669.95
802.83
877.68
821.17
785.42
669.95
802.83
877.68
C1
C2
C3
C1
C2
C3
--------------------------- -------
C4
C4
-----------
C5
C5
-----------
630.52
630.52
500.13
500.13
648.93
648.93
550.48
550.48
491.04
491.04
855.27
855.27
622.83
622.83
728.67
728.67
741.77
741.77
679.97 1087.41
679.97 1087.41
603.95
677.87
603.95
677.87
574.77
686.39
574.77
686.39
Tabla 14 (cont.). Especificaciones de los parmetros
Tabla 14 (cont.). Especificaciones de los parmetros
Tabla 14 (cont.). Especificaciones de los parmetros
[SALIDA EN FORMATO LISREL]
[SALIDA
EN FORMATO
LISREL]
Parameter
Specifications
Parameter Specifications
LAMBDA-X
LAMBDA-X
AFECT
COGNI
AFECT
COGNI
----------------------------A1
0
0
A1
0
0
A2
1
0
A2
1
0
A3 A3
2 2
0 0
A4 A4
3 3
0 0
A5 A5
4 4
0 0
C1 C1
0 0
0 0
C2 C2
0 0
5 5
C3 C3
0 0
6 6
C4 C4
0 0
7 7
C5 C5
0 0
8 8
PHI PHI
AFECT
COGNI
AFECT
COGNI
-------- ---------------------AFECT
AFECT
9 9
COGNI
COGNI
10 10
11 11
THETA-DELTA
THETA-DELTA
A1 A1
A2 A2
A3 A3
A4A4
A5A5
----------------------- --------------- --------------- ---------------------12 12
13 13
14 14
1515
1616
THETA-DELTA
THETA-DELTA
C1 C1
C2 C2
C3 C3
C4C4
C5C5
----------------------- --------------- --------------- ---------------------17 17
18 18
19 19
2020
2121
95
riable dependiente, producido cuando la variable independiente cambia una unidad en tanto
que las dems variables independientes se mantienen constantes. Por ejemplo, la ecuacin
A3=0.96*AFECT indica que el cambio de una unidad en AFECT supone el incremento de
0.96 unidades en A3. El error estndar (0.036 para la variable A3) muestra con qu grado de
precisin se ha estimado el parmetro: mientras ms pequeo sea, ms precisa habr sido la
medida. Si dividimos el valor del parmetro por el error estndar, tendremos el valor de t. As,
0.84/0.036=23.57. Los valores de t se utilizan para contrastar la hiptesis de que el parmetro
es distinto de 0 en la poblacin. Aceptamos la hiptesis si el valor absoluto es superior a 1.96,
lo que supone una significacin de p=.05. En la salida se ofrece, finalmente, otra informacin
relevante: las varianzas de error (que, al ser parmetros libres, vienen acompaadas del correspondiente error estndar y valor de t), as como la correlacin mltiple al cuadrado R2 (muestra la cantidad de varianza de la variable dependiente explicada por la variable independiente
en cada ecuacin). En el caso que vamos comentando, la varianza de error de la variable A3
es 155.67; el error estndar, 20.13; el valor de t, 7.73 y el valor de R2 0.88.
C3
- -
C4
- -
C5
- -
= 0.81
= 0.81
= 0.88
= 0.75
= 0.91
= 0.73
= 0.77
= 0.74
= 0.74
= 0.80
COGNI
-------- - - - - 1.00
1.11
(0.07)
17.05
1.33
(0.08)
16.60
1.17
(0.07)
16.44
1.13
(0.06)
17.67
47
96
benito arias
THETA-DELTA
[SALIDA EN FORMATO
LISREL]
C2
C3
C4
THETA-DELTA-------- -------- -------172.60
277.30
225.24
A1(20.66)
A2
A3
(32.29)
(25.99)
-------- 8.36
--------8.59 -------8.67
385.92
359.01
155.67
Squared Multiple
Correlations
for X
(43.48)
(40.61)
(20.13)
8.88
8.84
7.73
A1
A2
A3
-------THETA-DELTA 0.81
-------0.81
-------0.88
A4
-------498.77
(53.61)
9.30
A5
-------192.58
(27.73)
6.95
C5
-------147.55
A4
(18.53)
-------7.96
498.77
- Variables
(53.61)
A5
-------192.58
(27.73)
A5 6.95
9.30
A4
--------------0.75
0.91
C2
C3
C4
C5
Squared Multiple Correlations for X - Variables
----------------------------C2 277.30 C3
C4
C5
172.60
225.24
147.55
----------------------------(20.66)
(32.29)
(25.99)
(18.53)
0.77
0.74
0.74
0.80
8.36
8.59
8.67
7.96
Squared Multiple Correlations for X - Variables
C1
-------172.46
(19.70)
8.75
C1
-------172.46
(19.70)
8.75
C1
-------0.73
COGNI
705.34
458.06
de C3
la (86.35)
salida
se(59.44)
En el siguiente apartado
C2
C4muestra la
C5matriz de varianzas y covarianzas de
8.17
7.71----------------------------las variables independientes[SALIDA
(exgenas)
delLISREL]
modelo. Cada estimacin viene de nuevo acom0.77
0.74EN FORMATO0.74
0.80
paada por su error estndar y elPHIcorrespondiente
valor de t.
AFECT
COGNI
--------------1652.11
Tabla 14 (194.31)
(Cont.).
Matriz de covarianza de las VI
8.50
(cont.).
de covarianzas
COGNI Matriz
705.34
458.06 de las variables independientes
(86.35)
(59.44)
Covariance
Matrix
of Independent Variables
8.17
7.71
AFECT
Tabla 14
AFECT
COGNI
--------------AFECT
1652.11
(194.31)
8.50
COGNI
705.34
458.06
(86.35)
(59.44)
8.17
7.71
[SALIDA EN FORMATO LISREL]
PHI
AFECT
COGNI
--------------AFECT
1652.11
(194.31)
8.50
COGNI
705.34
458.06
(86.35)
(59.44)
8.17
7.71
48
Los apartados de la salida que vienen a continuacin se refieren al ajuste obtenido por el
modelo. Como ms arriba se ha dicho, el proceso de estimacin da como resultado una matriz S que reproduzca con la mxima fidelidad posible a la matriz observada S . Conviene,
en este punto, aclarar al lector que los ndices de ajuste no proporcionan garanta alguna respecto a la utilidad del modelo: de hecho, la informacin que realmente suministran se refiere
ms bien a la falta de ajuste del modelo. En segundo lugar, un buen ajuste no prueba nada
en sentido estricto (podran concebirse mltiples modelos que se ajustaran mejor a los datos
observados que el que sometemos a anlisis). En este sentido, resultara ms til un modelo
mal ajustado, en la medida en que dicho mal ajuste s sera una evidencia concluyente de
48
97
que el modelo no se ajusta a los datos. En tercer lugar, la evaluacin del ajuste debera realizarse desde perspectivas diversas y utilizando distintos ndices tanto globales como parciales
(dicho de otro modo, no disponemos de un ndice incuestionable que determine si el modelo
se ajusta o no a los datos empricos). Por ltimo, la evaluacin del ajuste de un modelo en
modo alguno deber desvincularse de la teora en la que se sustenta. Antes al contrario: un
no vinculado a una slida teora de base se torna intil.
buen ajuste
Tabla 14 (Cont.). Estadsticos de bondad del ajuste
Tabla 14 (cont.). Estadsticos de bondad del ajuste
Porcindelasalida
Goodness of Fit Statistics
Degrees of Freedom = 34
Minimum Fit Function Chi-Square = 88.47 (P = 0.00)
Normal Theory Weighted Least Squares Chi-Square = 85.11 (P = 0.00)
Estimated Non-centrality Parameter (NCP) = 51.11
90 Percent Confidence Interval for NCP = (27.72 ; 82.19)
Resultado
Comentarios
DegreesofFreedom=34
Grados de libertad del modelo. Evaluar el ajuste global significa
determinar el grado en que el modelo considerado como un todo es
consistenteconlosdatosempricos.Losndicesdeajusteglobalevalan
enqumedidaelmodeloseajustaperfectamentealapoblacin:6=6(T)
Minimum Fit Function El valor de F2 es la medida tradicionalmente utilizada para evaluar el
ChiSquare = 88.47 (P = ajuste global del modelo (pone a prueba la hiptesis nula de que el
0.00)
modelo se ajusta perfectamente a los datos de la poblacin). En el
ejemplo (F2=88.47, p=.000) debemos rechazar la hipteis nula (p=.000).
Sin embargo, desde una perspectiva ms pragmtica, conviene no tanto
examinarelniveldesignificacinestadstica,cuantolamagnituddelvalor
de F2: valores grandes corresponderan a un ajuste deficiente, y valores
pequeos a un mejor ajuste. Los grados de libertad podran servir como
estndaratravsdelcualjuzgarsielvalordeF2esgrandeopequeo.
interpretacineslamisma.Ambosvaloressonsensiblesalasdesviaciones
delanormalidadmultivariada(enespecialalacurtosis),altamaodela
muestrayasumen,adems,queelmodeloseajustaperfectamenteala
poblacin.
Estimated Noncentrality En lugar de preguntarnos si el modelo es correcto (i.e., se ajusta
Parameter(NCP)=51.11
NCPcuandosuvaloresdemasiadoalto).Aspues,ladiscrepanciaentre6
y6(T)nopuedeconsiderarseexcesiva,loqueapoyaelajustedelmodelo
alosdatos.
49
98
benito arias
Tabla 14 (Cont.). Estadsticos de bondad del ajuste
Resultado
Comentarios
Minimum Fit Function El valor de funcin de ajuste mnimo se usa para el clculo de F2 con el
Value=0.41
mtododemximaverosimilitud(ML)mediantelafrmula
F2
n 1 FML
donde n es el tamao de la muestra y FML es el Minimum Fit Function
Value;enelejemplo,F2=(2161)*.4115=88.4725
Population
Discrepancy El Population Discrepancy Function Value es el valor estimado de la
FunctionValue(F0)=0.24
funcindeajustecuandoelmodeloseajustaalamatrizdecovarianzade
la poblacin (6). Sirve para calcular el valor RMSEA (vid. ms abajo)
mediantelafrmulaRMSEA=(F0/GL)1/2dondeF0eselvalordefuncinde
discrepancia de la poblacin y GL los grados de libertad. As, en el
ejemplo,RMSEA=(.24/35)1/2=.0840
Approximation entre.05y.08razonable;entre.08y.10mediocre;porencimade.10el
(RMSEA)=0.084
modelodeberaserrechazado).RMSEA,aligualqueNCP,secentraenla
discrepanciaentre6y6(T),peroenestaocasinporgradodelibertad,lo
quesuponetomarenconsideracinlacomplejidaddelmodelo.
90 Percent Confidence El intervalo de confianza(0.062; 0.11) no incluye el valor .05, (tampoco
Interval for RMSEA = .06)loquerefrendaelescasoajuste.
(0.062;0.11)
PValue for Test of Close LaprobabilidaddequeelvalorRMSEAseainferiora.05esnicamenteen
Fit (RMSEA < 0.05) = nuestroejemplodel7.6%.
0.0076
50
Resultado
Comentarios
discrepancia entre 6 y 6(T), el valor ECVI lo hace sobre el error global
,estoes,ladiferenciaentrelamatrizdecovarianzasdela
entre 6 y 6
poblacinylaajustadaporelmodeloalamuestra.ECVIes,portanto,un
indicador ilustrativo del ajuste global del modelo. El valor obtenido en
nuestro ejemplo, ECVI=0.59 sera til si comparramos el modelo con
otros (no es informativo por s mismo). Si comparramos el modelo con
otros,elegiramoselquetuvieraunvalorECVImsbajo.Enlaprctica,los
otrosmodelossonelmodelodeindependenciayelmodelosaturado.El
primero es un modelo de independencia completa entre todas las
variables (i.e., todas las variables observadas son no correlacionadas y,
por tanto, es el ms restrictivo). Sus grados de libertad equivalen a k(k
1)/2 donde kes el nmero de variables; en nuestro caso, 10(101)/2=45
gl. El modelo saturado es aqul en el que el nmero de parmetros a
estimaresigualalnmero devarianzasycovarianzasentrelasvariables
observadas.Tiene,portanto,k(k+1)/2parmetrosy0gradosdelibertad,
es decir, es un modelo identificado (justidentified). En el ejemplo, los
parmetrosaestimarson10(10+1)/2=55.Cualquiermodelohipotetizado,
en consecuencia, se situar siempre en algn punto entre el modelo
saturado y el modelo de independencia. Si el ajuste es bueno, el valor
ECVI ser inferior al ofrecido por ambos modelos. En nuestro ejemplo,
ECVI=0.59 es menor que el ECVI del modelo de independencia (23.00)
peromayorqueeldelmodelosaturado(0.51),loqueabundaenqueel
ajuste obtenido no es excesivamente bueno. Sin embargo, debe
considerarsequeelintervaloal90%estentre0.48y0.74,demodoque
elvalormsbajodelintervalosesinferioralECVIdelmodelosaturado.
90 Percent Confidence Vid.explicacindelECVI
Interval for ECVI = (0.48 ;
0.74)
ECVI for Saturated Model Vid.explicacindelECVI
=0.51
ECVI for Independence Vid.explicacindelECVI
Model=23.00
51
99
100
benito arias
Tabla 14 (Cont.). Estadsticos de bondad del ajuste
Resultado
Comentarios
for ValordeF2paraelmodelodeindependencia(vid.msarriba).Estevalor
ChiSquare
IndependenceModelwith seusarparacalcularotrosndicesdeajuste(e.g.,NFI,NNFI).
45 Degrees of Freedom =
4924.37
Independence
AIC
4944.37
ModelAIC=127.11
En nuestro ejemplo, AIC=127.11 es inferior al AIC del modelo de
independencia (4944.37), pero superior al AIC del modelo saturado
(110.00):esteresultadoesconflictivo.
SaturatedAIC=110.00
Independence
CAIC
ValordelAICenelmodelosaturado.
= ValordelCAICenelmodelodeindependencia.
4988.12
ModelCAIC=218.99
En nuestro ejemplo, CAIC=218.99 es inferior tanto al AIC del modelo de
independencia(4988.12),comoalAICdelmodelosaturado(350.64).
SaturatedCAIC=350.64
ValordelCAICenelmodelosaturado.
52
Tabla 14 (Cont.). Estadsticos de bondad del ajuste
Resultado
Comentarios
Normed Fit Index (NFI) = Los siguientes ndices evalan en qu medida nuestro modelo es mejor
0.98
queotros,especialmenteelmodelodeindependencia.Enelejemplo,NFI
=0.9820;NNFI=0.9852;PNFI=0.7420;CFI=0.9888;IFI=0.9889;RFI=
0.9762. Con excepcin de PNFI, estos ndices indican un relativo buen
ajustedelmodelocomparadoconelmodelodeindependencia.
53
101
102
benito arias
Tabla 14 (Cont.). Estadsticos de bondad del ajuste
Resultado
Comentarios
CriticalN(CN)=137.24
CNindicaeltamaoqueunamuestradebealcanzarparaaceptarelajuste
de un determinado modelo sobre una base estadstica. El lmite inferior
aceptable suele estar en 200. En este caso, CN = 137.2438, valor algo
apartadodedicholmite.
Root
Mean
Square
RMR=29.47,indicaelvalorpromediodeloselementosen
Residual(RMR)=29.47
S 6 (vid.
explicacinsiguiente).
StandardizedRMR=0.022 Puesto que el tamao de los residuos puede variar con la unidad de
medida,esmejorutilizarelSRMR=0.022(losresiduosestandarizadosson
los residuos ajustados divididos por su error estndar) y pueden
interpretarsecomodesviacionestpicasnormales(valoresporencimade
2.58seconsideranaltos).EnelcasodelSRMR,valorespordebajode0.05
indicanunbuenajuste(taleselcasodenuestromodelo).
Goodness of Fit Index Los ndices GFI, AGFI y PGFI evalan el grado en que las varianzas y
(GFI)=0.93
covarianzasdelmodeloreproducencorrectamentelamatrizdevarianzas
y covarianzas original. El primero (GFI = 0.9266) lo hace globalmente, el
segundo (AGFI = 0.8813) ajustado a los grados de libertad y el tercero
(PGFI = 0.5728) ajustado a la complejidad del modelo. Los dos primeros
deben superar el valor de 0.90; el tercero puede ser mucho ms bajo y
aunaselmodelotenerunbuenajuste.
Como se ha visto, son muchos los posibles ndices de ajuste, y ninguno de ellos por separado es suficiente para determinar que el modelo se ajusta a los datos. La combinacin hoy
da ms utilizada es la siguiente: 2, RMSEA, ECVI, SRMR, GFI y CFI: ese conjunto debera
resultar suficiente para tomar una decisin respecto al ajuste del modelo (Boomsna,542000;
McDonald & Ho, 2002).
103
Los elementos de la matriz de covarianzas ajustadas (Fitted Covariance Matrix) son las
varianzas y covarianzas de las variables manifiestas estimadas por el modelo. En otras palabras, conforman la matriz que se compara con la matriz observada, S .
Tabla 14 (Cont.). Matriz de covarianzas ajustadas
Tabla 14 (cont.). Matriz de covarianzas ajustadas
Fitted Covariance Matrix
A1
A2
A3
A4
A5
C1
C2
C3
C4
C5
--------------------------------------------------------------------------------
A1 2038.04
A2 1612.15 1932.16
A5 1757.35
A1 1714.84
A2 1471.36
A3 1694.17
A4 2061.88
A5
C1
C2
C3
C4
C5
C1-------------------------------------------------------------------------------705.34 688.28 590.55 679.98 750.27 630.52
C2 2038.04
786.24 767.22 658.29 757.97
A1
C3 1612.15
938.02 1932.16
915.33 785.36 904.29
A2
C4
827.22
807.21 1313.81
692.59 797.47
A3 1383.25 1349.79
C5 794.46 775.24 665.17 765.90
A4 1592.71 1554.18 1333.51 2034.22
836.33
510.60
741.77
879.91
537.20
598.82
997.77
845.07
609.16
515.93
679.03 1087.41
575.11
714.42
686.13
855.27
605.08
728.67
C1
688.28
Los 705.34
resultados
de
679.98 anterior
750.27 630.52
la590.55
comparacin
se incluyen en el apartado Fitted Residuals
510.60 741.77
que
ejemplo,
el residuo entre A2 y C1 es 14.69,
609.16(702.969)
679.03 1087.41
resultado de la diferencia entre la covarianza original
y la estimada por el modelo
C4
827.22
807.21
692.59
797.47
879.91
537.20
598.82
714.42
modelo lleva a cabo
(688.28). Tenemos un caso de infra-ajuste (underfitting) toda vez que el 855.27
A1 775.24
A2 665.17
A3 765.90
A4 845.07
A5 515.93
C1 575.11
C2 686.13
C3
C4
C5
C5 794.46
605.08
728.67
una infraestimacin
de
la covarianza.
Lo contrario
sucede
cuando
los
residuos
ajustados
son
-------------------------------------------------------------------------------negativos.
A1
0.00
C2
786.24
767.22
757.97
). Por
Tabla
14 (cont.).
Matriz
deresidual
residuos
ajustados
componen
la
matriz658.29
(S S836.33
Fitted
Residuals
C3 938.02 915.33 785.36 904.29 997.77
A2
19.62
0.00
-60.25
0.00
-35.52 -26.55
27.04 -16.40
0.00
A1
A2
A3
A4
A5
C1
C2
C3
C4
C5
C1 -45.54
14.69
-5.53 -23.45
24.85
0.00
-------------------------------------------------------------------------------C2
-6.72
23.22
-4.56
6.78
34.88 -10.47
0.00
A1
0.00
C3 -38.11 -36.15 -35.33
-6.85
10.52
39.78
0.94
0.00
A2
19.62
0.00
C4 -51.98 -68.05 -32.73 -45.61
15.71
13.27
5.13 -36.55
0.00
A3
10.32 -12.91
0.00
C5
26.71
10.17
4.78
36.93
32.61 -24.89
-0.34
0.26
17.75
0.00
A4
64.59
92.98 -60.25
0.00
A5 -35.52 -26.55
27.04 -16.40
0.00
Summary Statistics for Fitted Residuals
C1 -45.54
14.69
-5.53 -23.45
24.85
C2
-6.72
23.22
-4.56
Smallest Fitted Residual =
C3 -38.11 -36.15 -35.33
Median Fitted Residual =
C4 -51.98 -68.05 -32.73
Largest Fitted Residual =
C5
26.71
10.17
4.78
6.78
-68.05
-6.85
0.00
-45.61
92.98
36.93
0.00
34.88
-10.47
0.00
15.71
13.27
5.13
10.52
32.61
39.78
-24.89
0.94
-0.34
0.00
-36.55
0.26
0.00
17.75
0.00
-68.05
92.98
0.00
55
104
benito arias
Los residuos vuelven a presentarse, en esta ocasin en formato estandarizado (StandarTabla 14 (cont.). Matriz de residuos estandarizados
dized
se adjunta
la mediana de los residuos y los valores mximo y mnimo. Los
Residuals);
Standardized
Residuals
residuos estandarizados se consideran grandes si superan el valor de |2.58|.
Tabla 14 (cont.).
A1 Matriz
A2de residuos
A3 estandarizados
A4
A5
C1
C2
C3
C4
C5
Standardized Residuals
Tabla 14 (Cont.). Matriz de residuos estandarizados
--------------------------------------------------------------------------------
A1
0.00
A1
A2
A3
A4
A5
C1
C2
C3
C4
C5
A2
0.95
0.00
-------------------------------------------------------------------------------A3
0.86
-1.12
0.00
A1
0.00
A4
2.55
3.81
-4.15
0.00
A2
0.95
0.00
A5
-2.90
-2.27
4.23
-1.10
0.00
A3
0.86
-1.12
0.00
C1
-1.58
0.53
-0.27
-0.75
1.03
0.00
A4
2.55
3.81
-4.15
0.00
C2
-0.23
0.82
-0.22
0.21
1.45
-1.16
0.00
A5
-2.90
-2.27
4.23
-1.10
0.00
C3
-1.03
-1.01
-1.37
-0.17
0.34
3.40
0.08
0.00
C1
-1.58
0.53
-0.27
-0.75
1.03
0.00
C4
-1.57
-2.12
-1.41
-1.27
0.57
1.25
0.50
-2.76
0.00
C2
-0.23
0.82
-0.22
0.21
1.45
-1.16
0.00
C5
0.97
0.38
0.25
1.21
1.48
-3.12
-0.04
0.03
1.97
0.00
C3
-1.03
-1.01
-1.37
-0.17
0.34
3.40
0.08
0.00
C4
-1.57
-2.12
-1.41
-1.27
0.57
1.25
Summary Statistics for Standardized Residuals
C5
0.97
0.38
0.25
1.21
1.48
-3.12
0.50
-0.04
-2.76
0.03
0.00
1.97
0.00
0.00
4.23
Al igual que en el caso de los residuos no estandarizados, se ofrece un grfico stem-andleaf con la distribucin de los residuos estandarizados18, y se incluye informacin sobre los
valores ms elevados, tanto positivos como negativos. En el ejemplo, el residuo negativo ms
elevado corresponde a A3-A4 (-4.15) en tanto que el positivo ms elevado corresponde a C318 En el grfico stem-and-leaf se muestra, a la izquierda de la lnea punteada, el tallo (i.e. primer dgito del residuo) y a la derecha de la lnea las hojas (i.e., segundo dgito). As, tenemos un valor cuyo primer dgito es -4 (-4.2); otro
valor cuyo primer dgito es -3 (-3.1); cuatro valores cuyo primer dgito es -2 (-2.9, -2.8, -2.3 y -2.1) y as sucesivamente,
hasta completar los 55 residuos.
56
56
105
Stemleaf Plot
A4 and
A3
-4.15
Residual for
C4 and
C3
-2.76
Residual for
A5 and
Residual for
C5 and
A1
C1
-2.90
-3.12
A4 and
A2
3.81
Residual for
C3 and
C1
3.40
Residual for
A5 and
A3
4.23
El grfico stem-and-leaf se completa, en la salida de LISREL, con el de residuos estanda3,5 de la distribucin normal20 (vid. Figura 8).
rizados contra los cuantiles
Cuantiles normalizados
19 Algunos autores (e.g.,2,5Diamantopoulos & Siguaw, 2000) estiman el valor de z|4| como punto de corte para
considerar grandes los residuos. Adoptando esa opcin, nuestro modelo nicamente tendra 2 residuos grandes (A3-A4:
z
-4.15) y A3-A5: 4.23).
z
1,5
z
20 Puesto que el grfico de residuos que proporciona LISREL es de z
bajazresolucin y de muy escasa calidad, recoz z DeltaGraph, SigmaPlot). El modo de generar
mendamos realizar dicho grfico en programas especializados (e.g., Excel,
zz
z
en Excel los datos para su graficacin
es, en snteis, el siguiente: zzenzzzla columna A escribimos los rangos, desde 1 a n,
0,5
zz
zz
siendo n el nmero de residuos (en nuestro ejemplo, 45, puesto
que desechamos los 10 valores 0.00 de la diagonal);
zz
z
en la B, la probabilidad acumulada, utilizando la frmula B2=(A2-0,5)/n y replicando hacia abajo; en la columna C
z la celda D2 calculamos la puntuacin normalizada con
z
z
escribimos los residuos y los ordenamos
de menor a mayor;zz
en
-0,5
z z
zz
la funcin D2=DISTR.NORM.ESTAND.INV(B2) y replicamos
hacia abajo: D3= DISTR.NORM.ESTAND.INV(B3) y as suz
z
zz
cesivamente. Graficamos a continuacin con un dispersigrama
los datos de las columnas C y D. Para asemejar el nuevo
zz
z
z
z
grfico al ofrecido por LISREL, sustituimos
-1,5
z los valores menores que -3.5 por -3.5 y los mayores que 3.5 por 3.5.
z
-2,5 z
-3,5
-3,5
-2,5
-1,5
-0,5
0,5
1,5
Residuos estandarizados
2,5
3,5
Residual for
C4 and
Residual for
C5 and
C3
-2.76
C1
-3.12
A4 and
A2
3.81
Residual for
C3 and
benito
arias
C1
3.40
Residual for
106
A5 and
A3
4.23
Figura 8. Residuos estandarizados y cuartiles normalizados
3,5
2,5
Cuantiles normalizados
1,5
z
zz
zz
z
zz
zz
z
zz
z
z
z
z
z
0,5
-0,5
-1,5
z
z
z
zz
z z
zz
z
zz
z
zz
z
z
z
zz
z
z
z
-2,5 z
-3,5
-3,5
-2,5
-1,5
-0,5
0,5
1,5
Residuos estandarizados
2,5
3,5
El mejor ajuste posible sucedera si todos los puntos estuvieran ordenados en una lnea
paralela al eje de ordenadas; el peor, si estuvieran en una lnea paralela al eje de abscisas. El
ajuste aceptable queda indicado cuando los puntos se sitan en torno a la diagonal.
57
107
AFECT
COGNI
--------------A1
- 1.02
A2
- 0.16
A3
- 1.28
A4
- 0.02
A5
- 4.97
C1
0.00
- C2
0.51
- C3Tabla 140.69
- modificacin
(cont.). ndices- de
C4Modification
1.78 Indices
- for
LAMBDA-X
C5
1.74
- -
AFECT
COGNI
--------------A1
- -0.13
A2
- -0.05
A3
- -0.10
A4
- -0.02
A5
- 0.24
C1
0.00
- C2
0.03
- C3
-0.05
- C4Expected
-0.07
Change for -LAMBDA-X
C5
0.06
- AFECT
COGNI
Completely
Standardized
--------------Change
for LAMBDA-X
A1
- -0.13
AFECT
COGNI
Standardized
Expected
Change
--------------for
A1 LAMBDA-X- 1.02
A2
- -0.05
AFECT
COGNI
A3
- -0.10
A4 -------- - --------0.02
A1A5
- - -0.06
0.24
A2C1
-0.00
-0.03
- A3C2
-0.03
-0.06
- A4C3
- -0.01
-0.05
- A5C4
0.11
-0.07
- C1C5
0.00
- 0.06
C2
0.05
- C3Completely
-0.06
- Standardized
C4Change -0.10
for LAMBDA-X - C5
0.09
- -
A2
- 0.16
AFECT
COGNI
A3
- 1.28
A4 -------- - -------0.02
A1A5
- - -2.84
4.97
A2C1
-0.00
-1.10
- A3C2
-0.51
-2.19
- A4C3
-0.69
-0.39
- A5C4
-1.78
5.14
- C1C5
-0.09
- 1.74
C2
1.41
- C3Standardized
-2.04 Expected
- -Change
C4for LAMBDA-X
-2.93
- C5
2.49
- -
Expected
Expected
AFECT
COGNI
AFECT
COGNI
----------------------------La informacin
orden
A1
- de
- los ndices
-2.84 de modificacin
A1 sigue el -mismo
-0.06que los parmetros
A2
-1.10
A2
-0.03
(LAMBDA-Y,
LAMBDA-X,
BETA,
GAMMA,
PHI,
PSI,
THETA-EPSILON
Y THETA-DELTA). Los
Tabla 14 (cont.). ndices de modificacin para TG
A3
- -2.19
A3
- -0.06
Modification Indices
for
THETA-DELTA
valores suministrados
servirn
para,
en
su
caso,
introducir
modificaciones
que mejoren el
A4
- -0.39
A4
- -0.01
ajuste delA5modelo. -Los
de modificacin sugieren
aadir
- ndices
5.14
A5
- - covarianzas
0.11 de error entre los
C1 A4 y-0.09
- 0.00
- -modelo con dichos
indicadores
A5 y A3,
y A3. SiC1
el
A1 A2,A2
A3 y entre
A4 A4 A5
C1volvemos
C2 a estimar
C3
C4
C5
C2
1.41
- C2
0.05
- 2
.
En
todo
caso,
tanto
la
introduccin
cambios,C3obtendramos
decremento
en
el
valor
de
---- -2.04
---- un------------------------- C3
-0.06
- C4 parmetros
-2.93 como la
- eliminacin
C4
-0.10 en el modelo
- de nuevos
de
alguno
presente
que
resulte inA1
- C5
2.49
- C5
0.09
- necesario
A2 fijndolo
0.91
- a-cero, deber estar justificada
A3
0.74
1.25
- A4
6.49
14.55
Tabla 14 (Cont.).
17.23
- - ndices de modificacin para q - d
A5
8.44
5.13 Indices
17.90 for
1.21
- Modification
THETA-DELTA
4.19
2.05
0.21
1.38
0.57
- -
C1
C2
A3
0.74
A5
8.44
A4
C1
C2
C3
C4
C5
1.25
- -
6.49
14.55
17.23
4.19
2.05
0.21
0.05
0.01
0.34
2.90
5.13
1.53
0.41
4.90
0.05
- -
17.90
1.21
0.25
0.02
0.56
0.00
0.03
1.13
- -
9.73
1.38
0.57
0.34
0.16
11.58
0.01
1.13
9.73
0.00
0.85
1.73
0.03
3.90
- -
0.00
1.35
1.56
- -
0.25
- -
- -
7.63
- -
C4
---- -
3.87
- -
3.87
C5
---- -
- -
58
108
benito arias
A1
A2
A3
A4
A5
C1
C2
C3
C4
C5
AFECT
-------40.65
39.66
34.03
39.18
43.24
- - - - - -
COGNI
-------- - - - - 21.40
23.86
28.46
25.10
24.11
PHI
AFECT
COGNI
AFECT
-------1.00
0.81
COGNI
-------1.00
Tabla 14 (cont.). Solucin completamente estandarizada
La diferencia entre
la solucin
estandarizada
(Standardized Solution) y la completamenCompletely
Standardized
Solution
te estandarizada (Completely Standardized Solution) estriba en que en la primera nicamente
LAMBDA-X
se estandarizan las variables
latentes (las manifiestas siguen conservando su mtrica original),
en tanto que en la segunda
se estandarizan
AFECT
COGNI tanto las variables latentes como las manifies--------------tas. A la vista de la solucin completamente estandarizada podemos obtener una serie de
A1
0.90
- conclusiones con respecto
al0.90
modelo: en- primer
lugar, hemos conseguido estimar el modelo
A2
A3
0.94 de sintaxis,
- - errores en el archivo de datos e.g., matriz sinsin problemas (debidos
a errores
A4
0.87
- gular, incompatibilidad
entre
A5
0.95el modelo
- y
- los datos, etc.); en segundo lugar, la revisin de
C1
0.85
los parmetros estimados revela que no existen estimaciones impropias o no razonables; en
- 0.88
tercer lugar, todos C2
los parmetros
son significativamente
distintos de cero como denotan los
C3
- 0.86
en cuarto
los valores de R2 son relativamente altos en todos los
valores de t obtenidos;
C4
- - lugar, 0.86
- - lo que
0.89
casos (el rango va C5
de .73 a .91),
nos sugiere que los indicadores son medidas razonablemente buenas de las
PHI variables latentes; por ltimo, la correlacin entre los factores es
positiva y moderadamente elevada, en consonancia con la teora previa.
AFECT
COGNI
AFECT
-------1.00
0.81
COGNI
-------1.00
THETA-DELTA
A1
-------0.19
A2
-------0.19
A3
-------0.12
A4
-------0.25
A5
-------0.09
C1
-------0.27
C2
-------0.23
C3
-------0.26
C4
-------0.26
C5
-------0.20
59
C3
C4
C5
- - - -
28.46
25.10
24.11
PHI
AFECT
COGNI
--------------AFECT
1.00
COGNI
0.81
1.00
desarrollo de un ejemplo de
anlisis factorial
confirmatorio
con lisrel, amos y sas
109
Tabla 14 (Cont.). Solucin completamente estandarizada
A1
A2
A3
A4
A5
C1
C2
C3
C4
C5
AFECT
-------0.90
0.90
0.94
0.87
0.95
- - - - - -
COGNI
-------- - - - - 0.85
0.88
0.86
0.86
0.89
PHI
AFECT
COGNI
AFECT
-------1.00
0.81
COGNI
-------1.00
THETA-DELTA
A1
-------0.19
A2
-------0.19
A3
-------0.12
A4
-------0.25
A5
-------0.09
C1
-------0.27
C2
-------0.23
C3
-------0.26
C4
-------0.26
C5
-------0.20
Fiab.
A1
.900
.810
A3
.939
.882
A2
A4
A5
C1
C2
C3
C4
C5
.902
.869
.952
.852
.876
.863
.858
.893
.814
.755
.906
.726
.767
.745
.736
.797
Adems de la fiabilidad de los indicadores individuales, puede calcularse la fiabilidad
compuesta de cada variable latente (fiabilidad de constructo). Para ello utilizaremos la infor-
110
benito arias
macin
de los coeficientes y varianzas de error de la tabla Completely Standardized Solution
y aplicaremos la siguiente frmula (LISREL no ofrece el clculo directo de esta clase de fiabilidad):
2
2
n n n
Uc Oi / Oi G i
i 1 i 1 i 1
donde c es la fiabilidad compuesta, i las saturaciones estandarizadas y i las varianzas de
error asociadas con las variables observadas individuales (i.e., varianzas de o ). La fiabilidad compuesta es similar al coeficiente a de Cronbach, e indica la consistencia interna de los
n
n
En
n la fiabilidad
indicadores dentro de un mismo nfactor.
el ejemplo,
compuesta de la subescaUv Oi2 / Oi2 G i Oi2 / n
la afectiva es igual a
i 1
i 1 i 1
i 1
20.182/(20.182+0.381)=0.962
2
media extractada,
las saturaciones
estandarizadas al
donde compuesta
U v es la varianza
la fiabilidad
de la subescala
cognitiva Oes
a
i igual
18.853/(18.853+1.227)=0.939
cuadrado y n el nmero de items de cada subescala. Una vez realizados los clculos (lo
la fiabilidad compuesta de la escala total equivale a
2
2
que puede hacerse fcilmente
enuna
hoja
n
n
n
clculo
los datos ofrecidos en la
de
apartir
de
79.282/(79.281+18.853)=0.975
Uc Oi / Oi G i
1 medias
i 1es
i 1 varianzas
ipodemos
superior
a 0.60,
concluir
quepara
los indicadoPuesto
en todostenemos
los casoslas
solucinque
LISREL),
siguientes
extractadas:
la
c
res de cada subescala, considerados en conjunto, son una medida fiable del constructo.
subescala afectiva: 4.167/5=0.834, lo que indica que el 83% de la varianza del factor
Una medida complementaria de la fiabilidad compuesta es la varianza media extractada
(average
variance
extracted),
quepor
se el
calcula
mediante
la frmula
afectivo
ha sido
capturada
constructo,
en tanto
que nicamente el 17% (1n
n 2 n n 2
Uv de
Oi2 /
.83=.17) es debido al error
medida;
la Osubescala
una VME algo ms
i G iafectiva
i /n
Opresenta
i 1
i 1 i 1
i 1
111
17.674.
Como se ve, todos ellos superan ampliamente el valor crtico de t=1.96 con p<.05,
t=2.58 con p<.01, o t=3.29 con p<.001.
determinarse en la medida en que
En lo que atae a la validez
Tabla discriminante,
15. Fiabilidad de podra
los indicadores
la varianza extractada de cada variable latente
Sat. fuera
Fiab.superior al cuadrado de la correlacin
2
= .656,
entre ellas (Hair et al., 2006). Esto es lo
sucede
en el ejemplo, toda vez que rAC
A1 que
.900
.810
= .755.814
como ms arriba se indic.
claramente inferior a VMEA = .834 y VME
A2 C .902
.939 nomolgica
.882
Cabra determinar, finalmente, laA3validez
(examinando si las correlaciones
A4
.869
.755 de la teora en que se inscribe la invesentre las variables latentes tienen sentido en el mbito
.952
tigacin) y la validez aparente (que, enA5todo
caso,.906
debera establecerse con anterioridad a los
C1 .852
.726
propios anlisis.
C2
C3
.876
.863
.858
.767
.745
.736
Mostramos
en la Tabla 16 la sintaxis en LISREL para el anlisis de este modelo. Como se
ve, es idntica a la del modelo anterior, con la nica diferencia de que se especifica el valor
0 en la matriz F. Tenemos en este caso un parmetro menos a estimar (i.e., la correlacin entre los dos factores) y, en consecuencia, un grado de libertad ms (GL=35) que en el modelo
anterior.
60
112
benito arias
Los resultados (Tabla 17 y Figura 10) denotan claramente un mal ajuste que conduce al
rechazo de
la hiptesis de que el modelo se ajusta a los datos observados.
17. Resumen
de resultados
del modelo
de dos no
factores
no correlacionados
TablaTabla
17. Resumen
de resultados
del modelo
de dos factores
correlacionados
Goodness of Fit Statistics
Degrees of Freedom = 35
61
113
Figura 10. Modelo AFC de dos factores no correlacionados
D. Modelo jerrquico (dos factores de primer orden y un factor de segundo orden)
El ltimo de los modelos sometidos a prueba (Figura 11) hipotetiza que los factores afectivo y cognitivo estn causados por un factor de segundo orden (arousal). Los parmetros a
estimar en este caso son 21 y las observaciones 55, por lo que tenemos un modelo supraidentificado con 34 grados de libertad. El modelo consta en total de 25 variables (10 manifiestas
y 15 latentes; 13 exgenas y 12 endgenas). En la Tabla 18 se ofrece la sintaxis (en SIMPLIS)
para analizar el modelo.
Figura 10. Modelo AFC de dos factores no correlacionados
62
62
Figura 11. Modelo AFC de dos factores de primer orden y uno de segundo orden
114
benito arias
Tabla 18.(en
Sintaxis
(en SIMPLIS)
deldemodelo
de dos de
factores
deorden
primeryorden
y un de
factor
de
Tabla 18. Sintasis
simplis)
del modelo
dos factores
primer
un factor
segundo
orden
segundo orden
!Matriz de covarianzas Williams Eaves & Cox, modelo C (Jerrquico)
Observed Variables
A1 A2 A3 A4 A5 C1 C2 C3 C4 C5
Latent Variables
C1 = 1*COGNI
C2 = COGNI
C3 = COGNI
C4 = COGNI
C5 = COGNI
AFECT = 1*AROUSAL
COGNI = AROUSAL
End of Program
63
desarrollo de un ejemplo
de anlisis
factorial
confirmatorio
Goodness
of Fit
Index (GFI)
= 0.93 con lisrel, amos y sas
115
Figura 12. Modelo AFC de dos factores de primer orden y uno de segundo orden
Figura 12. Modelo AFC de dos factores de primer orden y uno de segundo orden
A3
A4
A5
Arousal
C1
C2
C3
C4
C5
1
1
1
1
1
1
1
1
1
1
e1
e2
A2
e3
A3
Arousal Afectivo
e4
A4
e5
A5
e6
e7
C1
C2
Arousal Cognitivo
e8
C3
e9
C4
e10
C5
Modelo A
Modelo A
eA1
64
eA2
eA3
eA4
eA5
eC1
eC2
eC3
eC4
eC5
Modelo B1
Modelo B1
A1
A2
A3
Afectivo
A4
A5
C1
C2
Cognitivo
A1
C3
1
1
1
1
1
1
1
1
1
var_a
e1
res1
e2
e6
A4
A5
Arousal
var_a
res2
e7
e8
A3
Afectivo
e4
A1
A2
e3
e5
Cognitivo
C1
C2
C3
1
1
1
1
1
1
1
1
1
e1
e2
e3
e4
e5
e6
e7
e8
C4
C5
116
1
1
e9
C4
e10
C5
Modelo A
eC4
eC5
Modelo B1
benito arias
A1
A2
A3
Afectivo
A4
A5
C1
C2
Cognitivo
C3
C4
C5
1
1
1
1
1
1
1
1
1
1
var_a
e1
res1
e2
A2
e3
A3
Afectivo
1
e4
e5
A4
A5
Arousal
var_a
e6
res2
1
e7
e8
A1
Cognitivo
C1
C2
C3
e9
C4
e10
C5
Modelo B2
Modelo B2
1
1
1
1
1
1
1
1
1
1
e1
e2
e3
e4
e5
e6
e7
e8
e9
e10
Modelo C
Modelo C
65
Sem.TextOutput()
Sem.Standardized()
Sem.Smc()
Sem.AllImpliedMoments()
Sem.FactorScoreWeights()
Sem.TotalEffects()
Sem.BeginGroup(AmosEngine.AmosDir & "Examples\williams_eaves.sav")
sem.AStructure("A1
sem.AStructure("A2
sem.AStructure("A3
sem.AStructure("A4
sem.AStructure("A5
sem.AStructure("C1
=
=
=
=
=
=
(1) AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
+
+
+
+
+
+
(1)
(1)
(1)
(1)
(1)
(1)
e1")
e2")
e3")
e4")
e5")
e6")
20
amos (en
del modelo
SINTAXISsintaxis
AMOS (en VisualBasic)
del VisualBasic)
modelo A (unidimensional)
A (unidemensional)21
#Region "Header"
Imports System
Imports System.Diagnostics
Imports Microsoft.VisualBasic
Imports AmosEngineLib
Imports AmosGraphics
Imports AmosEngineLib.AmosEngine.TMatrixID
Imports PBayes
#End Region
Module MainModule
' AFC WILLIAMS EAVES & COX MODELO A
'
Sub Main ()
Dim sem As New AmosEngine
Try
Sem.TextOutput()
Sem.Standardized()
Sem.Smc()
Sem.AllImpliedMoments()
Sem.FactorScoreWeights()
Sem.TotalEffects()
Sem.BeginGroup(AmosEngine.AmosDir & "Examples\williams_eaves.sav")
sem.AStructure("A1
sem.AStructure("A2
sem.AStructure("A3
sem.AStructure("A4
sem.AStructure("A5
sem.AStructure("C1
sem.AStructure("C2
sem.AStructure("C3
sem.AStructure("C4
sem.AStructure("C5
=
=
=
=
=
=
=
=
=
=
(1) AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
AROUSAL
+
+
+
+
+
+
+
+
+
+
(1)
(1)
(1)
(1)
(1)
(1)
(1)
(1)
(1)
(1)
e1")
e2")
e3")
e4")
e5")
e6")
e7")
e8")
e9")
e10")
Sem.FitModel()
Finally
Sem.Dispose()
End Try
End Sub
End Module
20
Sepresentanicamente,attulodeejemplo,lasintaxisenAMOSVBdeunodelosmodelos.
66
117
118
benito arias
21
67
119
REFERENCIAS BIBLIOGRFICAS
Arbuckle, J. L. (2000). Exploratory structural equation modeling. Fordham University. Department of
Psychology colloquium series.
Bandalos, D. L. (2002). The effects of tem parceling on goodness-of-fit and parameter estimate bias in
structural equation modeling. Structural Equation Modeling: A Multidisciplinary Journal, 9, 78102.
Bandalos, D. L. & Finney, S. J. (2001). tem parceling issues in structural equation modeling. En G. A.
Marcoulides & R. E.Schumacker (Eds.), New development and techniques in structural equation
modeling (pp. 269-296). Mahwah, NJ: Lawrence Erlbaum.
Bentler, P. M. (1995). Structural Equations Program Manual. Encino, CA: Multivariate Software, Inc.
Bentler, P. M., & Chu, C. (1987). Practical issues in structural modeling. Sociological Methods & Research, 16, 78-117.
Boomsma, A. (2000). Reporting Analyses of Covariance Structures. Structural Equation Modeling: A
Multidisciplinary Journal, 7(3), 461483.
Brown, T. A. (2006). Confirmatory factor analysis for applied research. New York: The Guilford Press.
Breckler, S. J. (1990). Applications of covariance structure modeling in psychology: Cause for concern?
Psychological Bulletin, 107, 260-263.
Cribbie, R. A. (2007). Multiplicity Control in Structural Equation Modeling. Structural Equation Modeling: A Multidisciplinary Journal, 14, 98-112.
Diamantopoulos, A., & Siguaw, J. A. (2000). Introducing LISREL. Thousand Oaks, CA: Sage.
Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (2006). Multivariate data analysis
(6 ed.). Upper Saddle River, NJ: Pearson-Prentice Hall.
Hancock, G. R. (1999). A sequential Scheff-type respecification procedure for controlling Type I error
in exploratory structural equation model modification. Structural Equation Modeling: A Multidisciplinary Journal, 6, 158-168.
Hatcher, L. (2006). A step-by-step approach to using SAS for factor analysis and structucal equation
modeling. Cary, NJ: The SAS Institute.
Hu, L. T., & Bentler, P. M. (1999). Cutoff criteria for fit indices in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling: A Multidisciplinary Journal,
6, 1-55.
Jackson, D. L. (2007). The effect of the number of observations per parameter in misspecified confirmatory factor analytic models. Structural Equation Modeling: A Multidisciplinary Journal, 14(1),
4876.
Jreskog, K. G. (1993). Testing structural equation models. En K.A.Bollen & J.S.Lang (Eds.), Testing
structural equation models (pp. 294-316). Newbury Park, CA: Sage.
Jreskog, K. G., & Srbom, D. (1996a). LISREL 8: Users Reference Guide. Chicago, IL: Scientific Software International.
Jreskog, K. G., & Srbom, D. (1996b). LISREL 8: Structural Equation Modeling with the SIMPLIS command Language. Chicago, IL: Scientific Software International.
Kenny, D. A. (1979). Correlation and causality. New York: John Wiley and Sons.
Kishton, J. M., & Widaman, K. F. (1994). Unidimensional versus domain representative parcelling of
questionnaire tems: An empirical example. Educational and Psychological Measurement, 54,
757-765.
120
benito arias
Kline, R. B. (2005). Principles and practice of structural equation modeling. (2 ed.) New York: The Guilford Press.
Little, T. D., Cunningham, W. A., Shahar, G., & Widaman K. F. (2002). To parcel or not to parcel: Exploring the question, weighing the merits. Structural Equation Modeling, 9, 151-173.
Loehlin, J. C. (2004). Latent variable models: An introduction to factor, path, and structural equation
analysis. (4 ed.) Mahwah, NJ: Lawrence Erlbaum Associates.
Lomax, G. R. (1982). A guide to LISREL-type structual equation modeling. Behavior Research Methods
& Instrumentation, 14, 1-8.
McDonald, R. P., & Ho, M. R. (2002). Principles and Practice in Reporting Structural Equation Analyses. Psychological Methods, 7(1), 6482.
McKnight, P. E., McKnight, K. M., Sidaniy, S. y Figueredo, A. J. (2007). Missing Data: A Gentle Introduction (Methodology In The Social Sciences). New York: Guilford.
Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric theory (3 ed.). New York: McGraw-Hill.
SAS Institute (2006). SAS, v. 9.1.3. [Programa informtico]. Cary, NC: SAS Institute Inc.
Schumaker, R. E., & Marcoulides, G. A. (Eds.). (1998). Interaction and nonlinear effects in structural
equation modeling. Mahwah, NJ: Erlbaum.
Scientific Software International (2006). LISREL, v. 8.8 [Programa informtico]. Lincolnwood, IL: Scientific Software International.
SPSS (2006). AMOS, v. 6.0 [Programa informtico]. Chicago, IL: SPSS, Inc.
SPSS (2006). SPSS, V. 14.0 [Programa informtico]. Chicago, IL: SPSS, Inc.
Tabachnick, B. G., & Fidell, L. S. (2001). Using multivariate statistics (4 ed.). Boston: Allyn & Bacon.
West, S. G., Finch, J. F., & Curran, P. J. (1995). Structural equation models with nonnormal variables:
Problems and remedies. En R. H. Hoyle (Ed.), Structural equation modeling: Concepts, issues, and
applications (pp. 56-75). Thousand Oaks, CA: Sage.
Williams, T. O., Eaves, R. C. y Cox, C. (2002). Confirmatory factor analysis of an instrument designed
to measure affective and cognitive arousal. Educational and Psychological Measurement, 62(2),
264-283.
META-ANLISIS DE LA INVESTIGACIN
Julio Snchez Meca
Departamento de Psicologa Bsica y Metodologa
Facultad de Psicologa (Universidad de Murcia)
INTRODUCCIN
Durante la segunda mitad del siglo pasado se ha producido una explosin de informacin que ha provocado la necesidad de desarrollar mtodos objetivos y sistemticos para la
acumulacin del conocimiento cientfico en cualquier mbito de investigacin. El meta-anlisis ha surgido como una metodologa capaz de integrar cuantitativamente los resultados de
las investigaciones sobre un determinado tema para poder establecer qu es lo que la evidencia emprica, hasta ese momento, ha demostrado. La revisin cuantitativa de la investigacin
se ha convertido en una tarea imprescindible entre el quehacer cientfico del pasado y del
futuro, para orientar y dirigir nuevas investigaciones. Pero el meta-anlisis es ms que un
mero mtodo de revisin de la investigacin. El meta-anlisis comporta un nuevo modo de
entender el significado y el anlisis de los datos, con su nfasis en el tamao del efecto frente
a las pruebas de significacin; es un nuevo enfoque que afecta a la interpretacin habitual
de qu entendemos por descubrimiento cientfico (Glass, McGaw y Smith, 1981; Schmidt,
1992, 1996; Schmidt y Hunter, 1995).
La realizacin de un meta-anlisis es un proceso de investigacin que requiere el
cumplimiento de las normas propias del mtodo cientfico: objetividad, sistematizacin y
replicabilidad. sta es la principal diferencia con respecto a las revisiones tradicionales de la
investigacin. Frente a las revisiones narrativas, tambin denominadas revisiones cualitativas
o subjetivas, el meta-anlisis propugna el mismo rigor cientfico que se exige en las investigaciones primarias. En un meta-anlisis no se prejuzgan los resultados de las investigaciones,
sino que se cuantifican y se analizan conjuntamente. As mismo, un meta-anlisis tiene que
garantizar su replicabilidad por otros investigadores, por lo que todas las decisiones en el
proceso de revisin cuantitativa tienen que hacerse explcitas (Rosenthal, 1995).
La caracterstica que mejor identifica al meta-anlisis es el uso de los mtodos estadsticos para integrar cuantitativamente los resultados de los estudios. Para ello, se requiere
definir una medida de los resultados que sea homognea a lo largo de todos los estudios.
El ndice conocido como tamao del efecto (effect size) representa la magnitud en que se
manifiesta el fenmeno en cuestin en cada estudio emprico (Glass et al., 1981). Hoy da
existen numerosos textos que exponen cmo llevar a cabo estudios meta-analticos, cmo
Trabajo financiado con un Proyecto del Fondo de Investigacin Sanitaria en la convocatoria de Evaluacin de
Tecnologas Sanitarias (Expediente N PI07/90384)
122
calcular el tamao del efecto de cada estudio y cmo aplicar tcnicas de anlisis estadstico
especficamente diseadas para ser aplicadas en meta-anlisis, y todo ello dirigido a diferentes mbitos cientficos, tales como las Ciencias Sociales y del Comportamiento (Botella y
Gambara, 2002; Cooper, 1998; Cooper y Hedges, 1994; Glass et al., 1981; Gmez, 1987;
Hedges y Olkin, 1985; Hunter y Schmidt, 2004; Lipsey y Wilson, 2001; Petticrew y Roberts,
2006; Rosenthal, 1991; Schulze, 2004; Wolf, 1986) y las Ciencias de la Salud (Davey Smith, 2001; Eddy, Hasselblad y Shachter, 1995; Egger, Smith y Altman, 2001; Martn, Tobas y
Seoane, 2006; Sutton, Abrams, Jones et al., 2000; Whitehead, 2002).
FASES DE UN META-ANLISIS
A lo largo del proceso de realizacin de un meta-anlisis se suceden varias etapas, cada
una de las cuales pretende aportar objetividad y sistematizacin al proceso de revisin. Las
principales fases de un meta-anlisis pueden resumirse en (Lipsey y Wilson, 2001; MarnMartnez, Snchez-Meca, Huedo y Fernndez-Guzmn, 2007; Roberts, Kuncel, Viechtbauer
y Bogg, 2007; Snchez-Meca, 1999; Snchez-Meca y Ato, 1989): (a) formulacin del problema, (b) bsqueda de la literatura, (c) codificacin de los estudios, (d) anlisis estadstico y (e)
publicacin del estudio.
1 Formulacin del problema. Como en cualquier investigacin, el primer paso que
debe dar el meta-analista es definir el objeto del meta-anlisis, que generalmente ser estudiar la magnitud y sentido de la relacin entre dos (o ms) variables o conceptos. En esta
fase se precisa definir los conceptos no slo de forma terica, sino tambin las variables que
se aceptarn como operativizaciones de ellas. Las definiciones operativas de los conceptos
constituyen un importante criterio para la inclusin de los estudios en el meta-anlisis. As
mismo, hay que distinguir entre las variables fundamentales de la investigacin (aqullas
cuya relacin se pretende estudiar) y variables potencialmente moderadoras de tal relacin.
En esta fase deben tambin plantearse las hiptesis que se pretenden poner a prueba.
2 Bsqueda de la literatura. Una vez formulado el problema de investigacin, el paso
siguiente consiste en realizar una bsqueda de la literatura lo ms completa y exhaustiva posible. Para ello, es preciso especificar los criterios que deben cumplir los estudios empricos
para que sean incluidos en el meta-anlisis, tales como el rango temporal en el que se realizaron o publicaron o el tipo de informacin estadstica que deben aportar para poder realizar
posteriormente los clculos del tamao del efecto.
En esta fase se recomienda utilizar tanto procedimientos formales como informales de
bsqueda. Dentro de los procedimientos formales destacan las bsquedas por computador,
que permiten acceder con gran economa de tiempo y recursos a las bases de datos informatizadas mediante el uso de palabras clave y otros descriptores. Pero estos procedimientos
formales deben completarse con el uso de otros sistemas de bsqueda no sistemticos que
permiten localizar la literatura fugitiva, es decir, trabajos no publicados o de muy reducida
difusin, pero que pueden aportar datos relevantes al meta-anlisis.
Por muy completa que sea la bsqueda de los estudios siempre cabe la posibilidad de
que no seamos capaces de recoger todos los existentes, en especial aqullos que no han sido
publicados, con la consiguiente amenaza que el sesgo de publicacin contra los resultados
nulos puede ejercer en el meta-anlisis. Siempre es recomendable, pues, realizar un estudio
de la tolerancia a los resultados nulos para poder desechar el sesgo de publicacin como una
posible amenaza contra la validez de las conclusiones del meta-anlisis (Begg, 1994; Burdett,
Stewart y Tierney, 2003; Rosenthal, 1991; Rothstein, Sutton y Borenstein, 2005; Sutton, Duval, Tweedie et al., 2000).
meta-anlisis de la investigacin
123
124
5 Publicacin del estudio. Para lograr el carcter replicable del meta-anlisis, es preciso
que la publicacin del mismo siga las mismas normas que la publicacin de investigaciones
primarias (Botella y Gambara, 2006; Cooper, 1998; Rosenthal, 1995). La presentacin de
un meta-anlisis debe, pues, incluir una introduccin en la que se especifique el objetivo
del estudio, las definiciones conceptuales y operativas de las variables y las hiptesis que se
pretenden probar. En la seccin mtodo se incluye el proceso de bsqueda de los estudios
incluidos en el meta-anlisis, la codificacin de las variables y de los tamaos del efecto y la
especificacin de las tcnicas estadsticas que se han aplicado. En la seccin de resultados
se presentan y discuten los resultados de los estadsticos y contrastes aplicados, finalizando
con las conclusiones, que deben incorporar directrices para la investigacin futura. En la publicacin debe ofrecerse al lector todas las facilidades para disponer de toda la base de datos
meta-analtica, con objeto de posibilitar su replicacin por otros investigadores.
NDICES DEL TAMAO dEL EFECTO
Para poder integrar los resultados de mltiples estudios o investigaciones primarias acerca de una misma temtica, es preciso que vengan expresados en una mtrica comn que los
haga directamente comparables. En Ciencias Sociales es muy frecuente que, para la medicin de un mismo concepto, se empleen muy diversas definiciones operativas, con diferentes
indicadores y escalas de medida. Desde el meta-anlisis se ha propuesto el tamao del efecto
como el indicador idneo para representar el resultado de una investigacin, de forma que
sea comparable para diferentes escalas y operacionalizaciones de las variables implicadas.
Son mltiples los ndices del tamao del efecto que se pueden utilizar para resumir cuantitativamente la magnitud de la relacin entre las variables. En meta-anlisis estos ndices suelen
agruparse en dos familias: Las familias d y r.
La familia d. Cuando los diseos de los estudios implican asignacin de sujetos a diferentes grupos o condiciones experimentales (generalmente, grupos experimental y control),
el ndice del tamao del efecto ms adecuado es la diferencia media tipificada, que se define como la diferencia entre las medias de losygrupos
experimental y control dividida por la
E yC
d
c
m
(
)
,
desviacin tpica intra-grupo (Lipsey y Wilson, 2001; Shadish
y Haddock, 1994):
S
yE yC
y yC
d c ( m)
,
d c ( m) E
,
S
y E y y CS
donde y E yy y C son las medias de los grupos experimental y control, respectivamente; S es la
y y yC
desviacin tpica intra-grupo, que se obtieneE mediante:
(n E 1) S E2 (n C 1) S C2
,
n E nC 2
(n E 1) S E2 (nC 1) S C2
,,
n E nC 2
(n E 1) S E2 (nC 1) S C2
,
n E nC 2
S
S
3
.
4
(
n
nC ) 9 propona como resultado de los estudios el
E
Aunque 3la corriente meta-analtica preconizada por
Rosenthal
cnivel
(m) crtico
1 de probabilidad, .p, obtenido en la prueba de significacin,
3
actualmente no se utiliza este ndice debido a su
.
c(m) 1
4(del
n E tamao
nC ) de
9 la muestra.
dependencia
4( n E n C ) 9
c(m) 1
Glass et al. (1981) propusieron dividir la diferencia entre las medias por la desviacin tpica del grupo de
control, SC (cuando exista), en lugar de dividir por S, debido a que, en ocasiones, la aplicacin de un tratamiento puede
n E ndependiente,
alterar la variabilidad natural de los sujetos en la variable
d 2 como resultado de un efecto interactivo sujeto x
C
.
(d )
tratamiento. Pero siempre que se cumpla elVsupuesto
de homogeneidad
n E nC
2(n E nde
)varianzas, es ms eficiente utilizar S (Hedges
2
C
y Olkin,
n E 1985).
nC
d
2
V (d )
n E nC
2(n E nC )
y E yC ,
V (d )
n E nC
d
.
n E nC
2(n E nC )
y E yC ,
y E yC ,
y E yy yC y C
c ( m) E
,
S
y y
d c(ym) y Ey C ,
E
ySCE y C 2
2) investigacin
meta-anlisis
125
()m
,
(ndE c1de
Sla
E ( nC 1) S C
S
S
,
y En EyynCC 2
siendo nE y nC los tamaos muestrales de los ygrupos
experimental y control, respectivamente,
E2 y y C
(
n
1
)
S
(
n
1) S C2 sesgo positivo para muestras pey y las respectivas varianzas. El factor c(m)
corrige
elligero
E
E
C
S
,
y y
queas mediante:
d c(nmE ) nECy 3 2C y ,
E
C
c(m
(n)Ed11)cS(E2m) (SnCS 1) S C,2..
4
(
n
n
)
9 ,
S
(n E n 1)SnEE2 (2nC C 1) S C2
E
C
S
,
y E y yC
ny E y nyCdel
2efecto se pondera por la inversa de su
En meta-anlisis, cada estimacin del tamao
3 C
E
. ms precisos (que suelen ser los
c (m) 1 que los estudios
varianza muestral, con objeto de permitir
4( n E nC ) 2 9
basados en tamaos muestrales mayores)n Eejerzan
undmayor peso especfico en los clculos
nC
.
V (d )
3 de un estimador
meta-analticos. Por ello es fundamental
disponer
eficiente de la varianza
c (m)(n 1nE1n)CS 2 2(n(n E 1n) SC. )2
3
E
E
C
C
debida a error de muestreo (o varianza
intra-estudio).
Para
el
ndice
d,
sta viene dada por:
S c(m)(n 14(1n)ES2 nC()n 9 1) S. 2,
E n nE 2 C
C
S
,
E 4( n C n C2 ) 9
n E nCn E E nCd
2 .
V (d )
n E nC
2(n E nC )
D y E y C ,2
n E nC
d
En el caso de que todos losVestudios
del meta-anlisis
. hayan operativizado la variable
3
(d )
2
n
n
n
n
EC
C 2( n E dnC ) .
E
c
(
m
)
1
dependiente con la misma escala, test
necesario
estandarizar la diferencia
.
V (d o prueba, no
sera
3
n(Cnconjunta,
2C(n)E9 nsino
c (mtpica
) n1E4
E n
C ) . que la simple diferencia entre
de medias dividiendo por la desviacin
D y E 4(2 nyEC , nC ) 9 2
(Bond, Wiitala y Richard,
las dos medias sera un ndice del tamao
(nC apropiado
(n E del
1) S efecto
1) S C
.
V ( D) 2000): E
2003; Rosenberg, Adams y Gurevitch,
n n 2
D y EE y CC , 2
n nCy y d ,,
V (d ) (n ED
n E1)S n2EC (n C d1)2 S 2 .
V ( D)V (d ) En E nC E 2(nCE nC )C . .
nnEEnC nC
2(2n E nC )
siendo su varianza intra-estudio:
dr pE2 pC ,
(n E 1) S E (nC 1) S C2
.
V ( D)
(n 1) S 2 (n 1) S C2
V ( D) D E nyE nEyC ,2C
.
E
n E nC C 2
,
dr D pE yEpC ,yelC resultado
Cuando la variable dependiente es dicotmica,
de cada estudio queda resupC (1 pC )
(
1
)
p
p
E
E
mido en una tabla de contingencia
mdica
. ha estudiado en profundidad
V (dr2) x 2. La literatura
estos casos, recomendando la aplicacin denEalguno de nlos
tres siguientes ndices del tamao
C
dr pE 2 pC ,
del efecto (Deeks y Altman, 2001; Fleiss,
1) SpE Haddock,
(n 1) S C2Rindskopf y Shadish, 1998; Sn(n E 1994;
dr
E 2 pCC ,
.2
V
D
(
)
1) Sriesgos,
) S p (1n pde
p (1nLa
p 1diferencia
chez-Meca y Marn-Martnez, 2000, 2001):
dr (o de proporciones),
V (V
dr()D) E E n EE nEC C 2 C C . C .
la razn de riesgos, rr (o de proporciones) nyE el nodds
ratio,
C 2 or (o razn de posibilidades, o de
E nC n
productos cruzados). Siendo nE y nC los tamaos muestrales de los dos grupos, O1E y O1C las
p (1 p ) pC (1 pC )
frecuencias de xito en ambos grupos,
frecuencias
de fracaso respectivas, la
.
V (dr) yE O2E yE O2C las
pnE (1 pE ) pnC (1 pC )
E
C
diferencia de riesgos se obtiene mediante:
.
V (dr) dr p p
1
nEE C , nC
dr pE pC ,,
pE (1 pE ) pC (1 pC )
V (dr)
p (1 pE) pnC (1 p.C.)
C
.
V (dr) nE E
1
nE
nC
1
La razn de riesgos y su varianza intra-estudio, esta ltima en trminos del logaritmo de
la razn de riesgos, se obtienen mediante:
rr
V (Lrr)
or
pE
.
pC
1 pE 1 pC
.
nE pE nC pC
pE (1 pC )
O1EO2C
rr
V (Lrr)
126
pE
.
pC
1 pE 1 pC
.
nE pE nC pC
rr
ppE
pE .
rrintra-estudios,
p E ..
Y el odds ratio, junto con su varianzarr
tambin en funcin del logaritmo
rr pppECCC.
del odds ratio, se obtienen mediante:
p
C
111EOpp2CC
pE (111ppCp)E O
1 pCC ..
V
((Lrr
Vor
Lrrp))) (111nppppE)EE
1O
ppC .
O
V
(Lrr
V (Lrr) C nnEEE ppEEEE n
nn1CCC pp2CCCE .
nE pE nC pC
1
1
1
1
.
O1E O1C O2 E O2C
V ( Lor)
Por otra parte, se dan situaciones en las que la variable de respuesta es continua en nappE ((11 ppCque
) O
turaleza, pero ha sido dicotomizada,orde forma
nica
informacin disponible en el es1EO
2C
Ola
1EO2C
pCC)) O
1EO2C
or pppEE(((111
p
)
O
O
or
p
)
O
O
tudio es una tabla de contingencia 2orx d2 del
tipo
justamente
comentado. Lo ms aconsejable
EC (1
C
1
E
2
C
E
1
C
2
E
p
p
)
O
O
) 2E
pC(1 (pzEEE) Oz11CCCO
Probit
pCC(1 pestandarizada
O1CO22EE
en estos casos es estimar la diferencia media
aplicando alguna de las funcioE)
nes de transformacin de variable dicotomizada
De las diversas propues11
11 za2 variable
11
11continua.
2
2S))p E (11 p E )1e E 12SpC (11 p.. C )e zC
((Lor
V
V
Lor
tas, las que mejores propiedades
poseen
en
1son una
1 basada
1
1 la funcin
Lor
V (d Probit V
)V((Lor
)) O
, probit, dProbit (Glass et
O11EE O
O11CC O
O22EE O
O22CC ..
O
O
O
1n
EE O
1C
2 E propuestas
2n
CC
al., 1981), y otras dos basadas enla funcin
logstica
por
Cox, dCox (Haddock et
O1E O1C O2 E O2C
al., 1998) y por Hasselblad y Hedges (1995), dHH, respectivamente (Snchez-Meca, MarnMartnez y Chacn-Moscoso, 2003). El ndice dProbit y su varianza intra-estudio se obtienen
mediante:
ddProbit ((zzE zzC ))
Probit
( z E z CC )1
dProbit
1
[ zE )
( p E )(;zzEEC z)
d Probit
C ) ( pC ) ] .
2Sp E (1 p E )e zzzEE2E2 2SpC (1 pC )e zzzCC2C2
2Sp (1 p )e
2Sp (1 p )e 2
22SSppCCC((11n ppCCC))eezC2 ,,,
22SSppEEE((11n ppEEE))eez E
,
nnEE
nnCC
n EE
nCC
V
)
V (((dddProbit
Probit )
V
Probit )
V (d Probit )
siendo Lor el logaritmo del odds ratio. Y el ndice dHH y su varianza intra-estudio vienen da2
dos por:
33
ddHH Lor
Lor S33 ,,,
HH
d HH
Lor
d HH Lor SS ,
3 1
1
1
1
V (d HH )
.
2
S3 O11E O12 E O11C O12C
V (d HH )
.
O2 E O
O2C que son aplicables a diseos
S 2 O1E tienen
22
1C comn
Todos los ndices hasta aqu comentados
en
2
2
de dos grupos independientes. Si el diseo es de un solo grupo con pretest y postest, el ndice
ms apropiado para reflejar el efecto es la diferencia entre las puntuaciones de cambio estany Pre y Post
darizada, dChange:
,
d Change
y Pre Sy Post
,
d Change
S
d1
d1
d2
y Pre y Post
y SPrey
Pre
Post
S Pre
y Pre y Post
3 1
1
1
1
V ((dd HH )) 32 1 1 1 1 ..
V
3 O11E O12 E O11C O12C
HH
V (d HH ) SS22 O
1E O2 E O1C O2 C .
O1C O2C
meta-Sanlisis
la2 Einvestigacin
O1E de O
127
donde S es una estimacin de la desviacin estndar, para la cual se han propuesto diferen yy Post (1993) proponen utilizar la desviacin
Pre
yyPre
tes opciones. En concreto, Gibbons,dHedeker
y Davis
Post ,
Change
d Change
y Pre Sy Post ,
estndar de las puntuaciones de cambio
d Change entre elSpretest, y el postest (ndice d2). Dunlap, CorS
tina, Vaslow y Burke (1996) y Becker (1988) consideran
ms apropiado utilizar la desviacin
1
1 no1contaminado
1
estndar del pretest (ndice d1) como 3un estimador
por el efecto del trata
V (d HH )
.
2 1
3
1
1
1
miento:
V (d HH ) S2 Oy1E Oy2 E O1C O2C.
Pre O
PostO
O2 C
Sd O1yE Pre
y Post
1C
d 11 y Pre S 2yEPost
Pre
d1
S Pre
S Pre
y Pre
y Post
Pre
Post
yy Pre
yyPost
dddChange
2
.. ,
y Prey Pre
y
y
2
S
PostPost
S
D
SD
. ,
ddChange
2
S DS
2
V
d
d
(
)
1
1
V (d11) 2(1 n r ) nn13y1Pre S2(1ynPost
d11 d112 1)]22
n dn1 31 2(Pre
1 rr))d12 [[cc((nn
1)]
V (d1 )
n n 3 S2Pre
(1 r ) [c(n 1)]2
V((dd 2 ))
V
2
V (d 2 )
2y Post dd 222
nnd11 y1 Pre
,
nd
2
. 2
n 21 y1 nd
22y [c(nd 22 1)]22 ,
((nn2 33)) 1Pre
nnd
ndS22D Post
[c.(n 1)]2 ,
n(n 3)
S D [c(n 1)]
siendo n el tamao muestral, r el coeficiente de correlacin de Pearson entre las puntuaciones del pretest y el postest y c(m) el factor de correccin del sesgo para muestras pequeas,
que se obtiene mediante:
d12
33n
2(1 cr()nn1
1
.
c(n1)) 1114(n
V (d1 )
d. 12
3
1
)
1
2(1 n rc)(nnn1)131 4(n2(1n1)r1) .2 [c(dn12 1)]2
2
n 3 2(1 r ) [c(n 1)]
d 22a grupos se da cuando los dos grun 1con asignacin
Otra situacin comn en los diseos
,
V (d 2 )
1 nd 22
2
2
n 1enE el pretest
pos (experimental y control) se registran
ydC2
en1)]el
E
C postest. En estas condiciones,
C
,
V (d 2 ) n(n 3y)E1Pre ndy22EPost
[c(ynCPre
y
2 Post
el
yCPost
el ndice de la familia d ms
comparar
cambio que se produce en un
3)yEPre yEPost
n(n debera
[c(nyCPre
1)]
' 1 apropiado
Ey
'
y Pre SCCy Post
dd11EE dd11CC y Pre
1
E
Post
S
grupo con el cambio que se
produce
en
el
otro.
Pero,
dado
que
Pre
Pre
' 1 d1E d1C
SEPre
SCPre existen al menos dos posibles
S Pre
ndices para definir el cambio estandarizado Sdel
postest en cada grupo (ndices d1
Pre pretest al
3 utilizada, tambin cabe proponer dos
y d2), segn la estimacin de la desviacin estndar
.
c(n 1) 1
ndices de la diferencia entre cambios medios4(estandarizados
(Becker, 1988; Morris, 2000;
n31) 1 .
c(n 1) 1
n
n
n
n
'221 estandarizadas, tomando
Morris y DeShon, 2002). Siendo
d
y
d
las
diferencias
de
cambio
N
2
4
(
n
1
)
1
2
E n C1E N
En C
1C2
n
n
'
2
V
'
'
(
)
1
E
C
E
C
1
2
V (' 11) del
' 11 N'2
1 grupos
n Enpretest,
n NN
n n experimental
las desviaciones estndar
para
respectivamente,
24los
1 y2control
)@@2
n EE nnCCC N
41 nnEEECnnCC '21 >>cc((N
V (' 1 )
2
)
2
el primer ndice de la diferencia
n E nCentre
4puntuaciones
>c(CN lo
2)@representaremos por 1,
Nlas
n E nC de cambio
E
E
C
y viene definido por:
yEPre yEPost yCPre yCPost
' 1 d1E d1C
Ey
Cy
y Pre
y Pre
Post
Post
S Pre
S Pre
' 1 d1E d1C
E
C
S Pre
S Pre
3
V (d1 )
3
3
n E nC N 2
n n
'21
1 E C '21
V (' 1 )
2
n En nnC NN24
n n
'2
2
E C
V (' 1 )
1 n EE CnC ' 1 >c( N 1 2)2@
n E nC N 4 n E nC
>c( N 2)@
y siendo el factor de correccin c(N 2):
c( N 2)
c ( m) 1
'2
d 2 E d 2C
3
.
4( n E n C ) 9
3
3
128
3
c( N 2) c(m) 1
.
3
9 .
c( Nd 2y) d c(las
m) diferencias
1 4(n E nde
C ) cambio
Del mismo modo, siendo
estandarizadas, tomando
2E
2C
4( n E n C ) 9
las desviaciones estndar de las puntuaciones de cambio,
para los grupos experimental y
control respectivamente, el segundo ndice de la diferencia entre las puntuaciones de cambio
3
lo representaremos por 2, y viene
c( N definido
2) c(m)por:
E1 E
C.
3 C
n E nyCPre) 9yCPost
c( N 2) c(m)yEPre1 4yE(Post
.
' 2 d 2 E d 2C y Ey4(n E
3nyCPre) C9y Post
Pre S
Post
SD .
' 2 c( Nd 2E 2) d 2Cc(m) 1 ED
S D 4(n E nC ) SDC9
'
V (' 2 )
r
1
2
(
1
)
S 22
n E r)nnC n N
'22 2 .
24 y Pre SD y Post nn EynPre
Cn D y
N
Post
>
c
N
(
2) @ .
'
V (' 2 ) 2(1
r
1
2
(
1
)
E
C
E
C
'
d d
2
n E nCS DC >c( N 2)@2
2(1 r )2n E nC2 E N 2C4
S DE
La familia r. Cuando los estudios han aplicado un diseo correlacional en el que han
medido y/o registrado variables,
ms adecuado
es el coefin E nC el ndice
n efecto
'222
N 2 del tamao ndel
2
.
V (' 2 ) den EPearson,
1 r ) n EE nCCde 'ste
nC r,N o
'
2alguna
2
11 2(extensin
ciente de correlacin
cuando
la
variable
no es
2
V (' 2 ) 2(1 r )n E nC N Z 4 1 ln2(11 rr)n. E nC '22 >c( N 2 2)@2 .
2
cuantitativa (correlacin
phi, etc.). Se
2(1de
)nnE nC N
42r 12 11 rrbiserial-puntual,
n En EnnC C 2 >ccoeficiente
( N'2 2)@
nE rSpearman,
N correlacin
C
. los coeficientes
.
V (' 2 ) la transformacin
' 2
12 lnFisher
2(11 rr )de
Za r Zde
recomienda utilizar
de
correlacin
antes
2
n E nC
2(1 r )n E nC N 4
( N 2)@ (Hedges y Olsus>cvarianzas
de integrarlos en el meta-anlisis,
con objeto de homogeneizar
1 1 r
Z r 1 ln11 r .
ZVr ( Z r 2) ln 1 r ..
1
V ( Z r 2)1 N11 r3r .
lnN 3 .
Zr
2 1 r
En este caso, la varianza intra-estudio viene dada por:
1
V (Z r ) d 1 .
Vr( Z r ) dN 3. .
d 2N14 3.
r
.
V ( Z r ) d 2 algebraicas
Cuando resulte oportuno, existen frmulas
que permiten transformar un nN 4 3
dice de la familia d a uno de la familia r, y viceversa. En concreto, una diferencia de medias
de correlacin mediante (Rosenthal,
estandarizada, d, puede transformarse a coeficiente
d
.
r
d
1991; Snchez Meca y Ato, 1989):
2
r Ti = dT +Hi4. .
Ti = T
d 2d+Hi4.
.
r
d2 4
Ti =T P=T T+ +[i H+.Hi .
++
[i H+ii .Hi .
Ti =TiiP=T T
MODELOS ESTADSTICOS ENMATA-ANLISIS
Ti = T + Hi .
V T Tci = PT + [(para
. t ken
i + Hi Q
- 1) ,
2
ses de un meta-anlisis: CulV Tes
la magnitud
del
efecto
medio?
Q k - 1) , Cul es el intervalo de conc0= P + [(para
. efecto
T
i
T
i + HiQ
entre las estimaciones del tamao del efecto? Pueden encontrarse variables moderadoras de
Q (k 1)
corta historia(para
tal heterogeneidad? A lo largo de
del Q
meta-anlisis
se han propuesto diferent k - 1)
2 la
4
V T2 Q (ck 1) (para Q t k - 1) ,
tes modelos estadsticos paraVabordar
los
anlisis.
Pueden
consultarse
Chalmers,
Hedges
y
4
,
T
Q (c0k 1) (para Q k - 1)
4
A excepcin de los ndices diferencia de riesgos, dr, razn de riesgos, rr, y odds ratio, or, esta frmula de transformacin puede aplicarse al resto de ndices de la familia d.
4
meta-anlisis de la investigacin
129
Se entiende que Ti puede representar a cualquiera de los ndices del tamao del efecto tratados en el epgrafe
anterior.
Ti = T + Hi .
Ti = PT + [i + Hi .
130
V T2
Q (k 1)
(para Q t k - 1)
(para Q k - 1)
ww
cc ww
c
w w ,,,
www
,
c w
w nicamente de la varianza intra-estuen funcin
siendo w = 1/V(T ) el factor de ponderacin
, mediante:
c que
wse
dio. Y Q es el estadstico de heterogeneidad,
obtiene
w
c w
,w
QQ
wwTT TT , ,
Q
w
T
T
w ,
k
kk
i 1
ii 11
i 1
iki 11
kk
k
ii
2
2
i2
ii
2i i
i 1 i i
ii 11
k
i 1
i
k
k
k
i 1
i i 21
i
ik
k
i 1
i 1 i 1
k
2
k
k
i
k
22
i 1
i
i 1 i
i ii
i
i
i 1
ii 11
i 1
2
i
Q ponderado
wi Ti T , por la inversa de la varianza intra-estudonde T es el tamao del efecto medio
k
i 1
2
dio:
Qk kk
wi Ti T ,
k
2
T
1w
iw
wi iTTi i
Q
w
,
1 i Tii i T
i
..
TT i 1 ii k11
.
T
kk
k
wwi
wi
i 1w Ti
ii 11
i i
k
.
T i 1k
wi Ti
k
No obstante, se han propuesto otros estimadores
de la varianza inter-estudios que puewii 1
.
T
w
T
i
i
k
den funcionar mejor que el aqu descrito. Pueden
consultarse a este respecto los trabajos de
i 1
ki 1
kkk * .wi
Viechtbauer (2005, 2007b, 2007c) y deTSnchez-Meca
y Marn-Martnez (2008).
wwi *T*i Ti1
iTii
*
w
i
1
i
i del efecto medio, T , se estima segn aca** tamao
Desde el modelo de efectos fijos,TTel
..
ii ki111
.
T
k
k
*
bamos de exponer; mientras que asumiendo
un
modelo
de efectos aleatorios, los factores
k
*
w
*
i
wi
*w
1wi Tii
i
de ponderacin incluyen no slo varianzaintra-estudio,
sino
tambin una estimacin de la
ii 11 k
*
i 1
varianza inter-estudios:
. *
T
k
wi Ti
*
k
*
w
Puede,
as
mismo,
obtenerse
un
intervalo
de
i* 1 confianza en torno al tamao del efec
i
Puede, as
as mismo,
mismo, obtenerse
obtenerse un
un intervalo
intervalo
dek iconfianza
confianza
en torno
torno al
al tamao
tamao del
del efecefec.
T
wde
Puede,
en
iT
i 1
*
*
i 1
w
. i normal:
T
k
totomedio
medioen
enambos
ambosmodelos,
modelos,asumiendo
asumiendouna
unadistribucin
distribucin
normal:
i* 1
to medio
en
ambos
modelos,
asumiendo
una
distribucin
normal:
w
Para cada caso, la varianza del tamao del efecto medio viene dada por:
rios:
VV(T(T*)*) 11/ /i wwi***. .
V (T *)
i wiiwi ii .
) 11/ /
V (T ) 1 / i wi
*
V (VT (*)
T ) 11/
/ i wwi .
V (T *) 1 / i wi* .
V (T *) 1 / i wi* .
55
5
5
5
5
meta-anlisis de la investigacin
131
En el modelo de efectos fijos, la hiptesis de homogeneidad entre los tamaos del efecto, se contrasta planteando sta como hiptesis nula: Ho: 1 = 2 = ... = i = ... = k , y aplicando el estadstico Q arriba descrito, bajo cuya hiptesis se distribuye segn 2 de Pearson con
k 1 grados de libertad.
En el modelo de efectos aleatorios, al constituir un modelo de componentes de varianza,
la principal hiptesis a contrastar es la de que no existe variabilidad inter-estudios: Ho:-2= 0,
que se contrasta con el mismo estadstico de heterogeneidad, Q.
Si existe heterogeneidad entre los tamaos del efecto estimados a travs de los estudios,
el paso siguiente deber ser poner a prueba el influjo, o la asociacin, de variables moderadoras sobre los tamaos del efecto, con objeto de poder explicar tal heterogeneidad. Cuando
la variable moderadora es cualitativa el anlisis estadstico es el equivalente a un modelo de
ANOVA, pero estimando los parmetros por mnimos cuadrados ponderados; mientras que
si la variable moderadora es continua, se aplica un modelo de regresin, nuevamente por el
mtodo de mnimos cuadrados ponderados. En general, el modelo de anlisis cuando ponemos a prueba el influjo conjunto de un grupo de variables moderadoras (cualitativas y/o
continuas), es un modelo lineal en el que el vector de coeficientes de regresin, , se estima
mediante:
= (XWX)1XWT,
siendo X la matriz de diseo, que contiene las variables moderadoras, T el vector de tamaos
del efecto, que acta como variable dependiente, y W es una matriz de ponderacin diagonal n x n, que contiene los factores de ponderacin para cada tamao del efecto. Esta matriz
de ponderaciones se obtiene como la inversa de la matriz diagonal de varianzas de los tamaos del efecto estimados, W = -1. Dependiendo de que el modelo asumido sea de efectos
fijos o de efectos aleatorios, los elementos de la diagonal de W se obtienen en funcin de la
varianza intra-estudio, para el primerE modelo
= 1/V(T
= (XWX[w
)1i XWT
, i)], o bien en funcin de la suma de
la varianza intra-estudio y de una estimacin de la varianza inter-estudios, para el modelo de
efectos aleatorios [wi* = 1/(V(Ti) + -2)]. En este ltimo caso, la varianza inter-estudios tiene
que estimarse teniendo en cuenta la matriz de diseo mediante (Rosenberg et al., 2000):
Q E ( k h)
(para QE t (k h)
0
(para QE (k h)
>
132
efecto poblacional, mediante la suma de cuadrados de error ponderada, QE , que bajo dicha
hiptesis se distribuye segn 2 de Pearson con k - h grados de libertad.
El modo de operar analticamente en un meta-anlisis es similar para los dos modelos
asumibles: efectos fijos o efectos aleatorios. Pero la capacidad de generalizacin de los resultados es mayor en efectos aleatorios que en efectos fijos. Adems, se considera actualmente
ms plausible el modelo de efectos aleatorios, ya que es ms difcil imaginar que en la realidad toda una poblacin de estudios realizados sobre un mismo problema estn estimando
exactamente a un mismo efecto poblacional. De hecho, puede considerarse el modelo de
efectos fijos como un caso particular del modelo, ms general, de efectos aleatorios, cuando
no existe varianza inter-estudios. Pero ante una base de datos meta-analtica concreta, nunca
puede saberse con certeza si el modelo ms apropiado es uno u otro, ya que desconocemos
los parmetros poblacionales.
Una estrategia que suele recomendarse consiste en iniciar los anlisis poniendo a prueba
la hiptesis de homogeneidad de los tamaos del efecto mediante la aplicacin de la prueba
Q. Si sta resulta significativa, ello sera indicativo de que existe heterogeneidad entre los
tamaos del efecto, por lo que debera asumirse un modelo de efectos aleatorios en los anlisis subsiguientes. Si, por el contrario, el estadstico Q no alcanza la significacin estadstica,
podra adoptarse el modelo de efectos fijos. Esta estrategia sera factible si no fuera porque la
prueba Q de heterogeneidad se muestra poco potente cuando el nmero de estudios, k, no
es elevado (Harwell, 1997; Snchez-Meca y Marn-Martnez, 1997). Por tanto, un resultado
no significativo de la prueba Q no es garanta suficiente para asumir un modelo de efectos
fijos, pero un resultado significativo de dicha prueba s lo es para asumir confiadamente un
modelo de efectos aleatorios.
Otra opcin, compatible en general con la acabada de exponer, se basa en la estimacin
de la varianza inter-estudios. Dado que el estimador de dicha varianza se trunca en el valor 0
para evitar estimaciones negativas de la varianza inter-estudios, se puede asumir un modelo
de efectos fijos cuando se d tal situacin, y adoptar un modelo de efectos aleatorios en caso
contrario. Por ltimo, se ha propuesto recientemente un nuevo ndice, denominado ndice I2,
para estimar el grado de heterogeneidad de los tamaos del efecto en un meta-anlisis que,
aunque est en funcin del estadstico Q, no se deja afectar por el nmero de estudios, k,
y puede interpretarse como un porcentaje de heterogeneidad exhibido por los tamaos del
efecto (Higgins y Thompson, 2002; Huedo-Medina, Snchez-Meca, Marn-Martnez y Botella, 2006).
VENTAJAS Y LIMITACIONES DEL META-ANLISIS
No cabe duda de que el meta-anlisis se ha convertido en una herramienta metodolgica de gran utilidad para ayudar a acumular el conocimiento cientfico en un determinado
campo de investigacin de una forma objetiva, sistemtica y rigurosa. Entre sus ventajas cabe
destacar las siguientes (Cooper, 1998; Hedges y Olkin, 1985; Rosenthal, 1991; SnchezMeca, 2003; Snchez-Meca y Ato, 1989):
(a) Eficiencia. El meta-anlisis tiene una mayor capacidad para tratar grandes cantidades
de informacin que las revisiones narrativas, gracias a sus posibilidades de cuantificar y de codificar objetivamente las variables implicadas en los resultados de los
estudios.
(b) Rigor cientfico. El meta-anlisis cumple con las normas de rigor cientfico que se
exigen en las investigaciones primarias, posibilitando la replicacin del proceso. Se
meta-anlisis de la investigacin
133
134
(c) Calidad de los datos. La mezcla de estudios de buena calidad metodolgica con estudios de baja calidad puede dar lugar a estimaciones de los efectos sesgadas. Se recomienda
codificar como una variable moderadora ms la calidad del diseo del estudio y analizar su
posible relacin con los tamaos del efecto; o bien, fijar desde el principio normas estrictas
de calidad metodolgica que deben cumplir los estudios para ser incluidos en el meta-anlisis. Existe un buen nmero de escalas para valorar la calidad metodolgica de los estudios
primarios, buena parte de las cuales se han desarrollado en la literatura mdica (Jni, Altman
y Egger, 2001; Moher, Jones y Lepage, 2001; Tritchler, 1999; Wortman, 1994).
(d) Representatividad. Por muy exhaustiva que sea la bsqueda de la literatura, nunca
ser posible localizar todos los estudios seleccionables. Si, adems, no se dispone de estudios no publicados, el sesgo de publicacin puede ser una seria amenaza contra la validez
de los resultados del meta-anlisis. La inclusin de estudios no publicados es muy recomendable y, en cualquier caso, realizar un anlisis del sesgo de publicacin mediante el clculo
de ndices de tolerancia a los resultados nulos (fail-safe N), para valorar la robustez del metaanlisis frente a esta amenaza. El problema del sesgo de publicacin y sus efectos sobre los
resultados de los meta-anlisis es una lnea de trabajo actualmente muy activa (cf. por ejemplo, Rothstein, Sutton y Borenstein, 2005).
(e) Dependencia. La inclusin de ms de un ndice del tamao del efecto calculado
sobre la misma muestra de sujetos atenta contra el supuesto de independencia de los datos
que asumen las tcnicas meta-analticas de anlisis estadstico. Este problema surge cuando
un mismo estudio primario presenta resultados sobre diferentes variables dependientes. Si se
calcula un tamao del efecto para cada una de ellas y se incorporan todas las estimaciones
al meta-anlisis, se incurre en un problema de dependencia que afecta a la validez de la
conclusin estadstica. Se han propuesto varias soluciones para resolver este problema. Una
de ellas es obtener un promedio de los tamaos del efecto correspondientes a un mismo estudio (Gleser y Olkin, 1994; Hedges y Olkin, 1985; Marn-Martnez y Snchez-Meca, 1999;
Rosenthal y Rubin, 1986). Otras soluciones implican, bien realizar meta-anlisis diferentes
para cada variable dependiente, bien modelar la estructura correlacional entre ellas (Becker,
2000; Kalaian y Raudenbush, 1996; Raudenbush, Becker y Kalaian, 1988).
Como conclusin, podemos decir que el meta-anlisis es hoy da una metodologa de
investigacin que se ha convertido en un elemento indispensable como puente entre la investigacin pasada y la futura: Aunque se basa en la integracin cuantitativa de las evidencias
acumuladas sobre un determinado tpico, su principal funcin es orientar la investigacin
futura, detectando vacos conceptuales y/o metodolgicos, denunciando deficiencias en la
literatura y revelando relaciones no anticipadas. Su gran ventaja est en la suma de esfuerzos y en su empeo por explicar las desviaciones que se observan entre los resultados de los
estudios: Estas pequeas desviaciones, que por s mismas pueden no llegar a ser significativas, cuando se combinan pueden revelar importantes conexiones cientficas desde las que se
puede extraer nuevas evidencias cientficas (Garfield, 1991, p. 5).
El meta-anlisis no debe entenderse como un mero mtodo para hacer revisiones de
literatura, sino como un modo de afrontar el anlisis de los datos que implica cambios en la
forma de entender el progreso de una ciencia. Su nfasis en el tamao del efecto ha ejercido
una importante influencia a favor de las crticas contra la excesiva atencin prestada a las
pruebas de significacin a lo largo de la historia de la psicologa cientfica. Al mismo tiempo,
el meta-anlisis ha contribuido a relativizar el papel que los estudios primarios juegan en la
demostracin de hechos cientficos y en la importancia de acumular de forma sistemtica
la investigacin para el desarrollo de teoras cada vez ms slidas. En palabras de Schmidt
(1992, p. 1179):
meta-anlisis de la investigacin
135
Los datos nos llegan encriptados, y para entender su significado primero tenemos que descifrar el cdigo. Para hacer esto se necesita del meta-anlisis. Por tanto, los estudios individuales
deben ser considerados como meros datos puntuales que contribuirn a un meta-anlisis futuro.
De esta forma, el estatus y el valor cientfico del estudio individual se ve necesariamente reducido.
Siempre que se utilice con buen juicio y siendo consciente de sus limitaciones, el metaanlisis puede aportar una importante contribucin a la acumulacin del conocimiento cientfico y, por ende, al progreso de la ciencia.
REFERENCIAS BIBLIOGRFICAS
Becker, B.J. (1988). Synthesizing standardized mean-change measures. British Journal of Mathematical
& Statistical Psychology, 41, 257-278.
Becker, B.J. (2000). Multivariate meta-analysis. En H.E.A. Tinsley y S. S.D. Brown (Eds.), Handbook of
applied multivariate statistics and mathematical modeling (pp. 499-525). San Diego, CA: Academic Press.
Begg, C.B. (1994). Publication bias. En H. Cooper y L.V. Hedges (Eds.), The Handbook of Research
Synthesis (pp. 399-409). Nueva York: Russell Sage Foundation.
Bond, C.F.Jr., Wiitala, W.L. y Richard, F.D. (2003). Meta-analysis of raw mean differences. Psychological Methods, 8, 406-418.
Botella, J. y Gambara, H. (2002). Qu es el meta-anlisis? Madrid: Siglo XXI.
Botella, J. y Gambara, H. (2006). Doing and reporting a meta-analysis. International Journal of Clinical
& Health Psychology, 6, 425-440.
Burdett, S., Stewart, L.A. y Tierney, J.F. (2003). Publication bias and meta-analyses. International Journal
of Technology Assessment in Health Care, 19, 129-134.
Chalmers, T.C., Hedges, L.V. y Cooper, H. (2002). A brief history of research synthesis. Evaluation & the
Health Professions, 25, 12-37.
Cooper, H. (1998). Integrating research: A guide for literature reviews (3 ed.). Newbury Park, CA:
Sage.
Cooper, H. y Hedges, L.V. (Eds.) (1994). The handbook of research synthesis. Nueva York: Russell
Sage.
Cortina, J.M. y Nouri, H. (2000). Effect size for ANOVA designs. Thousand Oaks, CA: Sage.
Davey Smith (Ed.) (2001). Clinical Meta-analysis. Nueva York: Wiley.
Deeks, J.J. y Altman, D.G. (2001). Effect measures for meta-analysis of trials with binary outcomes. En
M. Egger, G.D. Smith y D.G. Altman (Eds.), Systematic reviews in health care: Meta-analysis in
context (2 ed.) (pp. 313-335). Londres: BMJ Books.
DerSimonian, R. y Laird, N. (1986). Meta-analysis in clinical trials. Controlled Clinical Trials, 7, 177188.
Dunlap, W.P., Cortina, J.M., Vaslow, J.B. y Burke, M.J. (1996). Meta-analysis of experiments with matched groups or repeated measures designs. Psychological Methods, 1, 170-177.
Eddy, D.M., Hasselblad, V. y Shachter, R. (1995). Meta-analysis by the confidence profile methods: The
statistical synthesis of evidence. Boston, MA: Academic Press.
Egger, M., Smith, G.D. y Altman, D.G. (Eds.) (2001). Systematic reviews in health care: Meta-analysis in
context (2 ed.). Londres: BMJ Books.
136
Erez, A., Bloom, M.C. y Wells, M.T. (1996). Using random rather than fixed effects models in metaanalysis: Implications for situational specificity and validity generalization. Personnel Psychology,
49, 275-306.
Eysenck, H.J. (1978). An exercise in mega-silliness. American Psychologist, 33, 517-517.
Eysenck, H.J. (1994). Meta-analysis and its problems. British Medical Journal, 309, 789-792.
Field, A.P. (2001). Meta-analysis of correlation coefficients: A Monte Carlo comparison of fixed- and
random-effects methods. Psychological Methods, 6, 161-180.
Field, A.P. (2003). Can meta-analysis be trusted? The Psychologist, 16, 642-645.
Field, A.P. (2003). The problems of using fixed-effects models of meta-analysis on real-world data. Understanding Statistics, 2, 77-96.
Field, A.P. (2005). Is the meta-analysis of correlation coefficients accurate when population correlations vary? Psychological Methods, 10, 444-467.
Fleiss, J.L. (1994). Measures of effect size for categorical data. En H. Cooper y L.V. Hedges (Eds.), The
handbook of research synthesis (pp. 245-260). Nueva York: Russell Sage Foundation.
Garfield, E. (1991). Meta-analysis and the metamorphosis of the scientific literature review. Current
Contents: Social & Behavioral Sciences, 43, 5-8.
Gibbons, R.D., Hedeker, D.R. y Davis, J.M. (1993). Estimation of effect size from a series of experiments involving paired comparisons. Journal of Educational Statistics, 18, 271-279.
Glass, G.V., McGaw, B. y Smith, M.L. (1981). Meta-analysis in social research. Newbury Park, CA:
Sage.
Gleser, L.J. y Olkin. I. (1994). Stochastically dependent effect sizes. En H. Cooper y L.V. Hedges (Eds.),
The handbook of research synthesis (pp. 339-355). Nueva York: Russell Sage Foundation.
Gmez, J. (1987). Meta-anlisis. Barcelona: PPU.
Grissom, R.J. y Kim, J.J. (2005). Effect sizes for research: A broad practical approach. Mahwah, NJ:
Erlbaum.
Haddock, C.K., Rindskopf, D. y Shadish, W.R. (1998). Using odds ratios as effect sizes for meta-analysis of dichotomous data: A primer on methods and issues. Psychological Methods, 3, 339-353.
Harwell, M. (1997). An empirical study of Hedgess homogeneity test. Psychological Methods, 2, 219231.
Hasselblad, V. y Hedges, L.V. (1995). Meta-analysis of screening and diagnostic tests. Psychological
Bulletin, 117, 167-178.
Hedges, L.V. (1994). Fixed effects models. En H. Cooper y L.V. Hedges (Eds.), The handbook of research synthesis (pp. 285-299). Nueva York: Russell Sage Foundation.
Hedges, L.V. y Olkin, I. (1985). Statistical methods for meta-analysis. Orlando, FL: Academic Press.
Hedges, L.V. y Vevea, J.L. (1998). Fixed- and random-effects models in meta-analysis. Psychological
Methods, 3, 486-504.
Higgins, J.P.T. y Thompson, S.G. (2002). Quantifying heterogeneity in a meta-analysis. Statistics in Medicine, 21, 1539-1558.
Huedo-Medina, T.B., Sanchez-Meca, J., Marin-Martinez, F. y Botella, J. (2006). Assessing heterogeneity
in meta-analysis: Q statistic or I2 index? Psychological Methods, 11, 193-206.
Hunter, J.E. y Schmidt, F.L. (2000). Fixed effects vs. random effects meta-analysis models: Implications
for cumulative research knowledge. International Journal of Selection & Assessment, 8, 275-292.
meta-anlisis de la investigacin
137
Hunter, J.E. y Schmidt, F.L. (2004). Methods of meta-analysis: Correcting error and bias in research synthesis (2 ed.). Sage.
Jni, P., Altman, D.G. y Egger, M. (2001). Assessing the quality of randomised controlled trials. En M.
Egger, G.D. Smith y D.G. Altman (Eds.), Systematic reviews in health care: Meta-analysis in context (2 ed.) (pp. 87-108). Londres: BMJ Books.
Kalaian, H.A. y Raudenbush, S.W. (1996). A multivariate mixed linear model for meta-analysis. Psychological methods, 1, 227-235.
Lipsey, M.W. y Wilson, D.B. (2001). Practical meta-analysis. Thousand Oaks, CA: Sage.
Marn Martnez, F. y Snchez Meca, J. (1998). Testing for dichotomous moderators in meta-analysis.
Journal of Experimental Education, 67, 69-81.
Marn Martnez, F. y Snchez Meca, J. (1999). Averaging dependent effect sizes in meta-analysis: A
cautionary note about procedures. Spanish Journal of Psychology, 2, 32-38.
Marn-Martnez, F., Snchez-Meca, J., Huedo, T.B. y Fernndez-Guzmn, I. (2007). Meta-anlisis:
Dnde estamos y hacia dnde vamos? En A. Borges y P. Prieto (Eds.), Psicologa y ciencias afines
en los albores del siglo XXI (Homenaje al profesor Alfonso Snchez Bruno) (pp. 87-102). Grupo
Editorial Universitario.
Martn, J.L.R., Tobas, A. y Seoane, T. (Coords.) (2006). Revisiones Sistemticas en las Ciencias de la
Vida. Toledo: FISCAM.
Moher, D., Jones, A. y Lepage, L. for the CONSORT Group (2001). Use of the CONSORT statement
and quality of reports for randomized trials: A comparative before-and-after evaluation. Journal of
the American Medical Association, 285, 1992-1995.
Morris, S.B. (2000). Distribution of the standardized mean change effect size for meta-analysis on repeated measures. British Journal of Mathematical & Statistical Psychology, 53, 17-29.
Morris, S.B. y DeShon, R.P. (2002). Combining effect size estimates in meta-analysis with repeated
measures and independent-groups designs. Psychological Methods, 7, 105-125.
Overton, R.C. (1998). A comparison of fixed-effects and mixed (random-effects) models for metaanalysis tests of moderator variable effects. Psychological Methods, 3, 354-379.
Petticrew, M. y Roberts, H. (2006). Systematic Reviews in the Social Sciences: A practical guide. Malden, MA: Blackwell.
Raudenbush, S.V. (1994). Random effects models. En H. Cooper y L.V. Hedges (Eds.), The handbook of
research synthesis (pp. 301-321). Nueva York: Russell Sage Foundation.
Raudenbush, S.W., Becker, B.J. y Kalaian, H.A. (1988). Modeling multivariate effect sizes. Psychological Bulletin, 103, 111-120.
Roberts, B.W., Kuncel, N.R., Viechtbauer, W. y Bogg, T. (2007). Meta-analysis in personality psychology: A primer. En R.W. Robins, R.C. Fraley y R.F. Krueger (Eds.), Handbook of research methods in
personality psychology (pp. 652-672). Nueva York: Guilford Press.
Rosenberg, M.S., Adams, D.C. y Gurevitch, J. (2000). MetaWin: Statistical software for meta-analysis
(Vers. 2.0). Sunderland, MA: Sinauer Assoc.
Rosenthal, R. (1991). Meta-analytic procedures for social research (ed. Rev.). Newbury Park, CA: Sage.
Rosenthal, R. (1994). Parametric measures of effect size. En H. Cooper y L.V. Hedges (Eds.), The handbook of research synthesis (pp. 231-244). Nueva York: Russell Sage Foundation.
Rosenthal, R. (1995). Writing meta-analytic reviews. Psychological Bulletin, 118, 183-192.
Rosenthal, R., Rosnow, R.L. y Rubin, D.B. (2000). Contrasts and effect sizes in behavioral research: A
correlational approach. Cambridge, UK: Cambridge University Press.
138
Rosenthal, R. y Rubin, D.B. (1986). Meta-analytic procedures for combining studies with multiple
effect sizes. Psychological Bulletin, 99, 400-406.
Rothstein, H.R., Sutton, A.J. y Borenstein, M. (Eds.) (2005). Publication bias in meta-analysis: Prevention, assessment, and adjustments. Chichester, UK: Wiley.
Snchez-Meca, J. (1999). Meta-anlisis para la investigacin cientfica. En F.J. Sarabia (Coord.), Metodologa para la Investigacin en Marketing y Direccin de Empresa (pp. 173-201). Madrid:
Pirmide.
Snchez-Meca, J. (2003). La revisin del estado de la cuestin: El meta-anlisis. En C. Camisn, M.J.
Oltra y M.L. Flor (Eds.), Enfoques, problemas y mtodos de investigacin en economa y direccin
de empresas. Tomo I (pp. 101-110). Castelln: ACEDE / Fundacin Universitat Jaume I Empresa.
Snchez-Meca, J. y Ato, M. (1989). Meta-anlisis: Una alternativa metodolgica a las revisiones tradicionales de la investigacin. En J. Arnau y H. Carpintero (Eds.), Tratado de psicologa general I:
Historia, teora y mtodo (pp. 617-669). Madrid: Alhambra.
Snchez-Meca, J. y Marn-Martnez, F. (1997). Homogeneity tests in meta-analysis: A Monte Carlo
comparison of statistical power and Type I error. Quality & Quantity, 31, 385-399.
Snchez-Meca, J. y Marn-Martnez, F. (1998a). Testing continuous moderators in meta-analysis: A
comparison of procedures. British Journal of Mathematical & Statistical Psychology, 51, 311-326.
Snchez-Meca, J. y Marn-Martnez, F. (1998b). Weighting by inverse-variance or by sample size in
meta-analysis: A simulation study. Educational & Psychological Measurement, 58, 211-220.
Snchez-Meca, J. y Marn-Martnez, F. (2000). Testing the significance of a common risk difference in
meta-analysis. Computational Statistics & Data Analysis, 33, 299-313.
Snchez-Meca, J. y Marn-Martnez, F. (2001). Meta-analysis of 2x2 tables: Estimating a common risk
difference. Educational & Psychological Measurement, 61, 249-276.
Snchez-Meca, J. y Marn-Martnez, F. (2008). Confidence intervals for the overall effect size in random-effects meta-analysis. Psychological Methods, 13, 31-48.
Snchez-Meca, J., Marn-Martnez, F. y Chacn-Moscoso, S. (2003). Effect-size indices for dichotomized outcomes in meta-analysis. Psychological Methods, 8, 448-467.
Snchez-Meca, J., Marn-Martnez, F. y Huedo, T. (2006). Modelo de efectos fijos y modelo de efectos
aleatorios. En J.L.R. Martn, A. Tobas y T. Seoane (Coords.), Revisiones Sistemticas en Ciencias
de la Vida (pp. 189-204). Toledo: FISCAM.
Schmidt, F.L. (1992). What do data really mean? American Psychologist, 47, 1173-1181.
Schmidt, F.L. (1996). Statistical significance testing and cumulative knowledge in psychology: Implications for training of researchers. Psychological Methods, 1, 115-129.
Schmidt, F.L. (2008). Meta-analysis: A constantly evolving research integration tool. Organizational
Research Methods, 11, 96-113.
Schmidt, F.L. y Hunter, J.E. (1995). The impact of data analysis method on cumulative knowledge:
Statistical significance testing, confidence intervals, and meta-analysis. Evaluation & the Health
Professions, 18, 408-427.
Schmidt, F.L. y Hunter, J.E. (1999). Comparison of three meta-analysis methods revisited: An analysis of
Johnson, Mullen, and Salas (1995). Journal of Applied Psychology, 84, 144-148.
Schmidt, F.L., Oh, I.-S. y Hayes, T.L. (en prensa). Fixed versus random effects models in meta-analysis:
Model properties and an empirical comparison of difference in results. British Journal of Mathematical and Statistical Psychology.
Schulze, R. (2004). Meta-analysis: A comparison of approaches. Hogrefe & Huber Pub.
meta-anlisis de la investigacin
139
Shadish, W.R. y Haddock, C.K. (1994). Combining estimates of effect size. En H. Cooper y L.V. Hedges
(Eds.), The handbook of research synthesis (pp. 261-281). Nueva York: Russell Sage Foundation.
Smith, M.L. y Glass, G.V. (1977). Meta-analysis of psychotherapy outcome studies. American Psychologist, 32, 752-760.
Sutton, A.J., Abrams, K.R., Jones, D.R., Sheldon, T.A. y Song, F. (2000). Methods for meta-analysis in
medical research. Chichester, UK: Wiley.
Sutton, A.J., Duval, S.J., Tweedie, R.L., Abrams, K.R. y Jones, D.R. (2000). Empirical assessment of effect
of publication bias on meta-analyses. British Medical Journal, 320, 1574-1577.
Sutton, A.J. y Higgins, J.P.T. (2008). Recent developments in meta-analysis. Statistics in Medicine, 27,
625-650.
Tritchler, D. (1999). Modelling study quality in meta-analysis. Statistics in Medicine, 18, 2135-2145.
Viechtbauer, W. (2005). Bias and efficiency of meta-analytic variance estimators in the random-effects
model. Journal of Educational & Behavioral Statistics, 30, 261-293.
Viechtbauer, W. (2007a). Accounting for heterogeneity via random-effects models and moderator
analyses in meta-analysis. Journal of Psychology, 215, 104-121. Viechtbauer, W. (2007b). Confidence intervals for the amount of heterogeneity in meta-analysis. Statistics in Medicine, 26, 3752.
Viechtbauer, W. (2007c). Hypothesis tests for population heterogeneity in meta-analysis. British Journal
of Mathematical & Statistical Psychology, 60, 29-60.
Whitehead, A. (2002). Meta-analysis of controlled clinical trials. Chichester, UK: Wiley.
Wolf, F.M. (1986). Meta-analysis: Quantitative methods for research synthesis. Beverly Hills, CA: Sage.
Wortman, P.M. (1994). Judging research quality. En H. Cooper y L.V. Hedges (Eds.), The Handbook of
Research Synthesis (pp. 97-109). Nueva York: Russell Sage Foundation.
142
continuidad temporal que le es inherente, con el fin de que la correspondiente recogida sistemtica de datos, categricos por naturaleza, y con independencia de su orientacin preferentemente idiogrfica y procesual, posibilite un anlisis (exploratorio, de reduccin de datos, de
toma de decisiones, evaluativo, etc.) que d lugar a la obtencin de conocimiento vlido con
suficiente potencia explicativa, acorde, en cualquier caso, con el objetivo planteado y los descriptores e indicadores a los que se tuviera acceso (Anguera, 1986, p. 24).
Se imponen varias matizaciones a esta conceptualizacin, que pueden estructurarse en
torno a criterios epistemolgicos, metodolgicos, tcnicos y de contenido, los cuales facilitan
su justificacin (Anguera, 1995a, 1999):
a) La va hipottico-deductiva, implantada tradicionalmente en buen nmero de lneas
de investigacin, ofrece graves dificultades en la investigacin cualitativa, ya que habitualmente conduce a una prdida de flexibilidad en la descripcin y a su descontextualizacin. Por el contrario, y sin asumir de forma generalizada la va inductiva,
sta se revela con mayor viabilidad, lo cual se halla en consonancia con el carcter
previamente no consolidado de los estudios temticos a los que se dirige (Miles &
Huberman, 1984).
b) Metodolgicamente, los datos cualitativos deben ofrecer la necesaria consistencia, y
emergen de una descripcin y registro cuidadosos, aunque su contenido es variable
y su anlisis difcil debido a la nula estandarizacin de las respuestas y su compleja
sistematizacin. El papel fundamental lo juega el proceso de categorizacin (Lofland,
1971), ya que no se puede aspirar a una adecuada captacin de la realidad en sus
propios trminos si no se logran elaborar las categoras que la hacen explicable y
dan coherencia al flujo de eventos y/o conductas necesariamente contextualizados.
En este mismo sentido, Denzin (1970) y Patton (1980) estn de acuerdo en que la
tarea de un metodlogo cualitativo es la de suministrar un marco dentro del cual los
sujetos respondan de forma que se representen fielmente sus puntos de vista respecto
al mundo y su experiencia.
c) A nivel genrico, las descripciones detalladas procedentes de registros directos y
datos documentales (Patton, 1980) constituyen el grueso de los datos cualitativos
que, por otra parte, requerirn diversos instrumentos de medida, a pesar del importante papel jugado por lo interpretativo (Smith, 1983). De forma particularizada, las
tcnicas que ms propiamente abarca la metodologa cualitativa son el registro de
conducta en observacin y de forma especial en observacin participante, entrevista
y material documental, entendiendo que la fase definitoria es la de recogida de datos
(Blaxter, 1979), ya que nada impide que el anlisis al cual se sometan los datos implique el adentrarnos en lo cuantitativo (Blanco, 1983).
d) Desde un criterio de contenido, existe una primera gran restriccin relativa al nivel de
observabilidad (Norris, 1984), y aunque la posicin oficial del cognitivismo rechaza
los procedimientos introspectivos (Nisbett & Wilson, 1977), se progresa en el camino
que pretende el acceso a los fenmenos mentales, reconocindose que los individuos
tienen acceso directo a una gran cantidad de hechos privados. La necesaria contextualizacin inherente a la metodologa cualitativa y sus implicaciones a nivel de los
trminos acuados ad hoc en el proceso de categorizacin (Bulmer, 1979), as
como la indudable tradicin de interaccionismo simblico (Schwartz & Jacobs, 1984)
que lo ha propiciado, muestran una inclinacin o mejor predisposicin temtica con
dicha orientacin, sin dejar de relacionarse con la teora de la titulacin de Howard
Becker, la induccin analtica de Florian Znaniecki, la teora fundamentada de Barney Glaser, o la etnografa bsica de John Lofland, por citar algunos de ellos.
143
En la actualidad, la investigacin cualitativa se entronca, desarrolla y aplica principalmente en psicologa, educacin, sociologa, antropologa, relaciones humanas, medicina y
justicia; y la discapacidad, en cuyo mbito nos interesa situar la metodologa cualitativa, se
entronca con todas estas reas del conocimiento.
Y, finalmente, la discapacidad puede abordarse, a su vez, desde distintas vertientes en
el marco de la metodologa cualitativa. Los ms radicales lo plantearan desde propuestas
tericas ms o menos crticas al efectuar una construccin social de la discapacidad (Ferreira
y Rodrguez Caamao, 2006; Ferreira, 2007; Urraca, 2007), pero aqu se desarrollar desde
una perspectiva emprica.
CARACTERSTICAS DE LA METODOLOGA CUALITATIVA
Como consecuencia de los principios inspiradores indicados se derivan una serie de caractersticas que concretan los rasgos diferenciales que los identifican y que, segn sea la tcnica concreta de recogida de informacin, se manifiestan de forma ms o menos acusada.
Las principales caractersticas son las siguientes:
a) La fuente principal y directa de los datos son las situaciones naturales, ubicadas especialmente en el contexto de la cotidianeidad (Anguera, 1999). Ningn fenmeno
puede ser entendido fuera de sus referencias espacio-temporales y de su contexto.
b) El investigador se convierte en el principal instrumento de recogida de datos, en
el sentido de actor del proceso que implica la captacin de la realidad, y con la capacidad para aportar datos tan fiables como los generados por medios ms objetivos
(Anguera, 2000b). Entre las principales ventajas que ello reporta, destacan: 1) Su
adaptabilidad para registrar informacin simultnea sobre mltiples factores y a varios niveles. 2) Visin holstica, es decir, capacidad para captar el contexto de forma
global. 3) Mayor amplitud de conocimientos. 4) Posibilidad de explorar respuestas
atpicas e idiosincrticas, las cuales son difciles de captar por medios ordinarios, y
tienen una enorme relevancia para lograr una ms ptima comprensin.
c) Incorporacin del conocimiento tcito, es decir, el correspondiente a intuiciones,
aprehensiones o sentimientos que no se expresan de forma lingstica pero que se
refieren a aspectos conocidos de algn modo. Muchos de los matices de la realidad
slo pueden ser captados por esta va, a la vez que muchas de las interacciones entre
investigador e investigado ocurren en este nivel.
d) Aplicacin de tcnicas de recogida de datos abiertas, por adaptarse mejor a las influencias mutuas y ser ms sensibles para detectar patrones de comportamiento (Anguera, 1995d).
e) Muestreo intencional. La seleccin de la muestra no pretende representar a una poblacin con el objeto de generalizar los resultados, sino que se propone ampliar el
abanico y rango de los datos tanto como sea posible, a fin de obtener la mxima informacin de las mltiples realidades que pueden ser descubiertas.
f) Anlisis inductivo de los datos. Ello implica una primera descripcin de las situaciones de cada uno de los casos o eventos estudiados, con el fin de detectar progresivamente la existencia de unas regularidades entre ellos que constituyen la base o
germen de una futura teora adecuada a las condiciones y valores locales.
144
g) La teora se genera a partir de los datos de una realidad concreta, no partiendo de generalizaciones a priori. Autores relevantes como Goetz y LeCompte (1988) definen
la teora como: 1) generativa, por preocuparse por el descubrimiento de constructos
y proposiciones, 2) inductiva aunque pueda parecer una incongruencia, pues las
teoras se desarrollan desde abajo, a travs de la interconexin de evidencias y datos
recogidos, 3) constructiva, dado que las unidades de anlisis comienzan a aparecer
en el curso de la observacin y descripcin, 4) subjetiva, entendido como el propsito de reconstruir categoras especficas que los participantes utilizan para conceptualizar sus propias experiencias y su visin de la realidad.
h) El diseo de la investigacin es emergente y en cascada, ya que se va elaborando a
medida que avanza la investigacin. La situacin generadora del problema da lugar
a un cuestionamiento continuado y a una reformulacin constante (Figura 1), en funcin de la incorporacin de nuevos datos. Esta filosofa de diseos no estandard
flexibiliza el estudio de forma acorde con la propia realidad y los datos que se obtienen, lo cual le aporta infinito nmero de posibilidades. Adems, este tipo de diseos
permite una adecuacin a las mltiples realidades, a los contextos especficos y a las
interacciones entre investigador y contexto. Un diseo previo prefijado relegara la
realidad vivencial.
i) La metodologa cualitativa se plantea criterios de validez especficos, utilizando tcnicas propias que garantizan la credibilidad de los resultados (Sandn, 2003).
EXIGENCIAS METODOLGICAS
De acuerdo con los apartados anteriores, puede surgir una seria duda sobre la calidad
que se requiere a la metodologa cualitativa, y, en consecuencia, a los datos que van a obtenerse mediante diferentes tcnicas. Patton (1980, p. 22) ha sealado que los datos cualitativos consisten en descripciones detalladas de situaciones, eventos, sujetos, interacciones y
conductas observadas; citas directas de sujetos acerca de sus experiencias, actitudes, creencias y pensamientos; y fragmentos o pasajes enteros de documentos, correspondencia, registros e historias de casos. Pero, qu garanta ofrece este tipo de material?
Se pueden sealar diversos marcos de exigencias (Erickson, 1986; Zabalza, 1991) respecto a las condiciones de legitimidad metodolgica:
A) Representatividad, relevancia y plausibilidad de los datos (validez semntica de la
investigacin). Este requisito implica identificar las diversas perspectivas de significacin,
proceder a una correcta contextualizacin, y constatar con objetividad los sucesos, o eventos, o conductas que se presentan. Ello significa y en este sentido estamos de acuerdo con
Zabalza (1991) cumplir determinadas condiciones:
a. Ampliar al mximo el contexto de anlisis, de manera que puedan incorporarse a la
situacin analizada todas las variables, sujetos o elementos que puedan aportar un
papel clarificador respecto al mbito estudiado. De aqu que se recomiende la triangulacin, o uso complementario de varias al menos tres modalidades distintas de
recogida de datos, lo cual minimizar las carencias de alguna de ellas al complementarse con las virtudes de otras.
b. Describir el propio proceso seguido en la obtencin y anlisis de la informacin. La
investigacin cualitativa tiene una naturaleza deliberativa, apenas existe estandarizacin, no existe uniformidad en los procesos seguidos, y algunos de los datos obtenidos pueden ser considerados confusos o parciales; la debilidad que ello comporta
145
146
OBSERVACION DIRECTA
CONDUCTA VERBAL
TRANSFORMABLE EN MATERIAL
DOCUMENTAL
MATERIAL DOCUMENTAL
(OBSERVACIN INDIRECTA)
PROCESO METODOLGICO
La metodologa cualitativa, como se indica en la Figura 1, consta de una serie de etapas
en las cuales se halla institucionalizada la vuelta atrs. Ninguna de ellas se puede obviar y el
procedimiento debe guiarse por un proceso continuado de decisiones del investigador (Rodrguez Gmez, Gil Flores y Garca Jimnez, 1996).
147
La esencia del proceso, una vez se ha planteado el diseo adecuado, consiste en seleccionar el material adecuado, plantear los criterios de segmentacin de unidades, recoger la
informacin de forma adecuada, transformarla, gestionarla, y analizarla, de forma que los
resultados revierten de nuevo en el proceso (Anguera, 2000b).
Esquemticamente se comentan los respectivos apartados:
a) Etapa preparatoria. Establecimiento del marco terico-conceptual desde el que parte
la investigacin, y dirigido especialmente a determinar el tpico de inters en funcin
de las razones por las que se elige el tema (motivacin personal, la propia vida cotidiana, experiencias concretas, prctica profesional, contraste con otros especialistas,
lectura de trabajos de otros investigadores, etc.).
b) Delimitacin del problema. La acotacin del problema implicar centrarse en algn
aspecto especfico del tema seleccionado. Es esencial que se efecte de forma clara,
sin ambigedades, y dejando claras las tres vertientes que abarca su cobertura: Temtica (problema de estudio acotado), espacial (mbito geogrfico o administrativo en
el que se ubica) y temporal (referente relativo al perodo de tiempo que interesa). Por
ejemplo, resolucin de conflictos relativos al manejo de la vida cotidiana en padres
de personas con discapacidad intelectual severa de una determinada ciudad a lo largo de un ao.
Figura 2. Diseos observacionales (Extrado de Anguera, Blanco y Losada, 2001)
c) Plantear el diseo adecuado. El diseo es una pauta o gua que debe establecerse
una vez est delimitado el problema de estudio, y que nos conducir a lo largo del
proceso emprico, especialmente en la obtencin, gestin y anlisis de datos. En metodologa cualitativa los diseos se plantean con carcter flexible, y existen diversas
taxonomas, en funcin de que se siga un planteamiento paralelo al de la metodologa observacional (Anguera, Blanco y Losada, 2001), considerando los ocho diseos
posibles (Figura 2), o bien se adopten posiciones ms abiertas (Rodrguez Gmez, Gil
28
Flores y Garca Jimnez, 1996; Flick, 2007).
148
d) Seleccin del material a estudiar. Se trata de llevar a cabo muestreos diversos que
habitualmente son de carcter no probabilstico, con las connotaciones negativas que
ello supone respecto a la representatividad de la muestra y posterior generalizacin
de los resultados para los cuales se habrn debido decidir los criterios a tener en
cuenta. Las decisiones se realizan a distintos niveles, que bsicamente se refieren a
los casos pero, a su vez, para cada uno de ellos se supeditarn otras decisiones, como
en qu contexto, qu episodios, que fragmentos del texto en su caso, etc. La seleccin
de material se efecta de acuerdo con algn tipo de triangulacin, que habitualmente
es la triangulacin de datos, pero que no quedan excluidos otros tipos (triangulacin
del investigador, terica, metodolgica o disciplinar). El proceso de muestreo se contina habitualmente hasta que se llega a la saturacin, cuando sucesivas muestras ya
no aportan ms informacin.
e) Transformacin/reduccin de datos. Resulta bsico, en primer lugar, el establecimiento de unidades, que se corresponde directamente con el planteamiento del muestreo,
y, en este sentido, deber diferenciarse entre unidad de anlisis y unidad de codificacin (Boyatzis, 1998), partiendo de la base de que la primera consiste en el mnimo
segmento significativo de la realidad, mientras que la segunda se basa en el mnimo
dato o informacin que puede ser evaluado y, por supuesto, nunca podr tener mayor
magnitud que la unidad de anlisis. Una vez se especifican las unidades, se deber
proceder a la sistematizacin del registro, en aras a facilitar el proceso de gestin de
la informacin. Si se trabaja con notas de campo, transcripciones provenientes de
entrevistas no estructuradas, documentos histricos o algn otro material cualitativo, una tarea determinante es la preparacin cuidadosa de la codificacin (Miles &
Huberman, 1984; Strauss & Corbin, 1990; Edwards & Lampert, 1993) mediante la
imposicin de alguna estructura en la mayor parte de la informacin. En primer lugar,
al igual que en los estudios cuantitativos, es importante revisar que los datos estn
completos, que tengan buena calidad y que estn en un formato que facilite su organizacin. Se debe confirmar que las transcripciones textuales en realidad lo sean, y que
se hallen completas. La principal tarea en la organizacin de los datos cualitativos es
desarrollar un mtodo para indizar el material; por ejemplo, listados que relacionan
los nmeros de identificacin de materia con otros tipos de informacin, como fechas
y lugares de la recogida de datos. Todo registro, por ajustarse al objetivo previamente
delimitado, implica una seleccin de las conductas consideradas relevantes, y en base
149
150
registros descriptivos, autoinformes, etc., a los cuales se los consideraba como material de
chatarra para el estudio del comportamiento y, por consiguiente, se despreciaba la riqueza
de informacin que podan aportar.
Por supuesto, los planteamientos son divergentes, y mucho se ha discutido acerca de si
comportan un diferente cuo epistemolgico, as como de la necesaria eleccin del paradigma (Cook y Reichardt, 1986). Pero la cuestin que aqu nos interesa es hasta qu punto es
factible aunar sus ventajas o puntos fuertes a la vez que se compensen sus carencias o puntos
dbiles.
La tarea no es fcil, pero si es factible, a nuestro humilde entender, y la clave se reduce
a dos cuestiones fundamentales: Por una parte, cubrir las respectivas deficiencias de ambos
colectivos de investigadores, considerando la extraordinaria riqueza que aportan los registros de conducta, la conducta verbal transformable a material documental, y los materiales
documentales (Tabla 1), con lo cual alcanzarn el rango de datos (Anguera, 2000a, 2004),
a la vez que se fortalecen todas las cautelas y acciones metodolgicas tendentes a controlar
la calidad del dato (Blanco, 1989, 1991, 1992, 1993, 2001; Blanco y Anguera, 2000, 2003;
Blanco, Castellano y Hernndez Mendo, 2000; Blanco y Hernndez Mendo, 1998; Blanco
y Losada, 2002; Blanco, Losada y Anguera, 1991) con el fin de garantizar la necesaria objetividad propia de cualquier estudio cientfico. Y, por otra parte, aprovechar la pertinencia
de los instrumentos no estndar (Bakeman y Gottman, 1989; Anguera y Blanco, 2006; Anguera, Magnusson y Jonsson, 2007) que, mediante los sistemas de categoras (en los diseos
unidimensionales) y los formatos de campo (en los diseos multidimensionales), as como la
combinacin entre ambos (en los diseos multidimensionales), dotan a los investigadores de
importantes herramientas que posibilitan la transformacin de datos cualitativos a datos tratables analticamente de forma cuantitativa.
En este sentido, la metodologa observacional ha sido pionera en lograr esta complementariedad (Anguera, 2004, 2005; Anguera & Izquierdo, 2006), desde su origen considerado tradicionalmente como una metodologa cualitativa (Blanco, 1997) hasta los desarrollos
analticos posteriores (Blanco, Losada y Anguera, 2003), que prcticamente no presentan
ninguna limitacin respecto a los tradicionales estudios cuantitativos.
Con estas nuevas consideraciones metodolgicas, se supera la crtica de la endmica
debilidad metodolgica de los estudios cualitativos, a la vez que se consiguen importantes
avances consistentes en el uso de recursos metodolgicos sofisticados que permiten un rigor
mucho ms elevado. Una idea bsica y esencial que forma parte de esta nueva concepcin
de la metodologa cualitativa en su complementariedad con la cuantitativa consiste en que,
en funcin del diseo planteado y de la naturaleza de los datos, proceder una u otra tcnica
analtica (Anguera, Blanco y Losada, 2001), aunque originariamente hubiese estado reservada nicamente a estudios cuantitativos (Anguera, Blanco, Losada y Snchez-Algarra, 1999).
En cualquier caso, si la metodologa cualitativa nos ayud en la obtencin de datos que
aportan una gran riqueza informativa, la cuantitativa nos suministra los recursos para su anlisis ms conveniente. La lgica sucesin de etapas de forma organizada debe permitir este
cambio de perspectiva (de lo cualitativo a lo cuantitativo) de forma pacfica, sin tensin interna en el seno del procedimiento a seguir.
Ambas vertientes metodolgicas pueden beneficiarse mutuamente entre s, y son muchas las ocasiones en que se utilizan de manera conjunta, dando garanta de su complementariedad. Es cierto que en ocasiones esta opcin presenta graves problemas por su costo en
tiempo y dinero, o por falta de personal preparado el efecto, pero en cualquier caso se trata
de superar la posicin enfrentada de ambas perspectivas.
151
El empleo conjunto de la metodologa cualitativa y de la cuantitativa, dado que se interesa por el proceso y el resultado, potencia la vigorizacin mutua de los dos tipos de procedimientos, y facilita la triangulacin a travs de operaciones convergentes (Cook y Reichardt,
1979). Sin embargo, no podemos eludir la coincidencia de diversos autores estudiosos de la
cuestin al considerar que buena parte de las tcnicas de recogida de datos son propias de
una determinada metodologa, o, lo que es lo mismo, que existen instrumentos tanto cualitativos como cuantitativos (Hernndez Lpez, 1995; Anguera, 1995c). As, y en una primera
aproximacin, las entrevistas en profundidad, tcnicas etnogrficas, anlisis histrico o historias de vida, son propias de la metodologa cualitativa, mientras que indicadores estadsticos,
observacin sistemtica, escalas de apreciacin o cuestionarios, lo son de la cuantitativa.
No obstante, se puede elaborar una sistemtica ms completa acerca de la naturaleza de las
diversas tcnicas de recogida de datos, as como de las posibilidades de ser utilizadas desde
una u otra metodologa (Cook y Reichardt, 1979; Marshall & Rossman, 1989).
Es innegable que habr estudiosos y profesionales que, genricamente, manifiestan una
preferencia marcada y casi excluyente por la metodologa cuantitativa, mientras que otros
prefieren la cualitativa. Pero cada vez es mayor el nmero de profesionales e investigadores
que optan por la combinacin de ambos planteamientos, contemplando la utilizacin de
tcnicas propias de uno y otro conforme a las caractersticas del estudio a realizar. Nosotros
igualmente nos pronunciamos en este sentido, considerando que debera intentarse una redefinicin del debate, y eliminando lo que durante dcadas se ha propuesto como necesaria
eleccin del paradigma. Un investigador no tiene por qu adherirse ciegamente a uno de
ambos paradigmas, sino que puede elegir libremente una relacin de atributos que indistintamente provengan de uno u otro si as se logra una adaptacin flexible a su problemtica.
A ello ayuda tambin el hecho de que cada vez sea mayor el nmero de situaciones en
que un equipo multidisciplinar, a partir de una pluralidad de tcnicas, trata de aunar esfuerzos en aras a una mayor rigurosidad de la evaluacin realizada. El camino est cada vez ms
despejado, pero todava requerir considerables esfuerzos en el futuro para consolidar nuevas posibilidades de colaboracin, e incluso de integracin, si atendemos a la propuesta de
Bericat (1998), que considera la actitud positiva y recproca entre ambas metodologas como
un paso ms all de la legtima y reconocida convivencia (p. 31).
Finalmente, es de justicia sealar el importante papel que han desempeado las nuevas tecnologas (Sul Duesa, 2004) y los avances informticos, no solamente en el avance
sustantivo, sino tambin en esta tarea de acercamiento entre las posiciones metodolgicas
cualitativa y cuantitativa, si bien es cierto que existen programas que siguen los planteamientos conceptuales ms radicales (Weitzman & Miles, 1995; Lewins & Silver, 2007). Es muy
amplio el elenco de programas de que se dispone, as como la inusitada velocidad con que
aparece nuevo software en el mercado y en la comunidad cientfica. En la actualidad ya no
nos sorprende ni que se realicen determinados anlisis estadsticos a partir de textos (Woods, Flechter & Hughes, 1996; Oakes, 1998; Lbart, Salem y Bcue Bertaut, 2000), ni que
determinados programas, como el Hyperbase (Brunet, 2006), puedan llevar a cabo anlisis
de conglomerados o anlisis factorial, o que otros que tradicionalmente se han aplicado a
registros sistemticos de conducta, como el Thme (Magnusson, 1996, 2000), puedan extraer
T-Patterns a partir de la transcripcin de sesiones de psicoterapia (Blanchet, Batt, Trognon &
Masse, 2005).
152
REFERENCIAS BIBLIOGRFICAS
lvarez, J.J. (1986). Investigacin cuantitativa / Investigacin cualitativa: Una falsa disyuntiva? En T.D.
Cook y CH.S. Reichardt (Eds.) Mtodos cualitativos y cuantitativos en investigacin evaluativa
(pp. 9-23). Madrid: Morata.
Anguera, M.T. (1985) Posibilidades de la metodologa cualitativa vs. cuantitativa. Revista de Investigacin Educativa, 3 (6), 127-144.
Anguera, M.T. (1986) Investigacin cualitativa. Educar, 10, 23-50.
Anguera, M.T. (1995a). Metodologa cualitativa. En M.T. Anguera, J. Arnau, M. Ato, M.R. Martnez, J.
Pascual y G. Vallejo. Mtodos de investigacin en Psicologa (pp. 513-522). Madrid: Sntesis.
Anguera, M.T. (1995b). Recogida de datos cualitativos. En M.T. Anguera, J. Arnau, M. Ato, M.R.
Martnez, J. Pascual y G. Vallejo. Mtodos de investigacin en Psicologa (pp. 523-547). Madrid:
Sntesis.
Anguera, M.T. (1995c). Tratamiento cualitativo de datos. En M.T. Anguera, J. Arnau, M. Ato, M.R.
Martnez, J. Pascual y G. Vallejo. Mtodos de investigacin en Psicologa (pp. 549-576). Madrid:
Sntesis.
Anguera, M.T. (1995d). Metodologa de la evaluacin: Evaluacin cualitativa frente a evaluacin cuantitativa. En Equipo del Gabinete Psicotcnico Municipal de Torrent (Recop.) La evaluacin ...
proceso final? (pp. 27-36). Torrent: Ajuntament de Torrent.
Anguera, M.T. (1999). Hacia una evaluacin de la actividad cotidiana y su contexto: Presente o futuro
para la metodologa? Discurso de ingreso como acadmica numeraria electa. Barcelona: Real
Academia de Doctores. [Reimpreso (2001) en A. Bazn Ramrez y A. Arce Ferrer (Eds.), Estrategias de Evaluacin y Medicin del Comportamiento en Psicologa (pp. 11-86). Mxico: Instituto
Tecnolgico de Sonora y Universidad Autnoma de Yucatn].
Anguera, M.T. (2000a). Cuantificacin no reduccionista en Ciencias del Comportamiento: Anverso y
reverso de una compleja realidad. En E. Oate, F. Garca-Sicilia y L. Ramallo (Eds.), Mtodos numricos en Ciencias Sociales (pp. 1-29). Barcelona: Centro Internacional de Mtodos Numricos
en Ingeniera (CIMNE).
Anguera, M.T. (2000b). Del registro narrativo al anlisis cuantitativo: Radiografa de la realidad perceptible. En Ciencia i cultura en el segle XXI. Estudis en homenatge a Josep Casajuana (pp. 41-71).
Barcelona: Reial Academia de Doctors.
Anguera, M.T. (2004). Posicin de la metodologa observacional en el debate entre las opciones metodolgicas cualitativa y cuantitativa. Enfrentamiento, complementariedad, integracin? Psicologia
em Revista (Belo Horizonte, Brasil), 10 (15), 13-27.
Anguera, M.T. (2005). Microanalysis of T-patterns. Analysis of simmetry/assimetry in social interaction.
In L. Anolli, S. Duncan, M. Magnusson & G. Riva (Eds.), The hidden structure of social interaction.
From Genomics to Culture Patterns (pp. 51-70). Amsterdam: IOS Press.
Anguera, M.T. y Blanco, A. (2006). Cmo se lleva a cabo un registro observacional? Butllet La Recerca, 4 [http://ice.d5.ub.es/recerca/butlleti/butlleti.html / http://ice.d5.ub.es/recerca/fitxes/fitxa4-cat.
htm].
Anguera, M.T., Blanco, A. y Losada, J.L. (2001). Diseos observacionales, cuestin clave en el proceso
de la metodologa observacional. Metodologa de las Ciencias del Comportamiento, 3 (2), 135160.
Anguera, M.T., Blanco, A., Losada, J.L. y Snchez-Algarra, P. (1999). Anlisis de la competencia en la
seleccin de observadores. Metodologa de las Ciencias del Comportamiento, 1 (1), 95-114.
Anguera, M.T. & Izquierdo, C. (2006). Methodological approaches in human communication. From
complexity of situation to data analysis. In G. Riva, M.T. Anguera, B.K. Wiederhold & F. Man-
153
tovani (Coord.), From Communication to Presence. Cognition, Emotions and Culture towards the
Ultimate Communicative Experience (pp. 203-222). Amsterdam: IOS Press.
Anguera, M.T., Magnusson, M.S. y Jonsson, G.K. (2007). Instrumentos no estndar. Avances en medicin, 5 (1), 63-82.
Bakeman, R. y Gottman, J.M. (1989). Observacin de la interaccin: Introduccin al anlisis secuencial. Madrid: Morata.
Benoliel, J.Q. (1984). Advancing nursing science: Qualitative approaches. Western Journal of Nursing
Research, 6, 1-8.
Bericat, E. (1998). La integracin de los mtodos cuantitativo y cualitativo en la investigacin social.
Significado y medida. Barcelona: Ariel.
Blanchet, A., Batt, M., Trognon, A. & Masse, L. (2005). Language and behaviour patterns in a therapeutic interaction sequente. In L. Anolli, S. Duncan, M.S. Magnusson & G. Tiva (Eds.), The hidden
structure of interactions: From neurons to culture patterns (pp. 124-139). Amsterdam: IOS Press.
Blanco, A. (1983). Anlisis cuantitativo de la conducta en sus contextos naturales: Desarrollo de un
modelo de series de datos para el establecimiento de tendencias, patrones y secuencias. Tesis
Doctoral no publicada. Barcelona: Universidad de Barcelona.
Blanco, A. (1989) Fiabilidad y generalizacin de la observacin conductual. Anuario de Psicologa, 43
(4), 5-32.
Blanco, A. (1991) La teora de la generalizabilidad aplicada a diseos observacionales. Revista Mexicana de Anlisis de la Conducta / Mexican Journal of Behavior Analysis (Mxico), 17 (3), 23-63.
Blanco, A. (1992). Aplicaciones de la teora de la generalizabilidad en la seleccin de diseos evaluativos. Bordn, 43 (4), 431-459.
Blanco, A. (1993) Fiabilidad, precisin, validez y generalizacin de los diseos observacionales. En
M.T. Anguera (Ed.) Metodologa observacional en la investigacin psicolgica (pp. 149-261). Barcelona: P.P.U., Vol. II.
Blanco, A. (1997). Metodologies qualitatives en la investigaci psicolgica. Barcelona: Edicions de la
Universitat Oberta de Catalunya.
Blanco, A. (2001). Generalizabilidad de observaciones uni y multifaceta: Estimadores LS y ML. Metodologa de las Ciencias del Comportamiento, 3 (2), 161-193.
Blanco, A. y Anguera, M.T. (2000). Evaluacin de la calidad en el registro del comportamiento: Aplicacin a deportes de equipo. En E. Oate, F. Garca-Sicilia y L. Ramallo (Eds.), Mtodos Numricos
en Ciencias Sociales (pp. 30-48). Barcelona: Centro Internacional de Mtodos Numricos en
Ingeniera.
Blanco, A. y Anguera, M.T. (2003). Calidad de los datos registrados en el mbito deportivo. En A. Hernndez Mendo (Coord.), Psicologa del Deporte (Vol. 2). Metodologa (p. 35-73). Buenos Aires:
Efdeportes (www.efdeportes.com).
Blanco, A., Castellano, J. y Hernndez Mendo, A. (2000). Generalizabilidad de las observaciones de la
accin del juego en el ftbol. Psicothema, 12 (Supl. 2), 81-86.
Blanco, A. y Hernndez Mendo, A. (1998). Estimacin y generalizacin en un diseo de estructura espacial defensiva en el ftbol. En J. Sabucedo, R. Garca Mira, E. Ares y D. Prada (Coords.), Medio
ambiente y responsabilidad humana (pp. 579-583). A Corua: Trculo.
Blanco, A. y Losada, J.L. (2002). Estimacin y generalizacin en diseos observacionales: Una aplicacin iterativa de mxima verosimilitud. Metodologa de las Ciencias del Comportamiento, vol.
especial, 85-90.
Blanco, A., Losada, J.L. y Anguera, M.T. (1991) Estimacin de la precisin en diseos de evaluacin
ambiental. Evaluacin Psicolgica / Psychological Assessment, 7 (2), 223-257.
154
Blanco, A., Losada, J.L. y Anguera, M.T. (2003). Analytic techniques in observational designs in environment-behavior relation. Medio Ambiente y Comportamiento Humano, 4 (2), 111-126.
Blaxter, M. (1979). Symposium on the handling of qualitative data. Introduction. Sociological Review,
27 (4), 649-650.
Boyatzis, R.E. (1998). Transforming qualitative information. Thousand Oaks: Sage.
Brunet, E. (2006). Hyperbase. Logiciel hypertexte pour le traitment documentaire et statistique des corpus textuels. Document non publi.
Bulmer, M. (1979). Concepts in the analysis of qualitative data. Sociological Review, 27 (4), 651-677.
Cook, T.D. y Reichardt (Eds.) (1979). Mtodos cualitativos y cuantitativos en investigacin evaluativa.
Madrid: Morata.
Denzin, N.K. (1970). The research act: A theoretical introduction to sociological methods. New York:
McGraw-Hill.
Edwards, J.A. & Lampert, M.D. (1993). Talking data. Transcription and coding in discourse research.
Hillsdale, N.J.: Lawrence Erlbaum Associates.
Erickson, F. (1986). Qualitative methods in research on teaching. In M.C. Wittrock (Edit.). Handbook of
research on teaching. New York; McMillan.
Ferreira, M. (2007). Prcticas sociales, identidad y estratificacin: tres vrtices de una hecho social,
la discapacidad. Intersticios. Revista Sociolgica de Pensamiento Crtico [Revista en lnea], 1 (2).
Disponible en: http://www.intersticios.es/article/view/1084/854 [Consulta: 03/05/2008].
Ferreira, M. y Rodrguez Caamao, M.J. (2006). Sociologa de la discapacidad: una propuesta terica
crtica. Nmadas. Revista crtica de Ciencias Sociales y Jurdicas [Revista en lnea], 13, 1. Disponible en: http://www.ucm.es/info/nomadas/13/ferreiracaama%F1o.html [Consulta: 03/05/2008].
Flick, U. (2007). Introduccin a la investigacin cualitativa. Madrid: Morata.
Goetz, J. y LeCompte, M. (1988). Etnografa y diseo cualitativo en investigacin educativa. Madrid:
Morata.
Hernndez Lpez, J.M. (1995). Procedimientos de recogida de informacin en evaluacin de programas. En R. Fernndez-Ballesteros (Ed.), Evaluacin de programas. Una gua prctica en mbitos
sociales, educativos y de salud (pp. 117-147). Madrid: Sntesis.
Huberman, A.M. & Miles, M.B. (1991). Analyse des donnes qualitatives. Recueil de nouvelles mthodes. Bruxelles: De Boeck-Wesmael.
Lbart, L., Salem, A. y Bcue Beraut, M. (2000). Anlisis estadstico de textos. Lleida: Milenio.
Lewins, A. & Silver, C. (2007). Using software in qualitative research. Los Angeles: Sage.
Lofland, J. (1971). Analyzing social settings. Belmont, Ca.: Wadsworth.
Magnusson, M.S. (1996). Hidden real-time patterns in intra and inter-individual behavior. European
Journal of Psychological Assessment, 12 (2), 112-123.
Magnusson, M.S. (2000). Discovering hidden time patterns in behavior: T-patterns and their detection.
Behavior Research Methods, Instruments, & Computers, 32 (1), 93-110.
Marshall, C. & Rossman, G.B. (1989). Designing qualitative research. Newbury Park: Sage.
Miles, M.B. & Huberman, A.M. (1984). Qualitative data analysis. Beverly Hills: Sage.
Morse, J.M. (1994). Qualitative research: Fact or fantasy? In J.M. Morse (Ed.) Critical issues in qualitative
research methods (pp. 1-9). Thousand Oaks: Sage.
Nisbett, R.E. & Wilson, T.D. (1977). Telling more than we can know: Verbal reports on mental processes. Psychological Review, 84 (3), 231-259.
155
Norris, S.P. (1984). Defining observational competence. Service Education, 68 (2), 129-142.
Oakes, M.P. (1998). Statistics for corpus linguistics. Edinburgh: Edinburgh Univesity Texts.
Patton, M.Q. (1980). Qualitative Evaluation Methods. Beverly Hills: Sage.
Riba, C.E. (2007). La metodologia qualitativa en lestudi del comportament. Barcelona: UOC.
Rodrguez Gmez, G., Gil Flores, J. y Garca Jimnez, E. (1996). Metodologa de la investigacin cualitativa. Archidona: Aljibe.
Sandn, M.P. (2003). Investigacin cualitativa en Educacin. Fundamentos y tradiciones. Madrid: McGraw-Hill.
Smith, J.K. (1983). Quantitative versus interpretative: The problem of conducting social inquiry. In E.R.
House (Ed.) Philosophy of evaluation (pp. 27-51). San Francisco: Jossey-Bass.
Schwartz, H. y Jacobs, J. (1984). Sociologa cualitativa. Mtodo para la reconstruccin de la realidad.
Mxico: Trillas.
Strauss, A. & Corbin, J. (1990). Basics of qualitative research. Grounded theory procedures and techniques. Newbury Park: Sage.
Sul Duesa, A. (2004). Tecnologies de la informaci (barates) aplicades a persones amb necessitats
especials. BiD: textos universitaris de biblioteconomia i documentaci [Revista en-lnea], 12.
Disponible en: http://www2.ub.es/bid/consulta_articulos.php?fichero=12sule2.htm. [Consulta:
03/05/2008].
Szent-Gyrgyi, A. (1980). Dionysians and apollonians. In M.R. Key (Ed.) The relationship of verbal and
non-verbal communication (pp. 317-318). New York: Mouton.
Urraco, M. (2007). La metodologa cualitativa para la investigacin en Ciencias Sociales: una mediografa orientativa. Un nuevo modelo terico de la discapacidad: aplicacin a la optimizacin de
las tiflotecnologas. Disponible en: http://www.um.es/discatif/PROYECTO_DISCATIF/Documentos/metodoloia_cualitativa.pdf [Consulta: 03/05/2008].
Valles, M. S. & Baer, A. (2005, Septiembre). Investigacin social cualitativa en Espaa: Pasado, presente y futuro. Un retrato [62 prrafos]. Forum Qualitative Sozialforschung / Forum: Qualitative
Social Research [Revista en-lnea], 6(3), Art. 18. Disponible en: http://www.qualitative-research.
net/fqs-texte/3-05/05-3-18-s.htm [Consulta: 02/05/2008].
Weitzman, E.A. & Miles, M.B. (1995). Computer programs for qualitative data analysis. A software
sourcebook. Thousand Oaks: Sage.
Woods, A., Flechter, P. & Hughes, A. (1996). Statistics in language studies. Cambridge: Cambridge University Press.
Zabalza, M.A. (1991). Los diarios de clase. Documento para estudiar cualitativamente los dilemas prcticos de los profesores. Barcelona: P.P.U.
Como en todas las innovaciones, la utilizacin del ordenador en este tipo de anlisis
genera posiciones encontradas entre quienes lo han incorporado y pretenden ver un mundo
inacabable de posibilidades, y los partidarios de continuar haciendo las cosas a mano. Los
primeros llegan a plantear esta actividad como un rea principal de especializacin dentro
del anlisis, como lo es la estadstica en los anlisis cuantitativos.
Imagen 1. Clasificacin de software de anlisis textual
158
Por una parte, Fielding y Lee (1998) encontraron en su estudio emprico sobre el uso de programas que dos tercios de los proyectos revisados no utilizaban la teora fundamentada pero
usaban programas de uso en la investigacin cualitativa. Esto muestra que la relacin entre
los programas informticos y la teora fundamentada no es tan estrecha como sospechan algunos autores.
Ten Have (1999), por otra parte, muestra cmo se puede aplicar este programa al anlisis de conversaciones. Otra preocupacin es que los programas informticos fuercen implcitamente su estructura lgica y de exposicin sobre los datos y el anlisis del investigador. El
programa NUDIST, por ejemplo, apoya el desarrollo de una estructura de cdigos jerrquica
en forma de rbol. Entre sus usuarios, se puede encontrar una cierta inflacin de sistemas de
codificacin estructurados en forma de rbol. Seale (2000) da una buena ilustracin de este
problema, cuando aplica NUDIST y ATLAS-ti a una teora fundamentada desarrollada por
Glaser y Strauss, y muestra lo diferentes que parecen la presentacin y la estructura de esta
teora en ambos programas.
Por ltimo, hay un temor a que la atencin atrada por el ordenador y los programas distraigan al investigador del trabajo analtico real: leer y entender los textos, pensar de manera
contemplativa sobre lo que est en los textos y lo que subyace a ellos, etc., (por ejemplo, Lee
y Fielding, 1991).
Del mismo modo, Richards y Richards (1994), que han desarrollado uno de los programas ms importantes (NUDIST), afirman que el mtodo informtico puede tener implicaciones espectaculares para el proceso y los resultados de la investigacin, desde restricciones
inaceptables en los anlisis a la apertura inesperada de posibilidades. Pero al final, depende
del usuario y de su forma de hacer til el ordenador y los programas para la investigacin en
curso, y de cmo reflexione sobre lo que est haciendo. As, los ordenadores y los programas
informticos se deben ver como una herramienta pragmtica de apoyo a la investigacin
cualitativa. Sobre sus repercusiones en la propia investigacin deben reflexionar sus usuarios.
No conviene sobrecargarlos de esperanzas y expectativas.
Al menos en teora, cualquier forma de anlisis cualitativo podra ser asistida por ordenador a travs de programas informticos (CAQDAS: Computer Assisted Qualitative Data
Analysis Software) creados a tal efecto, que facilitan el manejo mecnico de los datos: la
bsqueda, seleccin y organizacin. Programas como ETHNOGRAPH, AQUAD, NUDIST O
ATLAS-Ti, resultan sumamente tiles en el anlisis, para realizar operaciones como el marcado y codificacin del texto, la relacin de categoras y sujetos, la elaboracin de tipologas
o perfiles, o el recuento, bsqueda y recuperacin de unidades codificadas, siendo especialmente tiles cuando se trabaja simultneamente con grandes cantidades de informacin (GilGarca y otros, 2002).
Los CAQDAS nos ayudan a sintetizar, ordenar y organizar la informacin recogida para
presentar los resultados de la investigacin. El tratamiento informtico de los datos ayuda al
investigador a hacerse una visin de conjunto del objeto de estudio. La ingente cantidad de
datos que pueden obtenerse de protocolos de observacin, tcnicas de registro, observaciones etnogrficas, etc., deben ser tratados con herramientas potentes que permitan el aprovechamiento de esta informacin.
Estos instrumentos de origen multimedia, debido al diseo de los mismos, han permitido
a los creadores de los CAQDAS la actualizacin de sus prestaciones, incluyendo el anlisis
de datos textuales, grficos, sonoros y de video que los hacen especialmente interesantes
para tratar la informacin variada obtenida de diversas fuentes en contextos multiculturales.
Imagen 1.informtica
Clasificaciny de
software
de anlisis
anlisis
cualitativo
textual
159
Imagen 2. caqdas
Qu es CAQDAS?
Son programas informticos de ayuda al anlisis cualitativo de
datos.
Slo son herramientas que no harn ningn tipo de anlisis
sin nuestra ayuda.
Computer
Assisted
Qualitative
Data
Analysis
Software
Fuente: Adaptado de Muoz Justicia (2004)
Qu permite el CAQDAS?
Organizacin e integracin
Bsqueda y recuperacin
Vinculacin
Representacin grfica
Trabajo en equipo
28
Fuente: Adaptado
Justicia
(2004)afirman que, si bien la mayor
Flick (2004), Miles y Huberman
(1944)dey Muoz
Weitzman
(2000)
parte de los programas informticos en la investigacin cualitativa se utilizan para analizar
datos, hay tambin otros pasos en este proceso de investigacin para los que pueden utilizarse los ordenadores. En general se pueden utilizar para:
SOFTWARE
NUDIST
NUD*IST Vivo
FUNCIONES
Organizacin e
Integracin
160
161
que otra. Gonzlez Martnez (2002) afirma que una investigacin cualitativa podra considerarse vlida slo en funcin del grado de exactitud en la descripcin de la perspectiva de
los sujetos estudiados, la honestidad en el logro de la finalidad para la que se llev a cabo,
la adecuacin de las herramientas y procedimientos utilizados durante todas las fases del
estudio, y la capacidad de corroborar con evidencias las conclusiones, que deben ser crebles para los beneficiarios de la investigacin, como ponamos de manifiesto en el apartado
de calidad de la investigacin cualitativa. Por ltimo decir, como Denzin (1994), que cada
investigador interpreta sus datos de acuerdo con el paradigma del que proviene. Aqu volvemos a los comienzos de la investigacin (proceso circular).
Como indica Richard, citado por Ruiz Olabunaga (1999), es importante distinguir entre
los programas de software informtico que estn orientados expresamente al anlisis cualitativo de los programas no orientados a este anlisis aunque con gran potencialidad para:
creacin y mantenimiento de cdigos, bsqueda de cdigos, bsqueda y establecimiento de
patrones, tratamiento de textos y cdigos que permiten ordenar y separar diferentes patrones,
etc.
En las ltimas publicaciones sobre el anlisis de datos en la investigacin cualitativa
asistido por ordenador (Flick, 2004; Weitzman, 2000; Seale, 2000) se advierte que su utilizacin ayuda en el manejo de la gestin, la bsqueda y la exposicin de los datos y los elementos relacionados, como cdigos o memorandos en los enlaces con los datos. Dado el tiempo
necesario para decidir a favor de un programa, instalarlo y aprender a utilizarlo (o incluso
aprender el uso del ordenador), la ganancia real de tiempo merecer el esfuerzo.
La segunda utilidad es el aumento de la calidad en la investigacin cualitativa utilizando
ordenadores, o que resulte ms fcil demostrar su calidad. Aqu se menciona el aumento de
coherencia en los procedimientos analticos (Weitzman, 2000) o el rigor aadido en los anlisis (Seale 2000). Kelle y Laurie (1995) vinculan el uso de estos programas a un supervit de
validez en la investigacin cualitativa.
Por ltimo, afirma Flick (2004) con el uso de estos programas se incrementa la transparencia del proceso de investigacin y la comunicacin en un equipo de investigacin. Weitzman menciona tambin una consolidacin de la investigacin, ya que el ordenador permite
al investigador tener todos los documentos de sta (desde las notas de campo iniciales hasta
las exposiciones, tablas y escritos finales sobre los hallazgos) en un lugar: el disco duro del
ordenador. Seale (2000) por su parte, ve con estos programas una facilitacin de las decisiones de muestreo basada en el estado del anlisis de los datos hasta el momento (segn el
muestreo terico).
Una utilidad importante es que la gestin de los datos se hace ms fcil con los ordenadores. Kelle (2000) citado por Flick (2004) enumera diversas tcnicas de gestin de datos
apoyada por programas de ordenador de anlisis cualitativo:
La definicin de indicadores que contienen palabras clave junto con direcciones
de pasajes del texto que se pueden utilizar para recuperar segmentos de texto indizados.
La construccin de referencias cruzadas electrnicas con la ayuda de los llamados
hipervnculos, que se pueden utilizar para saltar entre pasajes de texto que estn vinculados entre s [...].
Funciones para el almacenamiento de comentarios de los investigadores (memorandos), que se pueden vincular a palabras clave o segmentos de texto.
Rasgos para definir vnculos entre palabras clave.
162
163
SOFTWARE
NUDIST
NUD*IST Vivo
FUNCIONES
Organizacin e
Integracin
ATLAS.ti
Bsqueda y
Recuperacin
AQUAD
Enlaces
Etnograph
Representacin
Grfica
WINMAX
MAXQDA
Trabajo en grupo
1) NUDIST
2004)
NUD*IST son las siglas de Non-numerical Unstructured Data * Indexing Searching and
Theorizing (una posible traduccin en castellano podra ser: Datos No Estructurados y No
Numricos * Indexar, registrar y teorizar).
QSR NUD*IST es una herramienta diseada para ayudar a sus usuarios en el manejo de
datos no numricos y no estructurados en anlisis cualitativos, para soportar procesos de codificacin de datos en un sistema de catalogacin, bsquedas de texto o modelos de cdigo
y teorizar sobre los datos. Hablaremos de l ms adelante.
2) NUD.IST Vivo
29
QSR NVivo es un programa altamente avanzado para el manejo del anlisis de datos
cualitativos en proyectos de investigacin. Es un producto asociado a la actualizacin opcional del NUD*IST.
Los investigadores pueden gestionar tanto datos enriquecidos, como texto enriquecido,
usando negrita, cursiva, colores y otros formatos con amplia capacidad para editar, visualizar cdigos y vincular documentos tal y como son creados, codificados, filtrados, manejados
y registrados.
En la ltima versin de este programa, las mejoras sobre la versin anterior estn relacionadas con: manejo de documentos, codificacin, manejo de datos, modelado (representacin grfica), informes y exportacin y facilidades para el proyecto.
3) WINMAX
WINMAX es una herramienta para el anlisis de texto, robusta y fcil de manejar, que
puede codificar y recuperar informacin incluso para los ms sofisticados anlisis textuales,
utilizando procedimientos cuantitativos y cualitativos de forma combinada.
164
El programa WINMAX ofrece: visualizacin de funciones bsicas como cdigos y memos, codificacin compleja y flexible y funciones de recuperacin (booleana, proximidad y
recuperacin semntica), bsqueda lexical y codificacin automtica, combinacin de datos
cuantitativos y cualitativos, importar y exportar matrices de datos, complejas y robustas herramientas de construccin de teora, funciones nicas como codificacin de variables segn
su peso significativo.
El programa tiene interfaz simple y fcil de usar, muestra cuatro ventanas: los grupos de
textos, la lista de cdigos, la lista de segmentos codificados y los propios textos ya importados.
4) ATLAS.ti
ATLAS.ti es una herramienta informtica cuyo objetivo es facilitar el anlisis cualitativo,
principalmente de grandes volmenes de datos textuales (Muoz Justicia, 2001).
ATLAS.ti es un potente software para el anlisis visual de datos cualitativos de: textos,
grficos, audio y video. Ofrece una variedad de herramientas para llevar a cabo las tareas
asociadas con una aproximacin sistemtica a los datos sensibles.
Este programa puede: recopilar y organizar su texto, audio o archivos de datos visuales,
junto con la codificacin, memos y bsquedas, en su proyecto o unidad hermenutica,
facilita actividades en el anlisis y la interpretacin, construye una red que permite conectar
visualmente pasajes seleccionados, permite construir conceptos y teoras basadas en las relaciones visibles, permite descubrir significados interrelacionados.
ATLAS.ti fue desarrollado por Muhr (1991, 1994) en un proyecto de investigacin en la
Universidad Tcnica de Berln. El programa se basa en el enfoque de la teora fundamentada
y de la codificacin terica segn Strauss (1987). Sus versiones ms recientes no slo pueden
procesar textos, sino tambin imgenes, grficos y sonido.
La mayora de los autores clasifican este programa en la categora de los constructores
de redes conceptuales (Weitzman, 2000), pero principalmente en el grupo de los constructores de teoras basadas en cdigos. Ayuda en operaciones en el nivel de textos y el
conceptual. Se forma una unidad hermenutica en la pantalla que unifica el texto primario
(por ejemplo, la entrevista que debe interpretarse) y las interpretaciones o las codificaciones
relacionadas con ella. El programa muestra el texto primario con todos los cdigos asignados
y los comentarios en ventanas diferentes. Ofrece algunas funciones, que estn presentes en la
pantalla en forma de smbolos (recuperar, copiar, cortar, codificar, formar redes, etc.) (Flick,
2004).
Aparte de la recuperacin de secuencias de palabras en el texto y la asignacin de cdigos, es til la presentacin de los cdigos y las categoras en redes conceptuales. Se integran
interfaces con el SPSS y otros programas. Adems es posible que autores diferentes trabajen
en el mismo texto en ordenadores distintos. Hay un apoyo aceptable del autor y una lista
electrnica muy activa de usuarios: (http:www.atlasti.de).
5) AQUAD
La caracterstica especial de este programa es su capacidad, no slo para categorizar y
organizar los datos para cada categora, sino tambin permitir al investigador extraer conclusiones al relacionar las categoras entre s explorando, por ejemplo, la aparicin de ciertas
configuraciones tpicas y repetitivas en la representacin de los datos. Una vez que dichas
165
repeticiones son intuidas, el investigador puede confirmar sistemticamente los datos o bien,
como sealan Miles y Huberman (1994), comprobar las hiptesis.
Como indica Piuel Raigada (2003) este programa permite interpretacin de textos
mediante codificacin simple del texto sin gua previa de categoras, o mediante un proceso
semiautomtico de codificacin a partir de listados de ocurrencia de trminos prefijados, que
aparecen destacados sobre la pantalla siguiendo el texto. Los programas de anlisis permiten
desde el recuento de palabras aisladas, hasta la confeccin de listas de palabras (diccionarios), diferenciacin de hablantes, codificacin de las partes de textos producidos por
hablantes diferentes, etc. Los segmentos de texto pueden ser recuperados por nmero de
archivos de texto, nmeros de lnea del texto, cdigo, palabra clave, etc. (la bsqueda texto
es completa). Permite la comparacin de casos/textos mediante anlisis bolanos de rasgos
crticos (minimizacin lgica de tablas de contingencia).
6) MAXQDA
MAXQDA es el nuevo programa desarrollado por los creadores de WINMAX, es una
potente herramienta para el anlisis de texto basado en datos cualitativos.
EL MAXQDA se relaciona con los siguientes mtodos y tcnicas cualitativas:
Teora Fundamentada.
Anlisis cualitativo del contenido.
Mtodos de investigacin de campo.
Mtodos etnogrficos.
MAXQDA analiza los siguientes tipos de textos: transcripciones de entrevistas abiertas,
entrevistas en profundidad, semiestructuradas y de expertos, observaciones, estudios sobre el
terreno, debates de grupo, discursos y documentos, textos procedentes de la red, discursos
polticos y charlas teraputicas.
El programa MAXQDA se utiliza en muchas disciplinas o mbitos, como sociologa,
ciencias de la educacin, economa, marketing, etnologa, arquitectura, planificacin urbana, sanidad pblica y medicina.
CMO DECIDIRSE POR UN PROGRAMA INFORMTICO
Autores como Weitzman (2000); Weitzman y Miles (1995); Bergmann y Meier (2004)
y Flick (1991; 2004) proponen que el investigador se formule una serie de preguntas clave
antes de decidirse por un programa informtico o por el uso de ordenadores en general. Estas
preguntas claves se detallan en cuadro siguiente.
166
Preguntas relacionadas con los datos: Para qu clase de datos se concibi el programa?
Para qu datos puede utilizarse ms all de estos datos originales? Para qu datos no se
debe utilizar?. Se trata slo de texto o utiliza video o fotografas, datos acsticos, imgenes en
movimientos?. No todos los programas estn preparados para trabajar con este tipo de datos.
2.
Preguntas relacionadas con las actividades: Qu actividades pueden realizarse con este
programa, cules no deben llevarse a cabo?
3.
en el rol que desempe el investigador o intrprete de acuerdo con las experiencias tenidas
hasta ahora? Qu nuevas opciones abri? Qu se ha vuelto ms difcil o laborioso en el
proceso de interpretacin debido al programa?
4.
Qu tipo de anlisis est previsto (con un esquema de codificacin predefinido con un conjunto
de categoras que evolucionan?
5.
Debe estar el texto que se interpreta siempre accesible (en pantalla) o slo las categoras?
6.
Preguntas tcnicas Cules son las condiciones necesarias en las opciones de red del equipo
(tipo de ordenador, Ram, disco duro, tarjeta grfica, pantalla) o de los programas (sistemas de
programas, necesidad de otros programas) para otros programas (SPSS, procesadores de
textos, bases de datos...)?
7.
8.
Desde nuestra experiencia personal con el manejo del software de anlisis cualitativo,
nos atrevemos a sugerir los programas NUDIST y ATLAS-Ti, que son los ms utilizados tanto
para el anlisis textual como para el conceptual. Nos obstante como seala Ruiz Olabunaga
(1999) no conviene perder de vista la afirmacin central de que el ordenador opera y ofrece
sus ventajas de rapidez, capacidad y versatilidad, siempre a nivel textual, dado que, a nivel
conceptual, es el investigador el que debe efectuar las operaciones oportunas en cada caso.
El ordenador ejecuta las operaciones mecnicas pero el investigar debe reservarse para s las
estrictamente conceptuales.
EL PROGRAMA NUDIST
De todos estos programas descritos el que se utiliza en la asignatura objeto de esta propuesta acadmica es el Nudist.
Fue desarrollado por Richards y Richards (1994). Weitzman (2000) clasifica el programa
como constructor de teoras basadas en cdigos. Incluye un sistema de comandos comple-
167
Adems, este programa informtico, como sealan Gil Flores y Perera Rodrguez (2001),
soporta los procesos de categorizacin deductiva e inductiva, incluso ambas. Esta habilidad
posibilita que podamos disear a priori un sistema de categoras desarrollado a partir de teoras existentes o establecidas en base al objeto de la investigacin, o bien hiptesis o constructos que se han ido incorporando durante la recogida de la informacin. Una de las caractersticas de este programa es que estas categoras las podemos agrupar y organizar de forma
jerrquica. Esto permite al investigador observar las relaciones que existen entre los mltiples
conceptos o categoras tratadas, compararlas mediante operadores especficos (booleanos,
contextuales, negativos, inclusivos, exclusivos) para esbozar conclusiones relativas a los temas de investigacin.
168
Imagen 4. Procesos del programa nudist (Adaptado de Rodrguez Gmez y otros, 1996)
z Sistema
Sistema
z
de documentacin:
documentacin:
de
informacin recogida
recogida de
de
informacin
entrevistas,cuestionarios,
cuestionarios,documentos,
documentos,diarios,
diarios,fotos,
fotos,vdeos,
vdeos,historias
historiasde
devida,
vida,textos,
textos,
entrevistas,
etc.
etc.
z Sistema
Sistema de
de indizacin:
indizacin: organizacin
organizacinde
deideas,
ideas,conceptos
conceptosyyhechos
hechos
z
quesurgen
surgenaalololargo
largode
delalainvestigacin,
investigacin,que
queseseordenan
ordenanen
enuna
unaestructura
estructurajerrquica
jerrquica
que
conforma
formade
derbol
rbolinvertido
invertido(cuestiones
(cuestionesde
deinvestigacin,
investigacin,temas
temasde
deinters,
inters,informacin
informacin
con
yaestructurada
estructurada
sistematizada,
etc.).
informtica
yetc.).
anlisis cualitativo
ya
yysistematizada,
Esta
estructuracin
permite
organizar
manejarlos
losconceptos
conceptosindizados
indizadoscomo
comosistemas
sistemas
Esta estructuracin permite organizar yymanejar
tericos,no
nosimplemente
simplementecomo
comoetiquetas.
etiquetas.
tericos,
169
En definitiva, a travs del programa NUD*IST se puede dividir la informacin textual recogida en la investigacin, asignar categoras, establecer relaciones entre ellas, realizar bsconstruir
matrices
tablas NUDIST
de frecuencias con la informacin
quedas textuales especficas,Imagen
5.- Procesos
del y
programa
relevante y todo ello ser lo que expondremos
a
continuacin
de forma lo ms exhaustiva
Fuente: Elaboracin propia
posible.
Imagen 6. Utilidad del programa nudist (1)
Integrarlalabsqueda
bsquedade
detexto
textoyylalaindizacin:
indizacin:aadiferencia
diferenciade
delos
losotros
otros
Integrar
programasinformticos
informticosde
deanlisis
anlisiscualitativo,
cualitativo,combina
combinalalaexploracin
exploracindedeinformacin
informacin
programas
delos
losnudos
nudoscon
conlas
lasdel
deltexto,
texto,recuperando
recuperandolas
lasunidades
unidadesdeseadas
deseadas(seccin
(seccinoo
de
documentoentero)
entero)en
encualquier
cualquiermomento.
momento.
documento
Comentariosen
enelelsistema
sistemade
deindizacin:
indizacin:elelinvestigador
investigadordispone
disponede
deuna
unaforma
forma
Comentarios
adecuadapara
paraalmacenar
almacenarnotas
notasde
detrabajo,
trabajo,opiniones
opinionesyypensamientos
pensamientosacerca
acercade
delas
las
adecuada
categoras,proporcionando
proporcionandode
deesta
estaforma
formauna
unarevisin
revisincontinua
continuadel
deldesarrollo
desarrollode
delas
las
categoras,
ideasen
enelelproceso
procesode
deinvestigacin.
investigacin.
ideas
Modificarelelsistema
sistemade
deindizacin:
indizacin:sesepuede
puedehojear,
hojear,explorar,
explorar,reorganizar,
reorganizar,
Modificar
cambiarnuevos
nuevosconceptos
conceptosque
queemergen
emergenen
enlalainvestigacin.
investigacin.Esto
Estoproporciona
proporciona
cambiar
flexibilidadmxima
mximayycontrol
controlsobre
sobrelalainformacin.
informacin.
flexibilidad
Buscaryyrecuperar:
recuperar: mediante
mediantelos
losoperadores
operadoresdel
delprograma
programasesepueden
puedenestablecer
establecer
Buscar
relacionesentre
entrelas
lasunidades
unidadesde
detexto
textoyylos
losnudos.
nudos.
relaciones
Crearnuevas
nuevascategoras
categorasde
deindizacin
indizacinaapartir
partirde
delas
lasanteriores:
anteriores:(teora
(teora
Crear
fundamentada)
fundamentada)
Integraranlisis
anlisisde
dedatos
datostextuales
textualesyynumricos:
numricos:nos
nosofrece
ofreceuna
unaserie
seriede
dedatos
datos
Integrar
estadsticoscomo
comoproducto
productode
delas
lasbsquedas
bsquedasrealizadas,
realizadas,que
quepueden
puedenser
serutilizados
utilizadospara
para
estadsticos
otrotipo
tipode
deanlisis.
anlisis.
otro
Sntesis:Permite
Permitedividir
dividirlos
lostextos,
textos,asignar
asignarcdigos,
cdigos,establecer
establecerrelaciones
relacionesentre
entrelos
los
Sntesis:
cdigos,realizar
realizarbsquedas
bsquedasde
detextos
textosconcretos,
concretos,construir
construirmatrices
matrices
cdigos,
textuales..yycon
conello,
ello,realizar
realizarlas
lasconclusiones
conclusionesen
enuna
unainvestigacin.
investigacin.
textuales..
OPERADORES
32
170
171
172
REFERENCIAS BIBLIOGRFICAS
Amors, P., Cabrera, F. y otros (1993). Una experiencia de investigacin cooperativa. La metodologa
de intervencin en medio abierto. Revista de Investigacin Educativa, 20, 109-130.
Anguera, M. T. (1995). Tratamiento cualitativo de datos. En M. T. Anguera y otros, Mtodos de investigacin en Psicologa, (pp. 549-576). Madrid: Sntesis.
Arnal, J., Del Rincn, D. y Latorre, A. (1992). Investigacin educativa. Fundamentos y metodologa.
Barcelona: Labor.
Ball, M. y Smith, G. (1992). Analyzing visual data. Newbury Park. CA: Sage.
Bardin, L. (1986). El anlisis de contenido. Madrid: AkaI.
Bartolom, M. (1990). Elaboracin y anlisis de datos cualitativos aplicados a la investigacin-accin.
Barcelona: Universidad de Barcelona.
Bogdan, R. y Biklen, S. (1992) (2 ed.). Qualitative research for Education: An Introduction to theory
and methods. Boston: Houghton Mifflin.
Bonal, X. (1995). Los lmites del enfoque prctico. Cuadernos de Pedagoga, 236, 70-71.
Buenda, L., Cols, P. y Hernndez Pina, F. (1997). Mtodos de investigacin en Psicopedagoga. Madrid: MacGraw Hill.
Caballero Romero, J. J. (1991). Etnometodologa: una explicacin de la construccin social de la realidad. Revista de Investigaciones Sociolgicas, 56, 83-114.
Cajide, J. (1992). La investigacin cualitativa: Tradiciones y perspectivas contemporneas. Bordn, 44
(4), 357-373.
Casanova Correa, J. y Pavn Rabasco, F. Nuevas herramientas para el procesamiento de datos cualitativos. Disponible en: [http://www2.uhu.es/agora/digital/numeros/03/03-articulos/miscelanea/pavon.PDF]. Universidad de Cdiz.
Coffey, A. y Atkinson, P. (1996). Making sense of qualitative data. London: Sage Publications.
Cols, M. P. (1992). El anlisis de datos en la metodologa cualitativa. Revista de Ciencias de la Educacin, 152, 521-540.
Cols, M. P. (1997). El anlisis cualitativo de datos. En L. Buenda, P. Cols y F. Hernndez (Eds.), Mtodos de investigacin en Psicopedagoga (pp. 287-311). Madrid: McGraw-Hill.
Corts Rodrguez, L. y Camacho Adarve, M. M. (2003): Qu es el anlisis del discurso? Barcelona:
Octaedro.
Creswell, J. W. (1998). Data analysis and representation, del libro Qualitative inquirind research design: Choosing among five traditions (pp. 139-165). California: Sage.
De la Orden, R.L. (1988). Informtica e investigacin educativa. En I. Dendaluce (Coord.), Aspectos
metodolgicos de la investigacin educativa (pp. 276-295). Madrid. Narcea.
Delgado, J. M. y Gutirrez, J. (Coords.) (1994). Mtodos y tcnicas cualitativas de investigacin en
ciencias sociales. Madrid. Sntesis.
Dey, L. (1993). Qualitative data analysis. A user friendly guide for social scientists. London: Roudedge
and Kegan Paul.
Etxeberra, J. y otros (1995). Anlisis de datos y textos. Madrid: Ra-Ma.
Fielding, N.G. y Lee, R.M. (1991). Using computers in qualitative research. Newbury Park CA: Sage.
Flick, U. (2004). Introduccin a la Investigacin Cualitativa. Madrid: Morata.
173
Garca, E., Gil, J. y Rodrguez, G. (1994). Anlisis de datos cualitativos en la investigacin sobre la diferenciacin educativa. Revista de Investigacin Educativa, 23, 179-213.
Gil, J. (1994). Aproximacin interpretativa al contenido de la informacin textual (pp.65-107), Cap.
3 del libro Anlisis de datos cualitativos: Aplicaciones a la investigacin educativa. Barcelona:
PPU.
Gil Flores, J. (1994). Anlisis de datos cualitativos: Aplicaciones a la investigacin educativa. Barcelona: PPU.
Gil Flores, J. y Perera Rodrguez, V. (2001): Anlisis informatizado de datos cualitativos. Sevilla: Kronos.
Glaser, R, y Strauss, A. (1967). The discover of grounded theory: strategies for qualitative research.
New York: Aldine Publishing Co.
Goetz, J., y LeCompte, M. (1988). Etnografa y diseo cualitativo en investigacin cualitativa. Madrid:
Morata.
Green, J.C. (1994). Qualitative Program Evaluation: Practice and Promise. En N.K. Denzin y Y.S. Lincoln (Eds.), Handbook of Qualitative Research. (pp. 530-544). Londres: Sage Publications.
Guba, E.G. y Lincoln, Y.S. (1994). Competing Paradigms in Qualitative Research. En N.K. Denzin y Y.S.
Lincoln (eds.), Handbook of Qualitative Research, (pp. 105-117). Londres: Sage.
Gustavo Rodrguez, P. (1997). El recurso informtico en el procesamiento de datos cualitativos en ciencias sociales. Disponible en: [http://www.naya.org.ar/analisis_cualitativo/vcaaspc.htm].
Hesse-Biber, S. y Dupuis, P. (1995). Hypothesis testing in computer-aided qualitative data analysis. En
Kelle, V. (Ed.). Computer-aided qualitative data analysis: Theory, methods and practice. London:
Sage.
Hill, M. (1993). Archival strategies and techniques. Newbury Park, CA: Sage.
Huber, G. L. (1991). AQUAD. Anlisis de datos cualitativos con ordenadores. Principios y manual del
paquete de programas AQUAD 3.0. Sevilla: Departamento de Didctica y Organizacin Escolar
y Mtodos de Investigacin y Diagnstico en Educacin.
Huber, G. y Marcelo, C. (1990). Algo ms que recuperar palabras y contar frecuencias: la ayuda del
ordenador en el anlisis de datos cualitativos. Revista de Enseanza, 8, 69-85.
Huber, G. (2001). AQUAD cinco: Manual del programa para analizar datos cualitativos. Berln: Ingeborg Huber Verlag.
Jacob, E. (1987). Qualitative research traditions: A review. Review of Education Research, 57, 1, 1-50.
Krippendorf, K. (1990). Metodologa del anlisis de contenido. Teora y prctica. Barcelona: Paids.
Latorre A., Del Rincn, D. y Arnal, J. (1996). Bases metodolgicas de la investigacin educativa. Barcelona: Hurtado.
Llinares, S. (1992). Los mapas cognitivos como instrumento para investigar las creencias epistemolgicas de los profesores. En C. Marcelo (Ed.), La investigacin sobre la formacin del profesorado.
Mtodos de investigacin y anlisis de datos. Irala, Argentina: Cincel.
Llinares, S. y Snchez, M. V. (1990). Las creencias epistemolgicas sobre la naturaleza de las matemticas y su enseanza y el proceso de llegar a ser un profesor. Enseanza, 8, 165-180.
Lofland, J. (1971). Analyzing social setting. Belmont: CA. Wadsworth Publishing Company.
Marcelo, C. (1992). Dar sentido a los datos: La combinacin de perspectivas cualitativa y cuantitativa
en el anlisis de entrevistas. En C. Marcelo (Ed.), La investigacin sobre la formacin del profesorado. Mtodos de investigacin y anlisis de datos (pp. 13-48). Irala, Argentina: Cincel.
174
Miles, M. B. y Hubermas, A.M. (1984). Qualitative data analysis: A source book. Beverly Hills, CA:
Sage.
Miller, A. (1986). Imagery in scientific thought. Cambridge: MIT Press.
Morse, J. M. (1997). Considering theory derived from qualitative research. En J. M. Morse (Ed.), Completing a qualitative project. Details and dialogue (pp. 163-189). California: Sage.
Muoz Justicia, J. (2001). Anlisis cualitativo de datos textuales con ATLAS/ti. Disponible en: [http://antalya.uab.es/jmunoz/Cuali/ManualAtlas.pdf].
Murh, T. (1997). Atlas.ti- Visual Qualitative data analysis-Management-Model Building-Release 4.1.
Berln, Short Users Manual.
Navarro, P. y Daz, C. (1994). El anlisis de contenido. En Delgado, J. M. y Gutirrez, J. (1994). Mtodos y tcnicas cualitativas de investigacin en Ciencias Sociales. Madrid: Sntesis.
Noblit, G.W.y Hare, R.D. (1988). Metaethnography: Synthesizing qualitative studies. Newbury Park,
CA: Sage.
Noldus, L.P. (1991). The Observer: A software for collection and analysis of observational data. Behavior Research Methods, Instruments &Computers, 23 (3), 415-429.
Pardo, A. y San Martn, P. (1994). Anlisis de datos en psicologa II. Madrid: Pirmide.
Patton, M. Q. (1990). Qualitative evaluation and research methods (2nd. Ed.). Newbury Park, CA:
Sage.
Prez Serrano, G. (1994). Investigacin cualitativa: retos e interrogantes II: Tcnicas y anlisis de datos.
Madrid: La Muralla.
Peshkin, A. (1993). The goodness of qualitative research. Educational Research, 22 (2), 23-30.
Piuel Raigada, J. L. (2003). Epistemologa, metodologa y tcnicas del anlisis de contenido, Estudios
de Sociolingstica, 4 (2).
Pitman, M.A. y Maxwell, J.A. (1992). Qualitative Approaches to Evaluation: Models and Methods. En
M. D. LeCompte, W. L. Millroy y J. Preissle (Eds.). The Handbook of Qualitative Research in Education, (pp. 727-770). Londres: Academic Press.
Plume, K. (1983). Documents of life: An introduction to the literature of humanistic method. London:
Allen and Unwin.
Psathas, G. (1994). Conversation Analysis. Thousand Oaks, CA: Sage.
Qsr (1994). NUDIST Version 3.0 User Guide. Victoria. Qualitative Solutions Research.
Renom, J. (Coord) (1997). Tratamiento informatizado de datos. Bacelona: Masson.
Revuelta Domnguez, F. I. y Snchez Gmez, M. C. (2003). Programas de anlisis cualitativo para la
investigacin en espacios virtuales de formacin. Teora de la Educacin: Educacin y Cultura
en la Sociedad de la informacin,4. Documento on-line [http://www3.usal.es/~teoriaeducacion/
rev_numero_04/n4_art_revuelta_sanchez.htm].
Richard, T. J. y Richard, L. (1994). Using computers in qualitative research, en Denzin, N. K. y Lincoln,
Y. S. (Eds.) Handbook of qualitative research, Sage, Thousand Oaks, California.
Richards, L. (1999): Using Nvivo in Qualitative Research. London: Sage.
Richards, L. (2002): Introducing N6 a workshop handbook. London: Sage.
Roberts, N. K. y otros (1993). VTLOGANL: A methodology for the qualitative analysis of video tape
data. Comunicacin presentada en la reunin anual de la MidWestern Educational Research Association, Chicago.
175
Rodrguez Gmez, G., Gil Flores, J., y Garca Jimnez, E. (1996). El papel de la informtica en el anlisis de datos (pp. 237-257), Cap. 13 del libro Metodologa de la investigacin cualitativa. Granada:
Aljibe.
Rodrguez Gmez, G., Gil Flores, J., y Garca Jimnez, E. (1996). Aspectos bsicos sobre el anlisis
de datos cualitativos (pp. 197-218), Cap. 11 del libro Metodologa de la investigacin cualitativa.
Granada: Aljibe.
Rodrguez, G., Gil, J. y Garca, E. (1996). Metodologa de la investigacin cualitativa. Mlaga: Aljibe.
Rodrguez, G. (2000). Avances en las tcnicas cualitativas de investigacin socioeducativa. En XII
Congreso Nacional y I Iberoamericano de Pedagoga. Madrid. Sociedad Espaola de Pedagoga.
Tomo I, 87-133.
Rodrguez, G., Corrales, A., Gil, J. y Garca, E. (1994). Nudist: una herramienta informtica para el
anlisis de datos cualitativos. En Revista de Investigacin Educativa (pp.522-528).
Rodrguez, G., Gil, J. y Garca, E. (1995). Anlisis de Datos cualitativos asistido por ordenador: Aquad
y Nudist. Barcelona. PPU
Ruiz Olabunaga, J. I. (1999). Metodologa de la investigacin cualitativa. Bilbao: Universidad de
Deusto.
Salvador Mata, F., Rodrguez Diguez, J. L. y Bolvar Bota, A. (Dirs.) (2004). Diccionario enciclopdico
de Didctica. Vols. I y II. Mlaga: Aljibe.
Snchez Gmez, M.C. (2004). Investigacin cualitativa. En Salvador Mata, F., Rodrguez Diguez, J. L.
y Bolvar Bota, A. (Dirs.). Diccionario enciclopdico de Didctica. Vol.II. Mlaga: Aljibe.
Snchez Gmez, M. C., Revuelta Domnguez, F. I. y Lpez Gmez, D. (2003): Estudio cualitativo de
los valores como mediadores educativos en la integracin del enfermo mental, Revista Estudios,
50. Diputacin de Salamanca.
Sandelowski, M. (1998). Writing a good read: Strategies for re-presenting qualitative data. Research in
Nursing and Health, 21, 375-382.
Sibert, E., y Shelly, A. (1995). Using logic programming for hypothesis generation and refinement. En
Kelle, V. (Ed.). Computer-aided qualitative data analysis: Theory, methods and practice. London:
Sage.
Serrano Gibert, T. (1992). Una metodologa cualitativa para el estudio del desarrollo conceptual en el
aprendizaje de las ciencias. Anlisis con redes sistmicas. Revista de Investigacin Educativa, 20,
37-69.
Thomas, J. (1993). Doing critical etnography. Newbury Park, CA: Sage.
Tesch, R. (1987). Comparing the most widely used methods qualitative analysis. What do they have in
common? American Educational Research Association. Annual Convention.
Tesch, R. (1990). Qualitative Research: Analysis Types and Software Tools. London: The Falmer Press.
Tesch, R. (1991). Software for qualitative researchers: Analysis Needs and Program Capabilities. En
Fielding, N., y Lee, R. Using computers in Qualitative Research. London: Sage
Valls, M. S. (1997). De las herramientas artesanales a las informticas (pp. 391-401), del libro Tcnicas cualitativas de investigacin social. Reflexin metodolgica y prctica profesional. Madrid:
Sntesis.
VV. AA. (1998): Chapter 2: Overview. Qualis Research Associates. Disponible en: [ftp://ftp.qualisresearch.com/pub/overview.exe].
VV. AA. (1998): Chapter 4: Quick Tour. Qualis Research Associates. Disponible en: [ftp://ftp.qualisresearch.com/pub/tour.exe].
176
VV. AA. (2001). MAXqda 2001: Introduccin. Berln. Disponible en: [http://www.maxqda.com/
maxqda-spa/download/mxintro.pdf].
Weaver, A. y Atkinson, P. (1996). From coding to hypertext. En R. G. Burguess (Ed.). Using computers in
qualitative research. Greenwich, CT: JA.
Weitzman, E. y Miles, M. (1995). Computers programs for qualitative data analysis. Thousand Oaks,
CA: Sage.
Wolcott, H. (1990). Transforming qualitative data: Description, Analysis and Interpretation. Thousand
Oaks, CA: Sage Publications.
178
gunos de ellos de obligado cumplimiento (en Espaa, el Cdigo Deontolgico del Colegio
Oficial de Psiclogos (1987), pendiente en estos momentos de la aprobacin del nuevo texto
Cdigo Deontolgico de la profesin de Psicologa- elaborado durante los ltimos aos).
Tenemos, en consecuencia, documentos consensuados sobre los principios ticos que deben
regir la accin profesional, y, en mucha menor medida, la actividad investigadora.
En este momento asistimos a una creciente preocupacin por la dimensin tica de la
prctica profesional del investigador y del profesional en general (Brown & Newman, 1992;
Bustelo Ruesta, 1998), y especficamente en el mbito de la discapacidad. Simultneamente, cada vez somos ms conscientes de los lmites existentes para hacer frente a conflictos
y situaciones de alta complejidad con que nos encontramos: las carencias, precariedad y
padecimientos de los individuos y de los colectivos estn desencadenados, con frecuencia,
por circunstancias persistentes, cuya modificacin no siempre se halla bajo nuestras posibilidades de actuacin; en los equipos multidisciplinares a los que acuden usuarios necesitados
de apoyo existen frecuentemente mltiples tensiones larvadas o manifiestas entre los profesionales; en innumerables ocasiones se debe decidir sin tener certeza objetiva del mejor
camino (Leal Rubio, 1997); no siempre se cuenta con una capacidad participativa suficiente
por interferencias polticas o de estructuracin administrativa; etc.
Y adems un condicionante de gran relevancia es la polaridad que se establece entre
la necesidad y legitimidad de la participacin en la investigacin, en un extremo, y un potencial usuario que exige un respeto a su autonoma individual y colectiva (Snchez Vidal,
1999), teniendo en cuenta el especial plus de la vulnerabilidad (Arboleda-Florez, 2003) en
el mbito de la discapacidad (Bermant & Warwick, 1978). As, por ejemplo, si un centro
especfico promueve un programa de mejora de calidad de vida para personas con discapacidad fsica que han sufrido una amputacin, aunque las propias personas con discapacidad
o sus familiares solicitan plaza para este programa porque suponen que ser positivo para
la vida de la persona con discapacidad ser recomendable que se mejore la informacin
sobre dicho programa, que se permita participar a las personas con discapacidad en cuanto
a la toma de decisiones, que se realicen ensayos de hbitos de actuacin transferibles, y que
se realicen controles externos por parte de personal sanitario especialmente capacitado para
esta funcin.
Todo ello nos lleva a la inapelable necesidad de adquirir una formacin integral en investigacin sobre discapacidad desde presupuestos ticos. Trabajar con las necesidades de
las personas y los colectivos es sumamente difcil, as como tambin lo es saber incorporar
en cada caso la especificidad y perfil diferencial que se adecua al caso y desde un posicionamiento tico. El investigador debe seguir creciendo en una capacidad y madurez reflexiva
que sea capaz de conjugar la puesta en prctica de los planteamientos ticos, con la rigurosidad conceptual y metodolgica, y el realismo de la praxis cotidiana.
CRITERIOS TICOS EN LA INVESTIGACIN SOBRE DISCAPACIDAD
Los diferentes cdigos ticos nacionales en el mbito de la Psicologa concuerdan
en diversos aspectos, y la American Psychological Association ha desempeado un papel
fundamental en este sentido, contribuyendo a que se estructuren ms sistemticamente los
principios bsicos. El Joint Committee on Standards for Educational Evaluation (1981) ofrece
guas para los evaluadores (Brown & Newman, 1992) desde el convencimiento de que los
cdigos ticos son importantes pero insuficientes para orientar a los profesionales e investigadores que aspiran a una prctica tica, remite a los cinco principios defendidos por Kitchener
(1984). Los cinco principios generales son los siguientes: autonoma, evitacin del dao,
179
actuacin positiva (beneficiencia), justicia y fidelidad, los cuales influyeron en buena medida
en el cdigo elaborado por la American Psychological Association (1982), en donde se establecieron los principios de competencia, integridad, responsabilidad profesional y cientfica,
respeto por los derechos y dignidad de las personas, procura del bienestar de las personas, y
responsabilidad social.
Ahora bien, existen aspectos ticos que son comunes a diversos contextos y mbitos
de investigacin, motivo por el cual no habr que contemplar cuestiones diferenciales entre
ellos. Se podra ilustrar, en el mbito especfico de la evaluacin de programas (Newman &
Brown, 1996; Muiz, 1997), como los principios ticos y deontolgicos que deben regirla se
articulan en torno a la utilidad de la evaluacin, las posibilidades de llevarla a cabo, la adecuacin y la precisin.
Una especificacin de las cuestiones ticas segn contextos de intervencin se puede
plantear a partir del Cdigo tico de la American Psychological Association (1992), que ha
sido la asociacin de psicologa ms activa en su inters por editar cdigos ticos y velar por
su cumplimiento, y cuyos seis principios se hallan tambin recogidos en el cdigo espaol
elaborado por el Colegio Oficial de Psiclogos. A partir de los principios generales, se ha establecido la siguiente especificacin (Anguera, Chacn y Sanduvete, 2008):
A) Grado elevado de preparacin y competencia profesional. La actualizacin constante de conocimientos debe constituir un compromiso para el profesional, que debe estar
permanentemente cualificado para cumplir su funcin.
Uno de los aspectos que ms repercusiones tienen en los distintos mbitos es la adecuada instrumentacin necesaria. Diferentes estudios realizados en Espaa y en el contexto
europeo muestran ciertas deficiencias relativas a esta necesaria competencia profesional del
investigador. Como afirma Muiz (1997), la potencialidad de los tests para causar dao proviene ms del uso inadecuado por parte de personas sin preparacin o principios, que de sus
propiedades tcnicas.
En los mbitos clnico, educativo, deportivo, social, etc., se requiere una gama de diversos instrumentos, desde los de carcter estndar hasta los registros de conducta, o hasta el
uso de medidas de erosin (Fang & Ellwein, 1990), y de todos ellos puede derivarse un uso
inapropiado (Fremer, 1996). La forma de atacarlo, aunque con intensidad variable, consiste
en combinar la formacin de los usuarios con la restriccin de acceso a los tests de personas
no cualificadas.
Una cuestin sumamente espinosa que se plantea con determinada frecuencia en el
mbito de evaluacin de programas es su ineficacia, o la baja eficacia, o especialmente la
presencia de una efectividad negativa (efectos nocivos que tienen como causa la implementacin de un determinado programa). Nos podemos preguntar hasta qu punto es el profesional que implementa un programa el responsable de los resultados inesperados o de los efectos nocivos imprevistos. Se plantea un reto tico fundamental y controvertido, y para cuyo
anlisis carecemos de criterios claros (Snchez Vidal, 1999). Parece estar aceptado que la
responsabilidad profesional (Asociacin de Biotica y Derecho (ABD), 1998) del especialista
que implementa un programa no le afecta en el sentido de hacerle responsable de aquello
que no puede prever o controlar; pero tampoco puede ser responsable de las consecuencias
de su actuacin. El uso del mejor conocimiento disponible en el momento de decidir o de
actuar puede no ser suficiente, y se podra aadir el criterio de que dispusiera de medios
complementarios (informacin, asesoramiento especializado, etc.), pero ello no resuelve el
problema tico planteado. Parece lgico que si el profesional acta de acuerdo a los mejores
principios cientficos y tcnicos existentes, la responsabilidad ha de recaer sobre el colectivo
180
181
Los valores clave que deben preservarse son: a) salvaguarda de los participantes; b)
produccin de avances cientficos sustantivos; y c) evitar perturbaciones innecesarias a los
participantes (Allen, 1996). A stos se les debe informar acerca de los lmites de las nuevas
tecnologas de la informacin, ya que podra derivarse una creencia errnea de que Internet,
o una videoconferencia, es confidencial y privado (Maheu, Callan & Nagy, in press). En este
sentido, Shapiro & Schulman (1996) han discutido tales aspectos desde un punto de vista tico y legal, y King (1996a, 1996b) ha analizado los aspectos ticos que derivan de la recogida
de informacin a travs de Internet, a la vez que ha propuesto unas guas en este sentido.
C) Utilizacin de todos los medios a su alcance para asumir la responsabilidad que le
corresponde en el desempeo de su actividad. Estos medios pueden ser muy diversos, y referirse tanto a cuestiones materiales o tecnolgicas, como institucionales, o colaborar con otros
profesionales a los que competen aspectos relacionados.
D) Respeto de los derechos y dignidad de las personas con discapacidad en todas sus dimensiones, sin que sufran menoscabo en funcin de su raza, sexo, religin, gnero, nacionalidad, orientacin sexual, idioma, nivel socioeconmico, etc. Las diferencias entre personas y
entre grupos sociales plantean abundantes problemas ticos, que requieren un adecuado tratamiento de la diferencia (Buxarrais, Carrillo, Galcern, Lpez, Martn, Martnez, Pay, Puig,
Trilla i Vilar, 1990), y que adems no siempre plantean un claro compromiso con los valores
democrticos.
E) Responsabilidad social, en sentido amplio, que trasciende ms all de los usuarios
especficos de un determinado programa.
A caballo entre los aspectos tratados por los puntos D) y E), resulta especialmente complejo y delicado tanto el tema de la diferenciacin entre individuos como el de la responsabilidad social, por sus connotaciones sociales y metodolgicas. Dennis (1994), por ejemplo,
aunque con cautela y restricciones, aboga a favor de los experimentos de campo aleatorizados, lo cual, a nuestro juicio, no es posible plantear en numerosas ocasiones. Considera que
se requerira una intensa monitorizacin, pero nos deberamos preguntar por la propia aleatorizacin (hasta qu punto se vulnera el derecho a la accesibilidad al programa?). Si se
plantea un diseo de grupo control, adems de los problemas derivados de la habitualmente
dudosa homogeneidad de los sujetos, se puede admitir ticamente la adscripcin a los grupos experimental y control? Jonas (1997) considera que s sera justificable experimentar con
seres humanos por el bien pblico, pero, a la vez, tambin sostiene que este bien reside tanto
en el derecho de la sociedad a pedirlo como en el sacrificio del individuo en favor del bien
pblico, de modo que el bien de la sociedad descansara sobre la primaca del individuo,
pues es l quien se ha de sacrificar y dar su consentimiento para hacer realidad el derecho
revindicado por la sociedad; de aqu que hay que tener conciencia del peligro que pueden
suponer los ensayos clnicos con seres humanos, y se plantea qu sucede con el consentimiento y con la voluntad autnoma e informada de la persona sujeta a ensayos clnicos. Se
trata de un difcil equilibrio, ya clsicamente puesto en evidencia por Suls & Rosnow (1981).
Por otra parte, Passamani (1991) sugiere que se debera determinar el momento en que
se pierde el punto de equilibrio, cuando el tratamiento ya no resulta eficaz, para detenerlo,
pero esta propuesta pone en evidencia la contradiccin existente en determinados momentos entre la ortodoxa aplicacin de la metodologa dada la perfecta sistematizacin que
plantean los diseos experimentales y la correcta resolucin de las cuestiones ticas. Otras
contradicciones entre la aplicacin de la metodologa y el surgimiento de problemas ticos
se pueden hallar en Anguera (2000).
182
183
dnde el qu, el cmo y el cundo son registrables. En el amplio abanico institucional que
se abre, la incidencia de la tica se manifiesta especialmente en los elementos humanos que
constituyen una dada particular: el investigador y la institucin que lo patrocina. Vamos a
referirnos a ambos, y nos centraremos en el mbito especfico de la evaluacin de programas
de intervencin.
Desde el punto de vista del investigador, algo se ha escrito sobre su deontologa profesional, que acota y regula su prctica profesional. As, en evaluacin de programas, en las
Guas para el proceso de evaluacin (Fernndez-Ballesteros, 1997) figura la tica como garanta en la evaluacin psicolgica. Por otra, resulta bsica la orientacin al evaluador acerca de los conflictos que se van a producir en cualquier situacin evaluativa. Los mltiples
cdigos existentes se manifiestan de forma genrica al abordar las cuestiones ticas, y esta
generalidad, en cierto modo inevitable e incluso deseable para evitar la rigidez, es una de las
mayores debilidades desde una perspectiva de tica institucional. Una de las consecuencias
de dicha generalidad es que todos los evaluadores se puedan ver reflejados desde un punto
de vista positivo, de forma polticamente correcta (Bustelo Ruesta, 1998).
Lo polticamente correcto en la actualidad en el mbito evaluativo consiste en ser
flexible con las diferentes aproximaciones y modelos, teniendo en cuenta la voz de los grupos minoritarios, y aceptando las diferentes perspectivas, aunque stas sean diametralmente
opuestas entre s. Pero hay que ser muy cauto y no dejarse seducir por esta fcil posicin
flexible en donde todo cabe. El evaluador deber utilizar sus referentes tericos y su formacin metodolgica y sustantiva para actuar profesionalmente y elaborar el correspondiente
informe de evaluacin.
En los diferentes mbitos de investigacin, y, por seguir la ilustracin, tambin en evaluacin de programas, confluyen posiciones epistemolgicas plurales, metodologas ms o
menos interventivas, diferentes polaridades referidas a los usuarios, al programa o a la temporalidad de la implementacin, en un intento mximo de integracin. A nuestro juicio, sta ha
sido la causa principal de que los propios cdigos hayan quedado un tanto insustanciales o
desabridos, dejando las orientaciones demasiado vagas o abiertas (Bustelo Ruesta, 1998).
En este sentido, Chelimsky (1995) y Rossi (1995) concuerdan en que muchos de los
principios incluidos en los cdigos no se preocupan de forma especial por la integridad de
los resultados, ni en hacer al evaluador lo suficientemente firme y audaz en su posicin a la
hora de presentar su informe valorativo, avalados por el proceso evaluativo llevado a cabo.
Rossi (1995, p. 58), valientemente, llega a afirmar que la evaluacin no es una negociacin
para conseguir aprobacin, sino la bsqueda de la mejor aproximacin a la verdad. Desde
un punto de vista comparado con los de otras disciplinas se muestra pesimista, considerando
que prima la debilidad y falta de firmeza: (...) los cdigos potentes y detallados existen en
los campos profesionales en los que se ha alcanzado consenso sobre la sustancia y el mtodo, mientras que los cdigos dbiles afloran en las asociaciones en las que los miembros
estn divididos en dichas materias (Rossi, 1995, p. 55).
En efecto, el investigador, y en nuestra ilustracin especfica, el evaluador de un programa debe manifestarse de forma firme y objetiva con el respaldo de una metodologa rigurosa seguida durante el proceso respecto a los diferentes aspectos que comporta el proceso
evaluativo, y defenderlo de forma argumentada, en la medida en que sea preciso, ante la
institucin y ante el usuario, as como ante los dems profesionales que participan en la elaboracin, implementacin, monitorizacin o gestin de un programa.
En este sentido, existe abierta una polmica que conviene tener presente acerca del
investigador. Mientras que, por una parte, se le considera especialista especfico en el m-
184
bito de la metodologa y diseo, por otra, podra serlo en el tema sustantivo. Se trata de una
polmica no cerrada, y que se orienta de una u otra forma segn el pas desde el cual se
contempla. As, en Espaa, en donde la consolidacin institucional del investigador en Psicologa todava es baja, se contratan habitualmente a especialistas en el mbito sustantivo
del estudio en nuestro caso la discapacidad, sin que lo sean en cuestiones metodolgicas,
lo cual conlleva una manifiesta debilidad en planteamiento del procedimiento, elaboracin
de indicadores, instrumentacin, diseo, recogida y anlisis de datos, proceso de generalizacin y elaboracin del informe. Por el contrario, en pases como Canad o Estados Unidos, con una profunda consolidacin institucional de la investigacin, existen profesionales
especialistas que, posteriormente, se pueden adems especializar en el respectivo mbito
sustantivo de la discapacidad; un claro ejemplo fue el profesor G.P. Sackett (Seattle University).
El segundo elemento de la dada antes mencionada es la institucin en la cual opera el
investigador. Esta institucin se configura como uno de los niveles del contexto el ms elaborado y sofisticado-, y, como afirma Chelimsky (1995), este contexto puede llegar a generar
una serie de condicionantes al investigador, sean facilitantes o dificultadores. Sin embargo,
son numerosas las ocasiones en que el contexto hace que los investigadores deban ser especialmente valientes para realizar sus estudios tal y como creen que deben efectuarse (Sieber,
1980).
La institucin, como contexto inmediato, gua y orienta la accin del investigador que
promueve y crea nuevo conocimiento en un mbito especfico, a la vez que la limita y la
coarta. Puede llegar a ser muy complicada la relacin entre la institucin y el investigador/
evaluador si ambos son ideolgicamente divergentes, y la continua o recurrente discrepancia,
enfrentamiento e insatisfaccin corren el riesgo de llegar a minar actuaciones inicialmente
ticas por la anomia de rol creada y el potencial de apata y conflicto que se ir acumulando
entre los miembros de un equipo de trabajo.
En la inmensa mayora de casos, los programas de investigacin obedecen a polticas diversas, pertenecientes a la Administracin central, a las autonmicas, o a las locales, aunque
no podemos olvidar los promovidos desde las Administraciones institucionales, o los impulsados por asociaciones diversas de carcter no lucrativo. Genricamente nos referiremos a la
institucin que promueve el estudio.
Los programas de investigacin penden de polticas determinadas, y stas han de ser
sensibles a la realidad de cada momento. Si nos referimos a programas sanitarios, los nuevos
avances tecnolgicos, el avance de los conocimientos en programas preventivos, la obtencin de nuevos frmacos, la informacin de que se dispone a nivel epidemiolgico, etc.,
influir de forma decisiva en la orientacin de las actuales polticas sobre personas con discapacidad. Si nos referimos a programas sociales, la realidad actual en nuestro pas es distinta
de la de algunas dcadas anteriores: las personas con discapacidad reciben mucha mayor
atencin; la homogeneidad de la clase trabajadora tradicional se ha visto resquebrajada por
la introduccin de nuevas tecnologas, por la necesidad de calificaciones crecientes y distintas para desempear puestos de trabajo, por la obsolescencia y casi desaparicin de algunos
sectores de actividad y ocupaciones tradicionales; hay que tener en cuenta la aparicin de
nuevos grupos, como los desempleados de distinta duracin y edad, los jvenes en busca del
primer empleo o las mujeres que desean incorporarse al mercado de trabajo.
Pero es igualmente cierto que esta modernizacin tiene un reverso pesimista en aquellos
casos en los que los ciudadanos no pueden organizar adecuadamente la defensa de sus intereses (Prez Yruela, 1997). Y as existe poblacin con discapacidad marginada por causa de
185
186
187
El resultado es que el investigador, igual que profesional (Corey, Corey & Callanan, 1993), se
pregunta qu debe hacer en ese caso, o, dicho de otro modo, qu principio se debe aplicar,
teniendo en cuenta que ambas posibilidades son igualmente relevantes.
Son muchos los interrogantes que nos podemos plantear en investigacin sobre discapacidad que suponen una controversia tica: Hay excepciones en disponer del consentimiento
informado de los participantes? Hasta qu punto prima el hecho de usar una metodologa
cientfica sobre una menos sistemtica con la finalidad de adaptarse mejor a la situacin
real? Actuando de la primera forma se ganara en credibilidad, pero se podra perder en humanismo Habra algn grado de incomodidad o estrs que podra aceptarse a consecuencia de una intervencin? Dnde estn los lmites de la responsabilidad de quin elabora o
implementa un programa? Hasta qu punto se podran utilizar nuevos avances mdicos o
tecnolgicos que no estn totalmente comprobados? Cmo se distribuiran los recursos en
funcin de la temporalidad del proceso (Snchez-Algarra & Anguera, 2005)? Qu tipo de
difusin se puede hacer de los resultados de un estudio? ... Como se indica en APA (1982),
todava muchos psiclogos creen que para obtener datos vlidos y generalizables es esencial
que los sujetos no estn informados, o consideran que el engao es necesario en muchas
condiciones experimentales, o no estn sensibilizados con la invasin de la privacidad.
Indudablemente se plantean conflictos entre la praxis de la evaluacin de programas y
determinados requisitos metodolgicos. La evaluacin de programas se desarrolla a lo largo de un proceso en el cual se plantean puntos de colisin que hasta pueden considerarse
habituales entre los requisitos metodolgicos y la deformacin que se tiende a producir en
estudios aplicados (Anguera, 2000; Anguera, Chacn y Sanduvete, 2008). Destacamos los
siguientes: a) Deteccin y priorizacin de necesidades, b) evaluacin de resultados vs. de
proceso, c) seleccin de participantes; d) uso de instrumentos; y e) Elaboracin de estndares
de calidad.
Despus de un anlisis sistemtico de la situacin que tenga en cuenta no slo los principios en juego, sino otros ms amplios, la controversia puede diluirse, pero esto no elimina
la primera vivencia, presentada como disyuntiva difcil y ante la cual el profesional se siente
desorientado.
La gama de controversias ticas es muy amplia (Pryzwansky & Wendt, 1999). Entre los
muchos estudios que se han llevado a cabo sobre conflictos ticos, Morris & Cohn (1993)
confeccionaron, a partir de una encuesta realizada a miembros de la American Evaluation
Association, un amplio catlogo acerca de retos o controversias, y en la mayora de casos se
presentan curiosamente en la elaboracin del informe final. Pero pueden surgir controversias
ticas en cualquier momento del proceso, o en un momento precedente, como en la evaluacin de necesidades, o en un momento posterior, cuando se trata de dilucidar la autora de
una determinada contribucin, en donde los problemas ticos que se llegan a plantear son
de considerable envergadura (Fine & Kurdek, 1993).
REFERENCIAS BIBLIOGRFICAS
Allen, C. (1996). Whats wrong with the Golden Rule? Conundrums of conducting ethical research in
cyberspace. Information Society, 12, 175-187.
Allen, D.F. & Allen, V.S. (1979). Ethical issues in mental retardation. Nashville, Tenn: Parthenon.
Altarejos, F., Ibez-Martn, J.A., Jordn, J.A. y Jover, G. (1998). tica docente. Barcelona: Ariel.
188
American Psychological Association (APA), Ethics Committee (1997, November). Services by telephone, teleconferencing, and Internet. Washington, DC: Author. [Consulta hecha el 7/3/2000 en
http://www.apa.org/ethics/stmnt.01html].
American Psychological Association (1982). Ethical principles in the conduct of research with human
participants. Washington: APA.
Anguera, M.T. (2000). Diseos de evaluacin de programas: Un reto para la Administracin y las instituciones? En A. Blanco, D. Rojas, L. de la Corte, J.D. Delius, J.J. Miguel Tobal, R. Fernndez-Ballesteros, M.T. Anguera y M.J. Daz-Aguado, Psicologa y Sociedad (pp. 127-158). Valencia: Real
Sociedad Econmica de Amigos del Pas.
Anguera, M.T. (2002). Marco competencial en Servicios Sociales de Atencin a la Tercera Edad en Catalua. En J. Tornos Ms (Coord.), Los servicios sociales de atencin a la tercera edad. El caso de
Catalua (pp. 551-587). Valencia: Tirant lo Blanch.
Anguera, M.T., Chacn, S. y Sanduvete, S. (2008, en prensa). Cuestiones ticas en evaluacin de programas. En M.T. Anguera, S. Chacn y A. Blanco (Coords.), Evaluacin de programas sociales y
sanitarios. Un abordaje metodolgico. Madrid: Sntesis.
Aragons i Vies, T. (1997, Octubre). s i abs de la informaci (Mesa Redonda). Actes de la 1 Jornada sobre Serveis Socials dAtenci Primria Dilemes tics en la nostra prctica: Entre el control
i la inserci (pp. 51-53). Barcelona: Col.legi Oficial de Psiclegs de Catalunya, Col.legi Oficial de
Diplomats en Treball Social i Assistents Socials de Catalunya, i Col.legi dEducadors i Educadors
Socials de Catalunya.
Arboleda-Florez, J. (2003). La investigacin en sujetos humanos: Poblaciones vulnerables. En F. Lolas
y A. Quezada (Eds.), Pautas ticas de investigacin en sujetos humanos: Nuevas perspectivas (pp.
129-142). Santiago de Chile: Programa Regional de Biotica OPS (Organizacin Panamericana
de la Salud) / OMS (Organizacin Mundial de la Salud). [Consulta hecha el 2/5/2008 en http://
www.bioetica.ops-oms.org/E/docs/pautas.pdf#page=83].
Asociacin de Biotica y Derecho (ABD) de la Universidad de Barcelona (2000). Resumen de la sesin
de 25/11/1998. [Consulta hecha el 23/1/2000 en http://www.ub.es/fildt/abdcas6e.htm].
Beauchamp, T.L. & Childress, J.F. (1999). Principles of biomedical ethics. New York: Oxford University
Press.
Bermant, G. & Warwick, D.P. (1978). The ethics of social intervention: Power, freedom and accountabillity. In G. Bermant, H.C. Kelman & D.P. Warwick (Comps.), The ethics of social intervention
(pp. 379-417). New York: Halstead Press.
Brown, R.D. & Newman, D.L. (1992). Ethical principles and evaluation standards. Do they match?
Evaluation Review, 16 (6), 650-663.
Brugu, Q. y Gom, R. (1998). La dimensin local del bienestar social: El marco conceptual. En Q.
Brugu y R. Gom (Coords.), Gobiernos locales y polticas pblicas. Bienestar social, promocin
econmica y territorio (pp. 39-56). Barcelona: Ariel.
Buckman, R. (1997). Com donar les males notcies. Una gua per a professionals de la salut. Vic, Barcelona: Eumo.
Bustelo Ruesta, M. (1998). Deontologa de la evaluacin: El modelo de los cdigos ticos anglosajones. Gestin y Anlisis de Polticas Pblicas, 11-12, 141-156.
Buxarrais, M.R., Carrillo, I., Galcern, M. del M., Lpez, S., Martn, M.J., Martnez, M., Pay, M., Puig,
J.M., Trilla, J. i Vilar, J. (1990). tica i escola: El tractament pedaggic de la diferncia. Barcelona:
Edicions 62.
Callahan, J. (Ed.) (1988). Ethical issues in professional life. Oxford: Oxford University Press.
Casado, M. (Ed.) (1998). Biotica, Derecho y Sociedad. Madrid: Trotta.
189
190
Joint Committee on Standards for Educational Evaluation (1981). Standards for evaluations of educational programs, projects, and materials. New York: McGraw-Hill.
Jonas, H. (1997). Tcnica, medicina y tica. La prctica del principio de responsabilidad. Barcelona:
Paids.
Kane, M.T. (1992). The assessment of professional competence. Evaluation & The Health Professions,
15 (2), 163-182.
King, S.A. (1996a). Commentary on responses to the proposed guidelines. Information Society, 12,
199-201.
King, S.A. (1996b). Researching Internet communities: Pproposed ethical guidelines for the reporting of
results. Information Society, 12, 119-127.
Kitchener, K.S. (1984). Intuition, critical thinking, and ethical principles: The foundation of ethical decisions in counseling psychology. The Counseling Psychologist, 12, 43-55.
Leal Rubio, J. (1997, Octubre). Dilemes tics en la intervenci social (Mesa Redonda). Actes de la
1 Jornada sobre Serveis Socials dAtenci Primria Dilemes tics en la nostra prctica: Entre el
control i la inserci (pp. 32-41). Barcelona: Col.legi Oficial de Psiclegs de Catalunya, Col.legi
Oficial de Diplomats en Treball Social i Assistents Socials de Catalunya, i Col.legi dEducadors i
Educadors Socials de Catalunya.
Metges on line (2000). La informaci clnica facilitada al pacient. [Consulta hecha el 23/1/2000 en
http://www.comb.es/publicacions/quaderns/cat/bp8.htm].
Morris, M. & Cohn, R. (1993). Program evaluators and ethical challenges. A National Survey. Evaluation Review, 17 (6), 621-642.
Muiz, J. (1997). Aspectos ticos y deontolgicos de la evaluacin psicolgica. En A. Cordero (Coord.), La evaluacin psicolgica en el ao 2000 (pp. 307-345). Madrid: TEA Ediciones.
Newman, D.L. & Brown, R.D. (1996). Applied ethics for program evaluation. Thousand Oaks, CA.:
Sage.
Nickelson, D.W. (1998). Telehealth and the evolving health care system: Strategic opportunities for
professional psychology. Professional Psychology: Research and Practice, 29, 527-535.
Olwenly, C. (1994). The ethics and conduct of cross-cultural research in developing countries. PsychoOncology, 3, 11-20.
Passamani, E. (1991). Clinical trials Are they ethical? New England Journal of Medicine, 324 (22),
1589-1592.
Prez Yruela, M. (1997). Corporativismo y Estado del bienestar. En S. Giner y S. Sarasa (Eds.), Buen
gobierno y poltica social (pp. 133-150). Barcelona: Ariel.
Pryzwansky, W.B. & Wendt, R.N. (1999). Professional and ethical issues in Psychology. Foundations of
practice. New York: Norton & Company.
Reynolds, P.D. (1979). Ethical dilemmas and social science research. San Francisco: Jossey-Bass.
Rodrguez-Arana, J. (1996). tica institucional. Madrid: Dykinson.
Roldn, B. y Perea Prez, B. (1996). El consentimiento informado en la prctica mdica. Madrid: Smihkline Beecham.
Rossi, P.H. (1995). Doing it good and getting it right. In W.H. Shadish, D.L. Newman, M.A. Scheirer &
C. Wye (Eds.), Guiding Principles for Evaluators (pp. 55-60). San Francisco: Jossey-Bass.
Snchez-Algarra, P. & Anguera, M.T. (2005). Time management in the cost evaluation of limited resource programs. Quality & Quantity. International Journal of Methodology, 39 (4), 391-411.
191
Snchez Valverde, C. (1997, Octubre). Dilemes tics en la intervenci social (Mesa Redonda). Actes
de la 1 Jornada sobre Serveis Socials dAtenci Primria Dilemes tics en la nostra prctica: Entre
el control i la inserci (pp. 41-50). Barcelona: Col.legi Oficial de Psiclegs de Catalunya, Col.legi
Oficial de Diplomats en Treball Social i Assistents Socials de Catalunya, i Col.legi dEducadors i
Educadors Socials de Catalunya.
Snchez Vidal, A. (1999). tica de la intervencin social. Barcelona: Paids.
Schuler, H. (1982). Ethical problems of psychological research. New York: Academic Press.
Sieber, J.E. (1980). Being ethical: Professional and personal decisions in program evaluation. In R. Perloff & E. Perloff (Eds.) Values, ethics, and standards (pp. 51-63). San Francisco: Jossey-Bass.
Shapiro, D.E. & Schulman, C.E. (1996). Ethical and legal issues in e-mail therapy. Ethics & Behaviour,
6, 107-125.
Suls, J.M. & Rosnow, R.L. (1981). The delicate balance between ethics and artifacts in behavioral research. In A.J. Kimmel (Ed.), Ethics of human subject research (pp. 55-65). San Francisco: JosseyBass.
Susanne, Ch. (Ed.) (1998). Reading book in bioethics: A multidisciplinar approach. Florencia-Bruxelles:
European Association of Global Bioethics.
Thompson, A. (1990). Guide to ethical practice in psychotherapy. New York: Wiley.
Wadeley, A. y Blasco, T. (1995). La tica en la investigacin y la prctica psicolgicas. Barcelona:
Ariel.
ANEXO
PROGRAMAS DE LOS SEMINARIOS DE ACTUALIZACIN
EN INVESTIGACIN SOBRE DISCAPACIDAD (SAID)
194
anexo
anexo
195
Medicin con escalas Tipo Likert. Gerardo Prieto Adnez (Universidad de Salamanca).
Tcnica Delphi: el consenso entre expertos. Jos Ignacio Ruiz Olabunaga (Universidad de Deusto).
Tcnicas de anlisis cuantitativo aplicadas en investigaciones cualitativas: anlisis
cluster/conglomerados. Jos Serrano Angulo (Universidad de Mlaga).
Evaluacin de Programas: prctica en mbitos educativos. M Jos Rodrguez Conde
(Universidad de Salamanca).
La tica en la investigacin sobre discapacidad. M Teresa Anguera Argilaga (Universidad de Barcelona).
El anlisis discriminante: posibilidades y aplicaciones. Gregorio Rodrguez Gmez
(Universidad de Cdiz).
El anlisis cualitativo. M Cruz Snchez Gmez (Universidad de Salamanca).
El proceso de anlisis con ayuda del Programa NVivo. Gregorio Rodrguez Gmez
(Universidad de Cdiz).
El proceso de anlisis con ayuda del Programa Atlas-Ti. Miguel Vicente Mario (Universidad Autnoma de Barcelona).
VI SAID: INTRODUCCIN A LA METODOLOGA DE ECUACIONES ESTRUCTURALES
APLICADA A LA INVESTIGACIN EN DISCAPACIDAD
El VI SAID, dirigido por Marta Badia Corbella, Benito Arias Martnez y Miguel ngel Verdugo Alonso y coordinado por Manuela Crespo Cuadrado, tuvo lugar los das 5 y 6 de junio
de 2008, y el programa fue el siguiente:
Introduccin a la metodologa SEM: concepto y propsitos fundamentales. Begoa
Orgaz Baz (Universidad de Salamanca).
Modelos de medida y anlisis factorial confirmatorio. Ramn Fernndez Pulido (Universidad de Salamanca).
Estrategias para el manejo de missing data. ngel Blanco Villaseor (Universidad de
Barcelona).
Desarrollo de un ejemplo de path analysis en LISREL. Begoa Orgaz Baz (Universidad de Salamanca).
Modelos con componentes de medida y estructurales. Miguel Ruiz Daz (Universidad
Autnoma de Madrid).
Generalizabilidad y 'missing data' en investigacin sobre discapacidad. ngel Blanco
Villaseor (Universidad de Barcelona).
Desarrollo de un ejemplo de anlisis factorial confirmatorio en LISREL, AMOS y SAS.
Benito Arias Martnez (Universidad de Valladolid).
Desarrollo de un problema de ecuaciones estructurales. Miguel Ruiz Daz (Universidad Autnoma de Madrid).