Análisis Estructural de Covarianza

Análisis de Ecuaciones Estructurales de Covarianza - Examina las relaciones de manera simultánea, da
(SEM) eficacia estadística.

Fue introducido por Bock y Bargmann, y desarrollado - Trabaja con la noción de V. Latente.
por Joreskog. Pertenece a una familia de técnicas - Las VL siempre son óvalos, y las VO cuadrados.
multivariadas en la que hay dos subgrupos: a) análisis - Hay dos modelos, el de medida y el de relación. Al
factorial confirmatorio y b) modelo de covarianza estimar el modelo de medida toma
estructural latente. También conocido como simultáneamente el error de medida. Se puede
Moldeamiento de Ecuaciones Estructurales (MEE). Es modificar el modelo en caso de ser necesario.
una compleja combinación del análisis factorial y del Modelos estructurales: tienen más potencia
análisis de regresión múltiple. En este, se pueden estadística, se hace de forma simultánea (en el AR se
evaluar los efectos de las variables latentes entre sí y hace secuencialmente) y tiene le modelo de medida
sobre otras variables observadas. Se usa para incluido (+ un modelo de relaciones). También se basa
desarrollar un modelo que tenga considerablemente en la regresión, pero es más complejo.
más puntos de datos que parámetros libres a estimar. Modelos de Medida en el SEM
Se adecua mejor al estudio y análisis de modelos Modelo de medida
teóricos estructurales complejos, donde se utilicen Es la relación entre la variable latente y sus
cadenas complejas de razonamientos para ligar la indicadores. De una única variable.
teoría con la investigación. También verifica resultados Modelo de relación o predicción
complejos. A partir de una variable latente exógena se predice una
Los diagramas de ruta se usan para desarrollar de endógena. Parecido al AR, implica un conjunto de
forma gráfica el modelo estructural que se va a probar. variables.
El SEM nace de dos tradiciones: predicción + enfoque Consideración
psicométrico. Donde hay una extensión de técnicas Las variables tanto observadas como latentes no
multivariantes de regresión múltiple, AF, AR. Abarca: pueden predecir a una dimensión o indicador de una
análisis estructural de covarianza, análisis de variable variable latente. Las variables observadas predicen
latente, AFC, Análisis de Lisrel. El AR se puede variables latentes, y viceversa, nunca sus dimensiones.
calcular desde una ecuación estructural. Tipos de modelos
Se basa en el análisis de la estructura de covarianza, Nociones
para estimar: a) parámetros del modelo: incógnita Parámetros libres: coeficiente a ser estimado referido
poblacional que se quiere conocer, b) ajuste de los a todas las posibles correlaciones y varianzas de todas
datos al modelo hipotetizado. Además, es un sistema las VI (es decir, sus cargas factoriales), y los errores de
analítico para modelar y probar teorías científicas del la VD. La S2 de la VI no funciona como PL porque se
comportamiento. Como técnica estadística implica un fija en 1 unidad (o algunos autores la fijan en 0, esto es
AF y un ARM. Además, evalúa las relaciones de un valor forzado).
manera confirmatoria (confirma relaciones). Número de Ecuaciones: corresponde a los datos
Estos modelos se caracterizan por evaluar pedidos y obtenidos.
simultáneamente las relaciones de dependencia de Número de incógnitas: parámetros libres, coeficientes
manera directa. Esto garantiza eficacia estadística a ser identificados en el modelo.
(mejor precisión en los resultados). Estos modelos Datos: son los indicadores, ítems o factores. Más, el
trabajan con la noción de variable latente. Toma en número de correlaciones entre ellos. Para calcularlo se
cuenta los errores de medida en los procesos de utiliza: [n(n+1)]/2. Donde n es la cantidad de variables
estimación. observadas, ítems, etc.
Objetivo Grados de libertad: gl = Datos – Parámetros Libres
Confirmación de una teoría, sea parcial o total. Modelos
Tipos de variables: VI (medidas o latentes), VD Modelo subidentificado: Más incógnitas que datos. gl
(medidas o latentes), Medidas de error. Las variables < 0. Por ejemplo, una VL con dos ítems tiene 3 datos y
latentes algunos autores la usan como sinónimo de 4 parámetros, por tanto, tendrá -1 gl, es decir, tengo 3
factor o v. sin medir, se representa mediante óvalos. datos y quiero saber cuatro.
Se utiliza mejor en etapas tardías de investigación, Modelo saturado o identificado: igual n° de datos
donde el investigador ya ha reunido suficiente que de incógnitas. gl = datos-incógnitas = 0. Ejemplo:
información sobre las relaciones entre las V. AFE, Análisis discriminante, AR, Análisis de
Características Regresión. Por ejemplo, si tengo una VL con tres
Diseño prospectivo con más de un eslabón causal. Es dimensiones, tendré 6 datos y 6 PL, por lo que se
criterio del investigador utilizar un análisis de ruta o un obtendrá 0 gl.
análisis estructural de covarianza.
Modelo sobreidentificado: todo lo demás, más datos Supuestos
que incógnitas. En análisis da más de lo que necesita. Del análisis factorial + análisis de ruta.
gl > 0. Ejemplo: SEM, AFC y modelos estructurales de - Todas las VIs tienen varianzas que funcionan
covarianza o AFE. Por ejemplo, si tengo una VL con 4 como parámetros en el modelo, y que incluyen
factores, tendré 10 datos y 8 PL, igual a 2 gl. Esto hace todas las variables de error, así como las VIs
una simplificación de la realidad, se estiman pocos medidas. Pero la VD no tiene varianzas que
parámetros. funcione como parámetro.
Ecuación - La causalidad no se fija en correlaciones.
Además, este método usa modelos de ruta. La - Si los grados de libertad son igual a cero, habrá un
estructura de covarianza más simple es el análisis de ajuste perfecto. Sin embargo, en los modelos con
regresión. X1 = B2X2+ B3X3+ B4X4+e (las puntuaciones grados de libertad mayores a cero son capaces de
son desviaciones). B son los pesos estandarizados. Se ofrecer información con significancia teórica.
usan cuadrados para diagramar a las variables medidas, - El modelo necesita ser sobreidentificado. gl > 0
y se utilizan elipses para v. sin medir. Por cada VD hay - La distribución de la VD es normal.
una ecuación. Los asteriscos significan que hay - Requisito de la identificación: el problema de la
parámetros libres a estimarse en conexión con estas estructura de la covarianza debe establecerse de tal
rutas, uno para cada estrella. Para la VD hay un error manera que todos los parámetros estimados
en la ecuación, que es independiente a las VIs, y que es puedan identificarse.
igual a 1. El asterisco indica: parámetro libre en el Pasos
modelo, y un valor estimado (no fijo). Las covarianzas 1. Los datos se analizan de acuerdo con el modelo
entre las VIs son relaciones, y las varianzas de cada establecido.
una que en conjunto también son parámetros libres 2. A partir de los análisis de datos se calcula una
Características del SEM matriz R utilizando los parámetros estimados del
1. Existe una flecha unidireccional a partir de cada modelo teórico, lo cual se hace escribiendo
VI, señalando hacia la VD. ecuaciones para cada una de las variables.
2. Cada variable que tiene una fecha unidireccional 3. Solo se estiman las cargas factoriales relacionadas
apuntando hacia sí misma genera una ecuación de a la hipótesis, el resto se fuerzan a ser iguales a
regresión lineal en el modelo de covarianza o de cero.
ecuación estructural. 4. Evaluar la bondad de ajuste con estadísticos que
3. Existe un asterisco (*) insertada en cada flecha de no dependan del tamaño de la N: índice de ajuste
las Vis a la VD, lo cual indica que existen comparativo (>.95 buen ajuste entre el modelo y
parámetros libres a ser estimados para estas rutas. los datos, lo que indica una baja probabilidad que
4. El asterisco identifica un parámetro libre en el cualquier reespecificación posterior del modelo
modelo. altere mucho al índice), índice de bondad de
5. Todas las covarianzas (correlaciones) entre las VIs ajuste, raíz del cuadrado medio residual (RCM).
también representan parámetros libres en el 5. Analizar residuales mediante: mínimos cuadrados
modelo. Los parámetros libres de la covarianza se sin ponderar, mínimos cuadrados generalizados y
indican por medio de flechas bidireccionales, con máxima verosimilitud. A menos tamaño de
un asterisco en medio. residuales, mejor será el ajuste, y viceversa.
6. Las varianzas de las VIs medidas también son 6. Además, resulta útil hacer una comprobación de
parámetros libres. Dichas variables se encuentran hipótesis alternativa cuando el problema permita
subrayadas en sus cajas, con un asterisco junto a su dicha comprobación.
símbolo. Errores en SEM
7. Todas las VIs poseen varianzas que funcionan - El modelo no se ajusta porque fue conceptualizado
como parámetros en el modelo. pobre e incorrectamente.
8. Las VDs no poseen varianzas que funcionen como - El análisis no funciona a causa de: fuerte
parámetros en el modelo. colinealidad en la matriz de correlación.
9. Las VIs deben tener su escala fija: a) al establecer - El modelo no se ajusta porque la teoría de donde
el coeficiente de regresión en un valor fijo, fue derivado está equivocada o es inaplicable.
generalmente 1. B) al fijar su varianza en algún
valor conocido, generalmente 1. Estimación del Parámetro del Modelo
10. En la mayoría de los casos, los errores de medición La estimación del parámetro al ser simultáneo
tienen coeficientes de regresión fijos en 1, y por optimiza los resultados, cosa que hace más exigente la
ello no aparece ningún asterisco en la flecha que estimación en comparación a la regresión múltiple.
apunta hacia la VD. Pero no puede ser así si la Programas con los que se puede calcular: AMUS
varianza se fijó en 1.
(extensión de SPSS), JAMOVI, JASP, ONYX, RMSEA que es un estadístico basado en χ2 relativo a
LISREL, MPLUS, etc. los grados de libertad, que estima el error de
Estimación del modelo a los datos aproximación del modelo propuesto, más
¿El modelo es congruente con los datos? ¿Lo que se específicamente, estima la discrepancia que habría
entre la matriz de correlación poblacional y la matriz
recolectó se ajusta al modelo teórico? Para responde a
reproducida por el modelo propuesto, también en la
esta pregunta, se emplean los valores de los parámetros
población. Valores por debajo de .05 se consideran
estimados y valores forzados para calcular una matriz excelente, y mayores a .08 indican un ajuste
de covarianza (o correlaciones) predicha es reducida a insuficiente; a su vez se recomienda reportar el
la ajustada. intervalo de confianza. Cuando se tiene una N > 200 O
R: Matriz de correlaciones observada. 250, el RMSEA es más preciso para modelos con
R*: Matriz de datos predicha o ajustada a partir de un errores de especificación moderados. Sin embargo,
modelo teórico. Hay ajuste del modelo cuando esta se este coeficiente es más recomendado utilizarlo en
corresponde con la obtenida. modelos confirmatorios a medida que las muestras se
R – R*: Matriz residual o del error, con menos error vuelve más grande (500 o más). SMRS
habrá un mejor ajuste global. Estimaciones
Máxima verosimilitud
Índices de Ajuste También conocido como Maximum Likelihood (ML),
El AEC ya que es simultáneo permite obtenerlo, se usa minimiza las correlaciones parciales, pero es muy
para ver si los datos se ajustan al modelo. Se suelen sensible al tamaño muestral; por tanto, todo el error
evaluar más índices para darle más validez, no todos será muestral y no por aproximación. Este método se
dan el ajuste. Se calculan a partir de la matriz residual. debe utilizar cuando se use: matriz de correlaciones de
Pearson, 5 o más categorías de respuesta, se cumpla el
Chi cuadrado χ2 supuesto de normalidad multivariada, curtosis y
Matriz residual teórica  Errores. Matriz obtenida. asimetría entre 2 y -2; y evaluar los índices de ajuste.
Esperamos que R teórica sea igual a R obtenida para No se puede utilizar con matrices policóricas y solo
que haya ajuste (Ho: R = R*, esperemos que no haya resulta apropiado bajo el modelo lineal. Es
diferencias significativas). A) χ2 no significativa: matemáticamente sólido, pero requiere del supuesto de
generalmente da no significativo porque es sensible a normalidad. Una alternativa robusta es el test de Mavi.
la N. B) Estadístico radio de verosimilitud χ2/gl < 3: si Mínimos cuadrados
no tenemos significancia o probabilidad, debe ser No supone normalidad.
inferior a 3. Mínimos cuadrados no ponderados o no
estandardizados (ULS): es un método de estimación
Porcentaje de Varianza Explicada
del modelo factorial que proporciona resultados
Debe ser > .99 o > .95 o > .99. Están medidas como:
adecuados cuando el número de factores a extraer es
GFI: Es una medida de bondad de ajuste absoluta
bajo y se tiene una muestra pequeña, evita los casos
normada, que, a modo de coeficiente de determinación
Heywood, no requiere de la normalidad multivariada;
multivariado, indica la proporción de covariación entre
da estimaciones de parámetros más precisas y menos
los ítems explicada por el modelo propuesto, es
variables, así como errores estándar más precisos en
sensible al tamaño de la muestra y no depende del
comparación con el Diagonally Weighted Least
método de estimación utilizado. Su rango de valores
Squares; (DWLS) y funciona bien tanto con el modelo
oscila entre 0 y 1, donde un monto por encima de .95
lineal como con el no lineal y es la mejor elección para
se considera que existe un buen ajuste al modelo.
grandes conjuntos de ítems y muestras no muy
Análogo al R2.
grandes. Se puede usar con matrices policóricas y da
CFI: es un índice de ajuste incremental, es decir, un
mejores estimaciones para muestras pequeñas (N <
índice normado que tiene una relativa insensibilidad a
1000).
la complejidad del modelo, donde valores más altos
indican mejor ajuste; donde valores por encima de .95 Consideraciones
se considera aceptables.
a. No se puede decir que los indicadores tienen
NFI: mide la mejora de ajuste que produce el modelo
propuesto con respecto al modelo nulo en 0 factores, efecto sobre una variable externa a su modelo de
en relación a la mejora esperada por un modelo que medida (los indicadores no ejercen influencia).
ajustara bien. Sus valores se mueven entre 0 y 1, se b. Variables endógenas: no cuentan los indicadores
recomienda interpretarlo como un coeficiente de observados sobre las v. observadas que estén
fiabilidad, y hasta cierto punto tiene en cuenta la explicando.
complejidad del modelo; en este sentido, valores por c. La variable o dimensión que es mejor explicada
encima de .95 se considera aceptables. por la variable latente es la que tenga mayor
Porcentaje de Varianza no Explicada magnitud de correlación (valor absoluto). Deberían
Es cualquier índice de ajuste relacionado con el error. de ser mayores a .5, pero algunos usan un criterio
Uno de ellos en de .3.
d. Las relaciones directas suelen ser los mayores tiempo, se analiza el comportamiento de cada
predictores. variable contra las demás.
e. Modelos de medida con al menos tres
Comparación con el Análisis de Ruta
dimensiones. Con dos dimensiones queda
Semejanzas
restringida. No es deseado que un factor sea
a. Verifican hipótesis causales o predictivas entre
explicado por completo por la v. latente.
variables.
f. Se espera que χ2 sea significativo, sin embargo, es
b. Permite evaluar mediación.
muy afectado por el tamaño de la muestra. Por eso
Diferencias
se emplean los otros indicadores.
a. La estimación de parámetros es simultaneo en
g. Si tenemos un modelo que trabaja con variables
SEM, mientras que en AR es secuencial.
observadas, a nivel matemático una variable
b. El AR evalúa la bondad de ajuste para c/u de las v.
observada es aquello que podemos calcular
endógenas (Beta, R2). En el SEM los indicadores
directamente.
de ajuste son de todo el modelo.
h. Las variables latentes van en círculo. La variable
c. El AR la estimación de parámetros es sucesiva, por
latente no se mide o calcula directamente, sino que
ende, no necesita tantos requisitos
se calcula a partir de una configuración de
computacionales. El SEM es más compleja la
variables observables.
estimación, más exigente y compleja a nivel
a. Los indicadores pueden ser ítems o
computacional.
dimensiones (las dimensiones pueden ser
d. En el SEM los modelos de resolución matemática
compuestas por ítems).
están los ML (ML Robusta), y los de Mínimo
i. La diferencia principal es que el Análisis de ruta
cuadrado (ULS, DWLS).
trabaja con variables observables, mientras que el
e. Mientras que en AR solo hay VO, en el SEM hay
análisis de ecuaciones estructurales con variables
VL y VO.
latentes.
f. El AR supone un modelo de relación, el SEM hay
j. Cada variable latente se vuelve un modelo de
modelo de relación y de medida.
medida de las ecuaciones estructurales. Al igual
g. El SEM permite verificar modelos de medida, y el
que el modelo de ruta, tiene un modelo de
AR no.
relaciones.
h. Los SEM son modelos sobreidentificados, los AR
k. Los indicadores de la variable latente son los que
identificados.
tienen errores, no la variable latente.
i. El SEM permite probar la teoría, el AR genera
l. La literatura no establece si el SEM es mejor que
teorías.
AR, sin embargo, el SEM tiene mayor potencia y
j. Los SEM son estrategias confirmatorias, y el AR
eficiencia estadística, porque la resolución a nivel
exploratorias.
matemático es con una regresión más compleja a
nivel computacional. En el SEM se resuelve todo FASES
de una vez, mientras que el AR se resuelve paso a
Especificación
paso.
El investigador establece la relación hipotética entre
m. Evalúa las relaciones de dependencia múltiple y
latentes y observadas.
cruzadas.
n. Grado para representar conceptos no observados y Identificación
tener en cuenta el error de medida en el proceso de Se determina si el modelo está identificado mediante
estimación. una expresión algebraica, en función de las varianzas y
o. Modela las relaciones entre variables predictoras covarianzas muestrales.
(o indicadores o exógenas) y variables criterio (o Estimación de parámetros (desconocidos)
dependiente, endógenas). Y sus errores de medición.
p. Más confirmatorios que exploratorios: confronta el Evaluación del ajuste o Bondad de ajuste
conocimiento a priori e hipótesis empíricas. Son índices de exactitud d ellos datos del modelo para
q. Trabaja con variables observables o medibles determinar si es correcto y sirve para los propósitos del
(tienen valor de entrada) y con variables no investigador.
observadas o latentes (no tienen valor y se pueden Medidas absolutas
usar como concepto). Grado en el que el modelo general predice la matriz de
r. Ventajas: análisis de las relaciones por cada correlación. χ2/gl, NCP (no-centralidad del parámetro),
subconjunto de variables, permite interrelación GFI, RMSEA, RMSR, ECVI (índice de validación
entre variables de distintos grupos. Además, cruzada esperada).
permite comprobar todas las hipótesis al mismo
Medidas de ajuste incremental
Comparan el modelo propuesto con otro, generalmente
“modelo nulo”.
AGFI, NNFI, NFI (índice normado de ajuste).
Medidas de parsimonia
Nro. de coeficientes estimados necesarios, es la
cantidad de ajuste del modelo por cada variable. Entre
0 y 1, adecuados y elevados. Compara modelos. PNFI
(índice de ajuste normado de parsimonia), AIC
(criterio de información de Akaike), PGFI (índice de
bondad de ajuste de parsimonia).
Reespecificación del modelo
Saber si el primer modelo obtenido es el mejor.
Métodos para mejorar el ajuste, más o menos
parámetros estimados. Hay un índice de modificación,
una reducción de χ2 (mínimo 3.84 para que sea
significativo).
Interpretación de resultados
Establecer modelo correcto y establecer que hipótesis
se cumplieron y cuáles no. Conclusión.
Interpretación de Luis
Indicadores de Ajuste
1. Seleccionar 3 o 5 (procurando de que sean
impares).
2. Fijar un criterio (nivel de seguridad): .90 y .10;
.95 y .05; .99 y .01. Si hay una N grande y
pocas VO, el criterio puede ser más laxo.
3. Indicar si se cumple o no, y su valor.
4. El modelo propuesto se ajusta al obtenido. Si
no se ajusta se puede recomendar reajustar el
modelo y no se sigue interpretando.
Evaluar modelos de medida
1. Evaluar cargas factoriales en c/u de los
modelos.
2. Criterio: mayor a .4 o .5. Se representa con
lambda.
3. Si uno es menor se puede recomendar eliminar
el factor.
4. Indicar cual tiene más correlación entre VO y
VL.
5. Identificar lo que determina las cargas
positivas y negativas del factor. Ejemplo de
Dieta y gaseosa.
Analizar Predicción
1. Similar al AR.
2. Calcular efectos directos, indirectos y totales.
3. Las cargas factoriales entre variables latentes
se interpretan por magnitud y dirección.
4. Los factores no pueden predecir.
5. Se representa con gamma.

Análisis Estructural de Covarianza

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Análisis Estructural de Covarianza

Cargado por

Copyright:

Formatos disponibles

Análisis de Ecuaciones Estructurales de Covarianza - Examina las relaciones de manera simultánea, da

(SEM) eficacia estadística.

También podría gustarte