Está en la página 1de 14

PATH ANALYSIS

Luis M. Carrascal
Depto. Biodiversidad y Biologa Evolutiva MUSEO NACIONAL DE CIENCIAS NATURALES

Estructura de relaciones entre variables Matrices de correlaciones frente a modelos a priori de asociaciones funcionales y jerarquizadas entre variables Regresin mltiple frente a path analysis Diagrama de relaciones (modelo a priori de relaciones entre variables) Tipos de variables Tipos de relaciones Coeficientes que miden efectos Efectos directos e indirectos Significacin de efectos y funciones de discrepancia Bondad de ajuste del modelos Comparacin entre matrices observadas y reproducidas Aproximacin mediante la 2 Otros estimadores cuantitativos Modelos anidados (significacin y bsqueda de parsimonia) Anlisis confirmatorio de componentes principales. Bibliografa seleccionada Mitchell, R. J. (1992) Testing evolutionary and ecological hypotheses using path analysis and structural equation modeling. Funct. Ecol. 6, 123-129. Mitchell, R. J. (1993) Path Analysis: Pollination. In Design and analysis of ecological experiments (S. M. Scheiner and J. Gurevitch, eds.), pp. 211-231. Steiger, J. H. (1989) EzPATH: a supplementary module for SYSTAT and SYGRAPH. SYSTAT, Evanston, Illinois. Steiger, J. H. (1995) Structural equation modeling. StatSoft Inc., Tulsa, Oklahoma.

PATH ANALYSIS
(introduccin 1)
Los sistemas ecolgicos vienen definidos por numerosas variables que interaccionan entre si

Dichas interacciones no son aleatorias, sino que responden a un esquema de estructura de relaciones.

Esta estructura podemos representarla mediante un modelo en el que definimos: + variables que interaccionan entre si + sentido se las interacciones (A B, , B A) + signo de la relacin [A=f +(B), A=f -(B)]

PATH ANALYSIS
(introduccin 2)
Los investigadores habitualmente utilizan diseos experimentales que manipulan las variables independientes para abordar el estudio de inter-relaciones entre variables y sus bases causales. Aunque esta aproximacin experimental es muy efectiva, no siempre es posible debido a limitaciones logsticas, posibilidades de manipulacin, o aspectos ticos. Cuando no es posible manipular las variables realizando experimentos, slo queda la posibilidad de efectuar un control estadstico sobre los datos. Dos posibilidades: REGRESIN MLTIPLE: + cuantifica las correlaciones (parciales) entre variables independientes + proporciona el % de la varianza explicada de la dependiente por las independientes + NO PUEDE explicar los esquemas de relaciones causales entre variables PATH ANALYSIS: + aborda los dos aspectos proporcionados por la regresin mltiple + Herramienta diseada para examinar modelos causales de relaciones entre variables.

PATH ANALYSIS
(introduccin 3)
Habitualmente trabajamos estableciendo mltiples relaciones entre variables que examinamos mediante matrices de correlaciones. En estas matrices se incluyen todas las relaciones posibles sin establecer el sentido de la asociacin. NO TENEMOS HIPTESIS CLARAS.
EDAD TARSO PESO DOMIN EDAD 1 0.05 -0.42 -0.34 TARSO 0.05 1 0.67 0.39 PESO -0.42 0.67 1 0.81 DOMIN -0.34 0.39 0.81 1

En el path analysis necesitamos predecir la posible estructura de las relaciones: EDAD PESO TARSO De las 6 correlaciones posibles, predecimos, y trabajamos, SOLO con 3. DOMINANCIA

PATH ANALYSIS
(introduccin 4)
La pieza clave en el path analysis es el diagrama de relaciones o path diagram. Los path diagram son esquemas parecidos a los diagramas de flujo que muestran mediante flechas cmo las variables estn inter-relacionadas. Resumen qu variables provocan cambios en cules variables. Los path diagrams contienen ideas a priori (encierran esquemas de hiptesis) Su establecimiento est basado en: + conocimiento de historia natural + hiptesis funcionales + intuicin y experiencia del investigador El path analysis proporcionar medidas de cmo de bien el modelo definido a priori se ajusta a los datos observados.

PATH ANALYSIS
(introduccin 5)
ASPECTOS RELACIONADOS CON LA BASE MATEMTICA: + El path analysis asume que las variables se asocian entre si mediante relaciones lineales. + Opera con las varianzas / covarianzas de las variables para examinar cmo de bien se ajustan a la estructura especificada por el modelo. Podemos distinguir cinco fases: 1) establecer el diagrama de relaciones (path diagram; sistema de ecuaciones) 2) definir la estructura de las matrices de varianza / covarianza 3) obtener datos que sern analizados 4) se ajustan las varianzas / covarianzas a la estructura predicha? 5) obtencin de coeficientes que miden los efectos, sus errores estandard y significacin Si encontramos buen ajuste entre datos y modelo podremos apoyar (tentativamente) el modelo propuesto. Si no existe un buen ajuste rechazamos el modelo propuesto a priori, y/o lo modificamos, comenzando de nuevo el proceso.

PATH ANALYSIS
(path diagram - 1)
Podemos distinguir entre tipos de variables y tipos de relaciones Cuatro TIPOS DE VARIABLES: Segn su naturaleza: Manifiestas: aquellas que son directamente observables y medibles Latentes: las que no pueden ser medidas, pero se postula su existencia bajo el nombre de: factores (combinacin lineal de variables originales) efectos cuantificados de origen desconocido (debidos a errores muestrales u otros efectos no medidos) Segn si reciben o no flechas (orden de efectos) Exgenas: son variables independientes que nunca reciben flechas de efectos Endgenas: aquellas que reciben flechas indicando que son afectadas por otra u otras variables; son, en al menos una ocasin, variables dependientes. Dos TIPOS DE RELACIONES: Flechas: indican flujo de asociacin causal entre variable(s) independientes y dependiente Lneas sin flechas: para representar varianzas / covarianzas entre variables exgenas

PATH ANALYSIS
(path diagram - 2)
EDAD PESO TARSO Modelos U1 DOMINANCIA U2

PESO = a + bEDAD + cTARSO + U1


DOMINANCIA = d + ePESO + U2 U mide la varianza residual (e.g., no explicada por EDAD y TARSO). U es una variable latente. representa la correlacin entre las variables exgenas EDAD y PESO representan los efectos. Son coeficientes de regresin parcial estandarizados. Esto es, coeficientes de regresin trabajando con las variables llevadas a: media=0 desviacin tpica=1 Este diagrama es tambin una representacin simblica de la siguiente ecuacin: PESO = EDAD + TARSO + U1

PATH ANALYSIS
(estimacin de efectos - 1)
Los coeficientes , que miden efectos establecidos entre pares de variables, son equivalentes a los coeficientes de regresin parcial estandarizados () obtenidos en regresin mltiple.

El efecto latente U mide la varianza no explicada por las variables (independientes) que lanzan flechas sobre la variable dependiente (endgena). Segn los paquetes estadsticos, este efecto U se mide como: U = 1 - R2 U = (1 - R2)0.5

La correlacin entre una variable independiente y otra dependiente se puede descomponer en dos efectos: Directo: el medido por el coeficiente del path analysis. Slo es atribuible a la variable independiente que lanza una flecha sobre la dependiente. Indirecto: mide el efecto sobre la variable dependiente determinado conjuntamente por las variables independientes.

PATH ANALYSIS
(estimacin de efectos - 2)
Clculo de efectos indirectos: correlacin = efecto directo + efecto indirecto efecto indirecto = correlacin entre independientes x (otra independiente)

r(dep.,B) = (dep.,B) + r(B,C) x

(dep.,C)

Estima de significacin de efectos: Para cada coeficiente es posible estimar su error estndard. El cociente entre el coeficiente y su error estndard proporciona una t con su p asociada. Los coeficientes y sus errores estndard pueden ser calculados mediante distintos algoritmos. No todos ellos permiten la estima de los errores estndard. Para su clculo se requiere comenzar con valores iniciales a partir de los cuales, mediante iteraciones, se estiman sus valores de manera que minimizen la funcin de discrepancia. En path analysis se suele utilizar el criterio de mxima verosimilitud (Maximum Likelihood) de Wishart si trabajamos con matrices de correlaciones o de covarianzas.

PATH ANALYSIS
(bondad de ajuste - 1)
Los modelos de relaciones causales representados por los path diagrams retienen una cierta cantidad de la informacin original en forma de matrices de covarianzas / varianza, o correlaciones. Recordemos que la correlacin entre A y B es covarianza (A,B) SDA SDB A partir de los coeficientes del path analysis es posible calcular las correlaciones o covarianzas representadas por el modelo. Las correlaciones o covarianzas representadas son aquellas que ocurriran si, y slo si, el modelo (path diagram) fuese correcto. Comparando la matriz representada con la matriz observada es posible obtener las diferencias entre correlaciones o covarianzas. Estos valores se aproximan a una 2, con v grados de libertad. grados de libertad = nmero de correlaciones posibles nmero de coeficientes estimados

PATH ANALYSIS
(bondad de ajuste - 2)
La 2 mide la falta de bondad de ajuste entre la matriz observada y la representada. En este caso, la no significacin es buena para el modelo. Una 2 no significativa muestra que no hay un desvo significativo entre, por ejemplo, las correlaciones observadas entre las variables y las representadas por el modelo. Esto significa que el modelo ha salido airoso frente a su examen para rechazarlo. No significa que el modelo se ajusta perfectamente bien a los datos, sino que es suficientemente bueno para representar la realidad subyacente a los datos. Si la falta de bondad de ajuste es importante (i.e., significativa) es prematuro aceptar los coeficientes obtenidos. Sera necesario rehacer el modelo. Adems de existen otros parmetros que cuantifican la bondad de ajuste: ndice Gamma poblacional (buen ajuste para valores > 0,95) Residuo estandarizado RMS (buen ajuste para valores < 0.05)

PATH ANALYSIS
(bondad de ajuste - 3)
Examen comparado de la bondad de ajuste de varios modelos complementarios. Caso particular en el que un modelo reducido quita alguno(s) de los efectos incluidos en un modelo que incluye todos los efectos posibles establecidos a priori. Siempre debera ser preferible aquel modelo que tenga mayor bondad de ajuste con los datos originales, utilizando la mnima cantidad de efectos. Esto es SLO aplicable si este criterio de parsimonia no elimina efectos conceptualmente importantes. Para comparar la bondad de ajuste de dos modelos tenemos que valorar las diferencias entre los estadsticos que miden bondad de ajuste: + restar los valores de 2 de los dos modelos que se comparan + esta diferencia se sigue ajustando a una distribucin de la 2 + restar los grados de libertad de ambos modelos

PATH ANALYSIS
(supuestos)
Las relaciones entre variables son aditivas y lineales Exploracin visual y transformaciones. La distribucin de los residuos debe ajustarse a una normal La violacin de este supuesto no suele afectar a la magnitud de los coeficientes del path analysis. En general el path analysis es robusto ante la violacin de este supuesto. No obstante, la significacin de los efectos puede perder relevancia. Para obtener estimas ms estables de significacin podramos utilizar una aproximacin jackknife (eliminar secuencialmente, y segn un proceso aleatorio, una observacin, y a continuacin efectuar las estimas de significacin; repetir el proceso muchas veces y cuantificar los patrones de significacin). Normalidad multivariante Este supuesto no es muy restrictivo en path analysis. Para examinarlo adecuadamente se requieren tamaos muestrales muy grandes. Contamos con estimas sintticas de sesgo y kurtosis (valores normalizados que se aproximan a una distribucin normal Z). El valor Kappa de Mardia para la kurtosis: este valor debe aproximarse a 0 si la distribucin de la poblacin proviene de una distribucin normal multivariante.