Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística.
Diagrama de Correlación
Facilitador: Integrante(s):
Son una representación gráfica que muestra la relación de una variable con respecto a
otra, aunque esta no tiene porque ser una relación causa-efecto.
Uso:
Este diagrama se usa para estudiar la posible relación entre dos variables, y probar las
posibles relaciones entre causa y efecto. No permite probar que una variable es causa de
la otra, pero si consigue aclarar si se establecen relaciones y la intensidad que se establece
entre ambas.
Elaboración:
recoger en pares los datos de las dos variables objeto de estudio, al menos 30 pares de
datos.
- Posible relación baja entre las variables; la causa puede afectar al efecto, pero
levemente. Es conveniente encontrar otras causas que influyan en mayor medida,
directamente y produzcan variación significativa en el efecto.
- Correlación alta; es probable que la causa esté directamente relacionada con el efecto.
- Perfecta; dado un valor de la causa, el correspondiente valor del efecto puede ser
estimado con absoluta certeza.
Correlación lineal:
Para estudiar la relación lineal existente entre dos variables continuas es necesario
disponer de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros
es la covarianza, que indica el grado de variación conjunta de dos variables aleatorias.
La covarianza depende de las escalas en que se miden las variables estudiadas, por lo
tanto, no es comparable entre distintos pares de variables. Para poder hacer
comparaciones se estandariza la covarianza, generando lo que se conoce como
coeficientes de correlación. Existen diferentes tipos, de entre los que destacan el
coeficiente de Pearson, Rho de Spearman y Tau de Kendall.
- La correlación de Pearson funciona bien con variables cuantitativas que tienen una
distribución normal. En el libro Handbook of Biological Statatistics se menciona que sigue
siendo bastante robusto a pesar de la falta de normalidad. Es más sensible a los valores
extremos que las otras dos alternativas.
La correlación lineal entre dos variables, además del valor del coeficiente de correlación
y de sus significancias, también tiene un tamaño de efecto asociado. Se conoce como
coeficiente de determinación (R^2). Se interpreta como la cantidad de varianza de (Y)
explicada por (X). En el caso del coeficiente de Pearson y el de Spearman, (R^2) se obtiene
elevando al cuadrado el coeficiente de correlación. En el caso de Kendall no se puede
calcular de este modo.
Significado matemático:
Usado en el estudio de la relación existente entre dos conjuntos de datos numéricos o
de elementos tales como puntos y líneas. Es usado particularmente en los estudios
estadísticos.
Se considera que dos variables cuantitativas están correlacionadas cuando los valores de
una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si
tenemos dos variables (A y B) existe correlación entre ellas si al disminuir los valores de A
lo hacen también los de B y viceversa.
La ecuación de regresión lineal simple indica que el valor medio o valor esperado de y
es una función lineal de x: E(y/x) = β0 + β1 x.
Regresión lineal:
El análisis de la regresión lineal se utiliza para predecir el valor de una variable según el
valor de otra. La variable que desea predecir se denomina variable dependiente. La
variable que está utilizando para predecir el valor de la otra variable se denomina variable
independiente
Métodos para el trazado de las líneas de regresión: