Está en la página 1de 6

Correlación

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y la


proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están
correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores
homónimos de la otra: si tenemos dos variables (A y B) existe correlación entre ellas si al disminuir los
valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí
misma, ninguna relación de causalidad (Véase cum hoc ergo propter hoc). Por ejemplo, los ingresos y
gastos de una familia, la producción y ventas de una fábrica, los gastos en publicidad y beneficios de una
empresa.

Una relación funcional se expresa mediante una función matemática. Si X es la variable independiente e Y
es la variable dependiente, una relación funcional tiene la forma: pY=f(X)

Índice
Fuerza, sentido y forma de la correlación
Coeficientes de correlación
Interpretación geométrica
Distribución del coeficiente de correlación
Distribución normal bivariada
Referencias
Para más información
Enlaces externos

Fuerza, sentido y forma de la correlación


Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama
nube de puntos o diagrama de dispersión. La relación entre dos variables cuantitativas queda representada
mediante la línea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes
elementales de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:

La fuerza extrema según el caso, mide el grado en que la línea representa a la nube de
puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica
que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la
relación es débil.
El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores de
A lo hacen los de B, la relación es directa (pendiente positiva); si al crecer los valores de A
disminuyen los de B, la relación es inversa (pendiente negativa).
La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva
monotónica o la curva no monotónica

Coeficientes de correlación
Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El
más conocido es el coeficiente de correlación de Pearson (introducido en realidad por Francis Galton), que
se obtiene dividiendo la covarianza de dos variables entre el producto de sus desviaciones estándar. Otros
coeficientes son:

Coeficiente de correlación de Spearman


Correlación canónica

Interpretación geométrica

Dados los valores muestrales de dos variables aleatorias e , que pueden ser
consideradas como vectores en un espacio de n dimensiones, pueden construirse los "vectores centrados"
como:

e .

El coseno del ángulo alfa entre estos vectores es dado por la fórmula siguiente:

Pues es el coeficiente de correlación muestral de Pearson. El coeficiente de correlación es el coseno


del ángulo entre ambos vectores centrados:

Si r = 1, el ángulo °, ambos vectores son colineales (paralelos).


Si r = 0, el ángulo °, ambos vectores son ortogonales.
Si r =-1, el ángulo °, ambos vectores son colineales de dirección opuesto.

Más generalmente: .

Por supuesto, desde el punto vista geométrico, no hablamos de correlación lineal: el coeficiente de
correlación tiene siempre un sentido, cualquiera sea su valor entre -1 y 1. Nos informa de modo preciso, no
tanto sobre el grado de dependencia entre las variables, sino sobre su distancia angular en la hiperesfera de
n dimensiones.
La Iconografía de las correlaciones es un método de análisis multidimensional que reposa en esta idea. La
correlación lineal se da cuando en una nube de puntos se encuentran o se distribuyen alrededor de una
recta.

La fórmula de correlación para dos series distintas con cierto desfase "k", está dada por la fórmula:

Distribución del coeficiente de correlación

El coeficiente de correlación muestral o analítico de una muestra es de hecho una variable aleatoria, eso
significa que si repetimos un experimento o consideramos diferentes muestras se obtendrán valores
diferentes y por tanto el coeficiente de correlación muestral calculado a partir de ellas tendrá valores
ligeramente diferentes. Para muestras grandes la variación en dicho coeficiente será menor que para
muestras pequeñas. R. A. Fisher fue el primero en determinar la distribución de probabilidad para el
coeficiente de correlación.

Si las dos variables aleatorias que trata de relacionarse proceden de una distribución gaussiana bivariante
entonces el coeficiente de correlación r sigue una distribución de probabilidad dada por:1 2​ ​

donde:

es la distribución gamma
es la función gaussiana hipergeométrica.

Nótese que el valor esperado del coeficiente de correlación muestral r es:

por tanto, r es estimador sesgado de . Puede obtenerse un estimador aproximado no sesgado resolviendo
la ecuación:
para

Aunque, la solución:

es subóptima. Se puede obtener un estimador sesgado con mínima varianza para grandes valores de n, con
sesgo de orden buscando el máximo de la expresión:

, i.e.

En el caso especial de que , la distribución original puede ser reescrita como:

donde es la función beta.

Distribución normal bivariada


Si un par de de variables aleatorias sigue una distribución normal bivariada, la media condicional
es una función lineal de , y la media condicional es una función lineal de . El
coeficiente de correlación entre y , junto con las medias y varianzas marginales de y ,
determina esta relación lineal:

deonde y son los valores esperados de y , respectivamente, y y son las


desviaciones estándar de y , respectivamente.

La correlación empírica es una estimación del coeficiente de correlación . Una estimación de


distribución para es dado por
donde es la función hipergeométrica gaussiana y . Esta densidad es tanto una densidad
bayesiana posterior como una densidad óptima exacta de distribución de confianza.3 4​ ​

Referencias
1. Kenney, J. F. and Keeping, E. S., Mathematics of Statistics, Pt. 2, 2nd ed. Princeton, NJ: Van
Nostrand, 1951.
2. Correlation Coefficient - Bivariate Normal Distribution (http://mathworld.wolfram.com/Correlat
ionCoefficientBivariateNormalDistribution.html)
3. Taraldsen, Gunnar (2021). «The Confidence Density for Correlation» (https://doi.org/10.100
7/s13171-021-00267-y). Sankhya A (en inglés). ISSN 0976-8378 (https://portal.issn.org/resource/issn/
0976-8378). S2CID  244594067 (https://api.semanticscholar.org/CorpusID:244594067). doi:10.1007/s13171-021-
00267-y (https://dx.doi.org/10.1007%2Fs13171-021-00267-y).
4. Taraldsen, Gunnar (2020). Confidence in Correlation (http://rgdoi.net/10.13140/RG.2.2.2367
3.49769) (en inglés). doi:10.13140/RG.2.2.23673.49769 (https://dx.doi.org/10.13140%2FRG.2.2.23673.4976
9).

Para más información


Cohen, J.; Cohen P.; West, S.G.; Aiken, L.S. (2002). Applied multiple regression/correlation
analysis for the behavioral sciences (3rd edición). Psychology Press. ISBN 978-0-8058-2223-6.
Hazewinkel, Michiel, ed. (2001), «Correlation (in statistics)» (http://www.encyclopediaofmat
h.org/index.php?title=p/c026560), Encyclopaedia of Mathematics (en inglés), Springer,
ISBN 978-1556080104.
Oestreicher, J. & D. R. (February 26, 2015). Plague of Equals: A science thriller of
international disease, politics and drug discovery. California: Omega Cat Press. p.  408.
ISBN 978-0963175540.

Enlaces externos
Wikcionario tiene definiciones y otra información sobre correlación.
Diccionario Estadístico - Divestadística (http://www.divestadistica.es/es/diccionario_estadisti
co.html#C) (en castellano)
[1] (http://cajael.com/mestadisticos/T1EDescriptiva/node20.php) (enlace roto disponible en
Internet Archive; véase el historial (https://web.archive.org/web/*/http://cajael.com/mestadisticos/T1EDe
scriptiva/node20.php), la primera versión (https://web.archive.org/web/1/http://cajael.com/mestadistico
s/T1EDescriptiva/node20.php) y la última (https://web.archive.org/web/2/http://cajael.com/mestadistico
s/T1EDescriptiva/node20.php)). Simulación de la correlación entre dos variables discretas con
R (lenguaje de programación)

Obtenido de «https://es.wikipedia.org/w/index.php?title=Correlación&oldid=149887765»

Esta página se editó por última vez el 14 mar 2023 a las 22:27.

El texto está disponible bajo la Licencia Creative Commons Atribución Compartir Igual 3.0; pueden aplicarse
cláusulas adicionales. Al usar este sitio, usted acepta nuestros términos de uso y nuestra política de privacidad.
Wikipedia® es una marca registrada de la Fundación Wikimedia, Inc., una organización sin ánimo de lucro.

También podría gustarte