Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Correlación
3-1
Tema 3
Correlación
Introducción
Introducción
Coeficiente
Coeficiente de
de correlación
correlación lineal
lineal de
de Pearson
Pearson
Coeficiente
Coeficiente de
de correlación
correlación poblacional
poblacional
Contraste
Contraste paramétrico
paramétrico clásico
clásico
Transformación
Transformación de
de Fisher
Fisher
Correlación
Correlación bayesiana
bayesiana
Test
Test no
no paramétrico:
paramétrico: Spearman
Spearman
Test
Test no
no paramétrico:
paramétrico: Kendall
Kendall
Test
Test de
de permutaciones
permutaciones
Correlaciones
Correlaciones parciales
parciales
Conclusiones
Conclusiones
Ejemplo:
Ejemplo: ley
ley de
de Hubble
Hubble
3. Correlación
3-2
Introducción
Introducción
Los peligros de salir a pescar:
La
La correlación
correlación podría
podría deberse
deberse aa efectos
efectos de
de selección.
selección.
Introducción
Los peligros de salir a pescar:
La
La correlación
correlación podría
podría deberse
deberse aa efectos
efectos de
de selección.
selección.
Cuidado
Cuidado con
con los
los outliers
outliers (regla
(regla del
del pulgar)
pulgar)
Introducción
Los peligros de salir a pescar:
La
La correlación
correlación podría
podría deberse
deberse aa efectos
efectos de
de selección.
selección.
Cuidado
Cuidado con
con los
los outliers
outliers (regla
(regla del
del pulgar)
pulgar)
Cuidado
Cuidado con
con mezclar
mezclar grupos
grupos de
de medidas
medidas no
no homogéneas
homogéneas
r = 0.90 r = 0.04
r = -0.20
3. Correlación
3-8
Introducción
Los peligros de salir a pescar:
La
La correlación
correlación podría
podría deberse
deberse aa efectos
efectos de
de selección.
selección.
Cuidado
Cuidado con
con los
los outliers
outliers (regla
(regla del
del pulgar).
pulgar).
Cuidado
Cuidado con
con mezclar
mezclar grupos
grupos de
de medidas
medidas no
no homogéneas.
homogéneas.
Podría
Podría existir
existir una
una correlación
correlación no
no lineal.
lineal.
r = -0.32
3. Correlación
3-9
Introducción
Los peligros de salir a pescar:
La
La correlación
correlación podría
podría deberse
deberse aa efectos
efectos de
de selección.
selección.
Cuidado
Cuidado con
con los
los outliers
outliers (regla
(regla del
del pulgar).
pulgar).
Cuidado
Cuidado con
con mezclar
mezclar grupos
grupos de
de medidas
medidas no
no homogéneas.
homogéneas.
Podría
Podría existir
existir una
una correlación
correlación no
no lineal.
lineal.
Una
Una correlación
correlación no
no implica
implica una
una relación
relación causal
causal (terceras
(terceras variables).
variables).
3. Correlación
3-10
Cálculo:
Relación con la −1 ≤ r ≤ 1
varianza residual
ρρ :: coeficiente
coeficiente de
de
correlación
correlación poblacional
poblacional
X e Y son independientes
X e Y no están correlacionados
Si Tienen distribuciones con colas que caen rápido
N es grande (>500)
3. Correlación
3-17
Coeficiente
Coeficiente de
de correlación
correlación de
de rangos
rangos de
de Spearman
Spearman
(se sustituye la distribución de probabilidad desconocida por una distribución uniforme entre 1 y N)
H0 se acepta si:
En caso de empates, se asigna a todos los puntos empatados el valor de medio de los rangos que
tendrían sin empates.
rs tiende a una
23,24
20,23
16,21 23,22
21,20
17,19
15,17 19,18
18,16 23,15
8.5,14
7,11.5 8.5,11.5 12,13
11,10
10,9
13.5,8
3,5 13.5,7
2,6 4,4
6,3
1,2 5,1
Coeficiente
Coeficiente de
de correlación
correlación de
de rangos
rangos de
de Spearman
Spearman
(se sustituye la distribución de probabilidad desconocida por una distribución uniforme entre 1 y N)
H0 se acepta si:
En caso de empates, se asigna a todos los puntos empatados el valor de medio de los rangos que
tendrían sin empates.
rs tiende a una
23,24
20,23
16,21 23,22
21,20
17,19
15,17 19,18
18,16 23,15
8.5,14
7,11.5 8.5,11.5 12,13
11,10
10,9
13.5,8
3,5 13.5,7
2,6 4,4
6,3
1,2 5,1
Coeficiente
Coeficiente de
de correlación
correlación tau
tau de
de Kendall
Kendall
H0 se acepta si:
Más lento de calcular que el coeficiente de Spearman (excepto para datos agrupados en intervalos)
Kendall Tau
3. Correlación
3-25
Test de permutaciones
Otro método no paramétrico: Se extraen muestras de la muestra observada, del mismo tamaño, permutando
aleatoriamente las asignaciones de las Ys a las Xs (sin reemplazamientos), y se calcula para cada muestra el
valor del estadístico de prueba (ej. r, rs, τ, etc.). La distribución obtenida representa la distribución del estadístico
en el caso de no correlación. Se compara el valor observado con dicha distribución.
Correlación parcial
SI se sabe que una tercera (cuarta, etc.) variable (conocida) está afectando la correlación se
puede eliminar su efecto.
Método paramétrico
Coeficiente de correlación
parcial de primer orden
Conclusiones
Los métodos no paramétricos solucionan el problema de la distribución de probabilidad
desconocida pero comparten las dificultades de los métodos no bayesianos (se basan
en la comparación con la distribución bajo la hipótesis nula basada en observaciones
hipotéticas)
El método bayesiano es más directo pero no soluciona el problema del desconocimiento
de la distribución de probabilidad.
El método bayesiano proporciona resultados muy parecidos a usar el método de Fisher
con simulaciones (bootstrap).
El análisis de correlación no indica cuál es
la variable dependiente (fundamental para
hacer un análisis de regresión).
Tampoco implica una relación causa-
efecto.
El coeficiente de correlación por sí sólo no
proporciona toda la información.
Ejemplo: cuarteto de Ascombe (mismo
coeficiente de correlación y línea de
regresión)
3. Correlación
3-28
Práctica
Posible correlación entre la abundancia relativa de C,N y la luminosidad (o masa) del cúmulo de galaxias
(Carretero et al., 2004, Ap.J. 609, L45)