Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CORRELACIÓN
X.1. Introducción (R.10.1)
by x =
( xy ) ≠ ( xy ) = b
( xx ) ( yy ) x y
La correlación r sí mide la fuerza
• La fuerza con que las dos variables están ligadas se mide mediante el coeficiente de
correlación poblacional ρ (lineal simple) o de Pearson, el cual se estima (bajo el
muestreo I) por el coeficiente de correlación muestral r (lineal simple):
130 X.- CORRELACIÓN
r=
( xy ) = en Tabla 9.1(b) reproducida abajo =
127
= +0 ,8775
( xx )( yy ) 52 × 402 ,86
1 ( xy )
2
s = 2
( yy ) − =
1
{( yy ) − b ( xy )} ⇒ despejando:
n − 2 ( xx ) n − 2
Variabilidad Comentarios
(yy) TOTAL • Variabilidad de todas las estaturas
=
• Variabilidad para x = constante (de las
(n−2) s2 NO EXPLICADA por x distancias verticales sobre la recta).
• Término (2) de arriba.
+
( xy ) • Resto de la variabilidad.
2
( xy ) = r 2 = Coeficiente de Determinación
2
Variabilidad SÍ explicada
=
Variabilidad TOTAL ( xx )( yy )
• r2 = Fracción de la variabilidad de y SÍ explicada por x.
• 1− r2 = Fracción de la variabilidad de y NO explicada por x.
127 2
• r2 = = 0 ,7699 ≈ 77% ⇒
52 × 402 ,86
→ El 77% de la variabilidad de las estaturas está explicado por la edad.
→ El otro 23% está explicado por otras causas (variables NO medidas) o por el azar.
• r = ± 0 , 7699 = +0 ,8775 [pues (xy) > 0] para que tenga signo y así podamos saber si
y ↑ o ↓ con x.
BIOESTADÍSTICA – GRADO – MEDICINA, ENFERMERÍA 131
Parte (+ )
• r2 = ⇒ 0 ≤ r 2 ≤ 1 ⇒ −1 ≤ r ≤ +1 ⇒ ¡r no puede ser mayor que 1!
Todo (+)
• r2 = 1 ≡ x explica todo ⇒ r = ±1 es la asociación máxima: Figuras 10.1 (c) y (e).
• r2 = 0 ≡ x no explica nada ⇒ r = 0 es la asociación mínima = asociación nula ≡
independencia entre x e y: Figura 10.1 (f).
r = +0,6
r = +0,8 r = +1
r = −1
r=0
r = − 0,6
r = 0 r = 0
(g) (h )
Figura 10.1
Ilustración gráfica (a través de la nube de puntos) de los diversos valores
posibles del coeficiente de correlación lineal simple r.
• r > 0 ≡ b > 0 ≡ Asociación positiva (si x ↑ ⇒ y ↑): Figuras 10.1 (a), (b) y (c).
• r < 0 ≡ b < 0 ≡ Asociación negativa (si x ↑ ⇒ y ↓): Figuras 10.1 (d) y €.
• r>>> ≡ mucha asociación
⇓
rmide la fuerza de la asociación (solo si el muestreo es de tipo I);
Signo (r) mide el sentido de la misma
• Fig.10.1 (a): menos fuerza que Fig.10.1 (b) ⇒ el grado de aplastamiento de la nube
sobre una misma recta mide la fuerza.
• Fig.10.1 (a): igual fuerza, pero distinto sentido, que Fig.10.1 (d) ⇒ la inclinación de
la recta mide el sentido de la asociación.
132 X.- CORRELACIÓN
• ¡Ojo! Casos especiales de recta paralela al eje x ⇒ r = 0: Figuras 10.1 (g) y (h).
• La intuición basada en la nube de puntos falla si r es pequeña: r = 0,2 (por ej.).
• Con datos biológicos r suele ser pequeño: r = 0,4 o r = 0,6 están bien (por ejemplo).
• Pero al evaluar métodos de medida debe obtenerse un r cercano a 1.
texp =
( n − 2) r2 vs. tα ( n − 2 gl ) de la Tabla 3
1 − r2
12 × 0 ,7699
texp = = 6 ,337 (12 gl ) ≈ 6 ,333 del capítulo anterior (errores redondeo)
1 − 0 ,7699
• ¡Ojo! r es muy variable ⇒ rha de ser grande para obtener significación con
muestras pequeñas ⇒
• Por ejemplo:
→ Tabla 10.1: n = 9, r = 0,5052, texp = 1,35 ⇒ se concluye H0: ρ = 0
→ Si el 9 (en negrita) se cambia por 0 ⇒ ¡r = 0! ⇒ ¡r es inestable si n <<! (de ahí
que arriba se concluyera, prudentemente, H0).
Tabla 10.1
x 0 4 6 8 12 14 16 22 26
y 4 3 8 6 7 13 2 11 9
Figura 10.2: Modo usual de presentar unos datos experimentales en regresión lineal
X.3.2. Condiciones
SÍ SÍ SÍ NO
X.3.3. Estimación
(1) Obtener una muestra de n parejas de valores (xi; yi): líneas 2 y 4 de Tabla 10.2.
134 X.- CORRELACIÓN
(2) Ordenar de menor a mayor los valores de xi y asignarles rangos Ri por el mismo
procedimiento que en los tests de Wilcoxon: línea 3 de Tabla 10.2.
(3) Proceder igual con los valores de yi asignándoles rangos Ri′ : línea 5 de T. 10.2.
(4) Anotar las parejas ( Ri ;Ri′) correspondientes a las parejas (xi; yi) originales,
rS =
( RR′) =
107
= +0 ,7483
( RR )( R′R′) 143 × 143
2 ⇒ ( )
R ′R ′ = Σ R ′2
−
ΣRi′ = 5 + 7 + ... + 11 = 650
2 2 2 i
n 12
Embarazada nº 1 2 3 4 5 6 7 8 9 10 11 12
xi 60 72 46 68 51 65 81 48 39 84 78 49
Ansiedad
Ri 6 9 2 8 5 7 11 3 1 12 10 4
Sensación yi 9 11 4 10 8 12 16 5 6 14 13 15
Dolorosa Ri′ 5 7 1 6 4 8 12 2 3 10 9 11
∑ ( R − R′ )
2
rS = 1 − 6 × i i
( n − 1) n ( n+1)
( 6 − 5) + ... + ( 4 − 11)
2 2
72
rS = 1− 6× = 1− 6× = +0,7483 (como antes)
11 ×12 ×13 11 ×12 ×13
X.3.4. Propiedades
• Como rS = r para los rangos ⇒ las propiedades de rS son las de r (pero para rangos).
Nota: Para cada número n de parejas de datos (primera columna) y para cada nivel de significación α
(primera fila), en el interior de la tabla se da un valor rα tal que si el coeficiente de correlación
de Spearman rS verifica que rS ≥ rα entonces se rechaza la hipótesis nula de independencia.
Las casillas con -- indican que para esos valores de n y α el test no puede dar significativo.
• Si fuera n > 30 (que no lo es), el TCL permite utilizar la opción ii):
zexp = 0 , 7483 × 11 = 2 , 482 ⇒ 1% < P < 5%
• Caso mixto: H0: Los valores que toma un individuo con respecto a una variable
cuantitativa x son independientes de la clase a que este pertenece respecto de una
cualidad C.
→ Ya hay ¡2 cantidades!
→ Nube de puntos: monotónica (algo de curvatura) ⇒ no aplicar Pearson + sí
Spearman.
Tabla 10.3
Grado de mejoría (y) y edades (x) de un grupo de 10 pacientes
Paciente nº 1 2 3 4 5 6 7 8 9 10
Edad (x) 29 42 31 48 49 26 39 50 43 31
Resultado Mejor Igual Mejor Peor Peor Mejor Igual Peor Igual Mejor
Anotación (y) +1 0 +1 −1 −1 +1 0 −1 0 +1
Ri 2 6 3,5 8 9 1 5 10 7 3,5
R′i 08,5 5 8,5 2 2 08,5 5 02 5 8,5
Acidez
Hiperclorhidria Normal Hipoclorhidria Total
Enfermedad
Úlcera crónica 30 (19,7%) 100 (65,8%) 22 (14,5%) 152
Cáncer de Estómago 04 (9,5%) 18 (42,9%) 20 (47,6%) 042
Total 34 118 00 42 194
FIN DE LA ASIGNATURA