Está en la página 1de 41

BIOESTADÍSTICA

Correlación
Contenido de la sesión

• Repaso
• Diagrama de dispersión
• Correlación
• Coeficiente de Pearson
• Coeficiente de Spearman
Breve repaso. análisis estadísticos
Análisis Análisis
univariado Bivariado

Una variable Dos variables


• Dos cualitativas
Cualitativa • Una variable cualitativa y una
cuantitativa
Variable cuantitativa • Dos cuantitativas

3
Análisis bivariados
Análisis Bivariado

Una variable cualitativa Dos variables


y una cuantitativa cuantitativas

Cualitativa dicotómica Cualitativa politómica

Prueba t ANOVA
Prueba U-Mann
Whitney / Prueba de Mx independientes
varianzas iguales Prueba Kruskal-Wallis
Signo y rango (Wilcoxon) Mx relacionadas
Varianzas desiguales / Prueba de Friedman
Muestras pequeñas Pareadas
y que no siguen Muestras pequeñas
y que no siguen
distribución normal
distribución normal
4
Análisis bivariados
Dos variables
cuantitativas

Establecer si existe Predecir una


relación o variable a partir de
asociación otra

Correlación Regresión lineal


lineal simple

5
Estudios • En muchos estudios, el objetivo es examinar
sobre la si dos variables están relacionadas.

relación de • Además frecuentemente se desea saber la


variables fuerza o intensidad de la relación lineal y su
sentido.
cuantitativas

6
• Cuando las dos variables son cuantitativas y se
supone que están relacionadas linealmente, la
Estudios técnica que corresponde aplicar es el análisis de
correlación lineal simple.
sobre la
relación de
variables • La medida de la correlación lineal simple más
utilizada es el coeficiente de correlación de
cuantitativa Pearson (r).
Ejemplo
• Se desea determinar si existe una relación estadísticamente
significativa entre el peso y la talla en los estudiantes de la
Facultad de Ciencias y Filosofía. Se toma para ello una muestra
de 10 estudiantes.

• Los datos sobre el peso y la talla de los 10 estudiantes se


presentan a continuación.

8
Participante Peso (kg) Talla (cm)
1 75 180
2 60 165
3 72 170
4 80 180
5 65 170
6 68 176
7 73 175
8 55 160
9 78 175
10 77 179
9
Solución del problema
• Pregunta: ¿Existe una
relación estadísticamente
significativa entre el peso y la VARIABLE ESCALA
talla en los estudiantes de la
Facultad de CF?
Peso

Talla

10
Solución del problema
• Pregunta: ¿Existe una
relación estadísticamente
significativa entre el peso y la VARIABLE ESCALA
talla en los estudiantes de la
Facultad de CF?
Peso De razón

Talla De razón

11
Solución del problema

1. Representación gráfica
El primer paso es tener algún indicio acerca de si la relación
entre ambas variables numéricas tiene una forma lineal.

El diagrama de dispersión proporciona el primer indicio sobre la


forma de la relación entre dos variables cuantitativas.
Lineal positiva Lineal negativa

No lineal Ninguna relación


13
En el ejemplo:

14
• Cuando las dos variables son cuantitativas y se supone que están
relacionadas linealmente, se estima un valor que indica la
fuerza o intensidad de la relación lineal y su sentido.

• La medida de correlación lineal simple más utilizada es el


coeficiente de correlación de Pearson (r).
2. Cálculo de r
La medida de la correlación lineal simple es el coeficiente de
correlación de Pearson (r).

𝑛 σ 𝑋𝑌 −(σ 𝑋)(σ 𝑌)
𝑟=
𝑛 σ 𝑋2− σ 𝑋 2 𝑛 σ 𝑌2− σ 𝑌 2
• En el ejemplo:
Paciente Peso (Y) Talla (X) XY Y2 X2
1 75 180 13500 5625 32400
2 60 165 9900 3600 27225
3 72 170 12240 5184 28900
4 80 180 14400 6400 32400
5 65 170 11050 4225 28900
6 68 176 11968 4624 30976
7 73 175 12775 5329 30625
8 55 160 8800 3025 25600
9 78 175 13650 6084 30625
10 77 179 13783 5929 32041
703 1730 122066 50025 299692
494209 2992900

(10)(122066)− (1730)(703)
𝑟= = 0.9070
10 299692 −(2992900) 10 50025 −(494209)

17
3. Interpretación

Correlación positiva Correlación negativa


r=1 (perfecto) r=-1 (perfecto)

Ninguna correlación
r=0 18
Guía para la interpretación de r:
Valor de r Interpretación

0,00 Ausencia de correlación lineal

± 0,01 a ± 0,19 Correlación lineal muy baja

± 0,20 a ± 0,39 Correlación lineal baja-leve

± 0,40 a ± 0,69 Correlación lineal moderada

± 0,70 a ± 0,99 Correlación lineal alta a muy alta

± 1,00 Correlación lineal perfecta

En el ejemplo:
La correlación entre talla y peso es muy alta y positiva
(r=0.9)
19
4. ¿Podemos extrapolar este resultado de la muestra a la
población?

• Al estadístico muestral r, le corresponde el parámetro  (rho).

• ¿r indica verdaderamente si X y Y están correlacionadas?, es


decir ¿r es verdaderamente diferente de cero (0)?
• Se aplica una prueba de hipótesis, en la cual se aplica el
estadístico de prueba t con n-2 grados de libertad:

1. Hipótesis estadística
H0 :  = 0
H1 :  ≠ 0

2. Significación estadística
 = 0.05
3. Cálculo del estadístico de prueba
𝑛−2
𝑡𝑛−2 = 𝑟 ∗
1−𝑟 2

10−2
𝑡10−2 = 0.9070 = 6.09
1−0.90702

4. Valor de p
En la tabla de valores críticos de t se observa
que el valor p para to con 8 g.l. es p < 0.001

Por tanto p < 0.05


22
5. Decisión y conclusión
Como p<0.05, entonces se rechaza la
hipótesis nula.

Se concluye que la correlación entre el


peso y la talla de los estudiantes de la
Facultad de CF es estadísticamente
significativa muy alta y positiva.

23
• El reporte de STATA es el siguiente:

. pwcorr peso talla, print(5) star(5)

| peso talla
----------+----------------------------------------
peso | 1.0000
talla | 0.9071* 1.0000

24
Medida de correlación no
paramétrica: Correlación
de Spearman

25
Problema
• Se desea examinar si el nivel de ansiedad
ante un examen está correlacionado con
la calificación obtenida en el examen.
• El nivel de ansiedad fue medido en
escala de 1 (ansiedad baja) a 20
(ansiedad alta). La calificación del
examen fue vigesimal.
• Se aplicó el estudio en una muestra de
10 alumnos.
• Los datos obtenidos se presentan en la
tabla siguiente:

26
Problema
Niveles de ansiedad y calificaciones obtenidas

Alumno Ansiedad Calificación


1 8 17
2 9 9
3 10 16
4 11 18
5 12 13
6 13 14
7 14 10
8 16 15
9 18 11
10 19 8

27
Solución del problema

• Pregunta: ¿Existe
correlación entre el nivel de Variable Escala
ansiedad y la calificación
obtenida en el examen?
Nivel de ansiedad Ordinal
• Variables
Calificación Ordinal
Solución del problema

• Pregunta: ¿Existe
Variable Escala
correlación entre el nivel de
ansiedad y la calificación
obtenida en el examen? Nivel de
ansiedad
• Variables

Calificación
Correlación de Spearman

Se aplica cuando:
• Se desea calcular la fuerza o intensidad y el sentido de la
relación.

• Una o ambas variables son medidas:


• Con una escala ordinal o de intervalo.
• Con una escala de razón; siempre que las poblaciones
de donde provienen los datos no sigan una
distribución normal.

• Se cumple el siguiente supuesto:


• Aleatoriedad.

30
El coeficiente de correlación de Spearman

• El cálculo del coeficiente (rs) se obtiene


según la siguiente fórmula:

6 σ 𝑑𝑖 2
𝑟𝑠 = 1 −
𝑛 𝑛2 −1

donde:
di2: diferencia de rangos para cada sujeto, al
cuadrado.
n: total de sujetos.

31
El coeficiente de correlación de Spearman

• Luego de calculado el coeficiente rs se


examina su significación estadística:

• Cuando n está entre 4 y 30 se compara rs


con los valores críticos de una tabla propia.

• Cuando n es mayor que 30 se aproxima a z.

32
El coeficiente de correlación de Spearman
• Para interpretar rs se puede seguir los siguientes criterios:

Valor de rs Interpretación

0.00 Ausencia de correlación

± 0.01 a ± 0.19 Correlación muy baja

± 0.20 a ± 0.39 Correlación baja-leve

± 0.40 a ± 0.69 Correlación moderada

± 0.70 a ± 0.99 Correlación alta a muy alta

1.00 Correlación perfecta


33
Ejemplo

Tomando el caso del problema propuesto:


1. Supuestos
• La muestra fue seleccionada
aleatoriamente.
• Las variables tienen escala ordinal.

2. Cálculo del coeficiente


• Asignación de rangos y cálculo de las
diferencias

34
Ejemplo

Ansiedad Calificación Rango Rango


Alumno (X) (Y) X Y di di2
1 8 17 1 9 -8 64
2 9 9 2 2 0 0
3 10 16 3 8 -5 25
• Niveles de ansiedad y
4 11 18 4 10 -6 36
calificaciones obtenidas
5 12 13 5 5 0 0
6 13 14 6 6 0 0
7 14 10 7 3 4 16
8 16 15 8 7 1 1
9 18 11 9 4 5 25
10 19 8 10 1 9 81
Suma 248
• Cálculos:
6(σ 𝑑𝑖 2 )
𝑟𝑠 = 1 −
𝑛(𝑛2 − 1)
6(248)
𝑟𝑠 = 1 − = -0.50
10(100−1)

3. Interpretación
La correlación es moderada e inversa.
Ejemplo
4. Prueba de significación
Un coeficiente de correlación pequeño
puede resultar significativo; en tanto que
un coeficiente grande podría no serlo.
Por consiguiente, es conveniente evaluar
su significación estadística.

36
Ejemplo

Para ello se aplica un contraste de hipótesis. Cuando la muestra es


suficientemente grande se recomienda la prueba t de Student, que se
aplicó en el caso de la correlación de Pearson, con n-2 grados de
libertad.

1. Hipótesis estadística
H0 : S = 0
H1 : S ≠ 0

2. Significación estadística
 = 0.05
3. Cálculo del estadístico de prueba
𝑛−2
𝑡𝑛−2 = 𝑟 ∗
1 − 𝑟2

10−2
𝑡10−2 = −0.50 1−0.502
= −1.63

4. Valor de p
En la tabla de valores críticos de t se observa que el valor p
para to con 8 g.l. es:
0.1< p < 0.2 (lo cual se corrobora con el reporte de Stata,
ver más adelante).
Por tanto p > 0.05

38
5. Decisión e interpretación
Como p > 0.05, entonces no se rechaza la
hipótesis nula.

Se concluye que los datos obtenidos no


permiten afirmar que exista una correlación
entre el nivel de ansiedad y la calificación.

39
Stata

. spearman ansiedad calificacion

Number of obs = 10
Spearman's rho = -0.5030

Test of Ho: ansiedad and calificacion are


independent
Prob > |t| = 0.1383
Preguntas

41

También podría gustarte