Está en la página 1de 19

CORRELACION

LINEAL
Ph.D. Walther CASIMIRO URCOS
A MANERA DE REFLEXION
Dos variables pueden estar altamante
correlacionadas, pero no se debe asumir
que una variable cause la otra.
Frecuentemente es usado como un medio
para la predicción, pero correlación sólo
nos dice como es la relación entre dos
variables.
La Correlación tiene que ver sólo con la
“En cierta universidad de un pais,
existe una correlacion significativa fuerza de la relación.
entre el número de mulas y el
número de grados doctorales” CORRELACIÓN NO IMPLICA CAUSALIDAD
CORRELACION
La correlación, es una medida
estadística que cuantifica la
dependencia lineal entre dos
variables, es decir, si se
representan en un diagrama de
dispersión los valores que toman
dos variables, el coeficiente de
correlación lineal señalará lo
bien o lo mal que el conjunto de
puntos representados se
aproxima a una recta.
CORRELACIONES

Relaciones lineales Relaciones Curvilineas

Y Y

X X

Y Y

X X
CORRELACION LINEAL

Relaciones fuertes Relaciones débiles

Y Y

X X

Y Y

X X
Diagrama de Dispersión de Datos con Varios
Coeficientes de Correlacción
Y Y Y

X X X
r = -1 r = -.6 r=0
Y
Y

X X X
r = +1 r = +.3 r=0
CALCULO DEL COEFICIENTE DE CORRELACION

 xy   x y
r n
 ( x) 2
 ( y) 2

x 
2 .  y 
2 
 n  n 
  
COEFICIENTE DE CORRELACION
El signo de “r” denota la naturaleza de la asociación. Mientras
que el valor de r denota la fuerza de asociación.
Si el signo es positivo, significa que la relación es directa (un
incremento en una variable está asociado con el incremento de
la otra variable; una disminución de una variable está asociado
con la disminución de la otra variable).
Si el signo es negativo, significa una relación inversa o indirecta
(significando que el incremento en una variable está asociado
con una disminución de la otra variable).
VALORES DEL COEFICIENTE DE CORRELACION
• El valor de r está entre ( -1) y ( +1)
• El valor de r denota la fuerza de la asociación como se ilustra en el
siguiente diagrama.

fuerte intermedio débil débil intermedio fuerte

-1 -0.75 -0.25 0 0.25 0.75 1


indirecta Directa
Correlación correlación
perfecta perfecta
sin relación
INTERPRETACION DEL COEFICIENTE DE CORRELACION
 Si r = cero significa que no hay
asociación o correlación entre las dos
variables.

 Si 0 < r < 0.25 = débil correlación.

 Si 0.25 ≤ r < 0.75 = intermedia


correlación.

 Si 0.75 ≤ r < 1 = fuerte correlación.

 Si r = 1 = perfecta correlación.
Ejercicios de aplicación 1
Una muestra de 6 niños fue seleccionada, los datos de su edad en años y
peso en kilogramos fue registrada como se muestra en la siguiente tabla.
Se requiere encontrar la correlación entre edad y peso.
Peso (Kg) Edad (años) Nº serial

12 7 1
8 6 2
12 8 3
10 5 4
11 6 5
13 9 6
Resolución del Ejercicio
Las dos variables son de tipo cuantitativo, por lo tanto
aplicamos el coeficiente de correlación de Pearson. Para
encontrar la relación entre edad y peso, calcule el coeficiente
de correlación simple, usando la siguiente fórmula:

 xy   x y
r  n

  x2   .  y 2  
 ( x) 2
 ( y) 2


 n  n 
  
Resolución del Ejercicio
Peso (Kg) Edad (años)
Y2
X2
xy Nº Serial
(y) (x)

144 49 84 12 7 1

64 36 48 8 6 2

144 64 96 12 8 3

100 25 50 10 5 4

121 36 66 11 6 5

169 81 117 13 9 6

=y2∑ =x2∑ =y ∑ =x∑ Total


xy= 461∑
742 291 66 41
Resolución del Ejercicio

41  66
461 
r 6
 2
(41)   2
(66) 
291  .742  
 6  6 

Existe una Fuerte correlación entre la edad y peso , con


un valor de r = 0,759
Ejercicios de aplicación 2

En un Centro de Salud hacen el seguimiento de la tensión arterial a sus pacientes,


y los resultados muestran que aquéllos que tienen sobrepeso, tienen una tensión
arterial superior a la media. Vamos a ver los datos y a calcular el coeficiente de
correlación de Pearson de este estudio. El número de datos totales es n=10

X = Peso (kg) 72 76 78 81 89 95 108 115 120 130

Y = Tensión sistólica 115 121 125 130 141 150 165 170 177 178
(mm Hg)
Resolución del Ejercicio
 xy   n
x y
Aplicamos la formula: r 
( x)  
.  y  
 2
( y) 2

  x2  2 
 n  n 
  

xi yi xi·yi xi2 yi2


72 115 8280 5184 13225
76 121 9196 5776 14641
78 125 9750 6084 15625
81 130 10530 6561 16900
89 141 12549 7921 19881
95 150 14250 9025 22500
108 165 17820 11664 27225
115 170 19550 13225 28900
120 177 21240 14400 31329
130 178 23140 16900 31684
964 1472 146305 96740 221910
Resolución del Ejercicio
Interpretación:
Como r=0,986 (muy cercano a 1), existe una alta correlación positiva entre el
peso y la tensión sistólica.

Estudio de hipertensión
200
Tensión sistólica (mm Hg)

180
160
140
120
100
80
60
65 75 85 95 105 115 125 135
Peso (kg)
Coeficiente de Determinación
Mide el porcentaje de variabilidad en Y que puede explicarse a través del conocimiento de la
variable X. Se calcula con la siguiente fórmula:
2
2
  ( x  x )( y  y ) 2
R   r
 i x 2
 nx 2
  i
y 2
 ny 2

Caracteristicas:
1.- Es un valor no negativo, ya que se encuentra entre 0 y 1. 0
2.- Es un valor muy importante en cualquier análisis de regresión, ya que muestra el grado
hasta el cual están relacionados las variables de X e Y

Ejemplo: Del ejemplo anterior entre el peso y la tensión sistólica.


r = 0,986, tenemos que = (0,986)² = 0,972
Interpretacion: El 97,2% de la tensión sistólica (Y) son explicados por el peso del paciente
Ph.D. Walther CASIMIRO URCOS – 988509552 – wacaur06@yaho.com

También podría gustarte