Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mg.
@ucvvirtual.edu.pe
ANALISIS DE CORRELACIÓN
CAPACIDADES:
Analiza el coeficiente de correlación de
Pearson para dos variables
cuantitativas y los coeficientes para el
modelo de regresión lineal simple.
TEMÁTICA:
⮚ Aplicaciones con el diagrama de
dispersión.
⮚ Coeficiente de correlación lineal de
Pearson.
⮚ Modelo de regresión lineal simple
(Uso de EXCEL).
Diagrama de Dispersión
Es la representación de los puntos o datos de cada una de
las variables en el plano cartesiano.
Altura Peso en
en cm. Kg. Pesa 85
187 76 kg.
Pesa 76
161 50
kg.
197 85
179 65
Pesa 50
Mide 197
Mide 187
171 66
kg.
169 60
cm.
Mide
cm.
166 54 161 cm.
176 84
163 68
…. ….
4
Relación entre las variables altura (X) y peso (Y) de los
30 individuos vistos en el ejemplo anterior.
5
DIAGRAMA DE DISPERSION
O NUBE DE PUNTOS
Y • Y Y
• •• • • • ••
•• •
•• • •• • • •
• •• • • • • ••
• ••
•• •• •• • • •
•••
• ••
X X X
(d) Curvilínea inversa (e) Lineal inversa (d) Ninguna relación
con más dispersión
COEFICIENTE DE CORRELACIÓN (ρ)
X Y XY X2 Y2
∑
Correlación Lineal -
Tendencias
Muy Alt Modera Baj Muy Muy Baj Modera Alt Muy
Alta a da a baja baja a da a Alta
- -- - -- - -- - -- - -- 0 + 0. + 0. + 0. + 0. + 1
1 Perfecta0.8 0.6 0.4 0.2 Nul 2 4 6 8 Perfecta
-- a +
62 39 90
25 80
Capacidad de atención
80
33 42 70
23 84 60
79 19 50
40
11 75
30
48 25
20
50 20
10
30 54 0
78 19 0 10 20 30 40 50 60 70 80 90
7 84 Estrés
Coeficiente de Correlación de
Pearson «R»
Ejemplo 1:
Capaci
Estrés dad de
(x) atenció
n (Y) XY X2 Y2
62 39 2418 3844 1521
25 80 2000 625 6400
33 42 1386 1089 1764
23 84 1932 529 7056
79 19 1501 6241 361
11 75 825 121 5625
48 25 1200 2304 625
50 20 1000 2500 400
30 54 1620 900 2916
78 19 1482 6084 361 Existe una relación inversa y muy alta
7 84 588 49 7056 entre El estrés (X) y la capacidad de
∑ 446 541 15952 24286 34085 atención (Y).
Ejemplo 2: (en Excel)
Calcule e interprete la
correlación.
Aplicación de la correlación
https://www.xatakaciencia.com/sabias-que/no-simple-que-ano-
humano-equivalga-a-siete-perrunos-este-estudio
La ciencia consiguió
establecer la verdadera
equivalencia entre años
humanos y caninos. Aunque
pueden haber diferencias
entre razas (en este caso se
usaron perros labradores),
"todos los perros exhiben una
trayectoria de desarrollo,
fisiológica y patológica
similar".
Esta es la fórmula: Edad
humana= 16*ln(edad
canina)+31
Dinámica
• ¿Se podrá determinar la estatura de una persona si se
conoce la medida de la extensión de su brazo?.
• ¿Existirá la relación entre dichas variables?
Caracteriza la relación entre una var. dependiente (Y) y una variable independiente (X). Es decir,
estudia cómo los cambios en una variable X afecta a una variable dependiente Y.
El propósito de la regresión lineal, es modelar la
dependencia de la variable Y en función de la variable X a
Y
través de la ecuación de una recta.
Variable Variable b=
dependiente independiente a pendiente
Intercepto Pendiente
MODELO DE REGRESIÓN LINEAL SIMPLE
La relación entre 2 variables numéricas puede ser representada mediante la línea de mejor
ajuste a los datos llamada recta de regresión
Se busca encontrar una función de X muy simple (lineal) que nos permita aproximar Y
mediante la siguiente formula:
Y
Dependientes
X
Independientes
Explicativas
MODELO DE REGRESIÓN LINEAL SIMPLE
Diagrama de Dispersión
Extensión Estatura
185
de brazos. en cm.
72 cm 172 180
69 cm 161
70 180 175
71 175
170
70 169
Estatura (cm)
75 172 165
70 162
68 163 160
65 150
155 Y = 8.9623 +
68 166
2.264x
150 R2 = 0.4985
La recta de regresión nos 145
describe cómo varía la media de 64 66 68 70 72 74 76
una variable (dependiente) en Extensión de los brazos (cm)
función de la otra (independiente)
Recta de Regresión
Para estimar la recta de regresión se aplica el método de mínimos
cuadrados. Esta línea es la que hace mínima la suma de los cuadrados de
los residuos 🡪🡪 ∑e2 = ∑(Yreal – Yest)2.
Pendiente
yi
Intercept
o
a
El método de Mínimos
Cuadrados
Alumno Extensión de Estatura
X2 Y2 XY
(n) brazos cm (X) cm. (Y)
1 72 172 5184 29584 12384
2 69 161 4761 25921 11109
3 70 180 4900 32400 12600
4 71 175 5041 30625 12425
5 70 169 4900 28561 11830
6 75 172 5625 29584 12900
7 70 162 4900 26244 11340
8 68 163 4624 26569 11084
9 65 150 4225 22500 9750
10 68 166 4624 27556 11288 La ecuación de la recta
es
SUMA 698 1670 48784 279544 116710
PROMEDIO 69.8 167
El Coeficiente correlación de
Pearson (r)
Extensión de
Alumno Estatura
brazos cm.
(n) cm. (Y)
(X)
1 72 172
2 69 161
3 70 180
4 71 175
5 70 169
6 75 172
7 70 162
=COEF.DE.CORREL(Matriz1,
8 68 163 Matriz2)
9 65 150
10 68 166
=COEF.DE.CORREL(B4:B13,
C4:C13)
r = 0.70606
Que tan bueno es el modelo?
r2 = Proporción de la variación total en la variable y, que es
explicada por la variación en la variable independiente x.
IMPORTANTE
• Si bien hay relación entre R2 y r, cada uno tiene una finalidad diferente:
• El coef. de correlación lineal (r) mide el grado de relación entre dos variables
• El coef. de determinación (R2) Nos indica que porcentaje de los datos es explicado por
el modelo. Cuanto más cerca a uno, las variables tendrán mayor correlación.
*
Variación no
Explicada
Variación Y’
Total
* Variación
Explicada
Error Estándar y Error de Estimación
Cuando se realiza una predicción, es importante determinar
el error estándar, el cual se representa por Sy.x y mide la
dispersión de los datos observados con respecto a la línea
de regresión.
Error de
predicción
El error de estimación,
que esta representado: e=y–y
EJEMPLO:
En un estudio de la relación entre la publicidad por radio y las ventas
de un producto, durante 10 semanas se han recopilado, los tiempos de
duración en minutos de la publicidad por semana (X), y el número de
artículos vendidos (Y).
Semana 1 2 3 4 5 6 7 8 9 10
Publicidad en 20 30 30 40 50 60 60 60 70 80
minutos X
Ventas Y 50 73 69 87 108 128 135 132 148 170
Interpretación
B0: El Número real de artículos vendidos es de 10 unidades.
B1: El número promedio de artículos vendidos aumenta en 2 unidades a medida que aumenta
cada minuto de duración, de la publicidad en la semana.
Regresión Lineal Simple
Ejemplo
- :
Tomando los datos del
ejemplo de la ausencia al
trabajo y la edad del empleado
:
- Obtenga la ecuación de
regresión.
- Interprete el valor de la
pendiente.
- Si un trabajador tiene 38
años, ¿cuántos días se
espera que falte al año?
Regresión Lineal Simple
Ejemplo
- : calcular el valor de los Coeficientes de la Ecuación:
Para
Las sumatorias:
Pendiente: Intercepto en el
origen:
Regresión Lineal Simple
Ejemplo
- :La Ecuación:
- Interpretación de la Pendiente:
Interpretación
de
Por cada centímetro adicional en el
DAP (X), la Altura del árbol (Y)
aumentará en 1,281028 metros.
Ejercicio 1 (Resuelto Excel)
98
96
94
Carga Útil (y)
92
Carga Útil (y)
Pronóstico Carga Útil (y)
90
88
86
84
0 10 20 30 40 50 60 70
Distancia Recorrida (x)
Ejercicio:
A continuación tenemos las estaturas en centímetros
(muestra x) y el peso en kilogramos (y) de niños de 6 años.
Niño 1 2 3 4 5 6 7 8 9 10
Estatura
121 123 108 118 111 109 114 103 110 115
(cm) x
Peso (kg) y 25 22 19 24 19 18 20 15 20 21
Reflexión del tema
Tiempo de 3 3 3 4 4 5 5 5 6 6 7 8
estudio
Calificación 9 12 11 12 15 14 16 15 18 16 15 17
Accidentes xi 5 7 5 3 2 1 9
Vehículos yi 15 18 13 11 10 8 20
Donde di = Xi - Yi
REFERENCIAS