Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Correlación
1
Introducción
Muchas veces las decisiones se basan en la relación entre dos o más
variables.
Ejemplos
La relación entre la radiación que reciben los sensores con la que se
predicen los rendimientos por parcelas con los rendimientos reales
observados en dichas parcelas.
3 130 260
Figura 1
Relación funcional perfecta entre dosis y
rendimientos
300
250
Rendimiento
200
150
Rend.
100
50
0
0 20 40 60 80 100 120 140
Dosis
1 60
Horas hombre
1 40
1 20
1 00
80
Horas hombre
60
40
20
0
0 10 20 30 40 50 60 70 80 90
variación aleatoria
Análisis de correlación
El término “correlación” literalmente significa relación mutua; de este
modo, el análisis de correlación mide e indica el grado en el que los valores
de una variable se relacionan con los valores de otra.
7
Variable dependiente (respuesta, predicha,
endógena): es la variable que se desea
predecir o estimar
8
ANÁLISIS DE CORRELACIÓN
El análisis de correlación es un grupo de técnicas
estadísticas usadas para medir la fuerza de la asociación
entre dos variables.
Un diagrama de dispersión es una gráfica que representa
la relación entre dos variables.
La variable dependiente es la variable que se predice o
calcula.
La variable independiente proporciona las bases para el
cálculo. Es la variable de predicción.
GRÁFICO DE
DISPERSIÓN
Diagrama de Dispersión: Es un gráfico que muestra la
intensidad y el sentido de la relación entre dos variables
de interés.
10
EL COEFICIENTE DE CORRELACIÓN, “R”
El coeficiente de correlación (r) es una medida de la intensidad de la
relación lineal entre dos variables.
0 1 2 3 4 5 6 7 8 9 10 13
X
Correlación Positiva Perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 14
X
Ausencia de Correlación
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 15
X
Correlación Fuerte y Positiva
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 16
X
FÓRMULA PARA EL COEFICENTE DE
CORRELACIÓN (R) PEARSON
n(ΣXY ) - ( ΣX )( ΣY )
r
n(ΣX 2 2
) - (ΣX ) * n ΣY 2
- ΣY
2
17
EJEMPLO 1
Luis Arce, presidente de la sociedad de alumnos de la Universidad
Mundial, se ocupa de estudiar el costo de los libros de texto.
Él cree que hay una relación entre el número de páginas en el texto
y el precio de venta del libro.
Para proporcionar una prueba, selecciona una muestra de ocho
libros de texto actualmente en venta en la librería.
Dibuje un diagrama de dispersión.
100
90
Price ($)
80
70
60
400 500 600 700 800
Page
EJEMPLO 1 (CONTINUACIÓN)
Libro Páginas Precio ($)
X Y XY X2 Y2
Intr. a la Nutrición 500 84 42,000 250,000 7,056
Bioquímica 700 75 52,500 490,000 5,625
Intr. a la Psicología 800 99 79,200 640,000 9,801
Cálculo Dietético 600 72 43,200 360,000 5,184
Microbiología 400 69 27,600 160,000 4,761
Nutrición Geriátrica 500 81 40,500 250,000 6,561
Nutrición Infantil 600 63 37,800 360,000 3,969
Met. Investigación 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606
EJEMPLO 1 (CONTINUACIÓN)
0.614
EJEMPLO 1 (CONTINUACIÓN)
La correlación entre el número de páginas y el precio de
venta del libro es 0.614.
El signo positivo indica que hay una relación directa entre el
precio de los libros y el numero de paginas por libro.
El valor de 0.614 está alejada de 1.00, por lo que se concluye
que la relación es moderada entre las variables.
EJEMPLO
El profesor de Bioestadística obtiene una serie de datos,
tanto promedio de alumnos y momento de entrega de
examen
Él quiere saber si hay relación entre la entrega de
examen, con el promedio de las calificaciones de las
exposiciones.
Dibuje un diagrama de dispersión.
24
Estudiante Lugar Promedio
Mendoza 1 9,75
Ramirez 2 9,75
Arce 3 9,8
Castro R 4 9,58333333
Gonzalez 5 9,41111111
Baltazar 6 9,4
Castro O 7 9,37777778
Cortez 8 9,55
Orozco 9 9,25
Peralta Y 10 9,16666667
Sandoval 11 9,41666667
Peralta V 12 9,33333333
De Alba 13 8,52777778
Ramírez J 14 9,21666667
Agundez 15 8,96666667
Flores 16 8,52777778
Ramírez 17 8,42777778
Frias 18 8,36111111
Pérez 19 8,16666667
25
GRAFICA DE DISPERSIÓN
Exposiciones
10
9.8
9.6
9.4
9.2
promedios
8.8
8.6
8.4
8.2
8
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
lugares
26
X Y XY X2 Y2
Arreola 1 9,75 9,75 1 95,0625
German 2 9,75 19,5 4 95,0625
Pacheco 3 9,8 29,4 9 96,04
Meza 4 9,583 38,3333333 16 91,8402778
Pinto 5 9,411 47,0555556 25 88,5690123
Lopez 6 9,4 56,4 36 88,36
Garcia 7 9,378 65,6444444 49 87,942716
Rodriguez 8 9,55 76,4 64 91,2025
Pavon 9 9,25 83,25 81 85,5625
Moreno 10 9,167 91,6666667 100 84,0277778
Mariche 11 9,417 103,583333 121 88,6736111
Alvarez 12 9,333 112 144 87,1111111
De Alba 13 8,528 110,861111 169 72,7229938
Herrera 14 9,217 129,033333 196 84,9469444
Peñaloza 15 8,967 134,5 225 80,4011111
Flores 16 8,528 136,444444 256 72,7229938
Fiol 17 8,428 143,272222 289 71,0274383
Fuerte 18 8,361 150,5 324 69,908179
Aja 19 8,167 155,166667 361 66,6944444 27
Total 190 174 1692,76111 2470 1597,87861
FÓRMULA PARA EL COEFICENTE DE
CORRELACIÓN (R) PEARSON
n(ΣXY ) - ( ΣX )( ΣY )
r
n(ΣX 2 2
) - (ΣX ) * n ΣY 2
- ΣY
2
28
19(1692,76) - (190)(174)
r
19(2470) - (190) * 191597,87 - 174
2 2
r = -0,90846611
29
EJEMPLO 1 (CONTINUACIÓN)
La correlación entre los lugares y los promedios de
estudiantes es -0,90846611
El signo negativo indica que hay una relación directa entre el
precio de los libros y el numero de paginas por libro.
El valor de -0,90846611 está cercano a de -1.00, por lo que se
concluye que la relación es fuerte entre las variables.
Correlación negativa intensa