Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Correlación
1
Introducción
Muchas veces las decisiones se basan en la relación entre dos o más
variables.
Ejemplos
2
Relación funcional entre dos variables
250
Rendimiento
200
150
Rend.
100
50
0
0 20 40 60 80 1 00 1 20 140
Dosis
1 60
Horas hombre 1 40
1 20
1 00
80
60
Horas hombre
40
20
0
0 10 20 30 40 50 60 70 80 90
variación aleatoria
Análisis de correlación
El término “correlación” literalmente significa relación mutua; de este
modo, el análisis de correlación mide e indica el grado en el que los valores
de una variable se relacionan con los valores de otra.
7
Variable dependiente: es la variable que se
desea predecir o estimar
8
TABLA DE CONTINGENCIA
Es una herramienta utilizada en la rama de la
estadística, la cual consiste en crear al menos dos filas
y dos columnas para representar datos categóricos en
términos de conteos de frecuencia.
Esta herramienta, que también se conoce como tabla
cruzada o como tabla de dos vías, tiene el objetivo de
representar en un resumen, la relación entre diferentes
variables categóricas.
9
GRÁFICO DE
DISPERSIÓN
Diagrama de Dispersión: Es un gráfico que muestra la
intensidad y el sentido de la relación entre dos variables
de interés.
10
ANÁLISIS DE CORRELACIÓN
El análisis de correlación es un grupo de técnicas
estadísticas usadas para medir la fuerza de la asociación
entre dos variables.
Un diagrama de dispersión es una gráfica que representa
la relación entre dos variables.
La variable dependiente es la variable que se predice o
calcula.
La variable independiente proporciona las bases para el
cálculo. Es la variable de predicción.
EL COEFICIENTE DE CORRELACIÓN, “R”
El coeficiente de correlación (r) es una medida de la intensidad de la
relación lineal entre dos variables.
0 1 2 3 4 5 6 7 8 9 10 14
X
Correlación Positiva Perfecta
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 15
X
Ausencia de Correlación
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 16
X
Correlación Fuerte y Positiva
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 17
X
FÓRMULA PARA EL COEFICENTE DE
CORRELACIÓN (R) PEARSON
n(ΣXY ) - ( ΣX )( ΣY )
r
n(ΣX 2
) - (ΣX ) * n ΣY - ΣY
2 2 2
18
EJEMPLO 1
Luis Arce, presidente de la sociedad de alumnos de la Universidad Mundial,
se ocupa de estudiar el costo de manuales de texto.
Él cree que hay una relación entre el número de páginas en el texto y el precio
de venta del manual.
Para proporcionar una prueba, selecciona una muestra de ocho manuales de
texto actualmente en venta en la librería.
Dibuje un diagrama de dispersión.
100
90
Price ($)
80
70
60
400 500 600 700 800
Page
EJEMPLO 1 (CONTINUACIÓN)
Manual Páginas Precio ($)
X Y XY X2 Y2
Intr. a la Nutrición 500 84 42,000 250,000 7,056
Bioquímica 700 75 52,500 490,000 5,625
Intr. a la Psicología 800 99 79,200 640,000 9,801
Cálculo Dietético 600 72 43,200 360,000 5,184
Microbiología 400 69 27,600 160,000 4,761
Nutrición Geriátrica 500 81 40,500 250,000 6,561
Nutrición Infantil 600 63 37,800 360,000 3,969
Met. Investigación 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606
EJEMPLO 1 (CONTINUACIÓN)
0.614
EJEMPLO 1 (CONTINUACIÓN)
La correlación entre el número de páginas y el precio de
venta del libro es 0.614.
El signo positivo indica que hay una relación directa entre el
precio de los libros y el numero de paginas por libro.
El valor de 0.614 está alejada de 1.00, por lo que se concluye
que la relación es moderada entre las variables.
EJEMPLO
El profesor de Bioestadística obtiene una serie de datos,
tanto promedio de alumnos y momento de entrega de
examen
Él quiere saber si hay relación entre la entrega de
examen, con el promedio de las calificaciones de las
exposiciones.
Dibuje un diagrama de dispersión.
25
Estudiante Lugar Promedio
Mendoza 1 9,75
Ramirez 2 9,75
Arce 3 9,8
Castro R 4 9,58333333
Gonzalez 5 9,41111111
Baltazar 6 9,4
Castro O 7 9,37777778
Cortez 8 9,55
Orozco 9 9,25
Peralta Y 10 9,16666667
Sandoval 11 9,41666667
Peralta V 12 9,33333333
De Alba 13 8,52777778
Ramírez J 14 9,21666667
Agundez 15 8,96666667
Flores 16 8,52777778
Ramírez 17 8,42777778
Frias 18 8,36111111
Pérez 19 8,16666667
26
GRAFICA DE DISPERSIÓN
Exposiciones
10
9.8
9.6
9.4
9.2
promedios
9 Series1
8.8
8.6
8.4
8.2
8
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
lugares
27
X Y XY X2 Y2
Arreola 1 9,75 9,75 1 95,0625
German 2 9,75 19,5 4 95,0625
Pacheco 3 9,8 29,4 9 96,04
Meza 4 9,583 38,3333333 16 91,8402778
Pinto 5 9,411 47,0555556 25 88,5690123
Lopez 6 9,4 56,4 36 88,36
Garcia 7 9,378 65,6444444 49 87,942716
Rodriguez 8 9,55 76,4 64 91,2025
Pavon 9 9,25 83,25 81 85,5625
Moreno 10 9,167 91,6666667 100 84,0277778
Mariche 11 9,417 103,583333 121 88,6736111
Alvarez 12 9,333 112 144 87,1111111
De Alba 13 8,528 110,861111 169 72,7229938
Herrera 14 9,217 129,033333 196 84,9469444
Peñaloza 15 8,967 134,5 225 80,4011111
Flores 16 8,528 136,444444 256 72,7229938
Fiol 17 8,428 143,272222 289 71,0274383
Fuerte 18 8,361 150,5 324 69,908179
Aja 19 8,167 155,166667 361 66,6944444 28
Total 190 174 1692,76111 2470 1597,87861
FÓRMULA PARA EL COEFICENTE DE
CORRELACIÓN (R) PEARSON
n(ΣXY ) - ( ΣX )( ΣY )
r
n(ΣX 2
) - (ΣX ) * n ΣY - ΣY
2 2 2
29
19(1692,76) - (190)(174)
r
19(2470) - (190) * 191597,87- 174
2 2
r = -0,90846611
30
EJEMPLO 1 (CONTINUACIÓN)
La correlación entre los lugares y los promedios de
estudiantes es -0,90846611
El signo negativo indica que hay una relación directa entre el
precio de los libros y el numero de paginas por libro.
El valor de -0,90846611 está cercano a de -1.00, por lo que se
concluye que la relación es fuerte entre las variables.
Correlación negativa intensa