Está en la página 1de 31

Análisis de

Correlación

1
Introducción
Muchas veces las decisiones se basan en la relación entre dos o más
variables.
Ejemplos

El daño pulmonar y el consumo de tabaco.

El número de palabras que incluye el vocabulario de un niño en relación


con su edad.

Las ventas de productos y la inversión que se realizó para su publicidad.

Distinguiremos entre relaciones funcionales y relaciones estadísticas

2
Relación funcional entre dos variables

 Una relación funcional se expresa mediante una


función matemática.
Si X es la variable independiente ,Y es la variable
dependiente, entonces una relación funcional tiene la
forma:
Y=f(X)
Ejemplo: dosis de fertilizante en cultivos.
Parcela Dosis Rend.(kg/h)
1 75 150
3
2 25 50
3 130 260
Figura 1
Relación funcional perfecta entre dosis y
rendimientos
300

250
Rendimiento

200

150
Rend.
100

50

0
0 20 40 60 80 1 00 1 20 140

Dosis

Nota: Las observaciones caen exactamente sobre la línea de 4


relación funcional
Relación estadística entre dos
variables
A diferencia de la relación funcional, no es una
relación perfecta, las observaciones no caen
exactamente sobre la curva de relación entre las
variables
Ejemplo 2
Lote de prod. Tamaño del lote Horas hombre
1 30 73
2 20 50
3 60 128
4 80 170
5 40 87 5
FIGURA 2
Relación estadística entre tamaño del lote y
horas hombre
1 80

1 60

Horas hombre 1 40

1 20

1 00

80

60

Horas hombre
40

20

0
0 10 20 30 40 50 60 70 80 90

Tamaño del lote

Nota: La mayor parte de los punto no caen directamente sobre


la línea de relación estadística.
Esta dispersión de punto alrededor de la línea representa la 6

variación aleatoria
Análisis de correlación
 El término “correlación” literalmente significa relación mutua; de este
modo, el análisis de correlación mide e indica el grado en el que los valores
de una variable se relacionan con los valores de otra.

 El análisis que se ocupa de medir la relación entre una sola variable


independiente y la variable dependiente se llama análisis de correlación simple.
 El resultado de un análisis de este tipo es un coeficiente de correlación, valor
que cuantifica el grado de correlación.

7
Variable dependiente: es la variable que se
desea predecir o estimar

Variables independientes :Son las variables


que proveen las bases para estimar

8
TABLA DE CONTINGENCIA
 Es una herramienta utilizada en la rama de la
estadística, la cual consiste en crear al menos dos filas
y dos columnas para representar datos categóricos en
términos de conteos de frecuencia. 
 Esta herramienta, que también se conoce como tabla
cruzada o como tabla de dos vías, tiene el objetivo de
representar en un resumen, la relación entre diferentes
variables categóricas. 

9
GRÁFICO DE
DISPERSIÓN
Diagrama de Dispersión: Es un gráfico que muestra la
intensidad y el sentido de la relación entre dos variables
de interés.

Los diagramas de dispersión no sólo muestran la relación existente entre


variables, sino también resaltan las observaciones individuales que se
desvían de la relación general.

Estas observaciones son conocidas como outliers o valores atipicos, que


son puntos de los datos que aparecen separados del resto.

10
ANÁLISIS DE CORRELACIÓN
 El análisis de correlación es un grupo de técnicas
estadísticas usadas para medir la fuerza de la asociación
entre dos variables.
 Un diagrama de dispersión es una gráfica que representa
la relación entre dos variables.
 La variable dependiente es la variable que se predice o
calcula.
 La variable independiente proporciona las bases para el
cálculo. Es la variable de predicción.
EL COEFICIENTE DE CORRELACIÓN, “R”
El coeficiente de correlación (r) es una medida de la intensidad de la
relación lineal entre dos variables.

 Puede tomar cualquier valor de -1.00 a 1.00

 Los valores de -1.00 o 1.00 indican la correlación perfecta y fuerte.

 Los valores cerca de 0.0 indican la correlación débil.

 Los valores negativos indican una relación inversa y los valores


positivos indican una relación directa.

 Su intensidad, ésta indica qué tan cerca están de la “recta” los


puntos que en el diagrama de dispersión resultan de graficar los
valores de las dos variables analizadas.
13
CORRELACIÓN NEGATIVA PERFECTA
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10 14
X
Correlación Positiva Perfecta
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10 15
X
Ausencia de Correlación
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10 16
X
Correlación Fuerte y Positiva
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10 17
X
FÓRMULA PARA EL COEFICENTE DE
CORRELACIÓN (R) PEARSON

n(ΣXY ) - ( ΣX )( ΣY )
r
n(ΣX 2
  
) - (ΣX ) * n ΣY - ΣY 
2 2 2

18
EJEMPLO 1
 Luis Arce, presidente de la sociedad de alumnos de la Universidad Mundial,
se ocupa de estudiar el costo de manuales de texto.
 Él cree que hay una relación entre el número de páginas en el texto y el precio
de venta del manual.
 Para proporcionar una prueba, selecciona una muestra de ocho manuales de
texto actualmente en venta en la librería.
 Dibuje un diagrama de dispersión.

 Compruebe el coeficiente de correlación.


EJEMPLO 1 (CONTINUACIÓN)
manual Páginas Precio ($)
 Intr. a la Nutrición 500 84
 Bioquímica 700 75
 Intr.a la Psicología800 99
 Cálculo Dietético 600 72
 Microbiología 400 69
 Nutrición Geriátrica 500 81
 Nutrición Infantil 600 63
 Met. Investigación 800 93
EJEMPLO 1 (CONTINUACIÓN)

Scatter Diagram of Number of Pages and Selling Price of Text

100

90
Price ($)

80

70

60
400 500 600 700 800
Page
EJEMPLO 1 (CONTINUACIÓN)
Manual Páginas Precio ($)
X Y XY X2 Y2
Intr. a la Nutrición 500 84 42,000 250,000 7,056
Bioquímica 700 75 52,500 490,000 5,625
Intr. a la Psicología 800 99 79,200 640,000 9,801
Cálculo Dietético 600 72 43,200 360,000 5,184
Microbiología 400 69 27,600 160,000 4,761
Nutrición Geriátrica 500 81 40,500 250,000 6,561
Nutrición Infantil 600 63 37,800 360,000 3,969
Met. Investigación 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606
EJEMPLO 1 (CONTINUACIÓN)

n(XY )  (X )(Y )


r
n(X 2 2
  
)  (X ) * n Y  Y 
2 2

8(397,200)  (4,900)(636)

8(3,150,000  (4,900) * 8(51,606)  (636) 
2 2

 0.614
EJEMPLO 1 (CONTINUACIÓN)
 La correlación entre el número de páginas y el precio de
venta del libro es 0.614.
 El signo positivo indica que hay una relación directa entre el
precio de los libros y el numero de paginas por libro.
 El valor de 0.614 está alejada de 1.00, por lo que se concluye
que la relación es moderada entre las variables.
EJEMPLO
 El profesor de Bioestadística obtiene una serie de datos,
tanto promedio de alumnos y momento de entrega de
examen
 Él quiere saber si hay relación entre la entrega de
examen, con el promedio de las calificaciones de las
exposiciones.
 Dibuje un diagrama de dispersión.

 Compruebe el coeficiente de correlación.

25
Estudiante Lugar Promedio
Mendoza 1 9,75
Ramirez 2 9,75
Arce 3 9,8
Castro R 4 9,58333333
Gonzalez 5 9,41111111
Baltazar 6 9,4
Castro O 7 9,37777778
Cortez 8 9,55
Orozco 9 9,25
Peralta Y 10 9,16666667
Sandoval 11 9,41666667
Peralta V 12 9,33333333
De Alba 13 8,52777778
Ramírez J 14 9,21666667
Agundez 15 8,96666667
Flores 16 8,52777778
Ramírez 17 8,42777778
Frias 18 8,36111111
Pérez 19 8,16666667

26
GRAFICA DE DISPERSIÓN
Exposiciones
10

9.8

9.6

9.4

9.2
promedios

9 Series1

8.8

8.6

8.4

8.2

8
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

lugares

27
X Y XY X2 Y2
Arreola 1 9,75 9,75 1 95,0625
German 2 9,75 19,5 4 95,0625
Pacheco 3 9,8 29,4 9 96,04
Meza 4 9,583 38,3333333 16 91,8402778
Pinto 5 9,411 47,0555556 25 88,5690123
Lopez 6 9,4 56,4 36 88,36
Garcia 7 9,378 65,6444444 49 87,942716
Rodriguez 8 9,55 76,4 64 91,2025
Pavon 9 9,25 83,25 81 85,5625
Moreno 10 9,167 91,6666667 100 84,0277778
Mariche 11 9,417 103,583333 121 88,6736111
Alvarez 12 9,333 112 144 87,1111111
De Alba 13 8,528 110,861111 169 72,7229938
Herrera 14 9,217 129,033333 196 84,9469444
Peñaloza 15 8,967 134,5 225 80,4011111
Flores 16 8,528 136,444444 256 72,7229938
Fiol 17 8,428 143,272222 289 71,0274383
Fuerte 18 8,361 150,5 324 69,908179
Aja 19 8,167 155,166667 361 66,6944444 28
Total 190 174 1692,76111 2470 1597,87861
FÓRMULA PARA EL COEFICENTE DE
CORRELACIÓN (R) PEARSON

n(ΣXY ) - ( ΣX )( ΣY )
r
n(ΣX 2
  
) - (ΣX ) * n ΣY - ΣY 
2 2 2

29
19(1692,76) - (190)(174)
r
19(2470) - (190) * 191597,87- 174 
2 2

r = -0,90846611

30
EJEMPLO 1 (CONTINUACIÓN)
 La correlación entre los lugares y los promedios de
estudiantes es -0,90846611
 El signo negativo indica que hay una relación directa entre el
precio de los libros y el numero de paginas por libro.
 El valor de -0,90846611 está cercano a de -1.00, por lo que se
concluye que la relación es fuerte entre las variables.
 Correlación negativa intensa

También podría gustarte