Está en la página 1de 21

ANÁLISIS DE

CORRELACIÓN DE PEARSON

BIOESTÁDISTICA
INTRODUCCIÓN
• Muchas veces las decisiones se basan en la relación entre dos o más
variables.
• Muchas veces en Estadística necesitamos saber si existe una relación entre
datos apareados y tratamos de buscar una posible relación entre variables.
• Podemos decir que hay una correlación entre dos variables “si cuando una
de ellas se relaciona con la otra de alguna manera”
Relación funcional entre dos variables
 Una relación funcional se expresa mediante una función matemática.
Si X es la variable independiente ,Y es la variable dependiente, entonces una relación
funcional tiene la forma: Y=f(X)
Ejemplo: dosis de fertilizante en cultivos.
Parcela Dosis Rend.(kg/h)
1 75 150
2 25 50 Relación funcional perfecta entre dosis y
3 130 260 rendimientos
300

250

Rendimiento
200

150
Rend.
100

50

0
0 20 40 60 80 100 120 140

Dosis
3
CONCEPTOS
• Análisis de correlación
– Conjunto de técnicas estadísticas empleado para medir la intensidad de la
asociación entre dos variables
– El término “correlación” literalmente significa relación mutua; de este
modo, el análisis de correlación mide e indica el grado en el que los
valores de una variable se relacionan con los valores de otra.
• El propósito del análisis de correlación, es determinar el grado o fuerza de asociación de las
variables analizadas. Esta fuerza puede ser inversa (negativa) o directamente proporcional
(positiva).
DIAGRAMA DE DISPERSIÓN
• Es una gráfica que representa la relación entre dos variables.
• Los datos muestrales apareados (x,y) se grafican en un eje
horizontal (x) y un eje vertical (y). Cada par individual (x, y) se
grafica como un solo punto.
• Podemos encontrar tres tipos de relación entre las variables
– Positiva
– Negativa Chart Title
120
– Sin relación
estudiante Examen 1 Examen 2 100

1 60 60
80
2 75 100
3 70 80 60

4 72 68
40
5 54 73
6 83 97 20

7 80 85
0
8 65 90 50 55 60 65 70 75 80 85
GRÁ FICA DE CORRELACI Ó N

• La gráfica para observar posible correlación entre las variables X y Y, se denomina: Gráfica de
dispersión o Nube de puntos.
• Esta se elabora mediante los pares coordenadas (X,Y).
• En la gráfica se mostrarán los puntos X,Y de la muestra analizada. Si son 10 pares X,Y,
entonces habrán 10 puntos en la gráfica.

Entre más alineados se encuentren los puntos, mayor será la


correlación.
EL COEFICIENTE DE CORRELACIÓN, “ R”
El coeficiente de correlación (r) es una medida de la intensidad de la relación lineal entre dos
variables.
• Puede tomar cualquier valor de -1.00 a 1.00
• Los valores de -1.00 o 1.00 indican la correlación perfecta y fuerte.
• Los valores cerca de 0.0 indican la correlación débil.
• Los valores negativos indican una relación inversa y los valores positivos indican una relación
directa.
• Su intensidad, ésta indica qué tan cerca están de la “recta” los puntos que en el diagrama de
dispersión resultan de graficar los valores de las dos variables analizadas.
FÓRMULA PARA EL COEFICENTE DE
CORRELACIÓN (R) PEARSON • ∑X Es la suma de todos los
valores de x
n(ΣXY ) - ( ΣX )( ΣY ) • ∑X2 indica que cada valor de
r
n(ΣX ) - (ΣX )  * n ΣY  -  ΣY  
x debe elevarse al cuadrado
2 2 2 2
y después dichos cuadrados
se suman
• ∑(X)2 indica que los
valores de x deben sumarse y
el total elevarse al cuadrado
• ∑XY indica que cada valor
de x debe multiplicarse por
su correspondiente de y
después hacer la suma de
todos los productos.

10
EJEMPLO
• Sayda Santini, presidenta de la sociedad de alumnos de la Universidad Mundial, se ocupa de
estudiar el costo de los libros de texto. Ella cree que hay una relación entre el número de páginas
en el texto y el precio de venta del libro. Para proporcionar una prueba, selecciona una muestra
de ocho libros de texto actualmente en venta en la librería.
Libro Páginas Precio ($)
• Intr. a la Nutrición 500 84
• Bioquímica 700 75
• Intr.a la Psicología 800 99
• Cálculo Dietético 600 72
• Microbiología 400 69
• Nutrición Geriátrica 500 81
• Nutrición Infantil 600 63
• Met. Investigación 800 93

Dibuje un diagrama de dispersión.


Libro Páginas Precio ($)
• Intr. a la Nutrición 500 84
• Bioquímica 700 75
• Intr.a la Psicología 800 99
• Cálculo Dietético 600 72
• Microbiología 400 69
• Nutrición Geriátrica 500 81
• Nutrición Infantil 600 63
• Met. Investigación 800 93 Scatter Diagram of Number of Pages and Selling Price of Text

100

90
Price ($)
Precio
80
Compruebe el coeficiente de correlación.
70

60
400 500 600 700 800
Page
Páginas
Libro Páginas Precio ($)
X Y XY X2 Y2
Intr. a la Nutrición 500 84 42,000 250,000 7,056
Bioquímica 700 75 52,500 490,000 5,625
Intr. a la Psicología 800 99 79,200 640,000 9,801
Cálculo Dietético 600 72 43,200 360,000 5,184
Microbiología 400 69 27,600 160,000 4,761
Nutrición Geriátrica 500 81 40,500 250,000 6,561
Nutrición Infantil 600 63 37,800 360,000 3,969
Met. Investigación 800 93 74,400 640,000 8,649
Total 4,900 636 397,200 3,150,000 51,606
n(XY )  (X )(Y )
r
 n ( X 2
  
)  ( X ) * n  Y    Y 
2 2 2

8(397,200)  (4,900)(636)

8(3,150,000  (4,900)  * 8(51,606)  (636) 
2 2

 0.614
• La correlación entre el número de páginas y el precio de venta del libro
es 0.614.
• El signo positivo indica que hay una relación directa entre el precio de
los libros y el numero de paginas por libro.
• El valor de 0.614 está alejada de 1.00, por lo que se concluye que la relación
es moderada entre las variables.
PROBLEMA
• El profesor de Bioestadística obtiene una serie de datos, tanto promedio de alumnos y momento de
entrega de examen
• Él quiere saber si hay relación entre la entrega de examen, con el promedio de las calificaciones de
las exposiciones.
• Dibuje un diagrama de dispersión.
• Compruebe el coeficiente de correlación.

16
Estudiante Lugar Promedio
Lucero 1 9,75
Leon 2 9,75
Reyes 3 9,8
Rojas 4 9,58333333
Ramirez 5 9,41111111
Cota 6 9,4
Gonzalez
Cortez
7
8
9,37777778
9,55 GRAFICA DE DISPERSIÓN
Guzman 9 9,25
Lopez 10 9,16666667
Magallon 11 9,41666667
Mendoza 12 9,33333333
ALUMNOS
Miramontes 13 8,52777778
Reyes 14 9,21666667 10
Santini 15 8,96666667 9.8
Sol 16 8,52777778 9.6
Rodriguez 17 8,42777778
9.4
Verdugo 18 8,36111111
Zamudio 19 8,16666667 9.2
promedios
9

8.8

8.6

8.4

8.2

8
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

lugares

17
X Y XY X2 Y2
Lucero 1 9,75 9,75 1 95,0625
Leon 2 9,75 19,5 4 95,0625
Reyes 3 9,8 29,4 9 96,04
Rojas 4 9,583 38,3333333 16 91,8402778
Ramirez 5 9,411 47,0555556 25 88,5690123
Cota 6 9,4 56,4 36 88,36
Gonzalez 7 9,378 65,6444444 49 87,942716
Cortez 8 9,55 76,4 64 91,2025
Guzman 9 9,25 83,25 81 85,5625
Lopez 10 9,167 91,6666667 100 84,0277778
Magallon 11 9,417 103,583333 121 88,6736111
Mendoza 12 9,333 112 144 87,1111111
Miramontes 13 8,528 110,861111 169 72,7229938
Reyes 14 9,217 129,033333 196 84,9469444
Santini 15 8,967 134,5 225 80,4011111
Sol 16 8,528 136,444444 256 72,7229938
Rodriguez 17 8,428 143,272222 289 71,0274383
Verdugo 18 8,361 150,5 324 69,908179
Zamudio 19 8,167 155,166667 361 66,6944444
Total 190 174 1692,76111 2470 1597,87861

18
n(ΣXY ) - ( ΣX )( ΣY )
r
n(ΣX 2
 
) - (ΣX ) * n ΣY -  ΣY 
2 2
 2

19(1692,76) - (190)(174)
r
19(2470) - (190)  * 191597,87 - 174 
2 2

r = -0,90846611
• La correlación entre los lugares y los promedios de estudiantes es -0,90846611
• El signo negativo indica que hay una relación directa entre los lugares y los promedios
• El valor de -0,90846611 está cercano a de -1.00, por lo que se concluye que la relación es fuerte
entre las variables.
• Correlación negativa intensa
PROBLEMA
• Una estudiante del posgrado en psicología del desarrollo tiene la impresión de que puede
existir una relación entre el peso de los individuos al nacer y su futuro CI. Para ello toma una
muestra de siete estudiantes de la universidad y los somete a una prueba de CI. A continuación
investiga cuál fue el peso de los siete estudiantes al nacer.
estudiante Peso al nacer CI Elabore un diagrama de dispersión de los datos,
(libras) empleando el peso al nacer como la variable
independiente (X)
1 5.8 122 Calcule el valor de la r de Pearson
2 6.5 120 Cuáles son sus conclusiones
3 8.0 129
4 5.9 112
5 8.5 127
6 7.2 116
7 9.0 130

También podría gustarte