Está en la página 1de 24

Estadística Descriptiva

Correlación

“Todos los Derechos reservados. El presente presentación es un aporte a los propósitos


académicos, no persigue fines lucrativos. Se prohíbe su reproducción parcial o total.”
2

Correlación
Cuando dos conjuntos de datos parecen estar conectados, es decir, un
conjunto de datos depende del otro, entonces hay varios métodos que se
pueden usar para comprobar si hay o no alguna correlación,
Uno de estos métodos es el diagrama de dispersión.

Los datos se pueden representar en un diagrama de dispersión con la variable


independiente en el eje horizontal y la variable dependiente en el eje vertical.
El patrón de los puntos dará una imagen visual de cuán estrechamente están
relacionadas las variables, en caso de que sea así.
3

Tipos de correlación
En una correlación positiva , la variable dependiente crece a medida que crece
la variable independiente

Por ejemplo nivel del estado físico ( variable dependiente), cantidad de horas
de ejercicio (variable independiente)
4

En una correlación negativa , la variable dependiente decrece a medida que


crece la variable independiente

Por ejemplo tiempo en correr una carrera (min) ( variable dependiente),


Tiempo de entrenamiento (horas) (variable independiente)
Cuando los puntos están dispersos en forma aleatoria en el diagrama, no hay
correlación 5

Por ejemplo Cantidad de pares de zapatos( variable dependiente), y Edad


(variable independiente)
La correlación también se pueden describir como fuerte, moderada o débil 6
Ejemplo 1
7
El gerente de un parque de recreación pensó que la cantidad de visitantes al parque
dependía de la temperatura.
Anoto la temperatura y la cantidad de visitantes durante un periodo de dos semanas.
Situé estos puntos en un diagrama de distpesión y comente acerca del tipo de
correlación
300

280

260

240

220

16 17 19 21 22 23 24 25 26 29 31
Recta de ajuste optimo o línea de mejor ajuste 9

La recta de ajuste optimo es una recta que se dibuja en un diagrama de dispersión, de


manera que la cantidad de puntos que se encuentran por arriba de la recta es
aproximadamente la misma que la cantidad de los que se encuantran abajo.
Para dibujar la recta de ajuste óptimo por aproximación:
▫ Hallar la media de cada conjunto de datos y situé este punto en su diagrama de
dispersión.
▫ Dibujar una recta que pase por este punto y este cerca de todos los dempas
puntos. Debe quedar aproximandamente la misma cantidad de puntos arriba y
debajo de la recta.
Coeficiente de correlación momento-producto de Pearson
10

Es útil conocer la fuerza de la relación entre dos conjuntos de datos que se cree que se
están relacionados.
El coeficiente de correlación momento-producto de Pearson, r, es una forma de hallar
un valor numeérico que se puede usar para determinar la fuerza de una correlación
lineal entre dos conjuntos de datos.

El coeficiente de correlaciión momento-producto de Pearson, r, puede tomar cualquier


valor entre -1 y 1 inclusive.
• Cuando r=-1, hay una correlación negativa perfecta entre los dos conjuntos.
• Cuando r=0, no hay correlación.
• Cuando r=1, hay una correlación positiva perfecta entre los dos conjuntos de
datos,
• Una correlación perfecta es aquella en la que todos los puntos están situados
sobre una recta.
Coeficiente de correlación momento-producto de Pearson
11
Ejemplo 2 12

Los datos que se dan a continuación , relativos a la primera división de una liga de
fútbol, muestran la posición del eauipo y la cantidad de goles anotados.

a) Situé estos puntos en un diagrama de distpesión y comente acerca del tipo de


correlación
b) Halle la media de la posición y de los goles.
c) Situe el punto medio M en el diagrama y dibuje la recta de ajuste optimo.
d) Halle el coeficiente de correlación ,r, y comente acerca de este valor.
80

13
70

60

50

40

30

20

10

1 2 3 4 5 7 8 10 11 12 13 14 16 18 19 20
6 9 15 17
14
b) Hallar la media de la posición y de los goles
CON CALCULADORA

Menú 6 Enter
Luego al numero 2, ya que se van a calcular 2 variables
Introducimos los datos tanto de x como de y
OPTN
Y luego numero 3 (2-Variable calculada)


𝒙 = 𝟏𝟎. 𝟓

ഥ = 𝟒𝟗. 𝟔
𝒚

𝑴 = (𝟏𝟎. 𝟓, 𝟒𝟗. 𝟔)
15

80
70
60
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

15
16
b) Hallar el coeficiente de r
CON CALCULADORA

Menú 6 Enter
Luego al numero 2, ya que se van a calcular 2 variables
Introducimos los datos tanto de x como de y
OPTN
Y luego numero 4 (Regresión calc,)

𝒓 = −. 𝟖𝟏𝟒𝟖

Correlacion negativa fuerte


Recta de regresión. 17

La recta de regresión de y sobre x es una versión mas precisa de la recta de ajuste


optimo, comparada con la hallada por aproximación.
La recta de regresión de y sobre x donde y es la variable dependiente, también se
conoce como “recta de regresión de minimos cuadrados”.
Es la recta que se dibuja a trav´és de un conjunto de puntos, tal que la suma de los
cuadrados de las distancias verticales de cada pundo a la recta es un minimo.
Si hay una correlación fuerte o moderada, podemos usar la recta de regresión de y
sobre x para precedir valores de y, cuando los valores de x se encuentran dentro del
rango de datos.
Ejemplo 3 18

Diez alumnos entrenan para una caminata de beneficiencia. La tabal muestra la


cantidad promedio de horas por semana que cada integrante y el tiempo que tardan
en completar la caminata.

a) Situé estos puntos en un diagrama de distpesión y comente acerca del tipo de correlación
b) Halle la media del tiempo de entrenamiento y el tiempo de completar la caminata.
c) Situe el punto medio M en el diagrama y dibuje la recta de ajuste optimo.
d) Halle el coeficiente de correlación ,r, y comente acerca de este valor.
e) Halle la ecuación de la recta de regresión 𝒚 = 𝒎𝒙 + 𝒃
f) Utilizando esta ecuación, estime cuantos minutos tardará en completar la caminata un
alumno que entrena 18 horas a la semana.
19
20

19

18

17

16

15

14

3 5 6 8 9 10 12 21 25
20
b) Hallar la media de la posición y de los goles
CON CALCULADORA

Menú 6 Enter
Luego al numero 2, ya que se van a calcular 2 variables
Introducimos los datos tanto de x como de y
OPTN
Y luego numero 3 (2-Variable calculada)


𝒙 = 𝟏𝟎. 𝟓

ഥ = 𝟏𝟓. 𝟓
𝒚

𝑴 = (𝟏𝟎. 𝟓, 𝟏𝟓. 𝟓)
21
20

19

18

17

M
16

15

14

3 5 6 8 9 10 12 21 25
22
d) Hallar el coeficiente de r
CON CALCULADORA

Menú 6 Enter
Luego al numero 2, ya que se van a calcular 2 variables
Introducimos los datos tanto de x como de y
OPTN
Y luego numero 4 (Regresión calc,)

𝒓 = −. 𝟕𝟔𝟕

Correlacion negativa fuerte


23
e) Hallar la ecuacion de la recta de regresión
CON CALCULADORA

Menú 6 Enter
Luego al numero 2, ya que se van a calcular 2 variables
Introducimos los datos tanto de x como de y
OPTN
Y luego numero 4 (Regresión calc,)

𝒚 = −. 𝟏𝟒𝟕𝒙 + 𝟏𝟕. 𝟎

Correlacion negativa fuerte


24
Utilizando esta ecuación, estime cuantos minutos tardará en completar la
caminata un alumno que entrena 18 horas a la semana.

𝒚 = −. 𝟏𝟒𝟕𝒙 + 𝟏𝟕. 𝟎

𝒚 = −. 𝟏𝟒𝟕(𝟏𝟖) + 𝟏𝟕. 𝟎

𝒚 = 𝟏𝟒. 𝟒 𝒉𝒓𝒔

También podría gustarte