Está en la página 1de 11

Estadística

Correlación Lineal de Pearson

• Manuel Cardona
• manuel.cardona@ieee.org
• www.mcardona.net

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson 1

Relación entre Variables


Para Variables Cuantitativas
Ecuación de una recta.
Regresión.
El método de los mínimos cuadrados
Coeficiente de Correlación y Determinación.

Para Variables Cualitativas


El Coeficiente de correlación por Rangos de Pearson
La prueba Chi-Cuadrado de Pearson
Coeficientes de Asociación

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Relación entre Variables Cuantitativas
Análisis de Regresión Simple
Establece la naturaleza de la relación entre variables,
estudia la relación funcional entre las variables y por tanto
proporciona un mecanismo de predicción o pronóstico

Análisis de Correlación
Determina el grado o la fuerza de la relación o asociación
entre las variables.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Correlación de Pearson
El coeficiente de correlación de Pearson, pensado para
variables cuantitativas, es un índice que mide el grado de
covariación entre distintas variables relacionadas
linealmente.

Hay estudios en los cuales no habrá una relación lineal


entre las variables y por lo tanto no será conveniente utilizar
el coeficiente de correlación de Pearson. Por ejemplo, la
relación entre la ansiedad y el rendimiento tiene forma de U
invertida; la relación entre población y tiempo tiene forma
exponencial.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Correlación de Pearson
El coeficiente de correlación (ρXY) es un Índice que mide
la covariación entre variables: en qué medida la variación
en una variable influye en la variación en otra variable.

El análisis de correlación se utiliza con el propósito de


disponer de un indicador cuantitativo que permite sintetizar
el grado de la asociación entre variables.

El coeficiente de correlación varía entre -1 y 1,

-1 ≤ ρXY ≤ +1.

La correlación puede ser positiva, negativa o nula.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Correlación de Pearson
En este sentido, tan fuerte es una relación de +1 como de
-1. En el primer caso la relación es perfecta positiva y en el
segundo perfecta negativa.

Si la correlación es cero, significa que no habrá relación


alguna entre las variables, esto significa que una variable no
influye en la otra.

En general, el análisis de correlación determina la relación


que puede existir, la dirección o tipo de asociación y el
grado de intensidad.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Correlación de Pearson
Y Y

⇢= 1
⇢=1

X X

Y Y

1<⇢<0
X
⇢=0

0<⇢<1

X X

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Correlación de Pearson
Y

X
Curvilinea positiva

X Y

Curvilinea negativa

X
Curvilinea positiva
Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson
Correlación de Pearson
P P P
n x i yi x i yi
⇢rxy
xy = p P P 2p P 2 P
n x2i ( xi ) n yi ( yi ) 2

La magnitud del Coeficiente de Correlación indica cuan


cerca están los puntos de la recta.

El grado de intensidad del coeficiente de correlación será


más fuerte, mientras más se aleje r del valor cero.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Sifnificado del Coeficiente de Correlación de Pearson

+0.70 ó superior relación positiva muy fuerte


+0.40 a +0.69 relación positiva fuerte
+.030 a +0.39 relación positiva moderada
+0.20 a +0.29 relación positiva débil
+0.01 a +0.19 ninguna relación ó insignificante
0 Ninguna relación [correlación de orden cero]
-0.01 a -0.19 ninguna relación ó insignificante
-0.20 a -0.29 relación negativa débil
-0.30 a -0.39 relación negativa moderada
-0.40 a -0.69 relación negativa fuerte
-0.70 ó superior relación negativa muy fuerte

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Ejemplo 1
Los siguientes datos corresponden a inteligencia y
rendimiento, determine el grado de correlación.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Ejemplo 2
La siguiente tabla muestra la relación entre el cociente
intelectual y el área del córtex cerebral de 20 pares de
gemelos. Determine el grado de correlación.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Análisis de Regresión
El análisis de regresión se utiliza con el propósito de
hacer predicciones, y su objetivo es el desarrollo de un
modelo estadístico que pueda ser utilizado para predecir
los valores de una variable de respuesta o dependiente
basados en los valores de una variable independiente o
explicativa.

En regresión los datos provienen de observaciones


efectuadas en dos variables, las distribuciones formadas
para tales conjuntos de datos se denominan bivariantes o
bivariadas.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Análisis de Regresión
Dado un conjunto de datos bivariados (x,y)

¿Cómo se obtiene la recta de mejor ajuste?

Cómo elegir una recta de tal modo que los errores o


diferencias que se generan entre el valor real y el valor
obtenido a través de la recta ajustada sean mínimos?

Método de Mínimos Cuadrados


Posee la propiedad de que la suma de los cuadrados
de las desviaciones de los valores reales de “Y” o las
distancias verticales de los puntos a la línea recta sea
mínima .

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Método de los Mínimos Cuadrados
Permite realizar una estimación confiable ya que
garantiza que la suma de los errores o desvíos al cuadrado
sea mínima

El procedimiento para adaptar una recta a un conjunto


de puntos presenta una recta resultante con las siguientes
características:

Es nula la suma de las desviaciones verticales de los puntos a


partir de la recta.

Es mínima la suma de los cuadrados de las desviaciones.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Método de los Mínimos Cuadrados

Y2 (X2%%,%Y 2)

e2+
(X2%%,%Ŷ 2)

(X1%%,%Ŷ 1)

e1,
Y1
(X1%%,%Y 1)

X1 X2 X

n
X
(yi ŷ)2
i=1

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Coeficiente de Determinación (R2)
Es un coeficiente que se encuentra asociado a la línea
de regresión y es el grado en que las predicciones que se
basan en la ecuación de regresión son superiores a las
basadas en el valor promedio de “y”, es decir, sí las
proyecciones que se fundamentan en la recta no son
mejores que las que utiliza el valor promedio de “y” no
tiene sentido contar con una ecuación de regresión.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Ejemplo 3
El año pasado, cinco estudiantes seleccionados al azar
tomaron un examen de aptitudes de matemática antes de
comenzar su curso de estadística. El Departamento de
Estadística tiene tres preguntas.

¿Qué ecuación de regresión lineal predice mejor el


rendimiento en estadística, basadas en las calificaciones del
examen de aptitudes en matemáticas?

Si un estudiante obtuvo 80 en la prueba de aptitud, que


calificación podríamos esperar en estadística?

¿En qué medida la ecuación de regresión se ajusta a los


datos?

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Ejemplo 3

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

Ejemplo 4
La siguiente tabla muestra la relación entre la edad de
un conductor y la distancia a la que éste puede ver.
Determine el grado de relación.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson


Ejemplo 5
La siguiente tabla muestra las edades de 35 estudiantes y su
respectiva nota en la materia de matemática. ¿Qué tan fuerte
es la relación entre la edad y las notas obtenidas?.

Manuel Cardona manuel.cardona@ieee.org Correlación Lineal de Pearson

También podría gustarte