Está en la página 1de 22

Análisis de Regresión y Correlación

PROFESOR: PROSPERO CELSO BENITES GRADOS


DIAGRAMA DE DISPERSIÓN
Se utiliza para graficar la relación entre dos variables X e Y,
consiste en una nube de puntos que indicará si existe o no
correlación dependiendo de la tendencia de los puntos.

Correlación Positiva Correlación Negativa Sin correlación


REGRESIÓN LINEAL SIMPLE

Este tipo de regresión se utiliza cuando existe


solo una variable independiente X para una
variable dependiente Y. Está definida por la
siguiente ecuación lineal en su forma general:
MÉTODO DE MÍNIMOS CUADRADOS

Recta de Regresión
V. dependiente estimada

yˆ  a  bx

Coeficientes de Regresión
V. Independiente
MÉTODO DE MÍNIMOS CUADRADOS

yˆ  a  bx
𝒏( 𝑿𝒀)−( 𝑿)( 𝒀) Pendiente de la línea de
b= 𝟐 regresión
𝒏( 𝑿𝟐 )− 𝑿)

𝒀 𝑿
a= − 𝒃 Punto donde se intercepta con el eje y
𝒏 𝒏
Ejemplo:
La Empresa Rotoplas vende tanques de agua. El nuevo gerente nacional de
ventas, en la próxima junta de ventas donde asistirán los representantes de
todo el país. A él le gustaría hacer notar la importancia de hacer llamadas
extras cada día para mejorar las ventas, para lo cual selecciona una muestra al
azar de 10 representantes, para ver la relación entre el número de llamadas y
el número de productos vendidos el último mes.
REPRESENTANTE NUMERO DE NUMERO DE TANQUES
S DE VENTAS LLAMADAS ( X ) VENDIDOS (Y)
TOM KELLER 20 30
JEFF HALL 40 60
BRIAN VIROST 20 40
GREG FISH 30 60
SUSAN WELCH 10 30
CARLOS RAMIRE 10 40
RICH NILES 20 40
MIKE KIEL 20 50
MARK REYNOLDS 20 30
SONI JONES 30 70
GRAFICO DE NUBE DE
PUNTOS
80

70

60

50

40
Series1

30

20

10

0
0 5 10 15 20 25 30 35 40 45
Predicciones

-Si hace 35 llamadas cuantos tanques venderá.

-Si hace 15 llamadas cuantos tanques venderá.


REPRESENTANTES NUMERO DE VENTAS
TRAZO DE LA LINEA DE VENTAS LLAMADAS ( X) ESTIMADAS (Y’)
DE REGRESION TOM KELLER 20 42.6316
JEFF HALL 40 66.3156
BRIAN VIROST 20 42.6316
GREG FISH 30 54.4736
SUSAN WELCH 10 30.7896
CARLOS RAMIRE 10 30.7896
RICH NILES 20 42.6316
MIKE KIEL 20 42.6316
MARK REYNOLDS 20 42.6316
SONI JONES 30 54.4736
80

70

60

50 PUNTOS DE DISPERSION

40 LINEA DE REGRESION

30 Lineal (LINEA DE
REGRESION)
20

10

0
0 10 20 30 40 50
¿QUÉ ES UN ANALISIS DE CORRELACION?
Es un conjunto de técnicas estadísticas empleadas para medir la intensidad
de la asociación entre dos variables.
El principal objetivo del análisis de correlación consiste en determinar que
tan intensa es la relación entre dos variables. Normalmente el primer paso
es mostrar los datos en un diagrama de dispersión.

Correlación Positiva Correlación Negativa Sin correlación


Coeficiente de Correlación de Pearson
El Coeficiente de Correlación de Pearson es una medida de
la relación lineal entre dos variables aleatorias cuantitativas.
A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de
correlación de Pearson como un índice que puede utilizarse
para medir el grado de relación de dos variables siempre y
cuando ambas sean cuantitativas.
En el caso de que se esté estudiando dos variables
aleatorias x e y sobre una población; el coeficiente de
correlación de Pearson se simboliza con la letra , siendo la
expresión que nos permite calcularlo:
Coeficiente de Correlación de Pearson

𝒏( 𝑿𝒀)−( 𝑿)( 𝒀)
r=
𝟐 𝟐
[𝒏( 𝑿𝟐 )−( 𝑿) ][𝒏( 𝒀𝟐 )−( 𝒀) ]

1  r  1
REPRESENTANTES NUMERO DE NUMERO DE 𝑋2 𝑌2 XY
DE VENTAS LLAMADAS X TANQUES
VENDIDOS (Y)
TOM KELLER 20 30
JEFF HALL 40 60
BRIAN VIROST 20 40
GREG FISH 30 60
SUSAN WELCH 10 30
CARLOS RAMIRE 10 40
RICH NILES 20 40
MIKE KIEL 20 50
MARK REYNOLDS 20 30
SONI JONES 30 70
total 220 450 5600 22100 10800

10 10800 − 200 (450)


r= = 0.759
[10 5600 −(200)2 ][10 22100 −(450)2 ]
Interpretación del Coeficiente R de Pearson
Antes de calcular el coeficiente de
correlación de Pearson hemos de
comprobar si existe una tendencia lineal en
la relación. Aunque más adelante
ofreceremos procedimientos analíticos que
permitan verificar con exactitud la
Hipótesis de linealidad, por el momento,
recurriremos a procedimientos gráficos,
que en una primera instancia, pueden
resultar suficientes:
Se observa la existencia de una cierta
tendencia lineal en la relación. Podemos, en
consecuencia, proceder a calcular el
coeficiente de correlación de Pearson.
Ejemplos
Si relacionamos horas de estudio con el
rendimiento académico obtendremos mayor
rendimiento a mayor inteligencia, pero será
prácticamente imposible saber con exactitud
la puntuación que obtendrá un sujeto para
unas horas determinadas. Dado un cierto
número de personas con un mismo número
de horas, por ejemplo 10, no todos obtendrán
exactamente la misma puntuación en
rendimiento. Unos obtendrán más o menos en
función de otras variables, tales como
motivación o personalidad. Si relacionásemos
ambas variables dada una muestra de sujetos
tendríamos un gráfico de las
siguientes características:
El grosor de la nube da una cierta idea de la magnitud
de la correlación; cuanto más estrecha menor será el
margen de variación en Y para los valores de X, y por
tanto, más acertado los pronósticos, lo que implica
una mayor correlación.
Si la nube de puntos es alargada y descendente nos
encontramos con una correlación negativa.
Supongamos, en este sentido, que relacionásemos la
cantidad de alcohol ingerida y el grado de
memorización ante determinados estímulos.
Obtendríamos un gráfico como el siguiente:
Se observa que a mayor cantidad de alcohol ingerida
menor material recordado. Igual que anteriormente
no puede establecerse con exactitud el grado de
memorización en función del alcohol ingerido,
aunque queda claro la tendencia existente.
Por último, si la nube de puntos adopta una
configuración más o menos redondeada de tal
forma que no pueda especificarse ningún tipo de
relación, nos encontramos con una correlación
nula. Supongamos que relacionásemos peso con
inteligencia.
Obtendríamos el siguiente gráfico:
Se observa que las personas con poco peso
obtienen en inteligencia tanto puntuaciones bajas
como medias o altas. Lo mismo sucede con
personas de peso alto. No puede establecerse, pues,
ningún tipo de relación. Ambas variables son
independientes entre sí; la variación de una de ellas
no influye para nada en la variación de la otra.
COEFICIENTE DE DETERMINACIÓN

Es el cuadrado del coeficiente de


correlación.

R r
2 2
0  R2  1

El Coeficiente de determinación,
explica la variabilidad de x sobre la
variabilidad de y.
COEFICIENTE DE DETERMINACIÓN
La porción de la variación total en la variable dependiente Y,
que se explica la variación en la variable independiente X.

En el ejemplo anterior respecto a la relación entre el numero


de llamadas telefónicas y la cantidad de productos vendidos el
coeficiente de correlación, 0.759, se interpreto como “fuerte”
.Sin embargo los términos como débil, moderado y fuerte no
tienen significado preciso. Una medida que tiene una
aceptación mas fácil de interpretar es el coeficiente de
determinación. Se calcula elevando al cuadrado el coeficiente
de correlación. Para el ejemplo dicho coeficiente de
determinación, 𝑟 2 que proviene de (0.759)2 esta es una
proporción o porcentaje, puede decirse que 57.6% de la
variación en un número de tanques vendidos se explica por la
variación en el número de llamadas a los clientes.
Ejemplos:
Si tenemos las siguientes puntuaciones en las variables X (inteligencia)
e Y (rendimiento académico):

X: 105 116 103 124 137 126 112 129 118 105
Y: 4 8 2 7 9 9 3 10 7 6

-Calcular el coeficiente de correlación de Pearson.


-Calcular el coeficiente de determinación e interpretar.

También podría gustarte