Está en la página 1de 22

16/10/2014

Regresión y Correlación

Bibliografía

1
16/10/2014

Qué es?
El modelo de regresión y correlación estudia
la relación estadística entre dos variables
cuantitativas.
No implica causa y efecto sino solo el “tipo
de relación estadística”.
Ejemplos:
 edad y peso
 Horas de estudio y notas obtenidas
 Gramos de proteínas consumidas y notas
 Cociente intelectual de la madre y del hijo.

Dependencia de una variable


REGRESIÓN Dependencia
con respecto adeunauna
u otras
variable
variables explicativas
con respecto a una u otras
variables explicativas

Fuerza, intensidad o grado de
CORRELACIÓN asociación entre dos variables

2
16/10/2014

Objetivo

Descubrir relaciones generales entre las


variables estudiadas

Enunciar la naturaleza de tales relaciones


en términos matemáticos.

Predecir el valor de una variable en


términos estadísticos

Propongan ejemplos de esta


carrera o de sus trabajos
actuales !!!!

3
16/10/2014

Se recurre a la estadística para:

Determinar si existe la relación


medir el grado de relación.
Medir la relación útil.
Determinar y medir los errores.
Medir grado de bondad de la
predicción.
predecir valores de variable
7

La relación entre las variables puede


ser:

Simple 2 variables

Múltiple Más de 2
variables

lineal

no lineal

4
16/10/2014

Tipos de relación entre las variables


y = 0,8x + 2
Relación funcional directa R² = 1
Y 9
Variable 8
7
explicada
6
5
4
3
DIAGRAMA 2
1
DE 0

DISPERSIÓN 0 1 2 3 4 5 6 7 8 9 Variable
X
explicativa

Coeficiente de determinación= R2 = 1
Coeficiente de correlación = 1
Ecuación de la recta de estimación= Y’ = 0,8 X + 2
Variable independiente X
Variable dependiente Y

Tipo de relación entre las variables:


y = -0,9x + 9
Variable Relación funcional inversa R² = 1
y 10
explicada
8

DIAGRAMA 4

2 Variable
DE 0 explicativa
DISPERSIÓN 0 2 4 6 8 10

Coeficiente de determinación= R2 1
Coeficiente de correlación = -1
Ecuación de la recta de estimación= Y’ = -0,09 X +9
Variable independiente X
Variable dependiente Y

5
16/10/2014

Tipo de relación entre las variables:

Variable Y Relación No funcional directa


10
explicada 9
8
7
6
5
DIAGRAMA 4
3
2
DE 1
0
DISPERSIÓN 0 2 4 6 8 10 Variable
y = 0,7669x + 2,6189
R² = 0,7629
X explicativa

Coeficiente de determinación= R2= 0,7629


Coeficiente de correlación = R = 0,87
Ecuación de la recta de estimación= Y’ = 0,7669 X + 2,6189
Variable independiente X
Variable dependiente Y

Tipo de relación entre las variables:


Relación NO funcional inversa
Variable 12
Y
explicada 10
8
6
DIAGRAMA 4

DE 2
0
DISPERSIÓN Variable
0 2 4 6 8 10
y = -1,1738x + 10,857 X explicativa
R² = 0,7758

Coeficiente de determinación= R2 = 0,77


Coeficiente de correlación = - 0,8774
Ecuación de la recta de estimación= Y’ = -1,1738 X + 10,857
Variable independiente X
Variable dependiente Y

6
16/10/2014

Tipo de relación entre las variables:

Variable Tipo de relacion inexistente


explicada Y
(no hay relación entre las variables)
14
12
10
8
6
4
2
0 Variable
0 2 4 6 8 10 12
y = 0,0474x + 6,4557 X
explicativa
R² = 0,0017

Coeficiente de determinación= R2 = 0,0017


Coeficiente de correlación = 0,04123
Ecuación de la recta de estimación= Y’ = 0,047 X + 6,4557
Variable independiente X
Variable dependiente Y

MODELO DE REGRESIÓN

7
16/10/2014

MODELO DE REGRESION

Variable explicativa
Recta:
Variable explicada

Ŷ = a + b X + ei
RECTA
CONCEPTO FIJO + SISTEMATICA + ALEATORIA

Donde:
a = ordenada al origen o factor fijo de la
variable
b = pendiente de la recta de regresión.
e = factor aleatorio
X= variable explicativa
Y = variable explicada

8
16/10/2014

Cálculo de la Recta:

• Las “Y”
Y valor real
Y valor estimado
Y media de Y

9
16/10/2014

Cálculo de la Recta:
Método de mínimos cuadrados
Características:
2
 La suma de los desvíos de Y es nula.  Y  Y 
 Es mínima la suma del cuadrado de Y  observado
los desvíos.
Y  valor calculado de Y

Se parte de las ecuaciones normales:

Y  n.a  b. X b
n. X .Y   X .Y .

2
 X .Y  a. X  b. X 2
n. X 2    X 

Resolviendo se llega a : a  Y  b X
n

Cálculo de la Recta:
Método simplificado: la pendiente
Pasos:
1º) Se calculan las medias de las dos variables.
2º) se calculan los coeficientes de regresión,
que determinan el incremento de una
variable en función del incremento unitario
de la otra: x.y  ( x  m( x) ).( y  m( y ) ) 
b1  
( x  m( x ) ) 2
x
2

b2  
x.y  ( x  m( x ) ).( y  m( y ) ) 
( y  m( y ) ) 2
y
2

10
16/10/2014

Cálculo de la Recta:
Método simplificado
3º Cálculo de a: a1   b1.mx  m y
a2   b2 .m y  mx
4º Quedan determinadas 1º Re cta de regresión
las rectas:
Y  a1  b1 X
2º Re cta de regresión

X a bY2 2

Ejemplo:
Determine la relación entre el número de
accidentes y las horas de capacitación anuales
en una empresa. Hs de Nº de
Capacitación Accidentes
y = -0,0059x + 8,4431
9,0
8,0
R² = 0,9084
X Y
7,0 200 7,0
6,0
500 6,4
5,0
4,0
450 5,2
3,0 800 4,0
2,0 900 3,1
1,0
150 8,0
0,0
0 200 400 600 800 1000
300 6,5
600 4,4
3900 44,6
DIAGRAMA DE
DISPERSIÓN

11
16/10/2014

Ejemplo:
Hs de Nº de
Desvío Desvío desvio de X.
Capacitación Accidentes de X de Y desvio de Y

X Y (x-mx) (y-my) (x-mx).(y-my) (x-mx)2 (y-my)2


200 7,0 -287,5 1,4 -409,69 82656,25 2,03
500 6,4 12,5 0,8 10,31 156,25 0,68
450 5,2 -37,5 -0,4 14,06 1406,25 0,14
800 4,0 312,5 -1,6 -492,19 97656,25 2,48
900 3,1 412,5 -2,5 -1020,94 170156,25 6,13
150 8,0 -337,5 2,4 -818,44 113906,25 5,88
300 6,5 -187,5 0,9 -173,44 35156,25 0,86
600 4,4 112,5 -1,2 -132,19 12656,25 1,38
3900 44,6 -3022,50 513750,00 19,58

mx= 487,5 horas


my= 5,575 accidentes

Ejemplo:
b1= -3022,50 -0,0059
513750,00

b2= -3022,50 -154,41


19,58

a1=-(-0,0059)*487,5+5,575= 8,45

a2=-(-154,41)*5,5+487,5= 1336,76

1 º R e c ta d e r e g r e s ió n
Y  8 , 4 5  0 , 0 0 5 9 . X
2 º R e c ta d e r e g r e s ió n

X  1 3 3 6 , 7 6  1 5 4 , 4 1 .Y

12
16/10/2014

9,0 y = -0,0059x + 8,4431


R² = 0,9084
8,0

Ejemplo:
7,0

6,0

5,0

4,0

3,0

2,0

1,0
Hs de Nº de
Capacitaci Accidente desvío de desvío de desvio de 0,0
0 200 400 600 800 1000
ón s X Y X.Y
(x-mx).(y-
X Y (x-mx) (y-my) my) (x-mx)2 (y-my)2 Ŷ 
X
200 7,0 -287,5 1,4 -409,69 82656,25 2,03 7,27 255,91
500 6,4 12,5 0,8 10,31 156,25 0,68 5,51 348,56
450 5,2 -37,5 -0,4 14,06 1406,25 0,14 5,80 533,84
800 4,0 312,5 -1,6 -492,19 97656,25 2,48 3,74 719,13
900 3,1 412,5 -2,5 -1020,94 170156,25 6,13 3,16 858,10
150 8,0 -337,5 2,4 -818,44 113906,25 5,88 7,57 101,51
300 6,5 -187,5 0,9 -173,44 35156,25 0,86 6,69 333,12
600 4,4 112,5 -1,2 -132,19 12656,25 1,38 4,92 657,37
3900 44,6 -3022,50 513750,00 19,58 44,67 3807,53

Tiene valor predictivo?


Sirve para estimar?
BONDAD DEL AJUSTE

COEFICIENTE DE DETERMINACION = R2

VARIACION EXPLICADA

El coeficiente de determinación mide la


proporción de variabilidad total de la variable
dependiente respecto a su media que es explicada
por el modelo de regresión

13
16/10/2014

MODELO DE REGRESION:
Variaciones

MODELO DE REGRESION:
Variaciones
Variación
Total

Variación Variación no
explicada Explicada

Y  Y  Y  Y 

14
16/10/2014

Coeficiente de determinación:R2
Es la proporción de las variaciones que son
explicadas por el modelo.

R 2  b1. b2
Si R2 es menor al 70% . El modelo lineal no es
apropiado para realizar estimaciones.

NO ESTIMAR SI R2 ES < 70%

Coeficiente de determinación:R2

R 2  b1 . b2
R 2   0, 0059. 154, 41 
R 2  0, 91

15
16/10/2014

Coeficiente de indeterminación:
(1-R2)
• El coeficiente de indeterminación es la
proporción de la variación total que NO es
explicada por el modelo.

(1  R 2 )  1  0,91
(1  R 2 )  0, 09

Ahora podemos estimar


10Y
8
6
4

De PUNTO
2
0
0
y = 0,7669x 5
+ 2,6189 10
R² = 0,7629 X

Estimación
De
INTERVALO

16
16/10/2014

Varianza total
Es la varianza de los datos originales (Y).
2

 2

(x  m )
x

19,58
 2, 44
n 8

VARIANZA EXPLICADA VARIANZA NO EXPLICADA

2, 44 . 0, 91  2, 22 2, 44 . 0,09  0, 22

COEFICIENTE DE CORRELACION

17
16/10/2014

Cálculo del coeficiente de correlación

R  b1 . b2

 ( X  X ).(Y  Y )
cov( X , Y ) n
R 
 X . y  X . y

Tipos de correlación
Funcional
-1
Inversa

No Funcional
-1<R<0
Inversa

No hay
R 0
relación

No Funcional
0<R<1
Directa

Funcional
1
Directa

18
16/10/2014

El signo de R
El coeficiente de correlación tiene el signo de la
pendiente!!!
Se debe elegir el valor de la raíz cuyo signo
coincide con el de la pendiente (b)

Relación Relación
inversa inversa

POSITIVA NEGATIVA

19
16/10/2014

ATRIBUTOS CUALITATIVOS

Coeficiente de asociación de YULE


A α
B AB αB
β Aβ αβ

( AB )( )  ( A ).( B )
Q
( AB )( )  ( A ).( B )

1  Q  1

20
16/10/2014

Disociación
-1
Total

-1<Q<0 Disociación

Q 0 Independencia

0<Q<1 Asociación

Asociación
1
Total

Ejemplo
Se desea saber si es posible que la implementación de cierta
publicidad en algunos comercios han tenido algún efecto en
las ventas.
Se analiza si hay alguna asociación entre dichos hechos
(variables).

nº de comercios que han


A= implementado propaganda
Nº de comercios que han aumentado
( AB )( )  ( A ).( B )
Q 
B= las ventas ( AB )( )  ( A ).( B )
A α 180.250  20.50
Q  0,95
B 180 50 230 180.250  20.50
β 20 250 270
200 300 500

21
16/10/2014

Próxima Clase

SERIES CRONOLÓGICAS

22

También podría gustarte