Está en la página 1de 57

ESTADSTICA I

ANLISIS DE REGRESIN Y CORRELACIN LIC. OSCAR NO LPEZ CORDN o s c a r n o e @ l o p e z c o r d o n . ne t

Algunos Ejemplos de Variables y su relacin


Existe alguna relacin entre la cantidad que

Healthtex gasta por mes en publicidad y sus ventas mensuales? Con base en el costo de calefaccin de una casa en el mes de enero. Es posible estimar el rea de la casa? Hay alguna relacin entre las millas por galn que rinde una camioneta grande y el tamao del motor? Hay alguna relacin entre el nmero de horas que estudiaron los alumnos para un examen y la calificacin que obtuvieron?

CLASIFICACIN DE MOVIMIENTOS, VARIACIONES O PATRONES DE LAS SERIES


Movimientos

Seculares o de Larga Duracin (Tendencia Lineal) Movimientos Cclicos Movimientos Estacionales Movimientos Irregulares o al Azar

TENDENCIA LINEAL
Es la que puede sealarse en una lnea recta

o curva suave, y puede ser ascendente o descendente.

REGRESIN Y CORRELACIN
LOS ANLISIS DE REGRESIN Y DE C O R R E L AC I N E S T N B A S A D OS E N L A RELACIN O ASOCIACIN, ENTRE 2 O MS VA R I A B L E S : UNA VA R I A B L E CONOCIDA LLAMADA VA R I A B L E I N D E P E N D I E N T E . L A VA R I AB L E Q U E S E E S T T R ATA N D O D E P R E D E C I R E S L A VA R I A B L E D E P E N D I E N T E . LA REGRESIN Y LOS A N L I S IS DE C O R R E L AC I N M U ES T R A N COMO D E T E R M I N A R TA N T O L A N AT U R AL EZ A C O M O L A F U ERZ A D E U N A R E L AC I N E N T R E D O S VA R I A B L E S .

REGRESIN Y CORRELACIN
La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple.

Mtodos para obtener una lnea recta y su ecuacin:

Mtodo Grfico, de Mano Alzada o Mano

Libre, Mtodo de Semipromedios, Mtodo de Promedios Mviles y Mtodo de

Mnimos Cuadrados.

Mtodo de Mnimos Cuadrados:


Para el ajuste de la lnea se utiliza el Mtodo de Mnimos Cuadrados, con la Ecuacin de la Lnea Recta: Y = a + bx Y cuando se usa para describir la tendencia es escrita as:

Yc = a + bx

ANALISIS DE REGRESIN

Es la tcnica mas usada en investigacin econmica y comercial para buscar una relacin entre 2 o mas variables ligadas de un modo causal. Consiste en general en: una funcin a partir de datos o informacin conocida para hacer estimaciones .

TIPOS ANLISIS DE REGRESIN

a) REGRESION LINEAL SIMPLE Se refiere al anlisis de 2 variables.


b) REGRESION MLTIPLE Cuando se relacionan 3 o mas variables.

Regresin Lineal Simple

E N E L A N L I S IS D E R E G RE S I N S E D E S A RRO L L A U N A E C UA C I N D E E S T I M A C I N , E S T O E S , U N A F R M U LA M AT E M T I C A Q U E R E L A C I O N A L A S VA R I AB LE S CONOCIDAS CON LA VA RI A B L E DESCONOCIDA.

Modelo de Regresin

En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente. En el Modelo de Regresin Simple se establece que Y es una funcin de slo una variable independiente, razn por la cual se le denomina tambin Regresin Divariada porque slo hay dos variables, una dependiente y otra independiente y se representa as:
12
12

Modelo de Regresin

La variable dependiente es la variable que se desea explicar, predecir. Tambin se le llama REGRESANDO VARIABLE DE RESPUESTA. La variable Independiente X se le denomina VARIABLE EXPLICATIVA REGRESOR y se le utiliza para EXPLICAR Y

13

13

Tcnicas ms utilizadas en el anlisis de regresin lineal simple


1) ORDENAMIENTO Y ANLISIS DE LA 14 INFORMACIN ORIGINAL 2) DIAGRAMA DE DISPERSIN E INTERPRETACIN EL PRIMER PASO PARA DETERMINAR SI EXISTE O NO UNA RELACIN ENTRE DOS VARIABLES ES ANALIZAR LA GRFICA DE DATOS OBSERVADOS .
14

Tcnicas ms utilizadas en el anlisis de regresin lineal simple

15

LA GRFICA SE LLAMA DIAGRAMA DE DISPERSIN Y ES UN DIAGRAMA QUE NOS PUEDE DAR DOS TIPOS DE INFORMACIN: ( V I S UA LM E N T E ) PAT R O N E S Q U E N O S I N D I Q U E N Q U E L A S VA R I A B L E S E S T N R E L A C I O N A D A S E N T O N C E S ( S I ES TO S U C E DE ) , P O D E M O S V E R Q U E T I P O D E L N E A , O E C UA C I N D E E S T I M A C I N , D E S C R I B E E S TA R E L A C I N .

Diagrama de Dispersin
Es una grfica con datos muestrales apareados (x, y) en un sistema de ejes rectangular, y cada par ordenado representa un solo punto. Sirve ms para visualizar la asociacin entre las variables que las grficas de barras de los hechos aislados, que nos muestran tendencias al estar ordenados en una secuencia temporal. Al observar una grfica debemos ver Existe un patrn? Que direccin tiene? Si una variable se incrementa, que sucede con la otra? Existen datos distantes?
16
16

Diagramas de Dispersin

17

17

Tipos de relaciones lineales:

RELACION LINEAL ASCEDENTE


RELACION LINEAS DESCENDENTE RELACION LINEAL CURVILNEA

RELACION LINEAL CONSTANTE

REGRESIN LINEAL SIMPLE


Para este anlisis es necesario ajustar los datos a una lnea recta, para poder estimar una variable con relacin a otra. Para esto utilizamos la ecuacin de la lnea recta:

Y = a+ bx === yc = a+ bx = Ecuacin de Regresin

Donde:
Yc = ayb= X = Variable estimada o calculada. Coeficientes de regresin. Variable que sirve para estimar la otra variable. Predictor en base a ella se estima el predictando. (Variable Independiente). Constituye la Variable a estimar y recibe el nombre de Predictando. (Variable Dependiente).

ECUACIONES NORMALES:

= n.a

+ Xb

Xy = X a

+ X^2b

FRMULAS PARA ENCONTRAR "a" y "b":

a =

x^2 (y - xxy n(x ^2) - x^2 n(xy) - xy n(x ^2) - x^2

b =

ERROR ESTANDAR DE REGRESIN: (SMBOLO Sy/x)


Mide el grado de error de las estimaciones alrededor de la lnea de regresin; si este es igual a cero ( 0 ) se dir que existe una estimacin perfecta.

Propiedades de Syx;
Yc, +, - Syx = Agrupa aproximadamente al

68.26% de los datos.


Yc , +, - 2 (Syx)= Agrupa aproximadamente al

95.46% de los datos.


Yc , +, - 3 (Syx)

= Agrupa aproximadamente al 99.72% de los datos.

Hay dos formas de calcularlo:


1.) VARIANZA NO EXPLICADA (VE) ___________ Syx = (y- yc)^2 n 2.) FORMULA GENERAL Syx = y^2 - y a - XY b n

INTERVALO DE CONFIANZA: Yc +- Z. Syx

APLICACIN: Al tabular los costos Unitarios y la produccin de una empresa industrial durante el ao anterior, se encontr el siguiente comportamiento:
Estad stica I

COSTO POR UNIDAD Q 1.00 Q. 2.00 Q 3.00 Q. 4.00 Q. 5.00

PROD EN MILES DE UNIDADES 20 15 12 11 7

1.) Con los datos tabulados de la contabilidad de la empresa se pide: Elaborar la representacin grfica sabiendo que la empresa desea estimar su produccin.
Estad stica I

Produccin (Miles Q)

25 20 15 10 5 0 0 2 Costo Unitario 4 6

Serie1

DESARROLLO:
Estad stica I

x 1 2 3

y 20 15 12

x 1 4 9

y 400 225 144

xy 20 30 36

4
5 15

11
7 65

16
25 55

121
49 939

44
35 165

DATOS N x y x y xy

= = = = = =

5 15 65 55 939 165

2). Encuentre la Ecuacin de Regresin del comportamiento de la produccin en funcin de los costos unitarios
Estad stica I

65 = 5 a + 15b 165 = 15 a + 55b

15/5 = 3 al cual se le cambia signo a negativo (-) y se usa como factor que multiplica a toda la ecuacin de la siguiente forma:

-195 = - 15 a - 45b (-3) Factor que multiplica a la Ec. 165 = 15 a + 55b -30 = 10b
b = -30 10 = b= -3

Encontrar "a":

Estad stica I

65 = 5 a + 15b 65 = 5 a + 15 (-3) Valor de b 65 = 5 a - 45 65 + 45 = 5 a 110 = 5a a = 110 5 = a= 22

La Ecuacin de regresin de la Produccin en funcin de los costos = Yc = 22 3x

3.) OBTENER "a" y "b" por Frmula:


Estad stica I

OBTENER a a = (x ) (y) (x) (xy) n( x ) (x) a = ( 55 ) (65) (15) (165) = 3575 2475 = 1100 5 (55) - (15) 275 - 225 50 a = 22

Estad stica I

OBTENER b b = n xy - (x) (y) n( x ) - (x)

b=

5 (165) (15) (65) = 5 (55) - (15)

825 975 275 225

= -150 50

b = -3

4.)El Departamento de Ventas de la empresa solicita le indique qu nmero de unidades puede producir el presente ao, si segn estudios se considera que su costo unitario ser igual a Q.3.75
Estad stica I

Y = a + bx Yc = 22 3 (3.75)

Yc = 22 11.25

= 10.75

5.) CALCULAR EN ERROR ESTANDAR DE REGRESION;


Estad stica I

Syx =
Syx = Syx =

y - y.a - xy.b N
939 ( 65) 22 165 (-3) 5 939 1430 + 495 5 Syx = 0.894427191 = 4 5

Explicacin del Clculo de la columna Yc


Estad stica I

Yc 19 16 13 10 7 65

Yc=22-3x 22 - 3 (1) 22 - 3 (2) 22 - 3 (3) 22 - 3 (4) 22 - 3 (5) xxxx

(y-Yc) 1 -1 -1 1 0 0

(y-Yc) 1 1 1 1 0 4

Otra forma:
Estad stica I

___________ Syx = (y- yc) N ___________ Syx = 4 5 Syx = 0.894427191

6.) Estimar por intervalo la produccin para costo de Q.6.00 con un 85% de confianza
Estad stica I

yc = a +bx yc = 22 +-3 (6) yc = 22 18 yc = 4

4 + - 1.44 (0.89442719) Ls = 4 + 1.29 = 5.29 Li = 4 1.29 = 2.71

La produccin estimada para costos de Q 6.00 oscila entre 2.71 y 5.29 miles de unidades.

Anlisis de Correlacin
E L A N L I S I S D E C O R R E L A CI N S E A P L I C A PA R A D E T E R M I N A R E L G R A D O E N E L Q U E E S TN R E L A C I O N A D A S L A S VA R I A B L E S . E L A N L I S I S D E C O R R E L A CI N , I N D I C A Q U TA N B I E N E S T N R E L A C I O N A D A S L A S VA R I A B L E S . E L A N L I S I S D E C O R R E L AC I N , M U ES T R A Q U E TA N BIEN LA E C UA C I N DE ESTIMACIN REALMENTE DESCRIBE LA RELACIN

38

ANALISIS DE CORRELACIN :
Mide el grado de asociacin de dos o ms variables. La correlacin tambin se puede usar por si misma para medir el grado de asociacin de dos variables.

SMBOLO

"r"

Coeficiente de Correlacin Lineal r

Mide la fuerza de la relacin lineal entre dos valores cualitativos apareados, en una muestra. Tambin se llama Coeficiente de correlacin producto momento de Pearson..
40

Si r es igual a 0 Si r mayor que 0 Si r menor que 0 Si r es igual a menos 1

Si r es igual a uno

= no existe correlacin = correlacin positiva = correlacin negativa = correlacin perfecta negativa = correlacin perfecta positiva.

Los lmites o extremos del coeficiente de correlacin son 1 y 1.

Coefifiente de Correlacin - Interpretacin

42

Mapa de Dispersin

Correlacin perfecta positiva r = 1

Mapa de Dispersin

Correlacin perfecta negativa r = -1

Mapa de Dispersin

No hay correlacin r = 0

COEFICIENTE DE DETERMINACIN:
Es la forma primaria por la cual se puede medir la extensin o fuerza, de la asociacin que existe entre 2 variables X y Y.
r^2= a (y) + b (xy) - n ( y )^2 y - n ( y ) ^2

Dnde y = y/n

COEFICIENTE DE CORRELACIN:

Sirve para medir la relacin entre dos variables. Es la segunda medida que se pueda usar para describir lo bien que una variable se explica por otra. Cuando se est tratando de muestras, el coeficiente de correlacin se denota por 1 y es la raz cuadrada del coeficiente de determinacin muestral .

Frmula

r =

r^2

R=

a (y) + b (xy) - n ( y )^2 y - n ( y ) ^2

APLICACIN: Con los datos del ejemplo que se ha desarrollado en el Anlisis de Regresin, calcular la forma en que primariamente se relacionan las variables:
Estad stica I

r r r

= = =

a (y) + b (xy) - n ( y promedio) y - n (y promedio) (22) 65 + (-3) 165 - 5 ( 13) 939 - 5 (13) 0.957447

A continuacin calcular el grado de asociacin entre las dos variables, (la fuerza o extensin en que se asocian las variables):
Estad stica I

r=

0.957447

r = 0.978492 Por ser r mayor que cero se dice que la correlacin es positiva.

Ejemplo de Regresin
El gerente de ventas de Copier

Sales of America que tiene una fuerza de ventas muy grande en Estados Unidos y Canad, desea determinar si hay alguna relacin entre el nmero de llamadas de ventas en un mes y el nmero de copiadoras vendidas en ese mes. El gerente selecciona una muestra aleatoria de 10 representantes de ventas y determina el nmero de llamadas de ventas que cada uno hizo el mes pasado y el nmero de copiadoras vendidas. La informacin muestral aparece a continuacin:

51

Diagrama de Dispersin

52

Coeficiente de Correlacin Ejemplo en Excel

53

Coeficiente de Correlacin - Ejemplo

54

Coeficiente de Correlacin - Ejemplo

Cmo se interpreta una correlacin de 0.759? Es positiva, por lo que se observa una relacin directa Entre el nmero de llamadas de ventas y el nmero de copiadoras Vendidas.

55

Coeficiente de Correlacin Ejemplo con Excel


No. De No. Llamadas Copiadoras realizadas Vendidas x y 20 30 40 60 20 40 30 60 10 30 10 40 20 40 20 50 20 30 30 70 Promedios 22 45

56

Llamadas realizadas vrs. Copiadoras Vendidas


80 70 60 50 40 30 20 10 0 0 10 20 30 40 50 y Linear (y) y = 1.1842x + 18.947 R = 0.5761

También podría gustarte