Está en la página 1de 29

FIMAAS

SEM 14

ING. OSCAR EDUARDO ROJAS FARRO


FIMAAS

REGRESIÓN LINEAL SIMPLE


GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
La relación entre dos variables métricas puede ser
representada mediante la línea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresión, que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
Para el cálculo de la recta de regresión se aplica el método de
mínimos cuadrados entre dos variables. Esta línea es la que
hace mínima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuación de la
recta y los valores reales de la serie, son las menores posibles.

y = a + bx
REGRESION LINEAL SIMPLE

METODO DE LOS MINIMOS CUADRADOS


Este método consiste en minimizar LA SUMA DE LOS ERRORES AL
CUADRADO para estimar los parámetros poblacionales α y β mediante a
y b respectivamente.

n n n
SSE   e    y i  yˆ     y i  a  bxi 
2 2 2
i
i 1 i 1 i 1
REGRESION LINEAL SIMPLE

ESTIMACION DE LOS COEFICIENTES DE REGRESION.- Dada una


muestra , las estimaciones de mínimos cuadrados a y b de los coeficientes
de regresión α y β se calcula por medio de las formulas:

n xi y i    xi   y i   y i  b xi
b a
n xi2    xi  n
2
REGRESION LINEAL SIMPLE

Para deducir el estimador S2 de σ2 es necesario introducir las


notaciones.

 x  2

S xx    xi  x    xi2 
2 i

 y  2

S yy    y i  y    y 
2 2 i
i
n

 n  n 
n
  i   i 
x y
S xy    xi  x  y i  y    xi y i   i 1  i 1 
i 1 n
REGRESION LINEAL
;
SIMPLE

Ahora podemos escribir la suma de los cuadrados del error


como sigue:
n n
S xy
SSE   ei2    yi  a  bxi   S yy  bS xy
2
b
i 1 i 1 S xx

Concluimos que luego con el siguiente teorema:

Una estimación insesgada de  2


es:

SSE S yy  bS xy
S 
2

n2 n2
REGRESION LINEAL SIMPLE

ERROR ESTANDAR DE ESTIMACION S  S2


El error estándar es la medida de variabilidad de los valores
de Yi a partir de sus valores predichos de la misma manera
en que desarrollamos una media de la variabilidad alrededor
de la media. La media de la variabilidad alrededor de la línea
de regresión (su desviación estándar) se conoce como error
estándar de la estimación. En cualquier recta de regresión
predicha cae cerca de muchos de los valores de Y, existen
varios valores por encima y por debajo de esta, de modo que:

 y i  ŷ   0
REGRESION LINEAL SIMPLE

PROB 1
1.- AL GERENTE DEL DEPARTAMENTO DE ADQUISICIONES DE UNA ORGANIZACIÓN BANCARIA LE GUSTARÍA
DESARROLLAR UN MODELO PARA PREDECIR LA CANTIDAD DE TIEMPO(Y) QUE LLEVARÍA PROCESAR SUS
FACTURAS(X). SE TOMARON DATOS DE UNA MUESTRA DE 30 DÍAS CON LOS RESULTADOS SIGUIENTES:

X Y X2 Y2 X.Y
∑ 3897 61.2 669459 153.92 10007.8
a. Construya un diagrama de dispersión
b. Suponiendo que haya relación lineal utilice el método de mínimos
cuadrados, para encontrar los coeficientes de regresión a y b.
c. Interprete el significado de la intersección con el eje Y, a y de la
pendiente, b. de este problema.
d. Utilice el modelo de regresión. Para predecir la cantidad de tiempo
que llevaría procesar 150 facturas
e. Calcule el error estándar de estimación.
xyii22y i

REGRESION LINEAL SIMPLE

SOLUCION

a. Construya un diagrama de dispersión


REGRESION LINEAL SIMPLE

b. Suponiendo que haya relación lineal utilice el método de mínimos cuadrados



Sea la ecuación:
y  a  bx

b
  x   y   30  10007.8  (3897)(61.2)  0.0126
n x i y i  i i

n x    x  30  669459
Dónde:  ( 3897 )
2 2 2
i i

a
 y i  b xi

61.2  0.0126  3897
 0.4023
n 30

 y  0.4023  0.0126 x
c. Interprete el significado de la intersección con el eje Y. a. y de la pendiente b. de este problema.
Sabemos que: 
 y  0.4023  0.0126 x

a  0.4023 , REPRESENTA LA VARIACIÓN EN HORAS DEBIDO A OTROS FACTORES DIFERENTES AL PROCESO DE FACTURACIÓN.

b  0.0126 , PUEDE INTERPRETARSE COMO EL AUMENTO O VARIACIÓN POR CADA FACTURA PROCESADA, EL INCREMENTO
DE LA CANTIDAD DE TIEMPO EN HORAS.
REGRESION LINEAL SIMPLE

d. UTILICE EL MODELO DE REGRESIÓN PARA PREDECIR LA CANTIDAD DE TIEMPO QUE LLEVARÍA PROCESAR 150 FACTURAS:

x0  150 facturas

yˆ 0  0.4023  0.0126(150)

 y 0  2.2923 Horas estimadas a la predicción cuando se procesan 150 facturas.

e. CALCULE EL ERROR ESTÁNDAR DE ESTIMACIÓN.


( y i ) 2  61.2 
2
S yy   y  2
i  153.92   153.92  124.848  29.072
n 30
( xi ) 2  3897  2
S xx   xi2  n
 669459 
30
 669459  506220.3  163238.7

 n  n 
n
  xi   yi 
(3897)(61.2)
S xy   xi yi   i 1  i 1   10007.8   10007.8  7949.88  2057.92
i 1 n 30

S yy  bS xy 29.072  (0.0126) 2057.92


S2    0.1122217
n2 28
POR LO TANTO EL ERROR ESTÁNDAR DE ESTIMACIÓN SERÁ: S  S 2  0.334995  0.335
PROB 2.
EN UNA COMPAÑÍA FABRICANTE DE HELADOS SE SOSPECHA QUE AL
ALMACENAR EL HELADO A TEMPERATURA BAJA. DURANTE LARGOS
PERIODOS TIENE UN EFECTO LINEAL EN LA PERDIDA DE PESO DEL
PRODUCTO . EN LA PLANTA DE ALMACENAMIENTO DE LA COMPAÑÍA SE
OBTUVIERON LOS SIGUIENTES DATOS:
Perdida de
peso (x) 1.01 1.32 1.30 1.06 1.00 1.30 1.26
(Tm.)
Tiempo(y) 28.00 32.00 35.00 27.00 25.00 31.00 30.00
(horas)

a) CONSTRUYA UN DIAGRAMA DE DISPERSIÓN


b) SUPONIENDO QUE HAYA UNA RELACIÓN LINEAL UTILICE EL MÉTODO
DE MÍNIMOS CUADRADOS, PARA ENCONTRAR LOS COEFICIENTES DE
REGRESIÓN A Y B.
c) INTERPRETE EL SIGNIFICADO DE LA INTERSECCIÓN a CON EL EJE Y, Y
DE LA PENDIENTE , b. DE ESTE PROBLEMA
d) UTILICE EL MODELO DE REGRESIÓN PARA PREDECIR LA CANTIDAD DE
TIEMPO QUE LLEVARÍA ALMACENAR 1.05 TONELADAS METRICAS
e) CALCULE EL ERROR ESTÁNDAR DE ESTIMACIÓN
Solución:

〖𝑥𝑖〗 〖 y𝑖 〗 〖𝑥𝑖〗 ^2 〖 y𝑖 〗 ^2 𝑥i.yi

1.0100 28.0000 1.0201 784.0000 28.2800

1.3200 32.0000 1.7424 1024.0000 42.2400

1.3000 35.0000 1.6900 1225.0000 45.5000

1.0600 27.0000 1.1236 729.0000 28.6200

1.0000 25.0000 1.0000 625.0000 25.0000

1.3000 31.0000 1.6900 961.0000 40.3000

1.2600 30.0000 1.5876 900.0000 37.8000

8.2500 208.0000 9.8537 6248.0000 247.7400


Construyendo diagrama de dispersión
 b) Suponiendo que haya relación lineal utilice el método
de mínimos cuadrados

Sea la ecuación y = a + bx
Donde:

b = = = = 19.9037
 
a= =

y
c) Interprete el significado de la intersección con el eje Y,
a. y de la pendiente b. de este problema.

Sabemos que:

y = 6.2564 + 19.9037 x

a = 6.2564, representa la variación en horas debido a otros


factores diferentes al de la cantidad de peso perdido.

b = 19.9037, puede interpretarse como el aumento o


variación por cada tonelada métrica pérdida de peso, el
incremento de la cantidad de tiempo en horas.
  Utilice el modelo de regresión para predecir la cantidad
d)
de tiempo que llevaría almacenar 1.05 toneladas métricas

=1.05 toneladas métricas


=6.2564+19.9037(1.05)

=27.1552 horas estimadas para almacenar 1.05 toneladas


métricas
e.
PROB
DE UNA DETERMINADA EMPRESA SE CONOCEN LOS
SIGUIENTES DATOS, REFERIDOS AL VOLUMEN DE Y AL
GASTO EN DE LOS ÚLTIMOS 6 AÑOS:

(y) (x)
a. Construya un diagrama de dispersión.
b. Suponiendo que haya relación lineal utilice el
método de mínimos cuadrados, para encontrar
los coeficientes de regresión a y b.
c. Interprete el significado de la intersección con el
eje Y, a y de la pendiente, b de este problema.
d. Utilice el modelo de regresión. Para predecir el
gasto de publicidad 120 volúmenes de ventas .
e. Calcule el error estándar de estimación
Solución:
i i i i i i
a) Dibujamos primero el diagrama de
dispersión
•b)  Suponiendo que haya relación lineal utilice el
método de mínimos cuadrados, para encontrar los
coeficientes de regresión a y b.
Sea la ecuación:
•c)  Interpretando el significado de la intersección con
el eje Y, a y de la pendiente, b de este problema.
Ya sabemos que :
a= representa la variación en gastos de publicidad
debido a otros factores diferentes al volumen.
b= puede interpretarse como el aumento o
variación por cada unidad de volumen, el
incremento de la cantidad de gastos de publicidad
•  
d) Utilizando el modelo de regresión. Para
predecir el gasto de publicidad 120 volúmenes
de ventas .
•e)  Calculando el error estándar de estimación

por lo tanto el error estándar de estimación será:


S=

También podría gustarte