Está en la página 1de 38

SEMANA 2

ANALISIS DE REGRESION
LINEAL Y MULTIPLE
Docente:
Mercedes Aida Osorio Maza
mosorio@uni.edu.pe

2017 - I
PRACTICA
PROBLEMAS A DESARROLLAR

 Se desarrollaran problemas en la clase con el


objetivo de que el estudiante observe los pasos a
seguir para la resolución del problema.
 También se dejara problemas propuestos para que
el estudiantes concretice todo lo aprendido en la
clase y así pueda resolver el problema con los
conocimientos dado por el docente en clase.
PROBLEMAS RESUELTOS
1.- En un estudio sobre densidad (x) en gr/ml y
contenido de hierro de un mineral y en porcentajes
se obtuvieron los siguientes resultados.
CONTENIDO DE DENSIDAD
HIERRO (Yi) (Xi)
27 2.8
23 2.9
30 3.0
28 3.1
30 3.2
32 3.2
34 3.2
33 3.3
30 3.4
Hallar:

a ) Realizar el diagrama de disperción


b ) Ajuste los datos a una linea recta
y i  a  bx
2
c ) halle r , presentar los datos bien ajus -
tados ¿que opina?
Solución 1
a) 36.5

34.5
34

33
32.5
32

30.5
30 30 30
yi

28.5
28

27
26.5 y = 12.07x - 8.10

24.5

23
22.5
2.75 2.85 2.95 3.05 3.15 3.25 3.35 3.45
xi
b) Por regresión lineal tenemos que:
a  -8.10
b  12.07
La ecuación será:
Y = -8.10 + 12.07x
c)  (  ) Relac. Directa

b  (-) Relac. Inversa
(0) No existe Relac.

Δy
b
Δx
La sumatoria de los errores   es igual :
2
i

 i  46.96
2
x y Y* (y* - yp)2 e i2
2.80 27 15.06 7.11 1.47
2.90 23 7.15 44.44 15.94
3.00 30 2.15 0.11 3.24
3.10 28 0.07 2.78 1.98
3.20 30 0.90 0.11 0.38
3.20 32 0.90 5.44 1.92
3.20 34 0.90 18.78 11.45
3.30 33 4.64 11.11 1.39
3.40 30 11.30 0.11 9.17

28.10 267.00 43.06 90.00 46.96

Yp = 29.67
b = Al incrementar en una unidad la variable “x” la variable “y”
aumenta en promedio en 12.07%
r2 = 0.48 lo cual nos quiere decir que estamos frente a un regular ajuste
2.- La tabla presenta cifras del producto real bruto
a través de los años 1978 – 1982.

Años Producto Real Bruto

1978 26.13
1979 29.56
1880 38.36
1981 46.87
1982 54.31
Hallar:

a ) Halle el modelo y  ab x
2
b ) Estime r (Interprete)
c ) Halle la sumatoria de los i2
d ) Halle el producto real bruto estimado
para el año 1985 y 1987
e ) En el año 1976 segun su modelo cual es
el error cometido
Solución 2
a)

X y y* xy* X2 ŷ (ŷ - y p ) 2 (yyp2) (yŷ) 2

1 26.13 1.42 1.42 1.00 25.87 173.61 166.82 0.07


2 29.56 1.47 2.94 4.00 31.30 59.96 89.98 3.04
3 38.36 1.58 4.75 9.00 37.88 1.37 0.47 0.23
4 46.87 1.67 6.68 16.00 45.83 46.02 61.21 1.08
5 54.31 1.73 8.67 25.00 55.45 269.23 232.99 1.31

15 195.23 7.88 24.47 55.00 196.33 550.19 551.48 5.73

De las formas normales tenemos que:


a* = 1.33 y b* = 0.08
a = 21.38 y b = 1.21
El modelo será:
Ŷ  21.38(1.21) x

60
REGRESIÓN EXPONENCIAL
55
54.31

50

46.87
45
y

40
38.36

35

30 29.56

26.13
25
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
x
b) También r2 = (550.19/551.48) = 1 lo cual nos indica que
estamos frente a un ajuste perfecto.

c) La sumatoria:

i2  5.73 (formula  rango)


d) Para el año 1985 corresponde un ( x = 8 ) que
reemplazando en el modelo nos un producto bruto
estimado de 98.24
Para el año 1987 corresponde (x = 10 ) que reemplazando
en el modelo nos da un producto bruto estimado de 143.83

e) Error cometido en 1978 será:

(26.13  25.87)
E .100  0.99% ERROR
26.13
3.- Una compañía desea evaluar el % de
trabajadores de ventas (yi) que perciben salarios
dentro de iguales rangos.
Si xi = (marca de clase de los salarios) tenemos:

No Trabajadores % Trabajadores
Salarios Semanales No Trabajadores
Dto. De ventas Dto. Ventas

 78 – 81  124 14 .....................
 81 – 84  1225 13 .....................
 84 – 87  3149 28 .....................
 87 – 90  1441 31 .....................
 90 – 93  175 16 .....................
Hallar:
a) Realice el diagrama de dispersión
b) Halle el modelo de regresión por
ecuaciones normales
c) Y =a + bx +cx2
d) Plantee el modelo matricialmente
e) Determine r2. Interprete
f) Si x = 92 nuevos soles cuanto será y?
Solución 3
a)
No Trabajadores % Trabajadores
Salarios Semanales No Trabajadores
Dto. De Ventas Dto. Ventas

 78 – 81  124 14 11.29
 81 – 84  1225 13 1.06
 84 – 87  3149 28 0.89
 87 – 90  1441 31 2.15
 90 – 93  175 16 9.14

yi xi x2 x3 x4 xy x2y
11.29 79.5 6320.25 502459.88 39945560.06 897.56 71355.62
1.00 82.5 6806.25 561551.63 46325039.06 87.45 7214.63
0.89 85.5 7310.25 625026.38 53439755.06 76.10 6506.12
2.15 88.5 7832.25 693154.13 61344140.06 190.28 16839.34
9.14 91.5 8372.25 766060.88 70094570.06 836.31 77522.37
12
11.29

10
9.14

6
yi

2 2.15

1.06 y = 0.28x2 - 48.77x + 2098.26


0.89
0
78 80 82 84 86 88 90 92 94

-2
xi

y prom  491
b) De las ecuaciones normales:

nB0  B1  x  B2  x 2   yi
B0  x  B1  x 2  B2  x 3   xy i
B0  x 2  B1  x 3  B2  x 4   x 2 yi

Tenemos:

Bo  2089.26

B1  -48.77  Ŷ  2098.26  48.77x  0.28x 2
B2  -0.28 
R2 = 0.96 lo que quiere decir que es un buen ajuste

y* (y* - yp)2 (y - yp )2 e2

10.67 33.22 40.76 0.38


2.66 7.08 1.12 2.56
0.22 0.05 0.79 1.23
2.02 4.08 4.62 0.02
9.38 87.98 83.54 0.06

132.41 130.83 4.25


c) Modelo matricial:
y  xB  i
11.29 1 79.5 79.5 1 
 1.06  1
   82.5 82.5 B0  2 
 0.89   1 85.5 88.5  B1   3 
     
 2.15  1 88.5 88.5 B2  4 
 9.14  1 91.5 91.5 5 
 n

x  
x 2

x x    x x 2
 x3 
 x 2 x 3
 x 4 

 y 
 
xy    yx 
 x 2 y 
 

B̂  xx  xy
1
4.- En un experimento donde se evalúa el tiempo de
combustión de muestras de tabaco( Y ) media en
minutos, se tomó como referencia el porcentaje de
nitrógeno( X1 ) y de cloro(X2) que contenían dichas
muestras obteniéndose los siguiente datos:

Combustión (Tiempo en minutos) -> Y 5.38 8.45 10.12 18.14 20.02

Nitrógeno (%) ->X1 75.80 64.90 87.00 94.10 98.30

Cloro (%) ->X2 15.30 15.50 20.84 29.45 30.75


Hallar:
a) Realice el Diagrama de Dispersión( Bosquejo )
b) Halle el modelo
mediante el vector de coeficientes
c) Interprete
d) Plantee y halle
e) Halle ¿Qué opina?
f) Indique gráficamente el modelo lineal los errores Ej.
I = 1, 2, 3, 4, 5 y halle la suma cuadrado error.
g) ¿Cuál es el objetivo de plantear un modelo de
regresión y cuál es el criterio para determinar el
modelo adecuado?
Solución 4
a) Realice el Diagrama de Dispersión( Bosquejo )

Modelo de Regresión Múltiple:


b) Halle el modelo mediante
el vector de coeficientes
De las ecuaciones normales:
Hallamos el vector coeficiente mediante matrices:
c) Interprete

 : - 0.21767 Significa que manteniendo constante


(Cloro) al aumentar en una unidad la variable
(Nitrógeno), las ventas disminuyen en promedio de
-0.21767 (Miles de nuevos soles).

 : + 1.21246 Significa que manteniendo constante


la variable (Nitrógeno) al aumentar en una unidad la
variable (Cloro), las ventas se incrementan en
+ 1.21246 (Miles de nuevos soles).
d) Plantee y halle
e) Halle ¿Qué opina?
Entonces procedemos a aplicar la fórmula para el coeficiente
de correlación:

El coeficiente de correlación nos indica que el 99.723% de la variación de


Y esta explicada por la variable (Nitrógeno) y (Cloro).Debido a que el
coeficiente de correlación nos resulto en el rango de 0.7 y menor que 1
podemos decir que es un Buen Ajuste para la siguiente regresión
polinomial de dos variables.
f ) Indique gráficamente el modelo lineal los errores Ej. I = 1,
2, 3, 4, 5 y halle la suma cuadrado error.
Sabemos que:

Elaboramos el siguiente cuadro:


g) ¿Cuál es el objetivo de plantear un modelo de
regresión y cuál es el criterio para determinar el
modelo adecuado?
Hay muchos objetivos que uno puede tener presente para poder plantear
un modelo de regresión, pero a continuación mencionaremos algunos de
ellos:

Plantear el problema a resolver por un modelo de regresión con variable


dependiente
Seleccionar y estimar un modelo de regresión logística y analizar su
bondad de ajuste
Interpretar los resultados obtenidos
Plantear un modelo de regresión logística con observaciones múltiples
Plantear un modelo de regresión con variable dependiente y, en
particular, un modelo de regresión logística multinomial
Para determinar un modelo adecuado con respecto a otros, sería
necesario poder hallar el coeficiente de correlación y así poder
determinar qué modelo se ajusta más a la forma posible que uno
quiera hacer. Comparar los coeficientes de correlación con los otros
modelos sería la mejor opción, sabiendo que el mayor de todos
tiene un ajuste más perfecto en comparación a los demás modelos.

Por lo tanto el modelo que tenga el mayo coeficiente de correlación


seria la mejor opción a escoger ya que su porcentaje de error es
mínimo en comparación a los demás modelos.
PROBLEMAS PROPUESTOS
1.- Con los siguientes datos:

V (Volumen) Plug3 56,8 62,7 73,6 90,2 120,6 196,0

P (Presión) lb./Plug3 61,2 48,5 36,4 26,3 19,2 9,6

a) Realice el diagrama de dispersión.


b) Halle la ecuación de la regresión aplicando el método
de los mínimos cuadrados al modelo: Yi = Bo/Xi
c) Interprete el valor del coeficiente de correlación.
2.- El ingreso y el consumo promedio mensual (en
miles de nuevos soles); de una muestra de 6
familias de distintos estratos sociales fue de:

Ingreso: 1,3 1,7 2,1 2,4 2,8 3,0

Consumo: 1,2 1,6 1,8 2,1 2,1 2,2

a) Realice el diagrama de dispersión ajuste los datos al


modelo Ŷ = axb.
b) Halle ê4, y la suma cuadrado de los errores, del modelo
elegido.
c) Cuál será su consumo de una familia si su ingreso es de
S/ 2 500.
3.- Una compañía desea evaluar el % de trabajadores
de ventas (yi) que perciben salarios dentro de
iguales rangos.
Si xi = (marca de clase de los salarios) tenemos:

Salarios Nº Nº Trabajadores Dto. De % Trabajadores Dto.


Semanales Trabajadores Ventas De Ventas

 78 – 81  124 14 14/124

 81 – 84  1225 13 13/1225

 84 – 87  3149 28 28/3149

 87 – 90  1441 31 31/1441

 90 – 93  175 16 16/175
Halla:

a) Realice el diagrama de dispersión (Bosquejo).

b) Halle el modelo mediante


las ecuaciones normales.

c) Plantee el modelo matricialmente

d) Halle ry2 .12 ¿Qué opina?

e) Si x = 92 nuevos soles ¿cuánto será y?


4.- Bajo el criterio de matrices, demuestre:

También podría gustarte