Está en la página 1de 5

CASO DE ESTUDIO 3: Regresión Lineal simple_G

NOMBRES:
 Eduardo Enrique Muñoz Valderrama
 Jhon Sebastián Obando Benavides.

1. Elabore un diagrama de dispersión para X y Y, comente sobre el tipo de relación que presentan las variables.

CAPACITACIÓN Y RAPIDEZ DE EJECUCIÓN


35
30
Minutos en producir 1kg material

25
f(x) = − 1.32 x + 29.52
20 R² = 0.78
15
10
5
0
2 4 6 8 10 12 14 16 18 20 22
Horas de entrenamiento recibido

En la gráfica podemos ver que los datos presentan una relación lineal, con una pendiente negativa, es decir, que a
mayor horas de entrenamiento recibido por un obrero se demorará menos minutos en producir 1Kg de material.

2. Obtenga un modelo de regresión lineal simple que prediga a Y.


Al introducir los valores en la calculadora, me arroja los siguientes datos:
A: 29,51748252
B: -1,315384615
El modelo es:
^
Minutos producción=29,5175−1,3154 × Horas entrenamiento

3. Interpretar los coeficientes del modelo obtenido en 2.


A = b0 = 29,5175
Esto quiere decir que para las personas que tienen 0 horas de entrenamiento recibido los minutos en producir 1Kg
de material en promedio es de 29,5175 minutos.

B = b1 = -1,3154
Esto quiere decir que por cada hora de entrenamiento recibido los minutos en producir 1Kg de material en promedio
disminuye 1,3154 minutos.
4. Calcule e interprete el coeficiente de correlación.
r = - 0,884865444
Como el valor r es diferente a 0 quiere decir que las variables X y Y están correlacionadas, como r ˂ 0 hay
correlación negativa, es decir, las dos variables se correlacionan en sentido inverso. A valores altos de una de ellas
le suelen corresponder valores bajos de la otra y viceversa. Como este está próximo a -1 existe una fuerte
asociación lineal.

5. Calcule e interprete el coeficiente de determinación.

sumade cuadrados regresión 449,8615385


R 2= = =0,782986855
sumacuadrados total 574,5454545
El 78.2987% de la variación de los minutos en producir 1Kg de material es explicado por la variación de
las horas de entrenamiento recibidas por un obrero.

6. Realice la prueba de linealidad para el modelo encontrado en 2. (use α=0.05).


Se realiza la prueba de hipótesis correspondiente.
H0: β=0 (el modelo no es significativo).
H1: β≠0 (el modelo es significativo).

α=0,05
b1 = -1,3154
Ʈ ( 0,025,9)=2,262

b1 −β1 −1,3154−0
Ʈ c= = =−5,6993
Sb 1 0,2308
Se rechaza la hipótesis nula debido a que -5,6993 ˂ -2,262
Con una significancia del 0.05 se puede afirmar que el modelo es significativo por lo cual hay relación lineal.

7. Estime la pendiente del modelo con una confianza de 90%.


Se calculan los intervalos de confianza para la pendiente.
Intervalo de confianza=b1 ±Ʈ (α / 2 , (n−2 )) × Sb1
α=0,1
b1 = -1,3154
Ʈ ( 0,05,9)=1,833

Sb1 = 0.230832677

Reemplazando datos se tiene:


Intervalo de confianza=−1,3154 ±1,833 × 0.2308=(−1,7385 ;−0,8923)
Con una confianza del 90% por cada hora de entrenamiento recibido, los minutos en producir 1Kg de material en
promedio disminuye entre 1,7385 y 0,8923 minutos.
8. Realice la prueba de normalidad de los residuos para el modelo obtenido en 2. (α=0,05).

Gráfica de Probabilidad de Residuo


Normal
99
Media -1.93784E-15
Desv .Estan 3.531
95 N 11
AD 0.408
90
Valor p 0.286
80
70
Porcentaje

60
50
40
30
20

10

1
-10 -5 0 5 10
Residuo

Con ayuda de Minitab se logra hacer la gráfica de prueba de normalidad de residuos para así hacer el respectivo
análisis.
H0: Hay normalidad de residuos.
H1: No hay normalidad de residuos.

El valor de p es 0,286 > 0.05 que es la significancia, como p es mayor no se rechaza la hipótesis nula, por lo tanto,
hay normalidad de residuos.

9. Realice gráficamente las pruebas de independencia y homogeneidad de los residuos para el modelo obtenido en 2.
Error vs Horas de entrenamiento recibido
10
8
Error / Residuos 6
4
2
0
2 4 6 8 10 12 14 16 18 20 22
-2
-4
-6

Horas de entrenamiento recibido

Al hacer el análisis gráfico de los errores se determina que no hay independencia debió a que la gráfica toma forma
en curvas, además los residuos a lo largo del orden de observación, estos presentan mucha dispersión por lo tanto
no hay homogeneidad.

10. Prediga los minutos que se tarde en producir 1Kg de material para 22 horas de entrenamiento. Dé su respuesta con
un intervalo del 95%.
Para predecir un valor de Y dado X se utiliza la siguiente fórmula:
2
( xi − x́ )

α = 0,05
√ 1
^y ±t α / 2 ,n−1 S 1+ + n
n
∑ ( x i− x́ )2
1

^y =0,5790
Ʈ ( 0,025, 10) =2,2 28
S=3.722065079
n=11
x́=10
( 22−10 )2=144
n

∑ (x i−x́)2=404
1

1 144
Y =0,5790± 2,2 28× 3,7221 1+
√ +
11 404
=0,5790 ± 9,9768

Y =(−9,3978 ; 1 0 ,5558)
Con una confianza del 95% a 22 horas de entrenamiento recibido por el obrero, se predice que los minutos que se
tarde en producir 1Kg de material es entre -9,3978 y 10,5558 minutos.
11. Estime con una confianza del 98% el tiempo en producir 1Kg de material para 17 horas de entrenamiento.
Para predecir un valor de Y dado X se utiliza la siguiente fórmula:
2
( x i− x́ )

√ 1
^y ±t α / 2 ,n−2 S + n
n
∑ ( x i− x́ )2
1

α = 0,02

^y =0,5790
Ʈ ( 0,0 1 ,9) =2, 821

S=3.722065079
n=11

x́=1 0

( 17−10 )2=4 9
n

∑ (x i−x́)2=316,0248
1

1 49
Y =0,5790± 2 , 821× 3,7221
√ +
11 316,0248
=0,5790 ±5,2074

Y =(−4,6284 ; 5 ,7 8 64 )
Con una confianza del 98% a 17 horas de entrenamiento recibido por el obrero, se estima que los minutos que se
tarde en producir 1Kg de material en promedio es entre -4,6284 y 5,7864 minutos.

12. Genere un modelo que permita predecir de una mejor forma la rapidez en la ejecución de la tarea en función de las
horas de entrenamiento.
Con ayuda de Excel se logra generar un modelo que permite predecir con una mejor forma la rapidez en la ejecución
de la tarea en función de las horas de entrenamiento, que es la siguiente:

Minutos producción=0,0744( Horas entrenamiento )2−3,0616 ( Horas entrenamiento ) +37,778


^

También podría gustarte