Está en la página 1de 10

TALLER DE REGRESION LINEAL

TALLER # 4
DISEÑO DE EXPERIMENTOS
UNIVERSIDAD AGRARIA DE COLOMBIA
BOGOTA 2019-2
PAULA ANDREA GUTIERREZ PIÑEROS ID 10892
ERIKA LIZETH GONZALEZ CALDERON ID 21935
JAVIER ALFREDO VARGAS CLAVIJO ID 5210

1. En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual, que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo
de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación.

Horas de uso Diámetro (mm)


16 26,2
32 25,7
48 26
64 27,7
80 28,3
96 29,5
112 30,1
128 31,8
144 31,4
160 33,4
176 33,6
192 32,7
208 35
224 36,1
240 35,7
256 36,2
272 36,8
288 39,1
304 38,7
320 39,1

a) ¿En este problema cuál variable se puede ver como independiente y cuál como dependiente?
La variable independiente son las horas de uso por que no dependen del diametro y la varibla dependiente es el diametro ya que en cada hora de uso este va cambiando.
b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especiales?

DIAMETRO VS.HORAS DE USO


39
37
35
Diametro

33
31 y = 0,0463x + 24,873
29
27 R² = 0,9764
25
0 50 100 150 200 250 300 350
Horas de uso

Debido a la manera que toma el grafico de dispersion de cada uno de los datos se puede obcervas que hay una relacion lineal positiva entre las horas de uso y el diametro y que las variables son proporcionales , es
decir que a medida que aumentan las horas de uso aumenta el diametro.
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
Haciendo la regresion leneal se obtiene la ecuacion de la linea recta de tendencia entre los puntos , la ecuacion es la siguiente:

y = 0,0463x + 24,873
H0= Las dos varibles de estudio son independientes
Esta hipotesis se rechaza debido a que en el grafico de dispersion se puede evidenciar que las variables si tienen una relacion lineal.
H1= Las dos variables estan relacionadas

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,988134765
Coeficiente de determinación R^2 0,976410313
R^2 ajustado 0,975099775
Error típico 0,700184664
Observaciones 20

ANÁLISIS DE VARIANZA Valor P 0,00

Promedio de los
Grados de libertad Suma de cuadrados F Valor crítico de F
cuadrados
Al analizar los datos obtenidos del analisis de varianza y el valor de P , el cual es
Regresión 1 365,26 365,26 745,05 3,67 menor al nivel de confianza de 0.5, se puede decir que con un nivel de confianza
95 % se rechaza la hipotesis nula.
Residuos 18 8,825 0,490
Total 19 374,0895

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%

Intercepción 24,87315789 0,325257801 76,47213317 4,4798E-24 24,18981661 25,55649918 24,18981661 25,55649918


Horas de uso 0,046320489 0,001697 27,29551823 4,24068E-16 0,042755224 0,049885753 0,042755224 0,049885753

d) ¿La calidad del ajuste es satisfactorio? Argumente.

El coeficiente de correlacion r es de 0,975099 =97,5099% que indica que el odelo tiene una calidad de ajuste satisfactoria , ya que explica el 97,50% de la variabilidad en diametro.
e) Si el diámetro máximo tolerado es de 45, ¿cuántas horas de uso estima que tiene esa herramienta?
El valor seria de 433,89 horas
f) Señale el valor de la pendiente de la recta e interprételo en términos prácticos.

El valor de la pendiente es 0,0463 que indica la razon de cambio en el diametro (y) con respecto al cambio en las horas de uso (x), es decir cuanto va a variar el diametro cuando se varien las horas de uso.
g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad del ajuste
El error estandar es de 0,700 , indicando que la calidad de ajuste es buena , ya que si el error estandar de estimacion es menor la cantidad del ajuste sera mayor.
2. En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos se muestran en la página siguiente.
Tiempo (min) X Redimiento(%) Y
10 64 MEDIA X 14,67
15 81,7 MEDIA Y 75,47
20 76 n 12
8 68,5
12 66,6
13 77,9
15 82,2
12 74,2
14 70
20 76
19 83,2
18 85,3
a) ¿En este problema cuál variable se puede ver como independiente y cuál como dependiente?
La variable independiente (x) es el tiempo de extracción y la variable dependiente (y) es el rendimiento , debido a que el rendimiento siempre va a variar dependiento del tiempo,

b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especiales?

Redimiento(%) VS. TIEMPO (min)


90

85
Rendimiento (%)

80

75

70

65 y = 1,1887x + 58,033
60
R² = 0,4488
10 12 14 16 18 20 22
Tempo (min)

Debido a la manera que toma el grafico de dispersion de cada uno de los datos se puede obcervar que hay una relacion lineal positiva entre el timepo de extraccion y el rendimiento y que las variables son
proporcionales , es decir que a medida que aumenta el tiempo de extraccion aumenta el rendimiento.
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
Haciendo la regresion leneal se obtiene la ecuacion de la linea recta de tendencia entre los puntos , la ecuacion es la siguiente:
y = 1,1887x + 58,033
H0= Las dos varibles de estudio son independientes
Esta hipotesis se rechaza debido a que en el grafico de dispersion se puede evidenciar que las variables si tienen una relacion lineal.
H1= Las dos variables estan relacionadas
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,600675941
Coeficiente de determinación R^2 0,360811586
R^2 ajustado 0,289790651
Error típico 3,230111604
Observaciones 11
ANÁLISIS DE VARIANZA
Suma de Promedio de los
Grados de libertad F Valor crítico de F Al analizar los datos obtenidos del analisis de varianza y
cuadrados cuadrados
el valor de P , el cual es menor al nivel de confianza de
Regresión 1 53,00650214 53,00650214 5,08035535 0,050673957
0.5, se puede decir que con un nivel de confianza 95 % se
Residuos 9 93,90258877 10,43362097
rechaza la hipotesis nula.
Total 10 146,9090909

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -12,97645734 12,4904719 -1,038908493 0,325952025 -41,23186781 15,27895313 -41,23186781 15,27895313
64 0,366850084 0,162757713 2,253964363 0,050673957 -0,001333441 0,735033609 -0,001333441 0,735033609

Gráfico de los residuales


10
Residuos

5
Análisis de los residuales
0
Observación Pronóstico 10 Residuos Residuos estándares 0 10 20 30 40 50 60 70 80 90
1 16,99519453 -1,995194527 -0,651098151 -5
64
2 14,90414905 5,095850952 1,662945186
3 12,15277342 -4,152773418 -1,355187706
4 11,45575826 0,544241742 0,177604132
5 15,60116421 -2,601164208 -0,848846157 Curva de regresión ajustada
6 17,17861957 -2,178619569 -0,710955826 25
7 14,2438189 -2,243818897 -0,73223253
20
8 12,70304854 1,296951456 0,423238278
9 14,90414905 5,095850952 1,662945186 15
10

10 17,54546965 1,454530347 0,474661496 10 Series1


11 18,31585483 -0,315854829 -0,103073907 5 Pronóstico 10
0
0 20 40 60 80 100
64

d) ¿La calidad del ajuste es satisfactoria? Argumente.


El coeficiente de correlacion r es de 0,60 =60% que indica que el modelo tiene una calidad de ajuste satisfactoria
e) Señale el valor de la pendiente de la recta e interprételo en términos prácticos.
El valor de la pendiente es 1,1887 que indica la razon de cambio en el rendimiento (y) con respecto al tiempo (x), es decir que el rendimiento aumentara conforme aumente el tiempo.
f) Estime el rendimiento que se espera a un tiempo de extracción de 25 minutos y obtenga un intervalo de confianza para esta predicción.

y = 1,1887 (25) + 58,033 El intervalo de confianza esta definido entre 77,57 y 98,004 para un tiempo
1 25−14,66 ^2
de extraccion de 25 minutos
87,75 ± 2281 29,38( + )
12 170,66

87,75 ± 2281 20,85

87,75 ± 10,174= 77,57


3. En cierta empresa es usual pagar horas extras para cumplir con los tiempos de entrega. En este centro productivo, un grupo de mejora de calidad trata de reducir la proporción de piezas malas, con este propósito
deciden investigar la relación entre la cantidad de horas extras, X, y el porcentaje de artículos defectuosos, Y. En la página siguiente se muestran los datos obtenidos.

TABLA 1 TABLA 2
Semana H Extras Defectos Semana H Extras Defectos

1 340 5 1 340 5

2 95 3 2 95 3
3 210 6 3 210 6

4 809 15 4 809 15
5 80 4 5 80 4

6 438 10 6 438 10

7 107 4 7 107 4
8 180 6 8 180 6

9 100 3 9 100 3
10 550 13 10 550 13

11 220 7 11 220 7

12 50 3 12 50 3
13 193 193 14 290 8

14 290 8 15 340 2
15 340 2 16 115 4

16 115 4 17 362 10

17 362 10 18 300 9
18 300 9 19 75 2

19 75 2 20 93 2
20 93 2 21 320 10

21 320 10 22 154 7

22 154 7

a) ¿De estas variables cuál se puede suponer independiente y cuál dependiente?


La variable independiente son las horas de uso por que no dependen del diametro y la varibla dependiente es el diametro ya que en cada hora de uso este va cambiando.
b) Obtenga el diagrama de dispersión para estas variables, ¿qué relación observa?

TABLA 1 TABLA 2

HORAS EXTRAS VS.% DE DEFECTOS HORAS EXTRA VS. % DE DEFECTOS


900 900
800 800
700 700
HORAS EXTRAS

600 600
500 500
400 400
300 300
y = 43,103x - 24,032
200 200
y = 0,0609x + 245,51 R² = 0,738
100 100
0
R² = 0,0002 0
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
PORCENTAJE DE DEFECTOS PORCENTAJE DE DEFECTOS

Fue necesario proponer un segundo diagrama de disperson en el que se omitieron las valores correspondientes alos datos # 13 , ya que este punto se encontraba muy lejano a los demas y hacia que la linea de
tendencia presentara una pendiente muy pequeña muy cercana a cero quedando casi horizontal . una vez omitido este punto la grafica de dispersion arroja una linea de tendencia aplicable a los parametros de
estudio . La diferencia significativa entre los valores de este dato y el de el resto puede ser el resultado de un error producido en la fase de recoleccion de informacion.

c) Haga un análisis de regresión (ajuste línea recta, pruebas de hipótesis, análisis de residuos).
H0= Las dos varibles de estudio son independientes
Esta hipotesis se rechaza debido a que en el grafico de dispersion se puede evidenciar que las variables si tienen una relacion lineal.
H1= Las dos variables estan relacionadas

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,954697747
Coeficiente de determinación R^2 0,911447788
R^2 ajustado 0,858816209
Error típico 93,79108371
Observaciones 20
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
F Valor crítico de F
libertad cuadrados cuadrados
Regresión 1 1720319,42 1720319,42 195,5626817 4,14134E-11
Residuos 19 167138,5803 8796,767384
Total 20 1887458

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
5 39,61861314 2,833063291 13,98437277 1,87668E-11 33,68894352 45,54828276 33,68894352 45,54828276
Análisis de los residuales

Observación Pronóstico 340 Residuos


1 118,8558394 -23,85583942 5 Gráfico de los residuales
2 237,7116788 -27,71167883 400
3 594,2791971 214,7208029
Residuos

4 158,4744526 -78,47445255 200


5 396,1861314 41,81386861
0
6 158,4744526 -51,47445255
0 2 4 6 8 10 12 14 16
7 237,7116788 -57,71167883 -200
8 118,8558394 -18,85583942 5
9 515,0419708 34,9580292
10 277,330292 -57,33029197
11 118,8558394 -68,85583942
12 316,9489051 -26,94890511 5 Curva de regresión ajustada
13 79,23722628 260,7627737 1000
14 158,4744526 -43,47445255
340

15 396,1861314 -34,18613139 500


16 356,5675182 -56,56751825 Series1
17 79,23722628 -4,237226277 0 Pronóstico 340
18 79,23722628 13,76277372 0 5 10 15 20
19 396,1861314 -76,18613139 5
20 277,330292 -123,330292

Al realizar el analisis estadistico y observar la graficas y valores de los residuos podemos concluir que la diferencia entre los valores de la variable dependiente observados y los valores que predecimos a partir de
nuestra recta de regresión no estan distantes , esto tambien se evidencia en el diagrama de curva de regresion ajustada .
d) ¿La calidad del ajuste es satisfactoria?
El coeficiente de correlacion r es de 0,85 =85% este valor es cercano a 1 lo que indica que el modelo tiene una calidad de ajuste satisfactoria
e) El que dos variables estén relacionadas no necesariamente implica que haya una relación causa-efecto. Sin embargo, a pesar de esto, ¿puede concluir con seguridad que cuando se trabaja tiempo extra se
Si se podria asegurar , ya que el tiempo extra trabajado es una sobre carga laboral y en ocasiones no resulta ser muy buena en comparacion con el trabajo ejecutado en el horario normal.
4.En una fábrica de pintura se quiere reducir el tiempo de secado del barniz. Los siguientes datos corresponden al tiempo de secado del barniz (en horas) ya la cantidad de aditivo con el que se intenta lograr tal
reducción
Cant Aditivo x T secado y
0 14
1 11
2 10
3 8
4 7,5
5 9
6 10
7 11
8 13
9 12
10 15

a) Mediante un diagrama de dispersión investigue la relación entre el tiempo de secado y la cantidad de aditivo.

RELACION DE ADITIVO VS. TIEMPO DE


SECADO
16
14
Tiempo de secado

12
10
8
6
4
y = 0,2409x + 9,75
2
R² = 0,1116
0
0 2 4 6 8 10 12
Cantidad de aditivo

En el diagrama de dispersion se puede observar que la cantidad de aditivo y el tiempo de secado tienen una relacion lineal positiva baja , son directamente proporcionales , es decir , a mayor cantidad de aditivo se
necesita mayor tiempo de secado.
b) Con base en la relación, ¿qué cantidad de aditivo recomendaría para reducir el tiempo de secado?
Revisando los datos recomendaria el cuarto aditivo que tiene el menor tiempo de secado correspondiente a 7,5 horas , para que la ejecucion del trabajo sea la mas rapida.
c) Obtenga el coeficiente de correlación entre ambas variables e interprételo.
Coeficiente de correlación lineal 0,334001184
Este coeficiente estima la relacion lineal que existe entre las variables de estudio , tomando como 1 el mayor valor de correlacion y 0 como el menor valor de correlacion.Para este caso el valor es de 0,33 un valor muy
lejano a 1 , que significa que la relacion entre las variables es positiva pero baja .
d) Al parecer el coeficiente de correlación lineal es muy bajo, ¿quiere decir entonces que el tiempo de secado no está relacionado con la cantidad de aditivo?
Si existe una relacion por que el valor de coeficiente de correlacion es diferente a 0 , pero es muy baja.
e) ¿Usted cree que ajustar una línea recta sea correcto?
No , el grafico de dispersion deja ver que los puntos se encuentran muy dispersos y que la linea no acoge muy bien la tendencia de todos los puntos.
f) Proponga el modelo que crea adecuado, ajústelo y haga un análisis de regresión completo para tal modelo

RELACION DE ADITIVO VS. TIEMPO DE La regresión que mas se ajusta a los datos suministrados es la polinómica ,
SECADO ya que al trazar la curva en el diagrama de dispersión se puede notar que es
18 la que representa la mayor tendencia entre los puntos . Tambien el
16 coeficiente de relación tiene un mayor valor respecto al obtenido mediante
Tiempo de secado

14 regresion lineal
12
10
8
6
4 y = 0,2197x2 - 1,9561x + 13,045
2 R² = 0,8352
0
0 2 4 6 8 10 12
Cantidad de aditivo
5. Se realiza un estudio sobre la cantidad de azúcar transformada en cierto proceso a varias temperaturas. Los datos se recolectan y se registran como.
Temp , x Azucar, y
1 8,1
1,1 7,8
1,2 8,5
1,3 9
1,4 9,5
1,5 8,9
1,6 8,6
1,7 10,2
1,8 9,3
1,9 9,2
2 10,5
a) Estime la línea de regresión lineal más adecuada

TEMPERATURA VS. AZUCAR


10,5
CANTIDAD DE AZUCAR

10

9,5

8,5
y = 1,9545x + 6,1227
R² = 0,6265
8
1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2
TEMPERATURA

b) Estime la cantidad media de azúcar transformada que se produce cuando la temperatura vale 1.75
y = 1,9545x + 6,1227
y = 1,9545( 1,75) + 6,1227
y = 9,54
LA CANTIDAD MEDIA DE AZUCAR TRASFORMADA QUE SE PRODUCE CUANDO LA TEMPERATURA ES 1,75 SE OBTIENE DE COLOCAR ESTE VALOR REEMPLAZANDO LA X EN LA ECUACION OBTENIDA DE LA REGRESION LINEAL , PARQ ESTE CASO EL RESULTADO ES ES 9,54.

c) Calcule el error
Error tipico 0,5276
d) Calcule la varianza
Temp , x 0,11
Azucar, y 0,67
e) Moda
Temp , x NO APLICA
Azucar, y NO APLICA
f) La media
Temp , x 1,500
Azucar, y 9,055
g) Desviación estándar
Temp , x 0,332
Azucar, y 0,819
h) Correlación
Coeficiente de correlación lineal 0,7915
6.Un estudio de la cantidad de precipitación pluvial y la cantidad de contaminación eliminada del aire produce los siguientes datos:
Precipit diaria, x (0.01
Partic elimin, y (mcg/m3)
cm)
4,3 126

4,5 121

5,9 116
5,6 118
6,1 114
5,2 118
3,8 132
2,1 141
7,5 108

a) Encuentre la ecuación de la línea de regresión para predecir las partículas que se eliminan a partir de la cantidad de precipitación pluvial diaria.

CANTIDAD DE LLUVIA DIARIA VS.CANTIDAD DE


PARTICULAS ELIMINADAS
Cantidad de particulas eliminadas

150

140

130

120
y = -6,324x + 153,18
110
R² = 0,9578
100
0 1 2 3 4 5 6 7 8
Cantidad de lluvia diaria

b) Estime la cantidad de partículas eliminadas cuando la precipitación pluvial diaria x=4.8 unidades
y = -6,324x + 153,18
y = -6,324x + 153,18
y = 122,82
c) Calcule la media y la varianza Desviacion estandar y correlación
Media x 5,0
Media y 121,6

Varianza x 2,41
Varianza y 100,53

Desviacion estandar x 1,55


Desviacion estandar y 10,03

Coeficiente de correlación lineal -0,98


7. Un artículo en Wood Science and Technology ["Creep in Chipboard, Part 3: Initial Assessment of the Influence of Moisture Content and Level of Stressing on Rate of Creep and Time to Failure" (1981, Vol. 15, pp.
125– 144)] informó un estudio de la deflexión (mm) del tablero de partículas a partir de los niveles de tensión de humedad relativa. Suponga que las dos variables están relacionadas de acuerdo con el modelo de
regresión lineal simple. Los datos siguen.

Niveles de
Datos tensión de Deflexión y x*y x^2 y^2
humedad X
1 54 14,473 781,542 2916 209,47
2 54 18,693 1009,422 2916 349,43
3 61 14,305 872,605 3721 204,63
4 61 15,121 922,381 3721 228,64
5 68 13,505 918,34 4624 182,39
6 68 11,64 791,52 4624 135,49
7 75 11,168 837,6 5625 124,72
8 75 12,534 940,05 5625 157,10
9 75 11,224 841,8 5625 125,98
sumatoria 591 122,663 7915,26 39397 1717,85
Media x 65,67
media y 13,63
VARIANZA
(a) Calcule las estimaciones de mínimos cuadrados de la pendiente y la intersección. ¿Cuál es la estimación de σ2? Graficar el modelo de regresión y los datos.
con formulas
Título del gráfico MINIMOS CUADRADOS
20 b -0,24
19 y = -0,2374x + 29,221 a 29,22
18 R² = 0,7198
r 0,79
17
16 r2
15
14
Excel
13
12 b -0,23743254 29,22062566 a
11 0,055988562 3,704329686 Error ordenada de origen
Error pendiente
10
54 59 64 69 74 79 r2 0,719818624 1,357650468 r
17,98381618 7
33,14803601 12,90250355

Y= A+BX Y=29,22+-0,24X
8. En un artículo publicado en IEEE Transactions on Instrumentation and Measurement (2001, Vol. 50, pp. 986–990), los investigadores informaron sobre un estudio de los efectos de reducir el consumo de corriente
en un núcleo magnético por medios electrónicos. Midieron la corriente en un devanado magnético con y sin la electrónica en un experimento emparejado. Los datos para el caso sin electrónica se proporcionan en la
tabla.

Suministro de CORRIENTE
voltaje X ELECTRONICA (Y)
0,66 7,32
1,32 12,22
1,98 16,34
2,64 23,66
3,3 28,06
3,96 33,39
4,62 34,12
3,28 39,21
5,94 44,21
6,6 47,48

(a) Grafique los datos y ajuste una línea de regresión para predecir la corriente sin electrónica para suministrar voltaje. ¿Hay una regresión significativa en α = 0.05? ¿Cuál es el valor P?

CORRIENTE ELECTRICA VS.SUMINISTRO DE VOLTAJE


60

50
SUMINISTRO DE VOLTAJE

40

30

20
y = 6,7342x + 5,5027
10
R² = 0,8986
0
0 1 2 3 4 5 6 7
CORRIENTE ELECTRICA

(b) Estime el coeficiente de correlación.


Coeficiente de correlación lineal 0,95
(c) Pruebe la hipótesis de que ρ = 0 contra la alternativa ρ ≠ 0 con α = 0 05. ¿Cuál es el valor P?
H0= El valor de p es igual a 0
Esta hipotesis se rechaza debido a que al obtener el analisis estadistico de los datos se encuentra que el valor de p es 0,11
H1= El valor de p es diferente a 0

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 1493,668824 1493,668824 70,8782258 3,01868E-05
Residuos 8 168,589866 21,07373325
Total 9 1662,25869

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 5,502740383 3,103995036 1,772792907 0,114198868 -1,655085005 12,66056577 -1,655085005 12,66056577
Suministro de voltaje X 6,734186477 0,799887149 8,418920703 3,01868E-05 4,889643404 8,57872955 4,889643404 8,57872955
9. Una empresa de servicios eléctricos está interesada en desarrollar un modelo que relacione la demanda de horas pico (y en kilovatios) con el uso total de energía mensual durante el mes (x, en kilovatios hora). Los
datos de 50 clientes residenciales se muestran en la tabla

Uso total de
Dato Demanda de horas (x)
energia (y)
1 679 0,79
2 292 0,44
3 1012 0,56
4 493 0,79
5 582 2,7
6 1156 3,64
7 997 4,73
8 2189 9,5
9 1097 5,34
10 1434 0,31
11 837 4,2
12 1748 4,88
13 1381 3,48
14 1428 7,58
15 1255 2,63
16 1777 4,99
17 370 0,59
18 2316 8,19

(a) Dibuje un diagrama de dispersión de y versus x.


(b) Ajustar el modelo de regresión lineal simple

DEMANDA DE HORAS VS.USO TOTAL DE ENERGIA


10
9
8
USO TOTAL DE ENERGIA

7
6
5
4
3
2 y = 0,0037x - 0,7235
1 R² = 0,5959

0
0 500 1000 1500 2000 2500
DEMANDA DE HORAS

(d) Grafique los residuos versus yi y comente los supuestos de regresión subyacentes. Específicamente, ¿parece que se cumple el supuesto de igualdad de varianza?

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,771918148
Coeficiente de determinación R^2 0,595857627
R^2 ajustado 0,570598729
Error típico 1,857568983
Observaciones 18

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F

Regresión 1 81,39879959 81,39879959 23,59000858 0,000174834


Residuos 16 55,20900041 3,450562525
Total 17 136,6078

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -0,723533934 0,997568148 -0,725297752 0,478744103 -2,838283937 1,391216068 -2,838283937 1,391216068
Demanda de horas (x) 0,003723975 0,00076673 4,856954662 0,000174834 0,002098579 0,005349371 0,002098579 0,005349371

Análisis de los residuales Resultados de datos de probabilidad

Pronóstico Uso total de Uso total de


Observación
energia (y)
Residuos Residuos estándares Percentil
energia (y)

1 1,805045248 -1,015045248 -0,563254826 2,777777778 0,31


2 0,363866833 0,076133167 0,04224676 8,333333333 0,44
3 3,045129001 -2,485129001 -1,379013304 13,88888889 0,56
4 1,112385855 -0,322385855 -0,178893886 19,44444444 0,59
5 1,443819651 1,256180349 0,69706217 25 0,79
6 3,581381434 0,058618566 0,032527801 30,55555556 0,79
7 2,989269372 1,740730628 0,965942087 36,11111111 2,63
8 7,42824785 2,07175215 1,149627958 41,66666667 2,7
9 3,361666896 1,978333104 1,097789157 47,22222222 3,48
10 4,616646549 -4,306646549 -2,389784549 52,77777778 3,64
11 2,393433335 1,806566665 1,002474908 58,33333333 4,2
12 5,785974772 -0,905974772 -0,50273095 63,88888889 4,73
13 4,419275862 -0,939275862 -0,521209929 69,44444444 4,88
14 4,594302698 2,985697302 1,656781721 75 4,99
15 3,950054982 -1,320054982 -0,732506595 80,55555556 5,34
16 5,893970054 -0,903970054 -0,50161852 86,11111111 7,58
17 0,654336902 -0,064336902 -0,035700941 91,66666667 8,19
18 7,901192704 0,288807296 0,160260937 97,22222222 9,5

Demanda de horas (x) Gráfico de los Demanda de horas (x) Curva de


Uso total de energia (y)

residuales regresión ajustada


5 10
Residuos

5 Uso total de energia (y)


0
0
0 500 1000 1500 2000 2500 Pronóstico Uso total de
0 500 1000 1500 2000 2500
-5 energia (y)
Demanda de horas (x) Demanda de horas (x)
10. Un artículo en el IEEE Transactions on Instrumentation and Measurement ["Medición directa, rápida y precisa de VT y K del transistor MOS usando el circuito VT-Sift" (1991, Vol. 40, pp. 951-955)] describió el uso
de un modelo de regresión lineal simple para expresar la corriente de drenaje y (en miliamperios) en función del voltaje de tierra a la fuente x (en voltios). Los datos son los siguientes:

X Y
1,1 0,734
1,2 0,886
1,3 1,04
1,4 1,19
1,5 1,35
1,6 1,5
1,7 1,66
1,8 1,81
1,9 1,97
2 2,12

(a) Dibuje un diagrama de dispersión de estos datos. ¿Una relación en línea recta parece plausible?
Al realizar el diagrama de dispersion de los datos se evidencia que presentan una linealidad muy exacta , esto se corrobora al obtener el coeficiente de correlacion lineal igual a 1 , lo que podria poner en duda la
veracidad y confiabilidad de los datos , ya que su relacion seria muy exacta.

(b) Ajuste un modelo de regresión lineal simple a estos datos. y = 1,5438x - 0,9668

Título del gráfico


2,5

1,5

0,5
y = 1,5438x - 0,9668
0 R² = 1
0 0,5 1 1,5 2 2,5

11. Se está estudiando la resistencia a la compresión de un cierre de aleación utilizado en la construcción de aviones. Se seleccionaron diez cargas en el rango de 2500 a 4300 psi, y se probaron varios sujetadores en
esas cargas. Se registraron los números de sujetadores que fallaban en cada carga. Los datos completos de la prueba se muestran en la Tabla.

Carga PSI Sujetadores Numero de falla


2500 50 10
2700 70 17
2900 100 30
3100 60 21
3300 40 18
3500 85 43
3700 90 54
3900 50 33
4100 80 60
4300 65 51

(a) Ajuste un modelo de regresión logística a los datos. Utilice un modelo de regresión lineal simple como estructura para el predictor lineal.

El modelo de regresion utilizado fue el de regresion lineal multiple , tomando como variable independiente la carga y como variables dependientes los sujetadores y el numero de fallas .

Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,976601879
Coeficiente de determinación R^2 0,953751229
R^2 ajustado 0,938334973
Error típico 136,0128973
Observaciones 9
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
F Valor crítico de F
libertad cuadrados cuadrados

Regresión 2 2289002,951 1144501,475 61,86658915 9,89238E-05


Residuos 6 110997,0494 18499,50823
Total 8 2400000

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 3426,578641 183,3415573 18,68959058 1,51455E-06 2977,958012 3875,199271 2977,958012 3875,199271
50 -17,82202341 2,796257668 -6,373526879 0,000700968 -24,66421943 -10,97982738 -24,66421943 -10,97982738
10 36,90179574 3,341556332 11,04329602 3,2804E-05 28,72530195 45,07828953 28,72530195 45,07828953

(b) ¿Es adecuado el modelo de regresión logística en la parte (a)?


Si , podemos determinar que el modelo de regresion seleccionado , es indicado debido a que por medio del analisis estadistico realizado se obtienen valores logicos como lo es el coeficiente de correlacion lineal =
0,97.

También podría gustarte