Está en la página 1de 54

Ejercicio 11.

6
En una etapa inicial del procesamiento mecánico de piezas de acero
refleja en cierto diámetro de las piezas manufacturadas. Para prede
horas de uso y el diámetro promedio de cinco piezas producidas al fi
muestran a continuación:

Horas de uso Diámetro (mm)


16 26.2
32 25.7
48 26
64 27.7
80 28.3
96 29.5
112 30.1
128 31.8
144 31.4
160 33.4
176 33.6
192 32.7
208 35
224 36.1
240 35.7
256 36.2
272 36.8
288 39.1
304 38.7
320 39.2
RESPUESTA:
a) La variable dependiente es el diámetro de las piezas y la variable in

b) Se observa una relación lineal entre los datos

Diagrama de dispersión
45
40
35
30
Diámetro (mm)

25
20
15
10
5
0
0 50 100 150 200 250
Uso (h)

c) Pruebas de hipotesis: Ho: β = 0


Ha: β ≠ 0

Diagrama de dispersión
45
40
f(x) = 0.0464097744x + 24.8631578947
35 R² = 0.9767876061
30
Diámetro (mm)

25
20
15
10
5
0
0 50 100 150 200 250 300
Uso (h)

Variable X 1 Gráfico de los residuales


1.5
1
0.5
Residuos

0
-0.5 0 50 100 150 200 250 300 350
-1
-1.5
Resumen

Estadísticas de la regresión
Coeficiente de correlación múlti 0.9883256579
Coeficiente de determinación R 0.9767876061
R^2 ajustado 0.9754980286
Error típico 0.695767128
Observaciones 20

Coeficientes Error típico


Intercepción 24.8631578947 0.32320572
Variable X 1 0.0464097744 0.00168629

Análisis de los residuales

Observación Pronóstico para Y Residuos


1 25.6057142857 0.59428571
2 26.3482706767 -0.6482707
3 27.0908270677 -1.0908271
4 27.8333834586 -0.1333835
5 28.5759398496 -0.2759398
6 29.3184962406 0.18150376
7 30.0610526316 0.03894737
8 30.8036090226 0.99639098
9 31.5461654135 -0.1461654
10 32.2887218045 1.1112782
11 33.0312781955 0.5687218
12 33.7738345865 -1.0738346
13 34.5163909774 0.48360902
14 35.2589473684 0.84105263
15 36.0015037594 -0.3015038
16 36.7440601504 -0.5440602
17 37.4866165414 -0.6866165
18 38.2291729323 0.87082707
19 38.9717293233 -0.2717293
20 39.7142857143 -0.5142857

Con base al análisis de varianza, se obtiene una F calculada (757.45) mayor a la F crítica de (3.66E-16) por lo que s
rechaza la hipótesis nula y se concluye que el modelo de regreción tiene significancia. En la gráfica de residuos se
observa una distribucion normal
Con base al análisis de varianza, se obtiene una F calculada (757.45) mayor a la F crítica de (3.66E-16) por lo que s
rechaza la hipótesis nula y se concluye que el modelo de regreción tiene significancia. En la gráfica de residuos se
observa una distribucion normal

d) El ajuste si es satisfactorio debido a que el valor del coeficiente de correlación (0.98) es cercano a 1.

e) Se despeja x del valor de la recta y se obtiene que:

Y=mx+b
x=(Y-b)/m
Si Y=45 x=(45-24.863)/0.0464
x= 433.9870689655

f) El valor de la pendiente de la recta es de 0.0464, esto quiere decir que por cada hora transcurrida el diámetro a

g) El error estándar de la regresión es de 0.69, siendo un valor bajo por lo que el modelo tiene un buen ajuste.
o de piezas de acero, se sabe que una herramienta sufre un deterioro gradual, que
cturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos d
iezas producidas al final de la jornada. Los datos obtenido para una herramienta se

a) ¿En este problema cuál variable se puede ver como independiente y cuál c

b) Mediante un diagrama de dispersión analice la relación entre estas dos


variables. ¿Qué tipo de relación observa y cuáles son algunos hechos especial
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique p
d) ¿La calidad del ajuste es satisfactorio? Argumente.
e) Si el diámetro máximo tolerado es de 45, ¿cuántas horas de uso estima que
f) Señale el valor de la pendiente de la recta e interpretelo en términos prácti
g) Obtenga el error estándar de estimación y comente qué relación tiene éste
piezas y la variable independiente son las horas de uso de la herramienta.

dispersión

Respuesta

200 250 300 350

dispersión

Respuesta
Li near (Res puesta)

250 300 350

uales Variable X 1 Curva de regresión ajustada


50
40
Diámetro (mm)

f(x) = 0.0464097744x + 24.8631578947 Y


30 R² = 1 Pronóstico para Y
20 Linear (Pronóstico para Y)
250 300 350 Linear (Pronóstico para Y)
10
0
0 50 100 150 200 250 300 350
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 366.674346 366.674346 757.447808 3.667243E-16
Residuos 18 8.71365414 0.4840919
Total 19 375.388

Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
76.9267268 4.0277E-24 24.1841279 25.5421879 24.1841279 25.5421879
27.5217697 3.6672E-16 0.042867 0.04995255 0.042867 0.04995255

Residuos estándares
0.87755012
-0.9572668
-1.6107663
-0.1969603
-0.4074657
0.26801695
0.05751151
1.47131759
-0.2158347
1.64096544
0.83980126
-1.5856745
0.71411974
1.24193771
-0.4452146
-0.8033847
-1.0138901
1.28590404
-0.4012482
-0.7594184

F crítica de (3.66E-16) por lo que se


ancia. En la gráfica de residuos se
n (0.98) es cercano a 1.

La estimación de horas de uso es de 433.98 horas para obtener un diámetro de 45 mm

da hora transcurrida el diámetro aumetará 0.0464 mm

l modelo tiene un buen ajuste.


erioro gradual, que se
se tomaron datos de
una herramienta se

ependiente y cuál como dependiente?

entre estas dos


nos hechos especiales?
stos datos, aplique pruebas de hipótesis, verifique residuos).

s de uso estima que tiene esa herramienta?


o en términos prácticos.
é relación tiene éste con la calidad del ajuste.
amienta.
Ejercicio 11.7
En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos obtenidos

Tiempo (min) Rendimiento (%)


10 64 a) ¿En este problema cuál variable se puede ver c
15 81.7 b) Mediante un diagrama de disperción analice la
20 76.2 algunos hechos especiales?
8 68.5 c) Haga un análisis de regresión (ajuste una línea
12 66.6 d) ¿La calidad del ajuste es satisfactoria? Argume
13 77.9 e) Señale el valor de la pendiente de la recta e int
15 82.2 f) Estime el rendimiento que se espera a un tiemp
12 74.2
14 70
20 76
19 83.2
18 85.3

a) La variable independiente es el tiempo de extracción. La variable dependiente es el porcentaje de rendimiento

b) En el diagrama de dispersión se observa un modelo lineal que no tiene significancia en el ajuste de los datos. Se

Diagrama de dispersión
90
80
70
Rendimiento (%)

60
50
Res puesta
40
30
20
10
0
6 8 10 12 14 16 18 20 22
Tiempo(min)

c) Pruebas de hipotesis: Ho: β = 0


Ha: β ≠ 0

Diagrama de dispersión
90
80
f(x) = 1.194921875x + 57.9578125
70 R² = 0.4533185358
Rendimiento (%)

60
50 Res puesta
40 Li near (Res puesta )
30
90
80
f(x) = 1.194921875x + 57.9578125
70 R² = 0.4533185358

Rendimiento (%)
60
50 Res puesta
40 Li near (Res puesta )
30
20
10
0
6 8 10 12 14 16 18 20 22
Tiempo(min)

Resumen

Estadísticas de la regresión ANÁLISIS DE VARIANZA


Coeficiente d 0.6732893403 Grados de libertad
Suma de cuadrados
Coeficiente 0.4533185358 Regresión 1 243.684401
R^2 ajustado 0.3986503894 Residuos 10 293.872266
Error típico 5.4209986684 Total 11 537.556667
Observacione 12

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción 57.9578125 6.2840341894 9.22302628 3.3188E-06 43.9561118
Variable X 1 1.194921875 0.4149587698 2.87961591 0.01639631 0.27033612

Análisis de los residuales

Observación Pronóstico para Y Residuos Residuos estándares


1 69.90703125 -5.90703125 -1.1428423
2 75.881640625 5.818359375 1.12568683
3 81.85625 -5.65625 -1.0943233
4 67.5171875 0.9828125 0.19014623
5 72.296875 -5.696875 -1.1021831
6 73.491796875 4.408203125 0.85286176
7 75.881640625 6.318359375 1.22242259
8 72.296875 1.903125 0.36820049
9 74.68671875 -4.68671875 -0.9067466
10 81.85625 -5.85625 -1.1330176
11 80.661328125 2.538671875 0.4911607
12 79.46640625 5.83359375 1.12863425

d) El ajuste no es satisfactorio debido a que el valor del coeficiente de correlación (0.4533) es menor que 0.7; no s

e) El valor de la pendiente de la recta es de 1.1949, esto quiere decir que por cada minuto transcurrido el diámetr
modelo, los resultados no son confiables.

f) Si:
Y=mx+b Se estima un rendimiento de 87.830
Y=1.1949x + 57.958
Si X= 25 y=(1.1949)(25) + 57.958
x= 87.8305

Intérvalo de confianza:
2.23767827 = El intérvalo de confianza es de 85.59 a 90.07
87.8305-2.2376= 85.5928217292
87.8305+2.2376= 90.0681782708
y rendimiento. Los datos obtenidos se muestran en la tabla siguiente:

oblema cuál variable se puede ver como independiente y cuál como dependiente?
n diagrama de disperción analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son
s especiales?
álisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
del ajuste es satisfactoria? Argumente.
lor de la pendiente de la recta e interpretelo en términos prácticos.
ndimiento que se espera a un tiempo de extracción de 25 minutos y obtenga un intervalo de confianza para esta predicción.

te es el porcentaje de rendimiento

ficancia en el ajuste de los datos. Se observan irregularidades.

Variable X 1 Gráfico de los residuales


10
5
Residuos

0
-5 6 8 10 12 14 16 18 20 22
-10
Tiempo (min)
-5 6 8 10 12 14 16 18 20 22

Re
-10
Tiempo (min)

Variable X 1 Curva de regresión ajustada


100
f(x) = 1.194921875x + 57.9578125 Y
50 R² = 1 Pronóstico para Y
Y

0 Linear (Pronóstico
para Y)
6 8 10 12 14 16 18 20 22
Tiempo (min)

Promedio de los cuadradosF Valor crítico de F


243.684401 8.29218778 0.01639631
29.3872266

Superior 95%Inferior 95.0%


Superior 95.0%
71.9595132 43.9561118 71.9595132
2.11950763 0.27033612 2.11950763

Con base al análisis de varianza,se obtiene una F calculada (8.29)


mayor a la F crítica de (0.0163) por lo que se rechaza la hipótesis
nula y se concluye que el modelo de regresión tiene
significancia. En la gráfica de residuos ningun dato esta en la
linea central lo que indica una baja correlacion.

ón (0.4533) es menor que 0.7; no se recomienda hacer una predicción con este modelo.

ada minuto transcurrido el diámetro variará 1.1949. Sin embargo, al no haber un correcto ajuste de los datos al
e estima un rendimiento de 87.8305% en 25 minutos de extracción

confianza es de 85.59 a 90.07


ra esta predicción.
x y xy x^2 y^2
4 134 536 16 17956
6 145 870 36 21025
8 142 1136 64 20164
10 149 1490 100 22201
12 144 1728 144 20736
14 160 2240 196 25600
16 156 2496 256 24336
18 157 2826 324 24649
20 168 3360 400 28224
22 166 3652 484 27556
24 167 4008 576 27889
26 171 4446 676 29241
28 174 4872 784 30276
30 183 5490 900 33489
238 2216 39150 4956 353342

1478
Ejercicio 11.8

En cierta empresa es usual pagar horas extras para cumplir con los tiempos de entrega. En este centro productivo
piezas malas, con eeste propósito deciden investigar la relación entre la cantidad de horas extras, X, y el porcenta
datos obtenidos.

Semana Horas extra Defectos %


1 340 5 a) ¿De estas variables cuál se puede suponer ind
2 95 3 b) Obtenga un diagrama de disperción para esta
3 210 6 c) Haga un análisis de regresión (ajuste una líne
4 809 15 d) ¿La calidad del ajuste es satisfactoria?
5 80 4
6 438 10 e) El que dos variables estén relacionadas no ne
embargo, a pesar de esto, ¿puede concluir con
7 107 4 porcentaje de defectuosos, porque ocurren fact
8 180 6 esto causa mayores problemas en la calidad de
9 100 3
10 550 13
11 220 7
12 50 3
13 193 6
14 290 8
15 340 2
16 115 4
17 362 10
18 300 9
19 75 2
20 93 2
21 320 10
22 154 7

a) La variable dependiente es el diámetro de las piezas y la variable independiente son las horas de uso de la herr

b) Se observa una posible distribucion lineal entre los datos con ciertas irregularidades.

Diagrama de dipersión
16
14
12
defectos (%)

10
8 Res puesta
6
4
2
0
0 100 200 300 400 500 600 700 800 900
Horas extras

Variable
5
Residuos

0
-5 0 100 20

-10
Variable
c) Pruebas de hipotesis: Ho: β = 0 5
Ha: β ≠ 0

Residuos
0
-5 0 100 20

-10
Diagrama de dispersión
16
14 f(x) = 0.0170741494x + 2.1109561958
R² = 0.7367552521
12
defectos (%)

10
Res puesta Variable X
8
6 Li near (Res puesta) 20
4 f(x) = 0.0170
10
2 R² = 1

Y
0 0
0 100 200 300 400 500 600 700 800 900
0 100200300400
Horas extras Variab

Resumen ANÁLISIS DE VARIANZA


Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Estadísticas de la regresión Regresión 1 205.387271 205.387271
Coeficiente d 0.85834448 Residuos 20 73.3854563 3.66927282
Coeficiente 0.73675525 Total 21 278.772727
R^2 ajustado 0.72359301
Error típico 1.9155346 Coeficientes Error típico Estadístico t
Observacione 22 Intercepción 2.1109562 0.69499029 3.03738949
Variable X 1 0.01707415 0.00228214 7.4816392

Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 7.91616698 -2.916167 -1.5599728
2 3.73300039 -0.7330004 -0.3921108 Con base al análisis de varianza
3 5.69652756 0.30347244 0.16233939 (55.97) mayor a la F crítica de (3.2
hipótesis nula y se concluye que
4 15.923943 -0.923943 -0.4942536 significancia. En la gráfica de resid
5 3.47688814 0.52311186 0.27983318 distribucion
6 9.58943362 0.41056638 0.21962817
7 3.93789018 0.06210982 0.033225
8 5.18430308 0.81569692 0.43634848
9 3.81837113 -0.8183711 -0.437779
10 11.5017383 1.49826166 0.8014793
11 5.86726906 1.13273094 0.6059425
12 2.96466366 0.03533634 0.0189028
13 5.40626702 0.59373298 0.31761121
14 7.06245951 0.93754049 0.50152742
15 7.91616698 -5.916167 -3.1647913
16 4.07448337 -0.0744834 -0.0398441
17 8.29179826 1.70820174 0.91378454
18 7.233201 1.766799 0.94513053
19 3.3915174 -1.3915174 -0.7443776
20 3.69885209 -1.6988521 -0.908783
21 7.57468399 2.42531601 1.29739727
22 4.7403752 2.2596248 1.20876251

d) El ajuste es bajamente satisfactorio debido a que el valor del coeficiente de correlación (0.7368) es cercano a 0

e) Al realizar el análisis de los datos se observa una correlación baja entre las dos variables. Para poder atribuir a e
calentamiento de equipo, cansancio de obreros, etc. se necesita hacer un análisis más detallado como la superfici
ntrega. En este centro productivo, un grupo de mejora de calidad trata de reducir la proporción de
d de horas extras, X, y el porcentaje de artículos defectuosos, Y. En la tabla siguiente se muestran los

ariables cuál se puede suponer independiente y cuál independiente?


diagrama de disperción para estas variables, ¿qué relación observa?
álisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
del ajuste es satisfactoria?

ariables estén relacionadas no necesariamente implica que haya una relación causa-efecto. Sin
sar de esto, ¿puede concluir con seguridad que cuando se trabaja tiempo extra se incrementa el
defectuosos, porque ocurren factores como calentamiento de equipo, cansancio de obreros, etc., todo
yores problemas en la calidad de las piezas?

te son las horas de uso de la herramienta.

Variable X 1 Gráfico de los residuales


5
Residuos

0
-5 0 100 200 300 400 500 600 700 800 900

-10
Variable X 1 Gráfico de los residuales
5
Residuos

0
-5 0 100 200 300 400 500 600 700 800 900

-10
Variable X 1

Variable X 1 Curva de regresión ajustada


20
Y
10 f(x) = 0.0170741494x + 2.1109561958 Pronóstico para Y
R² = 1
Y

0 Linear (Pronóstico para


0 100200300400500600700800900 Y)
Variable X 1

F Valor crítico de F
55.9749251 3.2294E-07

Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
0.00650395 0.66123186 3.56068053 0.66123186 3.56068053
3.2294E-07 0.01231369 0.02183461 0.01231369 0.02183461

Con base al análisis de varianza,se obtiene una F calculada


(55.97) mayor a la F crítica de (3.22E-7) por lo que se rechaza la
hipótesis nula y se concluye que el modelo de regresión tiene
significancia. En la gráfica de residuos se observan datos sin una
distribucion normal.
orrelación (0.7368) es cercano a 0.7.

s variables. Para poder atribuir a el incremento en el porcentaje de defectuosos a factores como


s más detallado como la superficie de respuesta.
9. En una industria se desea investigar cómo influye la temperatura (°C) en la presión del vapor de B-
trimetilboro, los datos obtenidos para tal propósito se muestran en la siguiente tabla.

Temperatura Presión a) Construya un diagrama de dispersión e interprételo.


13 2.9 b) Ajuste una línea recta y observe la calidad de ajuste.
19.5 5.1 c) Señale el valor de la pendiente de la recta e interprételo en términos prácticos.
45.7 30.5 d ) Observe la gráfica de residuales contra predichos, ¿nota algo relevante?
56.1 51.4 e) ¿Está satisfecho con el modelo ajustado? Argumente.
64.4 74.5 f ) ¿Hay algún otro modelo que puede funcionar mejor? Proponga uno de los que se
71.4 100.2 explicaron al inicio del capítulo.
80.5 143.7
85.7 176.9
22.5 8.5
27.2 10.3
31.8 14.6

SOLUCIÓN
a) Construya un diagrama de dispersión e interprételo.

200
180
Se observa que entre X y Y existe u
160 conforme aumenta el valor de
puede observar u
140
120
PRESIÓN

100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 90
Axi s Ti tl e

b) Ajuste una línea recta y observe la calidad de ajuste.

200
f(x) = 2.1471495561 exp( 0.0538050879 x ) 200
180 R² = 0.9799531596 R² = 0.9799531596
180
160
160
140
140
120 R² = 0.898068
120
Presión

100
PRESIÓN

100
80
80
60
60
40
40
20
140
140
120 R² = 0.898068
120

Presión
100

PRESIÓN
100
80
80
60
60
40
40
20
20
0
0 10 20 30 40 50 60 70 80 90 0
0 10 20 30 4
Temperatura
tEM

El valor de R2=0.98 corresponde a una linea de tendencia ajustada exponencial, en contraste con una linea ajustada
lineal para los mismos datos con una R2=0.89. Por lo cual se puede concluir que la linea ajustada exponencial es la
que mejor se ajusta al modelo

c) Señale el valor de la pendiente de la recta e interprételo en términos prácticos.

y = 2.1471e0.0538x Para la gráfica de dispersión anterior se obtiene la ecuación y = 2.1471e0.0538x, debido a


que es una ecuacion exponencial el valor de la pendiente es Log 0.0538
R² = 0.98

y = mx + b Donde m es la pendiente de la recta y b es el incertecpto en y.

y=Arx Log y=Log A + x Log r Ecuación exponencial


Pendiente= Log r
Intersección=Log A

d ) Observe la gráfica de residuales contra predichos, ¿nota algo relevante?

Resumen

Estadísticas de la regresión
Coeficiente d 0.94766477
Coeficiente 0.89806852
R^2 ajustado 0.8867428
Error típico 20.3997839
Observacione 11

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 32998.5448 32998.5448 79.2946077 9.3137E-06
Residuos 9 3745.36065 416.151183
Total 10 36743.9055

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Intercepción -47.935064 13.2168336 -3.626819 0.00551287 -77.833619 -18.036509 -77.833619
Variable X 1 2.21298899 0.24851776 8.90475198 9.3137E-06 1.65080277 2.77517522 1.65080277

Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 -19.166207 22.0662068 1.14019954
2 -4.7817784 9.88177837 0.51060879 Variable X 1 Gráfico de los resid
3 53.1985333 -22.698533 -1.172873 40
4 76.2136188 -24.813619 -1.2821631
20

Residuos
5 94.5814275 -20.081427 -1.0376425
0
6 110.07235 -9.8723505 -0.5101216
-20 0 10 20 30 40 50 60
7 130.21055 13.4894497 0.69702349
-40
8 141.718093 35.1819069 1.81791073
9 1.85718861 6.64281139 0.3432457 Variable X 1
10 12.2582369 -1.9582369 -0.1011855
11 22.4379863 -7.8379863 -0.4050025

Variable X 1 Curva de regresión a


El valor de F calculado es mayor que F critico, se 200
rechaza la hipótesis nula y se concluye que hay 150
significancia en el modelo. Sin embargo, según lo Y
100 f(x) = 2.2129889947x - 47.9350637692
reportado en este ANOVAcon errores relativos de R² = 1 Pronósti
Y

20.39 lo que indica que no se ajusta el modelo con 50 Linear (


los datos. 0
-50 0 10 20 30 40 50 60 70 80 90
Variable X 1

e) ¿Está satisfecho con el modelo ajustado? Argumente.

Si, si se utiliza un modelo exponencial los datos se ajustan al


modelo con un coeficiente de r2 de 0.98

f ) ¿Hay algún otro modelo que puede funcionar mejor? Proponga uno de los que se
explicaron al inicio del capítulo.

El modelo exponencial se ajusta perfectamente a los datos como


se puede comprobar en el coeficiente de correlacion para este
modelo.
ételo en términos prácticos.
¿nota algo relevante?

r? Proponga uno de los que se

e observa que entre X y Y existe una correlación lineal positiva, debido a que
conforme aumenta el valor de X tambien se incrementa el valor de Y. Se
puede observar una tendencia exponencial.

200
R² = 0.9799531596
180
160
140
R² = 0.8980685205
120
100
80
60
40
140
R² = 0.8980685205
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 90
tEMPERATURA

con una linea ajustada


stada exponencial es la

1471e0.0538x, debido a
es Log 0.0538

Superior 95.0%
-18.036509
2.77517522

1 Gráfico de los residuales

0 30 40 50 60 70 80 90

Variable X 1

Curva de regresión ajustada

Y
29889947x - 47.9350637692
Pronóstico para Y
Linear (Pronóstico para Y)

50 60 70 80 90
e X1
Ejercicio 11.10
En un proceso de manufactura se utiliza una herramienta de corte y se quiere investigar la relación entre la veloci
herramienta. Los datos obtenidos para esta investigación se muestran a continuación:

Velocidad Vida Promedio


20 8.7
9.1
20 9.5 a) Mediante un diagrama de disperción analice la relación en
25 8.5 b) Haga un análisis de regresión (ajuste una línea recta a esto
25 7.7 8.2 c) ¿La calidad del ajuste es satisfactoria? Argumente.
25 8.4 d) Si normalmente la herramienta se opera a una velocidad d
30 8 puntual como por intervalo.
30 5.3 6.86666667 e) Señale el valor de la pendiente de la recta e interpretelo e
30 7.3 f) Obtenga el error estándar de estimación y comente que re
35 7.8
35 5.7 6.53333333 Velocidad Promedio de Vida
35 6.1 20 9.1
40 4.3 25 8.2
4.25
40 4.2 30 6.87
35 6.53
40 4.25

a) Se observa una relación lineal

Diagrama de dispersión
10
9
8
7
Promedio de vida

6
5 Res puesta
4
3
2
1
0
15 20 25 30 35 40 45
Velocidad

b) Pruebas de hipotesis: Ho: β = 0 Variable X 1 G


Ha: β ≠ 0 1
0.5
Residuos

0
Diagrama de dispersión -0.5 15 20
10
-1
9 f(x) = - 0.2274x + 13.812
8 R² = 0.9470973934
7
dio de vida

6
5 Res puesta
Li nea r (Res puesta)
4
0

Resid
Diagrama de dispersión -0.5 15 20
10
-1
9
f(x) = - 0.2274x + 13.812
8 R² = 0.9470973934
7

Promedio de vida
6
5 Res puesta Variable X 1 Cur
Li nea r (Res puesta)
4 10
3 f(x) = - 0.227
2 5 R² = 1

Y
1
0 0
15 20 25 30 35 40 45
15 20 25 30 3
Velocidad
Variable X

Resumen ANÁLISIS DE VARIANZA


Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Estadísticas de la regresión Regresión 1 12.92769 12.92769
Coeficiente d 0.97318929 Residuos 3 0.72211 0.24070333
Coeficiente 0.94709739 Total 4 13.6498
R^2 ajustado 0.92946319
Error típico 0.49061526 Coeficientes Error típico Estadístico t
Observacione 5 Intercepción 13.812 0.9563852083 14.4418796
Variable X 1 -0.2274 0.0310292335 -7.3285729

Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 9.264 -0.164 -0.3859865
2 8.127 0.073 0.17181108
Con base al análisis de varianza, se obtiene una
3 6.99 -0.12 -0.2824292 (0.0052) por lo que se rechaza la hipótesis n
4 5.853 0.677 1.59337128 regreción tiene significancia. En la gráfica de re
5 4.716 -0.466 -1.0967666

c) El ajuste si es satisfactorio debido a que el valor del coeficiente de correlación (0.9471) es cercano a 1.

d) Si:
Y=mx+b Se estima un tiempo de vida de 6.99 minutos a
Y=-0.2274x + 13.812
Si X= 30 y=(-0.2274)(30) + 13.812
x= 6.99

Intérvalo de confianza:
0.18319875 = El intérvalo de confianza es de 86.8068 a 7.17332
6.99-0.1832 6.80680125
6.99+0.1832 7.17319875

e) El error estándar de la regresión es de 0.49, siendo un valor bajo por lo que el modelo tiene un buen ajuste.
a relación entre la velocidad de corte (metros por minutos) y el tiempo de vida (horas) de la

ión analice la relación entre estas dos variables. ¿Qué tipo de relación observa?
ste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
oria? Argumente.
e opera a una velocidad de 30 metros por minuto, estime el tiempo medio de vida tanto de manera

e la recta e interpretelo en términos prácticos.


mación y comente que relación tiene éste con la calidad de ajuste.

Variable X 1 Gráfico de los residuales


1
0.5
Residuos

0
-0.5 15 20 25 30 35 40 45

-1
Variable X 1
Resid 0
-0.5 15 20 25 30 35 40 45

-1
Variable X 1

Variable X 1 Curva de regresión ajustada


10
f(x) = - 0.2274x + 13.812 Y
5 R² = 1
Pronóstico para Y
Y

Linear (Pronóstico
0 para Y)
15 20 25 30 35 40 45
Variable X 1

F Valor crítico de F
53.7079808 0.00524858

Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
0.0007197 10.7683554 16.8556446 10.7683554 16.8556446
0.00524858 -0.3261489 -0.1286511 -0.3261489 -0.1286511

varianza, se obtiene una F calculada (53.71) mayor a la F crítica


e se rechaza la hipótesis nula y se concluye que el modelo de
cancia. En la gráfica de residuos no se observan irregularidades.

) es cercano a 1.

e vida de 6.99 minutos a una velocidad de 30 metros por segundo

068 a 7.17332

tiene un buen ajuste.


Ejercicio 9.3.3

Un proyecto de investigación realizado por Philips et. al. Estuvo motivado porque existe una gran variedad de man
por explicar esta variación, los investigadores utilizaron un microrreómetro esférico magnetoacústico, desarrollad
suspensiones de células en individuos con esta enfermedad. Correlacionaron sus resultados con eventos clínicos y
falciformes. La siguiente tabla muestra las calificaciones para cada una de las mediciones reológicas, módulos de
Las calificaciones de fallas terminales se hicieron con base en la presencia de nefropatía, necrosis avascular de hu
después de síndrome torácico agua, úlcera de miembros inferiores y priapismo con impotencia.

X Y
0.32 0 a) ¿En este problema cuál variable se puede ver como indepe
0.72 3 b) Mediante un diagrama de dispersión analice la relación en
0.38 1 algunos hechos especiales?
0.61 4 c) Haga un análisis de regresión (ajuste una línea recta a esto
0.48 3 d) ¿La calidad del ajuste es satisfactorio? Argumente.
0.48 1 e) Señale el valor de la pendiente de la recta e interpretelo e
0.7 3 f) Obtenga el error estándar de estimación y comente qué re
0.41 2
0.57 2
0.63 5
0.37 1
0.45 1
0.85 4
0.8 4
0.36 1
0.69 4

a) La variable dependiente es la falla terminal orgánica y la variable independiente son los modulos de viscosidad.

b) En el diagrama de dispersión se observa un modelo lineal que no tiene significancia en el ajuste de los datos. Se

Chart Title
6

5
Modulo de viscosidad

3 Col umn D

0
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
Falla terminal orgánica
Variable
3
2
iduos

1
0
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
Falla terminal orgánica
Variable
3
c) Pruebas de hipotesis: Ho: β = 0
2
Ha: β ≠ 0

Residuos
1
0
Chart Title -1 0.2 0.3
6 -2
5
Modulo de viscosidad

f(x) = 7.4396505932x - 1.6636073895


4 R² = 0.6908051251

3 Col umn D Variable X


Linear (Col umn D)
2 6

1 4 f(x) = 7.
R² = 1
2

Y
0
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
0
Falla terminal orgánica 0.2 0.3 0.4 0.
Vari

Resumen ANÁLISIS DE VARIANZA


Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Estadísticas de la regresión Regresión 1 23.4441989 23.4441989
Coeficiente d 0.83114687 Residuos 14 10.4933011 0.7495215
Coeficiente 0.69080513 Total 15 33.9375
R^2 ajustado 0.66871978
Error típico 0.8657491 Coeficientes Error típico Estadístico t
Observacione 16 Intercepción -1.6636074 0.76456435 -2.1758893
Variable X 1 7.43965059 1.33023046 5.59275314

Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 0.7170808 -0.7170808 -0.857349
2 3.69294104 -0.692941 -0.8284873
3 1.16345984 -0.1634598 -0.1954342
4 2.87457947 1.12542053 1.34556411
5 1.9074249 1.0925751 1.30629379 Con base al análisis de varianza
6 1.9074249 -0.9074249 -1.0849263 (31.28) mayor a la F crítica de (6.
hipótesis nula y se concluye que
7 3.54414803 -0.544148 -0.6505889 significancia. En la gráfica de resid
8 1.38664935 0.61335065 0.73332821 no son de una distr
9 2.57699345 -0.5769934 -0.6898592
10 3.02337248 1.97662752 2.36327575
11 1.08906333 -0.0890633 -0.106485
12 1.68423538 -0.6842354 -0.8180787
13 4.66009561 -0.6600956 -0.789217
14 4.28811309 -0.2881131 -0.3444709
15 1.01466682 -0.0146668 -0.0175358
16 3.46975152 0.53024848 0.63397042

d) El ajuste no es satisfactorio debido a que el valor del coeficiente de correlación (0.6908) es menor que 0.7; no s

e) El valor de la pendiente de la recta es de 7.4397, esto quiere decir que por cada aunemto de 0.1 en la falla term
embargo, al no haber un correcto ajuste de los datos al modelo, los resultados no son confiables.

f) El error estándar de la regresión es de 0.8657, siendo un valor alto por lo que los datos no se hay un buen ajust
e existe una gran variedad de manifestaciones clínicas de anemia de células falciformes. En un esfuerzo
ico magnetoacústico, desarrollado en su laboratorio para medir algunos parámetros reológicos de
s resultados con eventos clínicos y fallas terminales orgánicas en los individuos con anemia de células
diciones reológicas, módulos de visvosidad (VI C) (X), y calificaciones de fallas terminales orgánicas (Y).
fropatía, necrosis avascular de hueso, ataques de aplopejía, retinopatía, de hipoxemia en reposo
on impotencia.

ariable se puede ver como independiente y cuál como dependiente?


e dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son

sión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
satisfactorio? Argumente.
diente de la recta e interpretelo en términos prácticos.
r de estimación y comente qué relación tiene éste con la calidad del ajuste.

te son los modulos de viscosidad.

cancia en el ajuste de los datos. Se observan irregularidades.

Variable X 1 Gráfico de los residuales


3
2
iduos

1
Variable X 1 Gráfico de los residuales
3
2
Residuos

1
0
-1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
-2
Variable X 1

Variable X 1 Curva de regresión ajustada


6

4 f(x) = 7.4396505932x - 1.6636073895 Y


R² = 1 Pronóstico para Y
2
Y

Linear (Pronóstico para Y)


0
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
Variable X 1

F Valor crítico de F
31.2788876 6.6312E-05

Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
0.04718211 -3.3034348 -0.0237799 -3.3034348 -0.0237799
6.6312E-05 4.58659 10.2927112 4.58659 10.2927112

Con base al análisis de varianza,se obtiene una F calculada


(31.28) mayor a la F crítica de (6.6E-5) por lo que se rechaza la
hipótesis nula y se concluye que el modelo de regresión tiene
significancia. En la gráfica de residuos se observan que los datos
no son de una distribucion normal
n (0.6908) es menor que 0.7; no se recomienda hacer una predicción con este modelo.

da aunemto de 0.1 en la falla terminal orgánical, el modulo de viscosidad aumentará 0.74397. Sin
o son confiables.

os datos no se hay un buen ajuste de los datos al modelo.


Ejercicio 9.3.4

Habib y Luchen presentaron una técnica de diagnóstico que resulta ser muy interesante para médico especialistas
producidas por esta técnica, llamada AMDN; también se presentan las calificaciones (% de predicción) del volume
siete individuos eran sanos, del octavo al décimoséptimo individuo tenían asma, y el resto de individuos eran pac

Paciente AMDN VEF1


1 1.36 102
2 1.42 92 a) ¿En este problema cuál variable se puede ver
3 1.41 111 b) Mediante un diagrama de dispersión analice
4 1.44 94 algunos hechos especiales?
5 1.47 99 c) Haga un análisis de regresión (ajuste una líne
6 1.39 98 d) ¿La calidad del ajuste es satisfactorio? Argum
7 1.47 99 e) Señale el valor de la pendiente de la recta e i
8 1.79 80 f) Obtenga el error estándar de estimación y com
9 1.71 87
10 1.44 100
11 1.63 86
12 1.68 102
13 1.75 81
14 1.95 51
15 1.64 78
16 2.22 52
17 1.85 43
18 2.24 59
19 2.51 30
20 2.2 61
21 2.2 29
22 1.97 86

a) La variable independiente es el tiempo de extracción. La variable dependiente es el porcentaje de rendimiento

b) En la gráfica de dispersión se observa una posible tendencia lineal de los datos

Chart Title
120

100

80
Sanos
60
VEF1

As ma
FQ
40

20

0
1.2 1.4 1.6 1.8 2 2.2 2.4 2.6
AMDN
FQ

V
40

20

0
1.2 1.4 1.6 1.8 2 2.2 2.4 2.6
AMDN

c) Pruebas de hipotesis: Ho: β = 0 Variable X 1 G


Ha: β ≠ 0
40
20

Residuos
Respuesta 0
-20 1.2 1.4 1.6
120 -40
100 f(x) = - 63.2944126343x + 189.6375247932
R² = 0.7683803037
80
Res puesta
60 Variable X 1 Cu
VEF1

Li near (Res puesta)


40 150
100
20 f(x) = - 63.29441
50 R² = 1

Y
0
1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 0
1.2 1.4 1.6 1.8 2 2
AMDN
Variable X 1

Resumen ANÁLISIS DE VARIANZA


Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Estadísticas de la regresión Regresión 1 9731.7461 9731.7461
Coeficiente d 0.87657305 Residuos 20 2933.52662 146.676331
Coeficiente 0.7683803 Total 21 12665.2727
R^2 ajustado 0.75679932
Error típico 12.1110004 Coeficientes Error típico Estadístico t
Observacione 22 Intercepción 189.637525 13.9246701 13.6188163
Variable X 1 -63.294413 7.77051867 -8.1454553

Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 103.557124 -1.5571236 -0.1317461
2 99.7594589 -7.7594589 -0.6565171
3 100.392403 10.607597 0.89749418
4 98.4935706 -4.4935706 -0.3801948 Con base al análisis de varianza
5 96.5947382 2.40526178 0.20350589 (66.35) mayor a la F crítica (8.18E
hipótesis nula y se concluye que
6 101.658291 -3.6582912 -0.309523 significancia. En la gráfica d
7 96.5947382 2.40526178 0.20350589 irregularid
8 76.3405262 3.65947382 0.30962304
9 81.4040792 5.59592081 0.47346316
10 98.4935706 1.5064294 0.12745692
11 86.4676322 -0.4676322 -0.0395657
12 83.3029116 18.6970884 1.58193492
13 78.8723027 2.12769732 0.18002154
14 66.2134202 -15.21342 -1.2871865
15 85.8346881 -7.8346881 -0.6628822
16 49.1239287 2.87607125 0.24334043
17 72.5428614 -29.542861 -2.4995808
18 47.8580405 11.1419595 0.94270586
19 30.7685491 -0.7685491 -0.0650259
20 50.389817 10.610183 0.89771298
21 50.389817 -21.389817 -1.809763
22 64.9475319 21.0524681 1.78122035

d) El ajuste no es satisfactorio debido a que el valor del coeficiente de correlación (0.7684) es cercano a 0.7.

e) El valor de la pendiente de la recta es de -63.294, esto quiere decir que por cada aumento de 1 en las calificacio
AMDN. Sin embargo, al no haber un correcto ajuste de los datos al modelo, los resultados no son confiables.

f) El error estándar de la regresión es de 12.11, siendo un valor alto por lo que no hay un buen ajuste de los datos
resante para médico especialistas en problemas respiratorios. Las siguientes calificaciones fueron
nes (% de predicción) del volumen espiratorio forzado (VEF1) registrado en 22 individuos. Los primeros
y el resto de individuos eran pacientes con fibrosis quística.

oblema cuál variable se puede ver como independiente y cuál como dependiente?
n diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son
s especiales?
álisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
del ajuste es satisfactorio? Argumente.
lor de la pendiente de la recta e interpretelo en términos prácticos.
error estándar de estimación y comente qué relación tiene éste con la calidad del ajuste.

e es el porcentaje de rendimiento
Variable X 1 Gráfico de los residuales
40
20
Residuos

0
-20 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6
-40
Variable X 1

Variable X 1 Curva de regresión ajustada


150
100 Y
f(x) = - 63.2944126343x + 189.6375247932
50 R² = 1 Pronóstico para Y
Y

Linear (Pronóstico para Y)


0
1.2 1.4 1.6 1.8 2 2.2 2.4 2.6
Variable X 1

F Valor crítico de F
66.3484424 8.8143E-08

Probabilidad Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
1.409E-11 160.591172 218.683878 160.591172 218.683878
8.8143E-08 -79.503431 -47.085395 -79.503431 -47.085395

Con base al análisis de varianza,se obtiene una F calculada


(66.35) mayor a la F crítica (8.18E-18) por lo que se rechaza la
hipótesis nula y se concluye que el modelo de regresión tiene
significancia. En la gráfica de residuos se observan
irregularidades.
n (0.7684) es cercano a 0.7.

da aumento de 1 en las calificaciones de VEF1 disminuirán 63.24 unidadesde las calificaciones de


esultados no son confiables.

o hay un buen ajuste de los datos al modelo.


Ejercicio 9.3.10
Ogasawara recolectó las siguientes calificaciones en la escala completa del IQ a partir de 45 pares de hermanos c

X Y
78 114
77 68 a) Mediante un diagrama de dispersión analice la relación en
112 116 algunos hechos especiales?
114 123 b) Haga un análisis de regresión (ajuste una línea recta a esto
104 107 c) ¿La calidad del ajuste es satisfactorio? Argumente.
99 81 d) Obtenga el error estándar de estimación y comente qué re
92 76
80 90
113 91
99 95
97 106
80 99
84 82
89 77
100 81
111 111
75 80
94 98
67 82
46 56
106 117
99 98
102 89
127 113
113 112
91 103
91 93
96 90
100 102
97 104
82 92
43 43
77 100
109 90
99 100
99 103
100 103
56 67
56 67
67 67
71 66
66 63
78 76
95 86
38 64

a) Se observa una relación posiblemente lineal con ciertas irregularidades.

Diagrama de dispersión
140

120

100
Hermano Y

80
Res puesta
60

40

20

0
20 40 60 80 100 120 140
Hermano X

b) Pruebas de hipotesis: Ho: β = 0 Variable


Ha: β ≠ 0 40

Residuos
20
Diagrama de dispersión
0
140
20 40
120 -20
f(x) = 0.7259607878x + 25.7702585149
100 R² = 0.6408767972
Hermano Y

80
Res puesta
60 Li near (Res puesta)
Variable X
40 150
20 100 f(x) = 0.7
50 R² = 1
Y

0
20 40 60 80 100 120 140 0
20 40 60 8
Hermano X
Variab

Resumen ANÁLISIS DE VARIANZA


Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Estadísticas de la regresión Regresión 1 9451.1383 9451.1383
Coeficiente d 0.80054781 Residuos 43 5296.0617 123.164225
Coeficiente 0.6408768 Total 44 14747.2
R^2 ajustado 0.63252509
Error típico 11.0979379 Coeficientes Error típico Estadístico t
Observacione 45 Intercepción 25.7702585 7.49428934 3.43865273
Variable X 1 0.72596079 0.08287306 8.75991252

Análisis de los residuales

Observación
Pronóstico para YResiduos
Residuos estándares
1 82.3952 31.6048 2.88073207
2 81.6692392 -13.669239 -1.2459315
3 107.077867 8.92213325 0.81323961
4 108.529788 14.4702117 1.31893898
5 101.27018 5.72981955 0.52226481
6 97.6403765 -16.640377 -1.5167464
7 92.558651 -16.558651 -1.5092972
8 83.8471215 6.15287846 0.56082602
9 107.803828 -16.803828 -1.5316447
10 97.6403765 -2.6403765 -0.2406665
11 96.1884549 9.81154507 0.89430822
12 83.8471215 15.1528785 1.38116308
13 86.7509647 -4.7509647 -0.4330436
14 90.3807686 -13.380769 -1.2196378
15 98.3663373 -17.366337 -1.5829167
16 106.351906 4.64809404 0.42366709
17 80.2173176 -0.2173176 -0.0198082
18 94.0105726 3.98942743 0.36363057
19 74.4096313 7.5903687 0.69185119
20 59.1644548 -3.1644548 -0.2884355
21 102.722102 14.277898 1.30140987
22 97.6403765 0.35962349 0.03277916
23 99.8182589 -10.818259 -0.9860687
24 117.967279 -4.9672786 -0.4527603
25 107.803828 4.19617246 0.38247508
26 91.8326902 11.1673098 1.01788423
27 91.8326902 1.16730979 0.10639861
28 95.4624941 -5.4624941 -0.4978985
29 98.3663373 3.6336627 0.33120313
30 96.1884549 7.81154507 0.7120111
31 85.2990431 6.70095688 0.61078258
32 56.9865724 -13.986572 -1.274856
33 81.6692392 18.3307608 1.67082249
34 104.899984 -14.899984 -1.3581121
35 97.6403765 2.35962349 0.21507629
36 97.6403765 5.35962349 0.48852197
37 98.3663373 4.6336627 0.42235169
38 66.4240626 0.57593737 0.05249586
39 66.4240626 0.57593737 0.05249586
40 74.4096313 -7.4096313 -0.6753772
41 77.3134744 -11.313474 -1.0312069
42 73.6836705 -10.683671 -0.9738012
43 82.3952 -6.3952 -0.5829133
44 94.7365334 -8.7365334 -0.7963225
45 53.3567685 10.6432315 0.97011525

c) El ajuste no es satisfactorio debido a que el valor del coeficiente de correlación (0.6908) es menor que 0.7; no s

d) El error estándar de la regresión es de 11.09, siendo un valor alto por lo que no hay un buen ajuste de los datos
partir de 45 pares de hermanos con distrofia muscular progresiva de Duchenne.

e dispersión analice la relación entre estas dos variables. ¿Qué tipo de relación observa y cuáles son

sión (ajuste una línea recta a estos datos, aplique pruebas de hipótesis, verifique residuos).
satisfactorio? Argumente.
r de estimación y comente qué relación tiene éste con la calidad del ajuste.
Variable X 1 Gráfico de los residuales
40
Residuos

20

0
20 40 60 80 100 120 140
-20
Variable X 1

Variable X 1 Curva de regresión ajustada


150
100 Y
f(x) = 0.7259607878x + 25.7702585149
Pronóstico para Y
50 R² = 1
Y

0 Linear (Pronóstico para


Y)
20 40 60 80 100 120 140
Variable X 1

F Valor crítico de F
76.7360674 4.0905E-11
Probabilidad Inferior 95% Superior 95%Inferior 95.0%
Superior 95.0%
0.00131037 10.6565837 40.8839334 10.6565837 40.8839334
4.0905E-11 0.55883133 0.89309025 0.55883133 0.89309025

Con base al análisis de varianza,se obtiene una F calculada


(76.73) mayor a la F crítica (4.09E-11) por lo que se rechaza la
hipótesis nula y se concluye que el modelo de regresión tiene
significancia. En la gráfica de residuos se observan datos que no
estan cercanos a la linea central lo que indica un coeficiente de
correlacion tan bajo.
n (0.6908) es menor que 0.7; no se recomienda hacer una predicción con este modelo.

o hay un buen ajuste de los datos al modelo.

También podría gustarte