Está en la página 1de 10

EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA DE LA III UNIDAD.

Código: 130092181.
Apellidos y nombre: Mocarro Suarez Luis Manuel.
Fecha: Miércoles 12/08/2020.
Escuela y ciclo: Escuela de Economía, V ciclo.

1) Es importante que los investigadores científicos del área de productos forestales sean
capaces de estudiar la correlación entre anatomía y las propiedades mecánicas de los árboles.
Para el estudio Quantitative Anatomical Characteristics of Plantation Grown Loblolly Pine
(Pinus Taeda L.) and Cottonwood (Populus deltoides Bart. Ex Marsh) and Their Relationships to
Mechanical Properties, realizado por el Departamento de Bosques y Productos Forestales de
Virginia Tech, se seleccionaron al azar 29 pinos de Arkanzas para investigarlos. En la tabla se
presentan los datos resultantes sobre la gravedad específica en gramos/cm3 y el módulo de
ruptura de kilopascales (kPa). Calcule e interprete el coeficiente de correlación muestral.

a) Realice e interprete el diagrama de dispersión.

Gráfico de dispersión de la gravedad específica (g/cm^3)


vs el módulo de ruptura (kPa)
100.000
90.000
f(x) = 305.346466317389 x − 93.3192420390894
80.000 R² = 0.890186424796105
70.000
60.000
50.000
40.000
30.000
20.000
10.000
0.000
0.350 0.400 0.450 0.500 0.550 0.600 0.650

Tiene un crecimiento, es decir, la tendencia lineal es creciente.


b) Encuentre e interprete el modelo de regresión muestral.

X Y X^2 Y^2 XY
0.414 29.186 0.171 851.823 12.083
0.383 29.266 0.147 856.499 11.209
0.399 26.215 0.159 687.226 10.460
0.402 30.162 0.162 909.746 12.125
0.442 38.867 0.195 1510.644 17.179
0.422 37.831 0.178 1431.185 15.965
0.466 44.576 0.217 1987.020 20.772
0.500 46.097 0.250 2124.933 23.049
0.514 59.698 0.264 3563.851 30.685
0.530 67.705 0.281 4583.967 35.884
0.569 66.088 0.324 4367.624 37.604
0.558 78.486 0.311 6160.052 43.795
0.577 89.869 0.333 8076.437 51.854
0.572 77.369 0.327 5985.962 44.255
0.548 67.095 0.300 4501.739 36.768
0.581 85.156 0.338 7251.544 49.476
0.557 69.571 0.310 4840.124 38.751
0.550 84.160 0.303 7082.906 46.288
0.531 73.466 0.282 5397.253 39.010
0.550 78.610 0.303 6179.532 43.236
0.556 67.657 0.309 4577.470 37.617
0.523 74.017 0.274 5478.516 38.711
0.602 87.291 0.362 7619.719 52.549
0.569 86.836 0.324 7540.491 49.410
0.544 82.540 0.296 6812.852 44.902
0.557 81.699 0.310 6674.727 45.506
0.530 82.096 0.281 6739.753 43.511
0.547 75.657 0.299 5723.982 41.384
0.585 80.490 0.342 6478.640 47.087
15.078 1897.756 7.952 135996.216 1021.125
n=29

15.078
X= =0.5199310345
29
1897.756
Y= =65.43986207
29
S XY ∑ XY −n ( X )(Y ) 1021.125−29∗0.5199∗65.43
b= = = =30 5.346466
S XX ∑ X 2−n ( X )2 7.952−29∗0.5199
2

a=Y −b X=65.43−305.346∗0.5199=−93.319242

Y^ =−93.319+305.346( X)
b=305.346 indica que la pendiente de la recta es positiva, indica que, para un aumento en la
gravedad específica, corresponde un aumento en el módulo de ruptura promedio de 315.346,
por lo tanto, un aumento de 10 en la gravedad específica corresponde un aumento en el
módulo de ruptura promedio de 315.346*10=3153.46 kPa.

c) Encuentre la varianza estimada de la regresión; analice si el coeficiente del modelo es


significativo con un nivel de confianza del 90%.

Varianza de la regresión poblacional:

S=2∑ Y i −a ∑ Y i−b ∑ X i Y i 41998−(3.8296∗1124)−0.9036∗41355


2
= =10.42993961
n−2 33−2
S= √ 10.4299=3.229541704
Varianza estimada de b:

S xx =∑ X −n ( X ) =41086−33∗33.45 =4152.181828
2 2 2

S 2 10.4299
σ^ b2= = =0.0035119
S xx 4152.18
Error estándar de b:

σ^ b=√ 0.0035119=0.050119
t 0.1 =t 0.05,31=1.6955
,n−2
2

Pruebe:

H 0 : β=1.0

H 0 : β< 1.0

α=0.1

b 0.9036
t cal= = =18.0299
^σ b 0.050119

t 0.1 =t 0.05,31=1.6955
,n−2
2

18.0299 ∈RR Se rechaza H0

Conclusión: La pendiente es altamente significativa.

d) Grafique los errores de la regresión. Averigüe e interprete si los errores tienden hacia una
distribución normal.

e) Pruebe la hipótesis de que no existe asociación lineal entre las variables (p=0).

f) Pruebe H1: p>0.


2) Uno de los problemas más desafiantes que enfrenta el campo del control de la
contaminación del agua lo representa la industria de la peletería, ya que sus desechos son
químicamente complejos; se caracterizan por valores elevados de la demanda de oxígeno
químico, solidos volátiles y otras medidas de contaminación. Considere los datos
experimentales de la tabla, que se obtuvieron de 33 muestras de desechos tratados
químicamente en un estudio realizado en Virginia Tech. Se registraron los valores de X, la
reducción porcentual de los sólidos totales, y de Y, el porcentaje de disminución de la
demanda de oxígeno químico.

a) Realizar el diagrama de dispersión y describa lo que observa. Estime la recta de regresión


e interprete sus coeficientes.
Gráfico de dispersión del Reducción % de sólidos vs Re-
ducción % de la demanda de oxigeno
60

50
f(x) = 0.903643210579323 x + 3.82963319758872
R² = 0.912940801014387
40

30

20

10

0
0 10 20 30 40 50 60

Tiene un crecimiento, es decir, la tendencia lineal es creciente.

X Y X^2 Y^2 XY
3 5 9 25 15
7 11 49 121 77
11 21 121 441 231
15 16 225 256 240
18 16 324 256 288
27 28 729 784 756
29 27 841 729 783
30 25 900 625 750
30 35 900 1225 1050
31 30 961 900 930
31 40 961 1600 1240
32 32 1024 1024 1024
33 34 1089 1156 1122
33 32 1089 1024 1056
34 34 1156 1156 1156
36 37 1296 1369 1332
36 38 1296 1444 1368
36 34 1296 1156 1224
37 36 1369 1296 1332
38 38 1444 1444 1444
39 37 1521 1369 1443
39 36 1521 1296 1404
39 45 1521 2025 1755
40 39 1600 1521 1560
41 41 1681 1681 1681
42 40 1764 1600 1680
42 44 1764 1936 1848
43 37 1849 1369 1591
44 44 1936 1936 1936
45 46 2025 2116 2070
46 46 2116 2116 2116
47 49 2209 2401 2303
50 51 2500 2601 2550
1104 1124 41086 41998 41355
n=33

1104
X= =33.45454545
33
11 24
Y= =34.06060606
33
S XY ∑ XY −n ( X )(Y ) 41355−33∗3 3.45∗34.06
b= = = =0.9036429923
S XX ∑ X 2−n (X )2 41086−33∗33.45
2

a=Y −b X=33.39−1.0438∗33.45=3.829640503

Y^ =3.8296+0.9036( X)
b=0.9036 indica que la pendiente de la recta es positiva, indica que, para un aumento en la
reducción porcentual de los sólidos totales, corresponde un porcentaje de disminución en la
demanda de oxígeno químico promedio de 0.9036, por lo tanto, un aumento de 10% en la
reducción porcentual de los sólidos totales corresponde a un porcentaje de disminución en la
demanda promedio de 0.9036*10=9.036%.

b) Calcule un intervalo de confianza de 90% para β en la recta de regresión; probar si es


significativo el coeficiente de regresión.

Varianza de la regresión poblacional:

S=2∑ Y i2−a ∑ Y i−b ∑ X i Y i 41998−(3.8296∗1124)−0.9036∗41355


= =10.42993961
n−2 33−2
S= √1 0.4299=3.229541704
Varianza estimada de b:

S xx =∑ X −n ( X ) =41086−33∗33.45 =4152.181828
2 2 2

S 2 10.4299
σ^ b = =
2
=0.0035119
S xx 4152.18
Error estándar de b:

σ^ b=√ 0.00 35119=0.0 50119


t 0.1 =t 0.05,31=1.6955
,n−2
2
Intervalo de confianza del 90% para β.

b−t 0 σ^ b ≤ β ≤b+ t 0 σ^ b

0.9036−1.6955∗0.050119 ≤ β ≤ 0.9036+1.6955∗0.0 50119


0. 81866 ≤ β ≤ 0.9886
β ∈ [ 0. 81866; 0.9886 ] con confianza del 90%.
Conclusión: La pendiente se encuentra dentro de los límites del intervalo de confianza del 90%.

c) Pruebe:

H 0 : β=1.0

H 0 : β< 1.0

α=0.1

b 0.9036
t cal= = =18.0299
σ^ b 0.0 50119

t 0.1 =t 0.05,31=1.6955
,n−2
2

18.0299 ∈RR Se rechaza H0

Conclusión: La pendiente es altamente significativa.

d) Construya límites de confianza de 90% para la respuesta cuando X 0=20%. Construya un


intervalo de predicción de 90% para Y0 cuando X0=20%

ANVA.

H 0 : β=0

H0 : β ≠ 0

α=0.1
n
SCT =∑ Y i2 −n ( Y ) =37609−20∗40.052=3713.87
2

i=1

(∑ )
n
SCR=b X i Y i−n ( Y ) ( X ) =0.8203( 44444−20∗47.45∗40.05)=3390.55
i=1

SCE=SCT−SCR=3713.87−3390.55=323.32

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
  libertad cuadrados cuadrados F de F
Regresió 325.07954
n 1 3390.55148 3390.55148 5 5.4754E-18
Residuos 31 323.327312 10.4299133
Total 32 3713.87879      
F tab=F 0.9 0 ;1 ;31=2.881

CMR 3390.55
F cal= = =325.079546
CME 10.42
F cal > Ftab Se rechaza la H0

Conclusión: Podemos afirmar que hay un efecto altamente significativo entre la reducción
porcentual de los sólidos totales, y el porcentaje de disminución de la demanda de oxígeno
químico.

Calcule el intervalo de confianza del 90% para esta estimación X0=20. 3.229541704
4152.181828 Y^ =3.8296+0.9036 ( 20 )=21.9016


2
1 (X 0−X )
( )
IC μ Y =^y 0 ± t α
X
( ,n−2)
2
S
n
+
S XX


2
1 (20−33.45)
( )
IC μ Y =21.9016 ±1.6955∗3.229
X
33
+
4152.18

20.4130 ≤ ^y 0 ≤ 23.39

Conclusión: 20% se encuentra dentro de los límites del intervalo de confianza del 90%.

Calcule el intervalo de predicción del 90% para esta estimación X0=20.


2
1 ( X 0 −X )
( )
IC μ Y =^y 0 ± t α
X
( ,n−2)
2
S 1+ +
n S XX


2
1 (20−33.45)
( )
IC μ Y =21.9016 ±1.6955∗3.229 1+
X
33
+
4152.18

16.227 ≤ ^y 0 ≤ 27.576

Conclusión: 20% se encuentra dentro de los límites de predicción de confianza del 90%, es
decir, el porcentaje de reducción de la demanda de oxígeno fluctúa entre 16.227 y 27.576.

e) Grafique e interprete la normalidad de los errores.

Y Y^  e  2
e  e
3 4

5 6.54056 -1.54056 2.37333 -3.65627 5.63271
11 10.15514 0.84486 0.71380 0.60306 0.50950
21 13.76971 7.23029 52.27711 377.97878 2732.89675
16 17.38428 -1.38428 1.91623 -2.65261 3.67196
16 20.09521 -4.09521 16.77075 -68.67977 281.25816
28 28.22800 -0.22800 0.05198 -0.01185 0.00270
27 30.03529 -3.03529 9.21296 -27.96398 84.87869
25 30.93893 -5.93893 35.27088 -209.47129 1244.03524
35 30.93893 4.06107 16.49229 66.97637 271.99574
30 31.84257 -1.84257 3.39507 -6.25567 11.52653
40 31.84257 8.15743 66.54362 542.82474 4428.05333
32 32.74622 -0.74622 0.55684 -0.41552 0.31007
34 33.64986 0.35014 0.12260 0.04293 0.01503
32 33.64986 -1.64986 2.72204 -4.49097 7.40948
34 34.55350 -0.55350 0.30636 -0.16957 0.09386
37 36.36079 0.63921 0.40859 0.26118 0.16695
38 36.36079 1.63921 2.68701 4.40458 7.22004
34 36.36079 -2.36079 5.57332 -13.15744 31.06194
36 37.26443 -1.26443 1.59879 -2.02156 2.55612
38 38.16808 -0.16808 0.02825 -0.00475 0.00080
37 39.07172 -2.07172 4.29202 -8.89185 18.42141
36 39.07172 -3.07172 9.43545 -28.98306 89.02779
45 39.07172 5.92828 35.14452 208.34663 1235.13747
39 39.97536 -0.97536 0.95133 -0.92789 0.90503
41 40.87900 0.12100 0.01464 0.00177 0.00021
40 41.78265 -1.78265 3.17783 -5.66496 10.09863
44 41.78265 2.21735 4.91665 10.90194 24.17344
37 42.68629 -5.68629 32.33391 -183.86002 1045.48162
44 43.58993 0.41007 0.16815 0.06895 0.02828
46 44.49358 1.50642 2.26931 3.41854 5.14976
46 45.39722 0.60278 0.36334 0.21902 0.13202
49 46.30086 2.69914 7.28533 19.66411 53.07610
51 42.40191 8.59809 73.92719 635.63282 5465.22972
      393.30154 1304.06637 17060.15708

Variable X 1 Gráfico de los residuales


10
5
Residuos

0
-5 0 10 20 30 40 50 60

-10
Variable X 1

H0: La distribución de los errores de los datos se aproxima a una normal.

H0: La distribución de los errores de los datos no se aproxima a una normal.

α=0.05

[ ]
2 2
A (K −3)
JB=T +
6 24
∑ e t3
n
A= =0. 9604354791

( )
2 3
∑ et 2

∑ et 4
n
K= =3.639533085

( )
2
∑ et 2
n

[ ]
2 2
0.96 (3.63−3)
JB=33 + =5.635778231
6 24
2 2
X tab =X 1−0. 05, 2 =5.991
2
JB< X tab Se acepta la H0

Conclusión: Los errores se aproximan a una distribución normal.

También podría gustarte