Está en la página 1de 50

UNIVERSIDAD NACIONAL MAYOR

DE SAN MARCOS
Ciencias Económicas y de la Gestión
Facultad de Ciencias
Administrativas
Escuela de Administración de Negocios Internacionales

NutriPet
Curso:
Estadística Inferencial

Docente:
Mg. María Victoria Hermenegildo Chávez

Estudiantes:
● Sucapuca Quiñones, Rosa Patricia
● Arias Montoya, Jahaira Crisaly
● Becerra Romero, Yarina Alexa
● Cabanillas Díaz, Edgar José Antonio
● Gonzales Anton, Keyssi Alhely
● Huanchi Aguirre, Maria Fernanda
● Nuñez Cabrera, Melanie Brigith
● Palacios Pizarro, Claudia Saray
● Rios Coronel, Karla Valeria

2022
Desarrollo

1. En economía, la función de demanda de un producto a menudo se estima mediante la


regresión de la cantidad vendida (Q) sobre el precio (P). La compañía Bamsy está
tratando de estimar la función de demanda para su nueva muñeca, y ha recabado los
siguientes datos:

P 20 17.5 16 15 12.5 10 8 7

Q 129 156 185 190 220 238 250 276

Solución:

a) Represente gráficamente estos datos.


b) Calcule manualmente la línea de regresión de mínimos cuadrados y el coeficiente
de determinación.

n=8 X (P) Y (Q) XY X^2 ŷ (𝑦 − 𝑦)


2
(y - 𝑦)
2

20 129 2580 400 134.40 5054.80 5852.25

17.5 156 2730 306.25 160.74 2003.89 2450.25

16 185 2960 256 176.53 839.00 420.25

15 190 2850 225 187.07 339.76 240.25

12.5 220 2750 156.25 213.40 62.40 210.25

10 238 2380 100 239.73 1171.82 1056.25

8 250 2000 64 260.80 3057.84 1980.25

7 276 1932 49 271.33 4333.67 4970.25

SUMA 106 1644 20182 1556.5 1644 16863.18 17180

- Determinamos la recta de mínimos cuadrados: ŷ = a + bx

2
𝑥= 13.25 2
Sxx = Σ𝑥 - n(𝑥) = 1556.5 – 8(13.25) = 152
2

𝑦= 205.5 Sxy = Σxy - n 𝑥 𝑦 = 20182 – 8(13.25)(205.5) = -1601

𝑆𝑥𝑦 −1601
Calculamos: b = 𝑆𝑥𝑥
= 152
= -10.5329

Calculamos: a = 𝑦 - b𝑥 = 205.5 - ((-10.53)*(13,25)) = 345.0609

Así, la recta de mínimos cuadrados es: ŷ = 345.0609 – 10.5329x

2
2 Σ(𝑦−𝑦)
- Determinamos el coeficiente de determinación, 𝑅 = 2
Σ(𝑦 − 𝑦)
2
2 Σ(𝑦−𝑦) 16863.18
𝑅 = 2 = 17180
= 0.982
Σ(𝑦 − 𝑦)
c) Trace la línea de regresión ajustada en su gráfica de dispersión del inciso.

d) Calcule manualmente el error estándar de la estimación. Intérprete.

n=8 X (P) Y (Q) ŷ (y - 𝑦)


2

20 129 134.40 29.19

17.5 156 160.74 22.42

16 185 176.53 71.66

15 190 187.07 8.60

12.5 220 213.40 43.56

10 238 239.73 3.00

8 250 260.80 116.59

7 276 271.33 21.80

SUMA 106 1644 1644 316.84

Calculamos el error estándar de la estimación:


2
2 Σ(𝑦 − 𝑦) 316.84 316.84
𝑆𝑒 = 𝑛−2
= 8−2
= 6
= 52.81

Se = 52. 81= 7.267

- Según nuestra ecuación de la regresión estimada ŷ = 345.0609 – 10.5329x,


podemos ver que el error estándar de la estimación para este este modelo es
de 7.267, esto nos indica que el punto de datos promedio cae 7.267 unidades
de la línea de regresión y además debido a que el valor está lejano al 0,
habría mayor dispersión.

e) Determine y grafique en computadora el ajuste lineal, cuadrático, cúbico y

exponencial. ¿Cuál ajuste elegiría? Justifique.

- Ajuste lineal

n=8 X (P) Y (Q) XY X^2

20 129 2580 400

17.5 156 2730 306.25

16 185 2960 256

15 190 2850 225

12.5 220 2750 156.25

10 238 2380 100

8 250 2000 64

7 276 1932 49

SUMA 106 1644 20182 1556.5

- Determinamos la ecuación ŷ = a + bx

2
𝑥= 13.25 2
Sxx = Σ𝑥 - n(𝑥) = 1556.5 – 8(13.25) = 152
2

𝑦= 205.5 Sxy = Σxy - n 𝑥 𝑦 = 20182 – 8(13.25)(205.5) = -1601

𝑆𝑥𝑦 −1601
Calculamos: b = 𝑆𝑥𝑥
= 152
= -10.5329
Calculamos: a = 𝑦 - b𝑥 = 205.5 - ((-10.53)*(13,25)) = 345.0609

Así, la ecuación es: ŷ = 345.0609 – 10.5329x

- Ajuste cuadrático

n=8 X (P) Y (Q) X^2 X^3 X^4 XY X^2*y

20 129 400 8000 160000 2580 51600

17.5 156 306.25 5359.38 93789.06 2730 47775

16 185 256 4096 65536 2960 47360

15 190 225 3375 50625 2850 42750

12.5 220 156.25 1953.13 24414.06 2750 34375

10 238 100 1000 10000 2380 23800

8 250 64 512 4096 2000 16000

7 276 49 343 2401 1932 13524

SUMA 106 1644 1556.5 24638.5 410861.13 20182 277184


- Determinamos la ecuación: y=ax²+bx+c

Sistema de ecuaciones y reemplazamos valores:

2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐𝑛 = Σy 𝑎(1556.5)+ 𝑏(106) + 𝑐(8) = 1644

3 2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 = Σxy 𝑎(24638.5)+ 𝑏(1556. 5) + 𝑐(106) = 20182

4 3
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥
2
= Σ𝑥
2 𝑎(410861.13)+ 𝑏(24638. 5) + 𝑐(1556. 5) = 277184
y

a = - 0.20 b = -5.34 c = 314.52

Por lo tanto la ecuación es: y=-0.20x² - 5.34x + 314.52


- Ajuste cúbico

n=8 X Y (Q) X^2 X^3 X^4 X^5 X^6 XY X^2*y X^3*y


(P)

20 129 400 8000 160000 3200000 64000000 2580 51600 1032000

17.5 156 306.25 5359.38 93789.06 1641308.59 28722900.39 2730 47775 836063.28

16 185 256 4096 65536 1048576 16777216 2960 47360 757760

15 190 225 3375 50625 759375 11390625 2850 42750 641250

12.5 220 156.25 1953.13 24414.06 305175.78 3814697.266 2750 34375 429688.60

10 238 100 1000 10000 100000 1000000 2380 23800 238000

8 250 64 512 4096 32768 262144 2000 16000 128000

7 276 49 343 2401 16807 117649 1932 13524 94668

SUMA 106 1644 1556.5 24638.5 410861.13 7104010.38 126085231.66 20182 277184 4157429.88

3
- Determinamos la ecuación: y=a𝑥 +bx²+cx+d

Sistema de ecuaciones y reemplazamos valores:

3 2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑𝑛 = Σy 𝑎(24638.5)+ 𝑏(1556. 5) + 𝑐(106) + 𝑑(8) = 1644

4 3 2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑Σ𝑥 = Σxy 𝑎(410861.13)+ 𝑏(24638. 5) + 𝑐(1556. 5) + 𝑑(106) = 20182

5 4 3
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑Σ𝑥
2 2
= Σ𝑥 y 𝑎(7104010.38)+ 𝑏(410861. 13) + 𝑐(24638. 5) + 𝑑(1556. 5) = 277184

6 5 4
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑Σ𝑥
3 2
= Σ𝑥 y 𝑎(126085231.66) + 𝑏(7104010. 38) + 𝑐(410861. 13) + 𝑑(24638. 5) =
4157429.88

a = -0.04 b = 1.32 c = - 24.80 d = 391.64

3
Por lo tanto la ecuación es: y= - 0.04𝑥 + 1.32x² - 24.80 x + 391.64
- Ajuste exponencial

n=8 X (P) Y (Q) y´=ln y XY´ X^2 y´^2

20 129 4.86 97.20 400 23.62

17.5 156 5.05 88.37 306.25 25.50

16 185 5.22 83.53 256 27.25

15 190 5.25 78.71 225 27.53

12.5 220 5.39 67.42 156.25 29.09

10 238 5.47 54.72 100 29.95

8 250 5.52 44.17 64 30.49

7 276 5.62 39.34 49 31.59

SUMA 106 1644 42.38 553.46 1556.5 225.01


(𝑚𝑥)
- Determinamos la ecuación: y=b 𝑒

𝑥= 13.25 𝑛(Σ𝑥𝑦´)−(Σ𝑥)(Σ𝑦´) 8(553.46)−(106)(42.38)


m= 2 2 = 8(1556.5)−(106)^2
= - 0.054
𝑛(Σ𝑥 )−(Σ𝑥)
𝑦´= 5.30

Luego: b´= 𝑦´- m 𝑥 = 5.30 - (-0.054*13.25) = 6.01

𝑏´ 6.01
Por último: b = 𝑒 = 𝑒 = 407.48

(6.01𝑥)
Entonces la ecuación será: y= 407.48 𝑒
CONSOLIDADOS DE LOS AJUSTES LINEAL, CUÁDRÁTICO, CÚBICO Y

EXPONENCIAL.
- Finalmente, al no haber diferencia significativa en los valores que toma el coeficiente

de determinación de los ajustes lineal, cuadrático, cúbico y exponencial, el modelo de

ajuste que se va a elegir es el lineal, debido a que resulta mucho más sencillo seguir

los pasos para determinar la ecuación; y además, la comprensión de ésta se hace

mucho más asequible.

2. Los contadores con frecuencia estiman los gastos generales basándose en el nivel de

producción. Se recabó información sobre gastos generales y unidades producidas en

diferentes plantas, y se desea estimar una ecuación de regresión para predecir gastos

generales futuros.

Gastos 191 170 272 160 280 173 234 124 158 178
Generales

Unidades 40 36 58 35 56 39 48 34 37 40

Solución:

a) Represente gráficamente estos datos.


b) Calcule manualmente la línea de regresión de mínimos cuadrados y el coeficiente
de determinación.

n = 10 X (U) Y (GG) XY X^2 ŷ (𝑦 − 𝑦)


2
(y - 𝑦)
2

40 191 7640 1600 180.58 180.10 9

36 170 6120 1296 157.5 1332.25 576

58 272 15776 3364 284.44 8179.39 6084

35 160 5600 1225 151.73 1786.75 1156

56 280 15680 3136 272.9 6225.21 7396

39 173 6747 1521 174.81 368.26 441

48 234 11232 2304 226.74 1071.91 1600

34 124 4216 1156 145.96 2307.84 4900

37 158 5846 1369 163.27 944.33 1296

40 178 7120 1600 180.58 180.10 256

SUMA 423 1940 85977 18571 1938.51 22576.14 23714

- Determinamos la recta de mínimos cuadrados: ŷ = a + bx

2
𝑥= 42.3 2
Sxx = Σ𝑥 - n(𝑥) = 18571 – 10(42.3) = 678.1
2

𝑦= 194 Sxy = Σxy - n 𝑥 𝑦 = 85977 – 10(42.3)(194) = 3915

𝑆𝑥𝑦 3915
Calculamos: b = 𝑆𝑥𝑥
= 678.1
= 5.7735

Calculamos: a = 𝑦 - b𝑥 = 194 - ((5.7735)*(42.3)) = - 50.22

Así, la recta de mínimos cuadrados es: ŷ = - 50.22 + 5.77x

2
2 Σ(𝑦−𝑦)
- Determinamos el coeficiente de determinación, 𝑅 = 2
Σ(𝑦 − 𝑦)
2
2 Σ(𝑦−𝑦) 22576.14
𝑅 = 2 = 23714
= 0.95
Σ(𝑦 − 𝑦)
c) Trace la línea de regresión ajustada en su gráfica de dispersión del inciso.

d) Calcule manualmente el error estándar de la estimación. Intérprete.

n = 10 X (U) Y (GG) ŷ (y - 𝑦)
2

40 191 180.58 108.58

36 170 157.5 156.25

58 272 284.44 154.75

35 160 151.73 68.39

56 280 272.9 50.41

39 173 174.81 3.28

48 234 226.74 52.71

34 124 145.96 482.24

37 158 163.27 27.77

40 178 180.58 6.66

SUMA 423 1940 1938.51 1111.04


Calculamos el error estándar de la estimación:

2
2 Σ(𝑦 − 𝑦) 1111.04 1111.04
𝑆𝑒 = 𝑛−2
= 10 − 2
= 8
= 138.88

Se = 138. 88= 11.78

- Según nuestra ecuación de la regresión estimada ŷ = - 50.22 + 5.77x,


podemos ver que el error estándar de la estimación para este este modelo es
de 11.78, esto nos indica que el punto de datos promedio cae 11.78 unidades
de la línea de regresión, y que además debido a que el valor es lejano al 0, se
refleja una mayor dispersión.

e) Pronostique los gastos generales cuando se producen 48 unidades.

ŷ = - 50.22 + 5.77x (sustituimos x por 48)

ŷ = - 50.22 + 5.77(48)

ŷ = - 50.22 + 276.96

ŷ = 226.74

- Los gastos generales serán de 226.74 cuando se produzcan 48 unidades.

f) Determine y grafique en computadora el ajuste lineal, cuadrático, cúbico y

exponencial. ¿Cuál ajuste elegiría? Justifique.


- Ajuste lineal:

n = 10 X (U) Y (GG) XY X^2

40 191 7640 1600

36 170 6120 1296

58 272 15776 3364

35 160 5600 1225

56 280 15680 3136

39 173 6747 1521

48 234 11232 2304

34 124 4216 1156

37 158 5846 1369

40 178 7120 1600

SUMA 423 1940 85977 18571

- Determinamos la ecuación:

2
𝑥= 42.3 2
Sxx = Σ𝑥 - n(𝑥) = 18571 – 10(42.3) = 678.1
2

𝑦= 194 Sxy = Σxy - n 𝑥 𝑦 = 85977 – 10(42.3)(194) = 3915

𝑆𝑥𝑦 3915
Calculamos: b = 𝑆𝑥𝑥
= 678.1
= 5.7735

Calculamos: a = 𝑦 - b𝑥 = 194 - ((5.7735)*(42.3)) = - 50.22

Así, la recta de mínimos cuadrados es: ŷ = - 50.22 + 5.77x


- Ajuste cuadrático

n = 10 X (U) Y (GG) X^2 X^3 X^4 XY X^2*y

40 191 1600 6400 2560000 7640 305600

36 170 1296 46656 1679616 6120 220320

58 272 3364 195112 11316496 15776 915008

35 160 1225 42875 1500625 5600 196000

56 280 3136 175616 9834496 15680 878080

39 173 1521 59319 2313441 6747 263133

48 234 2304 110592 5308416 11232 539136

34 124 1156 39304 1336336 4216 143344

37 158 1369 50653 1874161 5846 216302

40 178 1600 64000 2560000 7120 284800

SUMA 423 1940 18571 848127 40283587 85977 3961723


- Determinamos la ecuación: y=ax²+bx+c

Sistema de ecuaciones y reemplazamos valores:

2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐𝑛 = Σy 𝑎(18571)+ 𝑏(423) + 𝑐(10) = 1940

3 2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 = Σxy 𝑎(848127)+ 𝑏(18571) + 𝑐(423) = 85977

4 3
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥
2
= Σ𝑥 y
2 𝑎(40283587)+ 𝑏(848127) + 𝑐(18571) = 3961723

a = -0.11 b = 15.86 c = - 273.995

Por lo tanto la ecuación es: y=-0.11x²+15.86x - 273.995


- Ajuste cúbico

n = 10 X Y X^2 X^3 X^4 X^5 X^6 XY X^2*y X^3*y


(U) (GG)

40 191 1600 6400 2560000 102400000 4096000000 7640 305600 12224000

36 170 1296 46656 1679616 60466176 2176782336 6120 220320 7931520

58 272 3364 195112 11316496 656356768 38068692544 15776 915008 53070464

35 160 1225 42875 1500625 52521875 1838265625 5600 196000 6860000

56 280 3136 175616 9834496 550731776 30840979456 15680 878080 49172480

39 173 1521 59319 2313441 90224199 3518743761 6747 263133 10262187

48 234 2304 110592 5308416 254803968 12230590464 11232 539136 25878528

34 124 1156 39304 1336336 45435424 1544804416 4216 143344 4873696

37 158 1369 50653 1874161 69343957 2565726409 5846 216302 8003174

40 178 1600 64000 2560000 102400000 4096000000 7120 284800 11392000

SUMA 423 1940 18571 848127 40283587 1984684143 100976585011 85977 3961723 189668049

3
- Determinamos la ecuación: y=a𝑥 +bx²+cx+d

Sistema de ecuaciones y reemplazamos valores:

3 2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑𝑛 = Σy 𝑎(84812)+ 𝑏(18571) + 𝑐(423) + 𝑑(10) = 1940

4 3 2
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑Σ𝑥 = Σxy 𝑎(40283587)+ 𝑏(848127) + 𝑐(18571) + 𝑑(423) = 85977

5 4
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑Σ𝑥
3 2
= Σ𝑥 y
2 𝑎(198468414)+ 𝑏(40283587) + 𝑐(848127) + 𝑑(18571) = 3961723

6 5
𝑎Σ𝑥 + 𝑏Σ𝑥 + 𝑐Σ𝑥 + 𝑑Σ𝑥
4 3
= Σ𝑥 y
2 𝑎(100976585011)+ 𝑏(1984684143) + 𝑐(40283587) + 𝑑(84812) =
189668049

a = -0.00216 b = 0.18 c = 2.82 d = -83.98

3
Por lo tanto la ecuación es: y=-0.00216𝑥 +0.18x²+2.82x-83.98
- Ajuste exponencial

n = 10 X (U) Y (GG) y´=ln y XY´ X^2 y´^2

40 191 5.25 210.09 1600 27.59

36 170 5.14 184.89 1296 26.38

58 272 5.61 325.14 3364 31.43

35 160 5.08 177.63 1225 25.76

56 280 5.63 315.55 3136 31.75

39 173 5.15 200.98 1521 26.56

48 234 5.46 261.86 2304 29.76

34 124 4.82 163.89 1156 23.24

37 158 5.06 187.32 1369 25.63

40 178 5.18 207.27 1600 26.85

SUMA 423 1940 52.38 2234.61 18571 274.93


(𝑚𝑥)
- Determinamos la ecuación: y=b 𝑒

𝑥= 42.3 𝑛(Σ𝑥𝑦´)−(Σ𝑥)(Σ𝑦´) 10(2234.61)−(423)(52.38)


m= 2 2 = 10(18571)−(423)^2
= 0.028
𝑛(Σ𝑥 )−(Σ𝑥)
𝑦´= 5.24

Luego: b´= 𝑦´- m 𝑥 = 5.24 - (0.028*42.3) = 4.049

𝑏´ 4.049
Por último: b = 𝑒 = 𝑒 = 57.34

(0.028𝑥)
Entonces la ecuación será: y= 57.34 𝑒
CONSOLIDADOS DE LOS AJUSTES LINEAL, CUADRÁTICO, CÚBICO Y

EXPONENCIAL.
- Finalmente, al no haber diferencia significativa en los valores que toma el coeficiente

de determinación de los ajustes lineal, cuadrático, cúbico y exponencial, se elegirá el

ajuste lineal. La razón se basa en que los pasos para hallar la ecuación, así como la

misma comprensión de ésta es mucho más sencilla a diferencia de los otros modelos,

en los que se aprecia un mayor grado de dificultad.

3. El costo de decorar con jardinería ornamental casas recién construidas en una

comunidad fue proporcionado por una firma de decoración de jardinería ornamental en

relación con una muestra de 12 casas de las cuales se conocían los ingresos familiares y

los montos de las hipotecas. La información, expresada en miles de dólares, se da en la

siguiente tabla:

Familia Gastos en Ingreso familiar Monto de la


jardinería x1 hipoteca
y x2

1 2,7 18,6 24,2

2 3,6 20,4 32,1

3 1,8 19,4 28,2

4 5,4 24,2 36,1

5 5,2 24,0 30,4

6 6,3 28,4 40,1

7 1,3 37,2 48,2

8 8,4 56,8 80,3

9 4,6 26,4 20,1

10 5,9 23,6 32,6

11 7,1 45,4 54,7

12 4,1 24,6 48,2


a) Encuentre la línea de regresión de mínimos cuadrados que podría usarse para

predecir los gastos en jardinería

b) Utilizando cualquier paquete de computadora que tenga disponible, determine la

ecuación de regresión de mejor ajuste para los datos.

● Uso del SPSS para el cálculo de la ecuación de regresión lineal


𝑦 = 𝑎 + 𝑏1(1) + 𝑏2(2)

𝑦 = 1, 508 + 0, 097(1) + 0, 009(2)

● Estadístico de Prueba

gl=k=2

gl=n-k-1=12-2-1=9

𝑆𝑢𝑚𝑎 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠/𝑘


𝐹= 𝑆𝑢𝑚𝑎 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠/(𝑛−𝑘−1)

17,705/2
𝐹= 32,035/9

8,8525
𝐹= 3,8525

𝐹 = 2, 487

sig = p - value = 0,138


c) Utilice la ecuación que se obtuvo en el inciso (b) para estimar los gastos en

jardinería cuando el ingreso familiar es 43.2 y el monto de la hipoteca asciende a

51.3 miles de dólares.

𝑦 = 1, 508 + 0, 097(1) + 0, 009(2)

𝑦 = 1, 508 + 0, 097(43, 2) + 0, 009(51, 3)

𝑦 = 1, 508 + 4, 1904 + 0, 4617

𝑦 = 6, 1601

Los gastos estimados en jardinería cuando el ingreso es 43,2 y el monto de la hipoteca

asciende a 51,3 de acuerdo a la ecuación utilizada en el inciso b) es de 6,1601.

d) En qué medida explican las variables independientes a la variable dependiente.

El ingreso familiar (x1) y el monto de la hipoteca (x2) explican los gastos de

jardinería (y) en un 35,6%.

e) ¿El modelo es globalmente significativo?

F(2,9,0.05) = 4,26

Ho: b1= 0, x1 el modelo no es globalmente significativo


H1: b2≠0, x1 el modelo es globalmente significativo

La sig.=0,138 < 0,05 =α, es así que se acepta Ho, y se rechaza H1, es decir el modelo

no es globalmente significativo.

f) A un nivel de significancia del 5%, ¿Qué variables independientes son

significativas?

● El ingreso familiar

0.05= α; α <0.410= Sig

La variable independiente no es significativa, puesto que el Sig es mayor a 0.05.

● Monto de la hipoteca

0.05= α; α <0.911= Sig

La variable independiente no es significativa, puesto que el Sig es mayor a 0.05.

Entonces, ninguna de las variables independientes son significativas.

4. La tabla que sigue muestra las ventas semanales, calificaciones obtenidas en

exámenes y las calificaciones de desempeño de cinco vendedores que trabajan para un

distribuidor de automóviles local.


Vendedor Ventas semanales Calificación en el Calificación en el
y examen de aptitud desempeño
de ventas mecánico

1 13 10 10

2 10 9 8

3 7 6 5

4 12 10 9

5 9 9 6

a) Encuentre la línea de regresión de mínimos cuadrados que podría usarse para

predecir las ventas semanales.


b) Utilizando cualquier paquete de computadora que tenga disponible, determine

la ecuación de regresión de mejor ajuste para los datos.

Para ello haremos uso del SPSS con el fin de obtener el cálculo de la ecuación de regresión
lineal:
𝑦 = 𝑎 + 𝑏1(1) + 𝑏2(2)

𝑦 = 0. 250 + 0, 375(1) + 0, 875(2)

● Estadístico de Prueba

gl=k=2 del numerador

gl=n-k-1=5-2-1=2 del denominador

𝑆𝑢𝑚𝑎 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠/𝑘


𝐹= 𝑆𝑢𝑚𝑎 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠/(𝑛−𝑘−1)

22,300/2
𝐹= 0,500/2

11,15
𝐹= 0,25

𝐹 = 44, 6

Sig = 0,022= p - value

c) Utilice la ecuación que se obtuvo en el inciso (b) para estimar las ventas de un

vendedor con una calificación en el examen de aptitud de ventas de 2 y una

calificación de desempeño mecánico de 3.

𝑦 = 0. 250 + 0, 375(1) + 0, 875(2)

x1= 2

x2= 3

𝑦 = 0. 250 + 0, 375(2) + 0, 875(3)

𝑦 = 0. 250 + 0. 75 + 2. 625

𝑦 = 3. 625

Las ventas estimadas de un vendedor con una calificación en el examen de aptitud de


ventas de 2 y una calificación de desempeño mecánico de 3, de acuerdo a la ecuación
utilizada en el inciso b, es de 3.625
d) ¿En qué medida explican las variables independientes a la variable

dependiente?

La calificación en el examen de aptitud de ventas( x1) y la calificación en el

desempeño mecánico(x2) explican el volumen de ventas(y) en un 97.8%.

e) A un nivel de significancia del 5%, ¿el modelo es globalmente significativo?

F(2, 2, 0.05)= 19.00

Ho: b1= 0 Λ b2=0 el modelo no es globalmente significativo


H1: b1≠0 V b2≠0 el modelo es globalmente significativo
Si Sig = 0,022< 0,05 =α, se rechaza Ho, y se acepta H1, es decir el modelo es globalmente

significativo.
f) A un nivel de significancia del 5%, ¿qué variables independientes son

significativas?

Calificación en el examen de aptitud de ventas

0.05= α; α <0.325= Sig

La variable independiente no es significativa, puesto que el Sig es mayor a 0.05.

Calificación en el desempeño mecánico

0.05= α; α <0.062= Sig

La variable independiente no es significativa, puesto que el Sig es mayor a 0.05.

Entonces, ninguna de las variables independientes son significativas.


5. Un editor de periódicos que trata de determinar con precisión las características del

mercado de su periódico, se pregunta si la costumbre de la gente de la comunidad está

relacionada con el nivel educativo de los lectores. Se aplica una encuesta a los adultos

referente al nivel educativo y a la frecuencia con que leen el periódico. Los resultados se

muestran en la siguiente tabla:

Frecuencia Nivel Educativo Total


con la que lee
Profesional o Pasante de Preparatoria No terminó la
de posgrado licenciatura preparatoria

Nunca 10 17 11 21 59

Algunas veces 12 23 8 10 53

Mañana o 35 33 16 8 92
tarde

Ambas 28 19 6 13 66
ediciones

TOTAL 85 92 41 52 270

c) Establezca la hipótesis nula y alternativa.

d) Si el nivel de significancia es de 0.10, ¿la frecuencia con que se lee el periódico en la

comunidad difiere (depende) de acuerdo con el nivel educativo de los lectores?

Solución:

a) Desarrolle una tabla de frecuencias observadas y esperadas para este problema.


Variables X Frecuencia con que se lee el periódico en la
categóricas comunidad

Y Nivel educativo

Frecuencias observadas
NIVEL EDUCATIVO

Profesional o Pasante de Preparatoria No terminó la TOTAL


de posgrado licenciatura preparatoria

Nunca 10 17 11 21 59

Algunas 12 23 8 10 53
veces

Mañana o 35 33 16 8 92
tarde

Ambas 28 19 6 13 66
ediciones

TOTAL 85 92 41 52 270

Frecuencias esperadas

NIVEL EDUCATIVO

Profesional o de Pasante de Preparatoria No terminó la


posgrado licenciatura preparatoria

Nunca 18.57 20.10 8.96 11.36

Algunas veces 16.69 18.06 8.05 10.21

Mañana o tarde 28.96 31.35 13.97 17.72

Ambas ediciones 20.78 22.49 10.02 12.71

b) Calcule el valor Chi-cuadrado de la muestra.

fo fe (fo- fe)2 (fo- fe)2/ fe

10 18.57 73.51 3.96

17 20.10 9.63 0.48

11 8.96 4.16 0.46

21 11.36 92.87 8.17

12 16.69 21.95 1.32


23 18.06 24.41 1.35

8 8.05 0.00 0.00

10.00 10.21 0.04 0.00

35.00 28.96 36.45 1.26

33.00 31.35 2.73 0.09

16.00 13.97 4.12 0.29

8.00 17.72 94.45 5.33

28.00 20.78 52.16 2.51

19.00 22.49 12.17 0.54

6.00 10.02 16.18 1.61

13.00 12.71 0.08 0.01

270.00 270.00 2 27.39


𝑋 =

PASO 1: Hipótesis

● Ho: La frecuencia con que se lee el periódico en la comunidad es

independiente de su nivel educativo

● H1: La frecuencia con que se lee el periódico en la comunidad depende de su

nivel educativo

PASO 2: Estadístico de prueba


2
2 (𝐹0−𝐹𝑒)
𝑋 =∑ 𝐹𝑒
= 27. 39

PASO 3: Cálculo de valor crítico


𝑔𝑙 = (𝑟 − 1)(𝑐 − 1) = (4 − 1)(4 − 1) = 9
𝑎 = 0. 1
PASO 4: Toma de decisión

Como el estadístico de prueba es 27.39 y es mayor que el valor crítico 14.6837, se rechaza 𝐻0, es

decir, la frecuencia con que se lee el periódico en la comunidad depende de su nivel educativo.

6. Una importante corporación comercial de la ciudad de Boston ha tenido ventas (en

millones de dólares) por: 17, 27, 26, 41, 39, 48, 60, 72, 90, 102 durante los años de 2004 a

2013, respectivamente.

Años Ventas (millones


de dólares)

2004 17

2005 27

2006 26

2007 41

2008 39

2009 48

2010 60

2011 72

2012 90

2013 102
a. Trace la serie de tiempo.

b. Ajuste a los datos una recta de mínimos cuadrados y trácela en el diagrama que muestra

los datos originales. FALTA

2
𝑅 = 0. 944
c. Realice el ajuste, cuadrático, cúbico y exponencial. Considerando el ajuste lineal,

¿cuál es la mejor tendencia de esta serie. Justifique

RESPUESTA: Considerando los resultados la mejor tendencia para esta serie de tiempo es la

lineal ya que es mayor y más simple. Esto debido a que sí existe una diferencia significativa

entre los valores que toma el coeficiente en los ajustes lineal, cuadrático, cúbico y

exponencial.
7. Los siguientes son los ingresos operativos (en miles de millones de dólares) de una

importante línea aérea de Estados Unidos en los años de 2010 a 2018: 3.2, 3.4, 3.3, 3.6,

3.9, 4.2, 3.9, 3.8 y 4.3.

Solución

a. Elabore la gráfica de la serie de tiempo.

b. Ajuste a estos ingresos una recta de tendencia de mínimos cuadrados y trace la

recta en el diagrama que se trazó en el inciso a.


Ecuación de tendencia:

𝑦 = 3. 733 + 0. 123𝑥

2
𝑅 = 0. 761

c. Modifique la ecuación que se obtuvo en el inciso b, para utilizarla con datos

mensuales y desplace el origen al mes de enero de 2014.

0.123𝑥
𝑦 = 3. 733 + 12

𝑦 = 3. 733 + 0. 01025𝑥

Desplazando el origen al mes de enero del 2014…

Desde mitad de junio a enero= 5.5


𝑦 = 3. 733 + 0. 01025(5. 5)

𝑦 = 3. 733 + 0. 010𝑥

d. Realice el ajuste, cuadrático, cúbico y exponencial. Considerando el ajuste lineal,

¿Cuál es la mejor tendencia de esta serie? Justifique.

RPTA: En vista que no existe una diferencia significativa entre los valores que toma el

coeficiente en los ajustes lineal, cuadrático, cúbico y exponencial. La mejor tendencia de esta

serie, resulta ser el ajuste lineal.


8 .En los años de 2007 a 2019, los ingresos de las ventas de energía eléctricas y gas en

estados Unidos (en miles de millones de dólares) fueron 22.1, 24.7, 27.9, 31.7, 39.1, 46.9,

53.5, 62.6, 69.8, 79.6, 95.5, 111.6 y 122.0.

Y_Venta de energía
AÑO X eléctrica y gas en EE.UU. XY X^2.Y XY X^2 X^4

2007 -6 22.1 -132.6 795.6 -132.6 36 1296

2008 -5 24.7 -123.5 617.5 -123.5 25 625

2009 -4 27.9 -111.6 446.4 -111.6 16 256

2010 -3 31.7 -95.1 285.3 -95.1 9 81

2011 -2 39.1 -78.2 156.4 -78.2 4 16

2012 -1 46.9 -46.9 46.9 -46.9 1 1

2013 0 53.5 0 0 0 0 0

2014 1 62.6 62.6 62.6 62.6 1 1

2015 2 69.8 139.6 279.2 139.6 4 16

2016 3 79.6 238.8 716.4 238.8 9 81

2017 4 95.5 382 1528 382 16 256

2018 5 111.6 558 2790 558 25 625

2019 6 122.0 732 4392 732 36 1296

0 787 1525.1 12116.3 1525.1 182 4550


a. Trace la serie de tiempo.

b. Ajuste a esta serie una parábola por el método de los mínimos cuadrados.
y^ = a + bx + cx2

Se puede determinar b directamente haciendo una sustitución en la fórmula así:

b = Suma (xy) / Suma (x^2) = 1525.1 / 182 = 8.38

Después, al sustituir n = 13 junto con los totales de las columnas y, x^2.y, x^2 y x^4 en la

primera y tercera ecuaciones normales reducidas, se obtiene:

787 = 13 a +182c

12116.3 = 182a + 4550c


Al resolver estas dos ecuaciones simultáneas, se tiene que a = 9.32 y c = -0.14.

Con esto, las ecuaciones de tendencia parabólica y su leyenda son:

ŷ = 9.32 - 0.28x – 0.14x2

(origen: 2013; unidades de x: un año; y: venta de energía eléctrica y gas en EE.UU., en miles

de millones de dólares).

En esta ecuación parabólica que describe la tendencia de la venta de energía eléctrica y gas en

EE.UU., en el periodo de 2007 a 2019, a = 9.32 es el

valor de tendencia de 2013, b = -0.28 es la pendiente de la curva en x = 0 (el

origen) y 2c = -0.28 es la razón constante del cambio de la pendiente en este

punto en particular.

c. ¿Cuál es el valor de la tendencia en el año de 2010 y 2018?.

Para determinar el valor de la tendencia de un año cualquiera en la curva parabólica,

sustituimos simplemente el valor adecuado de x en la ecuación de tendencia.

Para 2010, sustituimos x = -5 y obtenemos. ŷ = 9.32 – 0.28(-5) – 0.14(-5)2 = 7.22

Para 2016, sustituimos x = 3 y obtenemos ŷ = 9.32 – 0.28(3) – 0.14(3)2 = 7.22 y para 2019

(un año después del término de la serie), sustituimos x = 6 y obtenemos ŷ = 9.32 – 0.28(6) –

0.14(6)2 = 2.60

d. Realice el ajuste, cuadrático, cúbico y exponencial. Considerando el ajuste lineal,

¿Cuál es la mejor tendencia de esta serie? Justifique.


9.- En una auditoría los auditores tienen que dar opiniones acerca de diversos aspectos

con base en sus propias experiencias directas, indirectas o en una combinación de

ambas. En un estudio se pidió a auditores que dieran su opinión acerca de la frecuencia

con que se presentan errores en una auditoría. Suponga que se obtuvieron los resultados

que se presentan a continuación; valores bajos indican opiniones más acertadas.

Directa Indirecta Combinación

17 16.6 25.2

18.5 22.2 24

15.8 20.5 21.5

18.2 18.3 26.8

20.2 24.2 27.5

16 19.8 25.8

13.3 21.2 24.2

Use α = 0.05 para determinar si el tipo de experiencia en que se basa la opinión afecta la

calidad de la misma.

Resolución:
PASO 1: HIPÓTESIS
𝐻𝑜 = El rendimiento promedio son iguales: v1 = v2 = v3
𝐻𝑖 = No todos los rendimientos promedio son iguales

PASO 2: CÁLCULO DEL ESTADÍSTICO DE PRUEBA:

Suma 119 142.8 175

𝑋 17 20.4 25

𝑆
2 5.01 6,2567 4.01

σ
2 2.24 2.501 2.002

n 7 7 7
Para calcular el estadístico de prueba usaremos las siguientes fórmulas:

𝑒𝑝 Cuadrado Medio Suma de Cuadrados

𝐶𝑀𝑇 𝑘 𝑘
𝑒𝑝 = 𝐶𝑀𝐸 ∑ 𝑛𝑦(𝑥𝑦−𝑥)
2
2
𝑦=1 ∑ 𝑛𝑦(𝑥𝑦 − 𝑥)
𝐶𝑀𝑇 = 𝑘−1 𝑦=1

𝑘 𝑘
2
∑ (𝑛𝑦−1)𝑠𝑦 2
𝑦=1 ∑ (𝑛𝑦 − 1)𝑠𝑦
𝐶𝑀𝐸 = 𝑛𝑦−𝑘 𝑦=1

● 𝐶𝑀𝑇
2 2 2
7 * (17 − 20. 5) = 85.75 7 * (20. 4 − 20. 5) =0.07 7 * (25 − 20. 5) =141.75

𝑘
2
∑ 𝑛𝑦(𝑥𝑦−𝑥)
𝑦=1 85.75+0.07+141.75 227.57
𝐶𝑀𝑇 = 𝑘−1
= 3−1
= 2
= 112. 84
● 𝐶𝑀𝐸
(7 − 1) * 5. 01 = 30.06 (7 − 1) * 6. 2567 = 37.54 (7 − 1) * 4. 01 = 24.06
𝑘
2
∑ (𝑛𝑦−1)𝑠𝑦
𝑦=1 30.06+37.54+24.06 91.66
𝐶𝑀𝐸 = 𝑛𝑦−𝑘
= 21−3
= 18
= 5. 092222
Dividir:
𝐶𝑀𝑇 112.84
𝑒𝑝 = 𝐶𝑀𝐸
= 5.092222
=22. 1592583

PASO 3: CÁLCULO DEL VALOR CRÍTICO


Nivel de significancia: 𝑎 = 0. 05
Ubicamos en la tabla de la distribución de Fisher
𝑔°𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 = 𝑘 − 1 = 3 − 1 = 2
𝑔°𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟 = 𝑛 − 𝑘 = 21 − 3 = 18
➔ Ahora revisamos nuestra Tabla de Fisher para elegir el valor crítico: 𝑣𝑐 = 3. 55
RESPUESTA: Como el estadístico de prueba (𝑒𝑝 = 22. 16) es mayor que el valor crítico (𝑣𝑐

=3.55) se rechaza 𝐻𝑜 En favor de la hipótesis alternativa, es decir, con un nivel de

significancia de 0.05 rechazamos la hipótesis nula y concluimos que el tipo de experiencia en

que se basa la opinión sí afecta la calidad de la misma..

10.- Para estudiar el efecto de la temperatura en el rendimiento de un proceso químico,

se produjeron cinco lotes con cada uno de los tres tratamientos. Los resultados se

presentan a continuación. Dé la tabla para el análisis de la varianza. Use 𝑎 = 0. 05 para

probar si la temperatura afecta al rendimiento medio del proceso.

Temperatura

50°C 60°C 70°C

34 30 23

24 31 28

36 34 28

39 23 30

32 27 31

Resolución:
PASO 1: PLANTEAMIENTO DE HIPÓTESIS
𝐻𝑜 = El rendimiento promedio de los tratamientos t1, t2 y t3 son iguales: t1 = t2 = t3
𝐻𝑖 = No todos los rendimientos promedio son iguales

PASO 2: CÁLCULO DEL ESTADÍSTICO DE PRUEBA:

50°C 60°C 70°C


34 30 23

24 31 28

36 34 28

39 23 30

32 27 31

Tratamiento 1 (t1) Tratamiento 2 (t2) Tratamiento 3 (t3)

Ẋ 33 29 28

𝝈 5.7 4.2 3.1

𝑆
2 32 17.5 9.5

n 5 5 5

Para calcular el estadístico de prueba usaremos las siguientes fórmulas:

𝑒𝑝 Cuadrado Medio Suma de Cuadrados

𝐶𝑀𝑇 𝑘 𝑘
𝑒𝑝 = 𝐶𝑀𝐸 ∑ 𝑛𝑦(𝑥𝑦−𝑥)
2
2
𝑦=1 ∑ 𝑛𝑦(𝑥𝑦 − 𝑥)
𝐶𝑀𝑇 = 𝑘−1 𝑦=1

𝑘 𝑘
2
∑ (𝑛𝑦−1)𝑠𝑦 2
𝑦=1 ∑ (𝑛𝑦 − 1)𝑠𝑦
𝐶𝑀𝐸 = 𝑛𝑦−𝑘 𝑦=1

𝑘
2
∑ 𝑛𝑦(𝑥𝑦−𝑥)
𝑦=1 45+5+20 70
𝐶𝑀𝑇 = 𝑘−1
= 3−1
= 2
= 35
𝑘
2
∑ (𝑛𝑦−1)𝑠𝑦
𝑦=1 128+72+40 240
𝐶𝑀𝐸 = 𝑛𝑦−𝑘
= 15−3
= 12
= 20
𝐶𝑀𝑇 35
𝑒𝑝 = 𝐶𝑀𝐸
= 20
= 1. 75

PASO 3: CÁLCULO DEL VALOR CRÍTICO


Nivel de significancia: 𝑎 = 0. 05
Distribución de Fisher
𝑔°𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 = 𝑘 − 1 = 3 − 1 = 2
𝑔°𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟 = 𝑛 − 𝑘 = 15 − 3 = 12
Ahora revisamos nuestra Tabla de Fisher para elegir el valor crítico: 𝑣𝑐 = 3. 89

PASO 4: TOMA DE DECISIÓN:


Como el estadístico de prueba (𝑒𝑝 = 1. 75) es menor que el valor crítico (𝑣𝑐=3.89), se acepta
𝐻𝑜, es decir, con un nivel de significancia de 0.05 no hay evidencia suficiente para comprobar
que exista alguna diferencia en el rendimiento promedio a causa de la temperatura.

También podría gustarte