Está en la página 1de 22

lOMoAR cP SD| 4041340

Nombre: Carolina Morales Lozano Matrícula: 2952056

Nombre del curso: Estadística y Nombre del profesor: Christian Gabriel


pronósticos para la toma de Valderrama Apresa
decisiones

Módulo: 2 Act
ividad:
Ejercicio 2

Fecha: 08 Julio 2022

Bibliografía:

 Universidad Tecmilenio (s.d.). Explicación del ejercicio 2 Recuperado de


https://miscursos.tecmilenio.mx/ultra/courses/_159245_1/cl/outline

lOMoAR cPS D| 4041340


lOMoAR cP SD| 4041340

Parte 1

1. Define los siguientes términos:

a. Análisis de la regresión simple.

El análisis de regresión es un proceso estadístico que permite analizar la relación que existe entre
dos o más variables, siendo una de ellas dependiente al resto de variables que estemos
empleando en nuestro cálculo matemático. Dicho de otro modo, un análisis regresivo hace
posible comprender cómo las variables independientes afectan directamente a otra variable que
dependa de ellas.

b. Estimadores de mínimos cuadrados.

Es una técnica de análisis numérico enmarcada dentro de la optimización matemática, en la que,


dados un conjunto de pares ordenados —variable independiente, variable dependiente— y una
familia de funciones, se intenta encontrar la función continua, dentro de dicha familia, que mejor
se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mínimo error
cuadrático.

c. Intervalo de confianza.

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que


posiblemente incluya el valor de un parámetro de población desconocido. Debido a su naturaleza
aleatoria, es poco probable que dos muestras de una población en particular produzcan
intervalos de confianza idénticos. Sin embargo, si usted repitiera muchas veces su muestra, un
determinado porcentaje de los intervalos de confianza resultantes incluiría el parámetro de
población desconocido.

d. Coeficiente de regresión.

Los coeficientes de regresión representan el cambio medio en la variable de respuesta para una
unidad de cambio en la variable predictora mientras se mantienen constantes los otros
predictores presentes en el modelo. Este control estadístico que ofrece la regresión es
importante, porque aísla el rol de una variable del resto de las variables incluidas en el modelo.

La clave para entender los coeficientes es pensar en ellos como pendientes, y con frecuencia se les
llama coeficientes de pendiente. Ilustraré esto en la gráfica de línea ajustada de abajo, donde
usaré la estatura de una persona para modelar su peso.

e. Coeficiente de correlación.

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una
medida de regresión que pretende cuantificar el grado de variación conjunta entre dos variables.

Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es
decir, si se representan en un diagrama de dispersión los valores que toman dos variables, el
coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos
representados se aproxima a una recta.
lOMoAR cP SD| 4041340

f. Coeficiente de determinación.

Es la proporción de la varianza total de la variable explicada por la regresión. El coeficiente de


determinación, también llamado R cuadrado, refleja la bondad del ajuste de un modelo a la
variable que pretender explicar. Es importante saber que el resultado del coeficiente de
determinación oscila entre 0 y 1.

Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que
estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará
el modelo y, por tanto, menos fiable será

Archivo de Excel aquí.

2. Desarrolla los siguientes ejercicios y da respuesta a las preguntas planteadas.

a. En una compañía fabricante de helados se sospecha que el almacenar el helado a


temperaturas bajas durante largos periodos tiene un efecto lineal en la pérdida
de peso del producto. En la planta de almacenamiento de la compañía se
obtuvieron los siguientes datos:

Pérdida de peso (gr) Y 28 37 36 30 28 36 35


Tiempo (semanas) X 26 32 35 27 25 31 30

b. Ajusta e interpreta un modelo de regresión lineal simple a los datos.

ẋ= 29.42
lOMoAR cP SD| 4041340

ẏ=32.85
∑xy= 6848
∑X2= 6140
∑y2= 7654

b1= 1.022
b0= 2.77

c. Prueba la significancia de la pendiente β1.

Pend.=b1= ∑xy-n XY/ ∑ x2-n (x2)

B1=6848-7(29.4285)(32.8571)/6140−(7) (29.4285)2

=79.4538/77.7437

=1.0219
lOMoAR cP SD| 4041340

Calcula e interpreta R2.


lOMoAR cP SD| 4041340

Sx= 3.5989
Sy= 4.0178
R2=0.8379
R=0.91
d. Elabora un intervalo de confianza del 90% para β1.

S2=raíz ∑ y2-b0∑Y-b1∑xy/n-2 Raíz 7654-2.84(230)-1.02(6848)/7 2=52.88

e. Pronostica la pérdida cuando el tiempo es de 33 semanas.

Ta/2n-

2=t0.05.5=2.015

b1+-ta/2(n-2)S/Raíz ∑x2-n(x)2 52.88/Raíz

6140-7(29.43)2

=11.11,13.15

Raíz 1.02+-2.015

3. Con los conceptos vistos y puestos en práctica, da una respuesta justificada a cada
una de las siguientes cuestiones:
a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu
especialidad?

En mi especialidad yo lo utilizaría para determinar los proveedores que me entregan los


materiales dañados, así también como quien es el que más tieneproblemas para entregarme
en cuanto tiempos de perdida.

b. ¿Qué relación tiene con la correlación?

Se puede poner en práctica como análisis anticipado a la regresión final, si con esta se
demuestra que no hay una relación lineal se deberá descartar el modelode regresión
lOMoAR cP SD| 4041340

c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido?

Calculando el error estándar de estimación para a la hip proceder a la hipótesis correcta.


d. ¿Qué es el coeficiente de determinación?

Se reduce el error por el simple hecho de utilizar el modelo lineal para sacar la variable
dependiente.

e. ¿Por qué crees que se llama regresión lineal?

Porque da a conocer el efecto de resultados la X sobre la Y.


lOMoAR cP SD| 4041340

f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de


confianza en la regresión?
Dar una comprobación del grado de verdad o falsedad de valores o de algúnhecho.

Parte 2

Realiza lo siguiente:

4. En un estudio de variables que afectan la productividad en el negocio de abarrotes


al menudeo, W. S. Good usa el valor agregado por hora de trabajo para medir la
productividad de tiendas de abarrotes al menudeo. Él define el “valor agregado”
como el “excedente [dinero generado por el negocio] disponible para pagar mano
de obra, muebles accesorios y equipo”. Los datos de acuerdo con la relación del
valor agregado porhora de trabajo Y y el tamaño X de la tienda de abarrotes
descrita en el articulo de Good para diez tiendas de abarrotes ficticias se muestran
enseguida. Se establecerá un modelo para relacionar Y con X.

Datos en relación con el tamaño de tienda y el


valor agregado
Tiend Valor agregado Tamaño de la tienda
a por hora de (miles de pies
trabajoY cuadrados) X
1 6.08 23.0
2 5.40 14.0
3 5.51 27.2
4 5.09 12.4
5 4.92 33.9
6 3.94 9.8
7 6.11 22.6
8 5.16 17.5
9 5.75 27.0
10 5.60 21.1
a. Realiza un diagrama de dispersión de los datos para Y contra X.

Tamaño de la tienda miles de pies cuadrados X


lOMoAR cP SD| 4041340

Y= 18.159

R2= 0.0108

Valor agregado por hora de trabajo Y

Y= -0.0093x + 5.4073
R2= 0.002
b. Calcula las rectas de mínimos cuadrados para Y contra X.

valor
agrega xy x2 y2
tamañ
do
1 6.0 2 139. 529 36.9
8 3 84 6
2 5.4 1 75. 196 29.1
4 6 6
3 5.5 2 149. 739. 30.3
1 7 87 84 6
.2
lOMoAR cP SD| 4041340

4 5.0 1 63.1 153. 25.9


9 2 16 76
.4
166. 1149
5 4.9 3
78 .2
2 3
8 1 24.2
.
9
9.8

6 3.9 38.6 96.0 15.


4 12 4 52
7 138.
6.1 2
1 2 08
510. 37.
. 6 76 33
6
8 5.1 1 90.3 306. 26.
6 7 25 62
.
5
9 5.7 2 155. 729 33.
5 7 25 06
1 5.6 2 116. 449. 31.
0 1 72 44 36
.
1
208 53.6 113 485 29
. 6. 9. 0.5
6 2 3

b1= 0.2570
b0= -0.0540
lOMoAR cP SD| 4041340

d. Obtén una gráfica de residuales contra el valor ajustado de Y, ya sea por medio
de Minitab. Observa la gráfica. ¿Qué patrón parecen seguir los datos? Éste es
un ejemplo de análisis de residuales.
FUENTE GL SC MC F P
REGRES
IO N

1 0.703 0.70 1.92 0.20


2
32 4
ERROR 8 2.934 0.36 0 0
2
68
TOTAL 9 3.637 1.07 1.92 0.20
4
4

5. En un experimento con conejos se tomaron en cuenta las siguientes


variables: Y: Proporción del peso final al peso inicial. X: Gramos
diarios de alimento por kg de peso inicial.

Proporción de peso Gramos diarios Proporción de peso final al Gramos diarios


final alde alimento por kg de de peso inicial alimento por kg
peso inicialpeso inicial de
pe
Y X so
Y
inicial
lOMoAR cP SD| 4041340

X
0.91 10 1.16 33
0.88 15 0.96 35
0.90 18 1.08 36
0.79 19 1.13 37
0.94 20 1.00 39
0.88 21 1.10 42
0.95 21 1.11 45
0.97 24 1.18 54
0.88 25 1.26 56
1.01 27 1.29 56
0.95 28 1.36 59
0.95 30 1.40 59
1.05 30 1.32 60
1.05 31 1.47 64
a. Realiza un diagrama de dispersión de los datos para Y contra X.

Gramos Proporci
diarios de ó n de
alimento peso final
por al peso
kg de peso inicial
10 0.91
15 0.88
18 0.9
19 0.79
20 0.94
21 0.88
21 0.95
24 0.97
25 0.88
27 1.01
28 0.95
30 0.95
lOMoAR cP SD| 4041340

30 1.05
31 1.05
lOMoAR cP SD| 4041340

33 1.16
35 0.96
36 1.08
37 1.13
39 1
42 1.1
45 1.11
54 1.18
56 1.26
56 1.29
59 1.36
59 1.4
60 1.32
64 1.47

b. Calcula las rectas de mínimos cuadrados para Y contra X.

Gr am o s dia rio s de ali


me Pro por ci ón de pes o
fin xy x2 y2
lOMoAR cP SD| 4041340

nt al
o por al
k pe
g so
d ini
e cia
p l
e
s
o
10 0.91 9.1 100 0.8281
15 0.88 13.2 225 0.7744
18 0.9 16.2 324 0.81
19 0.79 15.01 361 0.6241
20 0.94 18.8 400 0.8836
21 0.88 18.48 441 0.7744
lOMoAR cP SD| 4041340

21 0.95 19.95 441 0.9025


24 0.97 23.28 576 0.9409
25 0.88 22 625 0.7744
27 1.01 27.27 729 1.0201
28 0.95 26.6 784 0.9025
30 0.95 28.5 900 0.9025
30 1.05 31.5 900 1.1025
31 1.05 32.55 961 1.1025
33 1.16 38.28 1089 1.3456
35 0.96 33.6 1225 0.9216
36 1.08 38.88 1296 1.1664
37 1.13 41.81 1369 1.2769
39 1 39 1521 1
42 1.1 46.2 1764 1.21
49.95

45 1.11 2025 1.2321

54

1.18 63.72 2916 1.3924


56 1.26 70.56 3136 1.5876
56 1.29 72.24 3136 1.6641
59 1.36 80.24 3481 1.8496
59 1.4 82.6 3481 1.96
60 1.32 79.2 3600 1.7424
64 1.47 94.08 4096 2.1609
994 29.93 1132.8 41902 32.852
1

ẋ= 35.5

ẏ=1.0689

∑xy= 1132.8

∑X2= 41902

∑y2= 32.8521
b1=0.010625
b0= 0.691737
S= 0.65715

Y= 0.6917 + 0.0106x
Sb1= 0.0008079
lOMoAR cP SD| 4041340

d. Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas


de laprueba de hipótesis (α = 0.01).
1. Establecimiento de la hipótesis.

Ho: B1=0 el número de gramos de alimentos x1 no afecta la


proporción del peso final con el peso inicial Y.

2. Estadística de prueba.

Sb1= 0.000807989

T calculada= 13.15004436

3. Regla de decisión.

Rechazar Ho si T calculada es mayor que T : 2.7787 T se

En donde
obtiene de la tabla.
e. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15, 25,
30, 35.5,39, 45, 60, 70, 80, 90.
ẏ= b0 + b1X

X0 Y=0.692+0.0106X Predic
ciones

0 0.692
0.69+0.0106(0
)=0.
69
0.69+0.0106(5
5 )=0. 0.745
745

15 0.851
0.69+0.0106(15
)
lOMoAR cP SD| 4041340

25 0.957
0.69+0.0106(25
)
lOMoAR cP SD| 4041340

30 1.01
0.69+0.0106(
30
)

1.0683
35.5 0.69+0.0106(
35
.5)

39 1.1054
0.69+0.0106(
39
)

45 1.169
0.69+0.0106(
45
)

60 1.328
0.69+0.0106(
60
)

70 1.434
0.69+0.0106(
70
)

80 1.54
0.69+0.0106(
80
)

90 1.646
0.69+0.0106(
90
)
lOMoAR cP SD| 4041340

6. Calcula el intervalo de confianza de los valores particulares de Y para los valores


dados deX0 del inciso anterior.
Ŷ+-*S Raíz 1+1/n(x0-x)2/Ex2-n(x)2 Confianza
de 99%
Ta/2(n-2)=t0.005(26)=2.779

Raíz s2 Ey2-b0EY-b1Exy/n-2

Raíz 32.85-0.7(29.93)-0.0104(1132.8)/28-2=0.0673 X0=0


Ŷ=0.692

Intervalo(0.4849,0.8991)
Ŷ=0.74
Intervalo (0.5422,0.9478)

0.745-2.779(0.0673) Raíz 1+1/28+(5-35.5)*2/41902-28(35.5)*2 X0=15


Ŷ0.851

Intervalo (0.6549,1.0471)

.851-2.779(0.0673) Raíz 1+1/28+(15-35.5)*2/41902-28(35.5)*2


X0=25
Ŷ=0.957

.957-2.779(0.0673) Raíz 1+1/28+(25-35.5)*2/41902-28(35.5)*2

Intervalo (0.7651,1.1489)
X0=30
Ŷ=1.01

1.01-2.779(0.0673) Raíz 1+1/28+(30-35.5)*2/41902-28(35.5)*2

Intervalo (0.8192,1.2008)
X0=35.5
Ŷ=1.0683

1.0683-2.779(0.0673) Raíz 1+1/28+(30-35.5)*2/41902-28(35.5)*2

Intervalo (0.9149, 1.2959)


X0=45
Ŷ=1-169

1.169-2.779(0.0673) Raíz 1+1/28+(30-35.5)*2/41902-28(35.5)*2

Intervalo (0.9774, 1.3606)


X0=60
Ŷ=1.328

1.328-2.779(0.0673) Raíz 1+1/28+(30-35.5)*2/41902-28(35.5)*2

Intervalo (1.1295, 1.5265)


Ŷ=1.43
1.434-2.779(0.0673) Raíz 1+1/28+(30-35.5)*2/41902-28(35.5)*2

Intervalo (1.2278,1.6402)
X0=80
Ŷ=1.54

1.54-2.779(0.0673) Raíz 1+1/28+(30-35.5)*2/41902-28(35.5)*2

Intervalo ( 1.339, 1.7561)


X0=90
Ŷ=1.646

Bibliografía:

Universidad Tecmilenio (s.d.). Explicación del ejercicio 2 Recuperado


de
https://miscursos.tecmilenio.mx/ultra/courses/_159245_1/cl/outline

También podría gustarte