Está en la página 1de 13

Nombre: Irandy Alejandra

Valencia López
Matrícula: al02981898
Nombre del curso: Estadísticas y Nombre del profesor: José Ángle
pronósticos para la toma de Valles Bustos
decisiones
Módulo 9-12 Ejercicio 2 : ¿Existe relación entre la
cantidad de Kilómetros y los caballos
de fuerza y el peso total?

Fecha: 13 de diciembre de 2021


Referencias o bibliografía:
Economipedia. Sánchez J. 2011. Análisis de regresión. Recuperado de:
https://economipedia.com/definiciones/analisis-de-regresion.html

Revista unica. Universidad & ciencia. Vol.9, No.1, enero-abril 2020, Alvaréz
R. uso del estimador de mínimos cuadrados ordinarios en la inferencia con
datos de series de tiempo en modelos lineales using ordinary least squares
estimator in inference with time series data in linear models. Recuperado de:
https://revistas.unica.cu/index.php/uciencia/article/view/1544/2345.

Banco finandina. 1 noviembre 2019. ¿Qué es un intervalo de confianza y


para qué se utiliza? Recuperado de:
https://www.bancofinandina.com/finanblog/noticias/2019/11/01/que-es-un-
intervalo-de-confianza-y-para-que-se-utiliza
Ejercicio 2. ¿Existe relación entre la cantidad de Kilómetros y los caballos
de fuerza y el peso total?

 Instrucciones:

 Este ejercicio abarca del tema 9 al 12.


Parte 1

1. Define los siguientes términos:


a. Análisis de la regresión simple.

Una de las principales aplicaciones del análisis de regresión es la proyección


con diferentes escenarios. Esto, teniendo en cuenta el grado de influencia (en
estadística se conoce a esto como correlación) sobre la variable dependiente.
Economipedia. Sánchez J. 2011. Análisis de regresión. Recuperado de:
https://economipedia.com/definiciones/analisis-de-regresion.html.

El análisis de regresión lineal, en general, nos permite obtener una función


lineal de una o más variables independientes o predictoras (X1, X2, ... XK) a
partir de la cual explicar o predecir el valor de una variable dependiente o
criterio (Y). En el análisis de regresión lineal podemos diferenciar entre análisis
de regresión lineal simple y análisis de regresión lineal múltiple. En el primero,
se intenta explicar o predecir la variable dependiente Y a partir de una única
variable independiente, X1; mientras que en el segundo, contamos con un
conjunto de variables independientes, X1, X2, ... XK, para estimar la variable
dependiente Y. En ambos casos, tanto la variable dependiente como la/s
independiente/s están medidas en escala de intervalo o de razón.

b. Estimadores de mínimos cuadrados.

Es una técnica de optimización cuyo objetivo consiste en la obtención de la


función que mejor se ajuste (en el sentido de un error cuadrático mínimo) a los
datos observados de las variables objeto de estudio.
Es un procedimiento de análisis numérico en la que, dados un conjunto de
datos (pares ordenados y familia de funciones), se intenta determinar la función
continua que mejor se aproxime a los datos (línea de regresión o la línea de
mejor ajuste), proporcionando una demostración visual de la relación entre los
puntos de los mismos. En su forma más simple, busca minimizar la suma de
cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos
generados por la función y los correspondientes datos. Revista unica.
Universidad & ciencia. Vol.9, No.1, enero-abril 2020, Alvaréz R. uso del
estimador de mínimos cuadrados ordinarios en la inferencia con datos de
series de tiempo en modelos lineales using ordinary least squares estimator in
inference with time series data in linear models. Recuperado de:
https://revistas.unica.cu/index.php/uciencia/article/view/1544/2345

c. Intervalo de confianza.

El intervalo de confianza representa una técnica de estimación que se utiliza en


el campo de la inferencia estadística. En él se permite acotar uno o diversos
pares de valores, entre los cuales está la estimación puntual indagada. Esto
dentro de una determinada probabilidad.

Un intervalo de confianza estadística en estadística permite calcular los valores


que existen alrededor de una media muestral. Dentro de la muestra, se
encuentra un rango superior y otro inferior. Dentro de dicho rango, se estima la
probabilidad determinada y se localiza el parámetro poblacional. De modo que
esto permite expresar con precisión si la estimación de la muestra coincide con

el valor de toda la población. Banco finandina. 1 noviembre 2019. ¿Qué es un


intervalo de confianza y para qué se utiliza? Recuperado de:
https://www.bancofinandina.com/finanblog/noticias/2019/11/01/que-es-un-
intervalo-de-confianza-y-para-que-se-utiliza
d. Coeficiente de regresión.

En estadística, los coeficientes de regresión lineal son los valores constantes


que representan el punto donde la recta de regresión corta al eje de ordenadas
y la pendiente de la misma respecto al eje de ordenadas.

e. Coeficiente de correlación.

En estadística, el coeficiente de correlación de Pearson es una medida de la


relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlación de Pearson es independiente de la escala de medida
de las variables. De manera menos formal, podemos definir el coeficiente de
correlación de Pearson como un índice que puede utilizarse para medir el
grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

f. Coeficiente de determinación.

El coeficiente de determinación es una medida estadística de la bondad del


ajuste o fiabilidad del modelo estimado a los datos. Se representa por R2 e
indica cuál es la proporción de la variación total en la variable dependiente (Y),
que es
explicada por el modelo de regresión estimado, es decir, mide la capacidad
explicativa del modelo estimado.

2. Desarrolla los siguientes ejercicios y da respuesta a las preguntas


planteadas.
a. En una compañía fabricante de helados se sospecha que
el almacenar el helado a temperaturas bajas durante
largos periodos tiene un efecto lineal en la pérdida de peso
del producto. En la planta de almacenamiento de la
compañía se obtuvieron los siguientes datos:
Pérdida de peso (gr)
Y 28 37 36 30 28 36 35

Tiempo (semanas) X26 32 35 27 25 31 30

b. Ajusta e interpreta un modelo de regresión lineal simple a


los datos.
c. Prueba la significancia de la pendiente β1.
d. Calcula e interpreta R2.
e. Elabora un intervalo de confianza del 90% para β1.
f. Pronostica la pérdida cuando el tiempo es de 33 semanas.

Pérdida 28 37 36 30 28 36 35 Suma Prom


de peso edio
(gr) Y 230
32.86

Perdida de 26 32 35 27 25 31 30 206 29.43


peso (gr) X

Y=2.7794+ 29.35 35.48 38.55 30.37 28.33 34.46 33.44 230.0


1.0221x 1

ERROR (Y- -1.35 1.51 -2.55 -0.37 -0.331 1.53 1.55 -


y) 0.008
4

SST=SUMA 40804 37249 37636 40000 40804 37636 38025 27215


(Y- 4
ymedia)^2

SSr=SUMA 40258 37835.4 36652 39849 40670 38234 38635 27213


(y- .8 .7 .02 .13 5
ymedia)^2

SSE=SUMA 1.833 2.29 6.51 0.14 0.11 2.35 2.42 15.67


(Y-y)^2

R^2=SSR/ 0.986 1.015742 0.9739 0.996 0.996 1.015 1.016 0.999


SST 6386 705 2425 71649 89249 9
8 7
3. Con los conceptos vistos y puestos en práctica, da una respuesta
justificada a cada una de las siguientes cuestiones:

a. ¿Para qué utilizarías la regresión lineal simple en un


problema de tu especialidad?

Dentro de mi trabajo que es un banco se utilizaría para predecir alzas o bajas


de la bolsa de valores o bien la venta de servicios o productos.

b. ¿Qué relación tiene con la correlación?

En que una variable depende de otra.

c. ¿Cómo medirías el ajuste del modelo de regresión lineal


obtenido?

Y= β0+ β1X+ ε

d. ¿Qué es el coeficiente de determinación?

Su principal propósito es predecir futuros resultados o probar una hipótesis. El


coeficiente determina la calidad del modelo para replicar los resultados, y la
proporción de variación de los resultados que puede explicarse por el modelo.

e. ¿Por qué crees que se llama regresión lineal?

Porque ayuda a saber si las variables están relacionadas mediante el diagrama


de dispersión y la línea te indica que tan dispersas están.
f. ¿Cuál es la relación de la prueba de hipótesis con el
intervalo de confianza en la regresión?

Los intervalos de confianza y las pruebas de hipótesis son dos herramientas


estadísticas relacionadas cuando solicitamos la relación de la hipótesis incluye
los resultados de intervalos de confianza.

Parte 2

Realiza lo siguiente:

4. En un estudio de variables que afectan la productividad en el negocio


de abarrotes al menudeo, W. S. Good usa el valor agregado por hora
de trabajo para medir la productividad de tiendas de abarrotes al
menudeo. Él define el “valor agregado” como el “excedente [dinero
generado por el negocio] disponible para pagar mano de obra,
muebles accesorios y equipo”. Los datos de acuerdo con la relación
del valor agregado por hora de trabajo Y y el tamaño X de la tienda
de abarrotes descrita en el artículo de Good para diez tiendas de
abarrotes ficticias se muestran enseguida. Se establecerá un modelo
para relacionar Y con X.
Datos en relación con el tamaño de tienda y el valor agregado
Tienda Valor agregado Tamaño de la tienda
por hora de trabajo (miles de pies cuadrados)
Y X
1 6.08 23.0
2 5.40 14.0
3 5.51 27.2
4 5.09 12.4
5 4.92 33.9
6 3.94 9.8
7 6.11 22.6
8 5.16 17.5
9 5.75 27.0
10 5.60 21.1

a. Realiza un diagrama de dispersión de los datos para Y


contra X.
b. Calcula las rectas de mínimos cuadrados para Y contra X.
c. Obtén una gráfica de residuales contra el valor ajustado de
Y, ya sea por medio de Minitab. Observa la gráfica. ¿Qué
patrón parecen seguir los datos? Éste es un ejemplo de
análisis de residuales.
5. En un experimento con conejos se tomaron en cuenta las siguientes
variables:
Y: Proporción del peso final al peso inicial.

X: Gramos diarios de alimento por kg de peso inicial.

Proporción de peso Gramos diarios   Proporción de peso final Gramos diarios de


final al de alimento por kg al alimento por kg de
peso inicial de peso inicial peso inicial peso
inicial
Y X Y
X
0.91 10   1.16 33
0.88 15   0.96 35
0.90 18   1.08 36
0.79 19   1.13 37
0.94 20   1.00 39
0.88 21   1.10 42
0.95 21   1.11 45
0.97 24   1.18 54
0.88 25   1.26 56
1.01 27   1.29 56
0.95 28   1.36 59
0.95 30   1.40 59
1.05 30   1.32 60
1.05 31   1.47 64
a. Realiza un diagrama de dispersión de los datos para Y
contra X.
b. Calcula las rectas de mínimos cuadrados para Y contra X.

Gramos Proporción
diarios de peso final
de alimento al peso inicial
por kg de
peso incial
XY x2  y2
 
Y
X

10.00 0.91 9.0 100.000.83 0.77


15.00 0.88 13.20 225.00 0.81
18.00 0.90 16.20 324.00 0.81
19.00 0.79 15.01 361.00 0.62
20.00 0.94 18.80 400.00 0.88
21.00 0.88 18.48 441.00 0.77
21.00 0.95 19.95 441.00 0.90
24.00 0.97 23.28 576.00 0.94
25.00 0.88 22.00 625.00 0.77
27.00 1.01 27.27 729.00 1.02
28.00 0.95 26.60 784.00 0.90
30.00 0.95 28.50 900.00 0.90
30.00 1.05 31.50 900.00 1.10
31.00 1.05 32.55 961.00 1.10
33.00 1.16 38.28 1089.00 1.35
35.00 0.96 33.60 1225.00 0.92
36.00 1.08 38.88 1296.00 1.17
37.00 1.13 41.81 1369.00 1.28
39.00 1.00 3900 1521.00 1.00
42.00 1.10 46.20 1764.00 1.21
45.00 1.11 49.95 2025.00 1.23
54.00 1.18 63.72 2916.00 1.39
56.00 1.26 70.56 3136.00 1.59
56.00 1.29 72.24 3136.00 1.66
59.00 1.36 80.24 3481.00 1.85
59.00 1.40 82.60 3481.00 1.96
60.00 1.32 79.20 3600.00 1.74
64.00 1.47 94.08 4094.00 2.16
Suma=994.0 29.93 1132.80 41902.00 32.85
0
Promedio= 41.42 1.25

B1=-0.145538269 Bo=7.274793323
Y=7.27-.15X

c. Prueba la hipótesis de que la pendiente es cero. Realiza


todas las etapas de la prueba de hipótesis (α = 0.01).

Establecimiento de hipótesis: H0 : β1 = 0 en oposición a Ha :


β1≠ 0
Sb=0.001299833
Tcalculada=0.145538269-0/0.001299833=111.97
La hipótesis se rechaza

d. Calcula las predicciones Ŷ para los siguientes valores de


X0: 0, 5, 15, 25, 30, 35.5, 39, 45, 60, 70, 80, 90.

Xo Yo
0 7.27
5 6.55
15 5.09
25 3.64
30 2.91
35.5 2.11
39 1.60
45 0.73
60 -1.46
70 -2.91
80 -4.37
90 -5.82

6. Calcula el intervalo de confianza de los valores particulares de Y


para los valores dados de X0 del inciso anterior.

LC:0.15±0.145542318 LIC=0.0044578 LSC=0.295545318

También podría gustarte