Está en la página 1de 14

P: 1, O: 5

Dado el siguiente conjunto de datos donde se registra el número de faltas de


un empleado en función de su edad:

a) Se proponen dos modelos para estudiar la relación Edad – Numero de faltas,


se proponen dos modelos:
modelo 1: Y= -0,3242X+16,8711¸ modelo 2: Y= -0,3127X+16,4576
b) De los dos modelos dados, ¿cual representa mejor a los datos? (aporte
valores cuantitativos que apoyen su opción).
c) ¿Aportaría usted un modelo distinto a los dados en el literal (a). ¿Qué
modelo aportaría usted para los datos en cuestión.
d) Calcule que porcentaje del cambio en Y se explica por un cambio en X
(coeficiente de determinación) interprete dicho resultado.
e) Pruebe la hipótesis nula de que el coeficiente de regresión lineal es igual a
cero, contra la hipótesis alternativa es distinto de cero, con nivel de
significancia de 5%.
f) ¿Qué número de faltas tiene un empleado cuya edad es de 30 años y seis
meses?

Respuesta 1

Respuesta a y b

De los modelos aportados los dos se ajustan a los datos aportados ya que al
sustituir los valores de las edades generan valores aproximados a los
apartados en la casilla de al sustituir los valores de las edades generan valores
aproximados a los apartados en la casilla de # Faltas, sin embargo existe una
pequeña diferencia entre los dos modelos y el que más se ajusta es el modelo
1, para corroborar observemos los resultados obtenidos en el siguiente cuadro
y gráfico

Edad: X #Fallas:Y Modelo 1 Modelo 2


40 1 3,9031 3,9496
28 6 7,7935 7,702
34 6 5,8483 5,8258
27 9 8,1177 8,0147
21 12 10,0629 9,8909
38 4 4,5515 4,575
19 13 10,7113 10,5163
55 2 -0,9599 -0,7409
31 5 6,8209 6,7639
35 3 5,5241 5,5131
Cuadro de los datos originales y con los de los modelos
Datos Originales y de los Modelos
14

12

10

8
Datos Originales
#Fallas

6
Modelo 1

4 Modelo 2

0
0 10 20 30 40 50 60
-2
Edades

Respuesta c

¿Aportaría usted un modelo distinto a los dados en el literal (a)?

La respuesta es Sí, para ello dados los datos construyamos el modelo


siguiendo el análisis de regresión y correlación

Ahora bien.

𝑋 = 40 + 28 + 34 + 27 + 21 + 38 + 19 + 55 + 31 + 35 = 328,

𝑌 = 1 + 6 + 6 + 9 + 12 + 4 + 13 + 2 + 5 + 3 = 61

𝑋 2 = 1600 + 784 + 1156 + 729 + 441 + 1444 + 361 + 3025 + 961 + 1225 = 11726

𝑌 2 = 1 + 36 + 36 + 81 + 144 + 16 + 169 + 4 + 25 + 9 = 521

𝑋𝑌 = 40 + 168 + 204 + 243 + 252 + 152 + 247 + 110 + 155 + 105 = 1676
61 328
𝑌= = 6.1, 𝑋 = = 32.8 , n=10
10 10

2
𝑋 328 2 107584
𝑆𝐶𝑥 = 𝑋2 − = 11726 − = 11726 − = 11726 − 10758.4 = 967.6
𝑛 10 10

2
𝑌 61 2 3721
𝑆𝐶𝑦 = 𝑌2 − = 521 − = 521 − = 521 − 372.1 = 148.9
𝑛 10 10

𝑋 𝑌 61 (328 ) 20008
𝑆𝐶𝑥𝑦 = 𝑋𝑌 − = 1676 −
10
= 1676 −
10
= 1676 − 2000.8 = −324.8
𝑛
𝑆𝐶𝑥𝑦 −324.8
𝑏1 = = = −0.3357
𝑆𝐶𝑥 967.6

𝑏0 = 𝑌 − 𝑏1 𝑋 = 6.1 − −0.3357 32.8 = 6.1 + 11.01 = 17.11

¿Qué modelo aportaría usted para los datos en cuestión?

El modelo que aportaría para los datos en cuestión es

𝑌 = −0.3357𝑋 + 17.11

Respuesta d

Se quiere calcular el porcentaje del cambio en Y se explica por un cambio en X


(coeficiente de determinación) e interpretar dicho resultado.

Para ello se debe usar la siguiente formula

2
𝑆𝐶𝑥𝑦 2 −324.8 2 105495.04
𝑟 = = = = 0.7322
𝑆𝐶𝑥 𝑆𝐶𝑦 967.6 148.9 144075.64

Esto indica que el 73.22% del cambio en las faltas corresponde a un cambio
en la edad que tiene la persona, lo cual mientras más joven existe la posibilidad
de tener mayor número de faltas.

Respuesta e

Se quiere Probar que la hipótesis nula de que el coeficiente de regresión lineal


es igual a cero, contra la hipótesis alternativa es distinta de cero, con nivel de
significancia de 5%.

Esto es

La prueba de significancia del coeficiente de regresión 𝑏1 = −0.3357, sea el


nivel de confianza 95%, con 10 grados de libertad el valor crítico de t es ±2.228

Las Hipótesis son

𝐻0 : 𝛽1 = 0

𝐻𝐴 : 𝛽1 ≠ 0

Reglas de decisión: No rechazar 𝐻0 si t está entre ±2.228 . De lo contrario


rechazar.

Ahora

𝑏1
𝑡=
𝑆𝑏1

En donde
𝑆𝑒
𝑆𝑏1 =
𝑆𝐶𝑥

Encontremos el valor de 𝑆𝑒

2
𝑆𝐶𝑥𝑦
𝑆𝐶𝐸 = 𝑆𝐶𝑦 −
𝑆𝐶𝑥
−324.8 2
= 148.9—
967.6
105495.04
= 148.9 −
967.6
= 148.9 − 109.03

= 39.6
𝑆𝐶𝐸 39.6
𝐶𝑀𝐸 = = = 4.95
𝑛−2 8

𝑆𝑒 = 𝐶𝑀𝐸 = 4.95 = 2.225


De esta forma
𝑆𝑒 2.225 2.225
𝑆𝑏1 = = = = 0.072
𝑆𝐶𝑥 967.6 31.106

Así

𝑏1 −0.3357
𝑡= = = −4.6625
𝑆𝑏1 0.072

De esta manera se rechaza 𝐻0 , el valor para 𝑏1 es significativamente diferente


de cero al nivel del 5%.

Respuesta f

¿Qué número de faltas tiene un empleado cuya edad es de 30 años y seis


meses?

El número de faltas que tendría un empleado con 30 años y 6 meses (30.5) es


de

𝑌 30.5 = −0.3357 30.5 + 17.11 = −10.24 + 17.11 = 6.87


P: 2, O: 5
Se tiene la siguiente salida de Excel:

a) Indique si el modelo es útil para predecir y porqué. Explique en función de


valores numéricos.
b) ¿Cuánto es el error típico?
c) ¿Qué tanto de la variabilidad de la variable dependiente es explicada por la
variabilidad de la variable independiente? (¿qué tanto explica el modelo?)

Respuesta a

Para indicar si el modelo es útil para predecir se debe observar el resultado


del Coeficiente de determinación, el cual consiste en que grado porcentual va a
cambiar la variable dependiente dados los cambios en la variable
independiente. En este caso el valor de determinación es de 0.020301233, lo
que indica que existe una modificación en los valores de las variables
independientes, lo que la variable dependiente va cambiar en un 2,03%, el
modelo será bien ajustado en la medida que este porcentaje se acerque al
100%. Lo cual se evidencia que está alejado de lo deseado, por tanto el
modelo no es útil para predecir.

Respuesta b

El error típico es igual a la raíz cuadrada del residuo del promedio de los
cuadrados esto es 12.25848083 = 3.501211338

Respuesta c

Para dar respuesta positiva a esta interrogante se debe observar el resultado


de la significancia global del problema que se ve reflejado con el valor de F que
en este caso es de 0.1657753, y compararlo con el Valor critico de F, también
conocido como el p-valor que en este caso es de 0.69457055, para que el
modelo tenga variabilidad entre las variables, el valor crítico debe ser menor a
0.05, en este caso se concluye que el modelo no tiene significancia estadística
en otras palabras el modelo no explica la relación entre las variables
P: 3, O: 6.
Como un proyecto de clase, un equipo de estudiantes diseña un modelo que
explica la renta para la vivienda estudiantil que hay cerca de la Universidad. La
renta expresada en dólares, PC son los pies cuadrados que tiene el
apartamento o casa, DIST es la distancia en millas de la casa al campus.

a) Realice un modelo. ¿Es significante al nivel del 1%?


b) Evalúe la significancia de ambos coeficientes.
c) El modelo es útil para predecir la renta? Explique el por qué.
d) ¿Existe evidencia de multicolinealidad en el problema del modelo anterior?
Apoye su respuesta en cálculos estadísticos. ¿Invalida el modelo para predecir
la renta? Explique el por qué.
e) Si dos apartamentos tienen el mismo espacio, pero uno es dos millas más
cercano al campus, como difiere esta renta de la de la vivienda más distante?.
f) Para expandir su modelo sobre las rentas de los estudiantes, los
especialistas en mercadeo del programa anterior diseñaron un índice de lujo en
el cual los estudiantes clasifican los aspectos atractivos de un apartamento con
base en comodidades disponibles. Para las doce observaciones anteriores,
este índice midió 22, 23, 35, 40, 32, 55, 36, 41, 51, 50, 48 y 29. Incorpore esta
variable a su modelo para explicar las rentas. Explique si su modelo es mejor
con esta variable adicional? En que elementos estadísticos se basa para tal
conclusión?

Solución

De acuerdo a los datos aportados estamos en presencia de un problema que


se resuelve usando regresión lineal múltiple, con el uso del Programa Excel se
obtuvo los resultados que se reflejan en el cuadro siguiente
Para obtener dichos valores se utilizó el procedimiento que el usado en el
ejercicio 2,

Respuesta a

El Modelo se construye con las siguientes variables de regresión

Variable Dependiente: Renta medido en Dólares ($)

Variables Independientes:

𝑋1 =Area de la Vivienda medida en pies cuadrados (𝑝𝑖𝑒 2 )

𝑋2 =Distancia medida en millas (𝑚𝑖𝑙𝑙𝑎𝑠 )

De acuerdo con lo obtenido en el cuadro el modelo esta descrito por

𝑌 = 88.78593317 + 0.288616029 𝑋1 − 57.15359202𝑋2

¿Es significante al nivel del 1%?

En el anova (análisis de varianza) como el valor crítico de F es

0.00023711 < 0.01

Entonces la regresión es consistente globalmente con una certeza del 99%.

Respuesta b

Para evaluar la significancia de ambos coeficientes analicemos el siguiente


cuadro

Con una certeza del 90% los coeficientes 𝑋1 , 𝑋2 son distintos de cero porque
sus p son 10%.

Otra manera de interpretar este apartado es observar el coeficiente de


determinación y el de correlación

El coeficiente de determinación es 𝑅2 = 0.8435, esto significa que la variación


de la renta es explicada en un 84.35% por los pies cuadrados de casa o
apartamento y la distancia del mismo al campus de la universidad. Mientras
tanto con el coeficiente de correlación 𝑅 = 0.9184, indicamos que la relación
entre la renta, el tamaño de la casa y la distancia al campus es fuerte, ya que el
valor del coeficiente de correlación se acerca a 1, indicando que el modelo de
regresión tiene un grado de certeza del 91 % de predecir los datos de costo de
la renta con base en su tamaño y distancia a la universidad.
Respuesta c

Para responder si el modelo es útil para predecir la renta la respuesta es Si,


debido a que las variables y sus coeficientes apoyan la propuesta, esto es
contrastar la variable renta con cada una de las variables, en primer lugar la
renta en dólares aumenta con la mayor área en pies cuadrados, que tenga la
vivienda de la universidad. Por tanto son directamente proporcionales, con lo
cual podemos afirmar que el signo del coeficiente 𝑋1 es correcto al sentido
común o a la realidad.

En relación a la otra variable se dice que la renta en dólares disminuye con la


mayor distancia en millas que tenga la vivienda de la universidad. Por tanto son
inversamente proporcionales, con lo cual podemos afirmar que el signo del
coeficiente 𝑋2 es correcto al sentido común o a la realidad.

Respuesta d

Para determinar la existencia de la multicolienalidad se plantea la matriz de


correlación la cual esta dada por de la siguiente manera

Renta Pies Cuadrados


Renta 1.000 0.885
Pies Cuadrados 0.885 1.050

Calculamos el Factor de inflación de la varianza (FIV)

1 1
𝐹𝐼𝑉 = = = 3.7
1 − 𝑅𝑖 2 1 − (0,843529177538907 )2

Como el valor de FIV está lejos de 10 no hay peligro de multicolinealidad es


decir el modelo no se invalida para predecir la renta.

Respuesta e

El modelo es

𝑌 = 88.78593317 + 0.288616029 𝑋1 − 57.15359202𝑋2

La casa más cercana está a 𝑋2 millas y la más alejada esta a 𝑋2 + 2, entonces


la más cercana es más cara en

𝑑ó𝑙𝑎𝑟𝑒𝑠
∆𝑌 $ = 57.15359202 ∗ 2𝑚𝑖𝑙𝑙𝑎𝑠 = 114.307184 $
𝑚𝑖𝑙𝑙𝑎𝑠
Respuesta f

Al incorporar un nuevo grupo de datos los resultados obtenidos lo podemos


visualizar en el siguiente cuadro

De aca podemos indicar el modelo que posee las siguientes variables las ya
conocidas y la incorporada

Variable Dependiente: Renta medido en Dólares ($)

Variables Independientes:

𝑋1 =Area de la Vivienda medida en pies cuadrados (𝑝𝑖𝑒 2 )

𝑋3 =Indice de lujo de la vivienda (lujo)

El modelo es

𝑌 = −111,516975647234 + 0,193110563520511 𝑋1 + 6,69039135845624 𝑋3

Con esta variable anexada el modelo es superior al primero que se baso en el


coeficiente de determinación y el Error de correlación y ambos elementos son
significativos en este modelo.

P: 4, O: 7.

Se muestra la producción de arroz (en millones de toneladas) de un País durante: 2010-


2018

Años 2010 2011 2012 2013 2014 2015 2016 2017 2018
Producción 2620 3450 2667 3387 2592 3582 3815 3431 3355

.a) Halle la recta de tendencia usando el método de mínimos cuadrados.

𝑦 𝑥𝑦
𝑦 = 𝑎+𝑏∗𝑋 𝑎= 𝑏=
𝑁 𝑥2
b) Usando un promedio móvil de orden tres, ¿Cuál es el pronóstico para el 2019?

años Produccion pr. M.


2010 2620
2011 3450
2012 2667
2013 3387 2912
2014 2592 3168
2015 3582 2882
2016 3815 3187
2017 3431 3330
2018 3355 3609
2019 3534

Promedio móvil año 2019 es igual a 3534

c) Calcule el promedio móvil para cuatro periodos relacionado con estos datos. Centre
los promedios.
años Produccion pr. M.
2010 2620
2011 3450
2012 2667 3031
2013 3387 3024
2014 2592 3057
2015 3582 3344
2016 3815 3355
2017 3431 3546
2018 3355 3534
2019 3534

d) Si se aplica como técnica un suavizado exponencial con α = 0,2, ¿Cuál es el


pronóstico de viajeros para el año 2019?

años Produccion pr. M. α = 0,2


2010 2620
2011 3450 3450
2012 2667 4830
2013 3387 6329
2014 2592 8273
2015 3582 10446
2016 3815 13251
2017 3431 16664
2018 3355 20683
2019 25491
El pronóstico de ventas para el año 2019 es de 25.491

P: 5, O: 8.
Dado el problema anterior (pregunta 4)
¿Cuáles son los índices relativos si se toma como base el año 2013?

Años 2010 2011 2012 2013 2014 2015 2016 2017 2018
Producción 2620 3450 2667 3387 2592 3582 3815 3431 3355

𝑋𝑟
𝐼𝑜𝑟 = × 100
𝑋𝑜

P: 6, O: 8.

Un Restaurante de pizzas compró cantidades de ingredientes a los precios que aparecen


en la siguiente tabla. Utilizando enero como año base calcule

Precio / Libra Libras Utilizadas ( cientos)


Enero Febrero Marzo Abril Enero Febrero Marzo Abril
Queso 2,1 2,15 2,2 2,25 10 12 15 12
Peperoni 1,18 1,2 1,25 1,31 8 10 8 10
Salchichas 1.25 1,31 1,31 1,42 7 6 7 7

𝑝0 𝑄0 𝑃1 𝑄1 𝑃2 𝑄2 𝑃3 𝑄3
Enero Enero Febrero Febrero Marzo Marzo Abril Abril
Queso 2,1 10 2,15 12 2,2 15 2,25 12
Peperoni 1,18 8 1,2 10 1,25 8 1,31 10
Salchichas 1,25 7 1,31 6 1,31 7 1,42 7

a) Índice de precio simple.

𝑋𝑟
𝐼𝑜𝑟 = × 100
𝑋𝑜

Precio / Libra Libras Utilizadas ( cientos) Indice de precio simple


Enero Febrero Marzo Abril Ener Febrero Marzo Abril Febrero Marzo Abril
Queso 2,1 2,15 2,2 2,25 o
10 12 15 12 2,38 4,76 7,14
Peperoni 1,18 1,2 1,25 1,31 8 10 8 10 1,69 5,93 11,02
Salchichas 1,25 1,31 1,31 1,42 7 6 7 7 4,8 4,8 13,6

indice del precio del queso


Febrero Marzo Abril
I=p1/po*100 2,15 100 102,38 2,38 2,2 100 104,76 4,76 2,25 100 107,14 7,14
2,1 2,1 2,1
Indice precio Peperoni
Febrero Marzo Abril
I=p1/po*100 1,2 100 101,69 1,69 1,3 100 105,93 5,93 1,31 100 111,02 11,02
1,18 1,2 1,18
Indice precio Salchicha
Febrero Marzo Abril
I=p1/po*100 1,31 100 104,80 4,80 1,3 100 104,80 4,80 1,42 100 113,60 13,60
1,25 1,3 1,25

b) Índice de precios agregativos sin ponderar.

Precio / Libra Libras Utilizadas ( cientos) Indice de precio simple


Enero Febrero Marzo Abril Ener Febrero Marzo Abril Febrero Marzo Abril
Queso 2,1 2,15 2,2 2,25 o
10 12 15 12 2,38 4,76 7,14
Peperoni 1,18 1,2 1,25 1,31 8 10 8 10 1,69 5,93 11,02
Salchichas 1,25 1,31 1,31 1,42 7 6 7 7 4,8 4,8 13,6
Sumatorias 4,53 4,66 4,76 4,98 25 28 30 29 8,87 15,49 31,76
Índice promedio

Febrero Marzo Abril


P= ∑Pi 8,87 2,96 P= ∑Pi 15,49 5,16 P= ∑Pi 31,76 10,59
n 3 n 3 n 3

Índice agregativo sin ponderar

Febrero Marzo Abril


Pas = ∑Pi X 100 4,66 102,87 Pas = ∑Pi X 100 4,76 105,08 Pas = ∑Pi X 100 4,98 109,93
∑Po 4,53 ∑Po 4,53 ∑Po 4,53

c) Índice de precios de Laspeyres.

𝑃1 𝑄0
𝐼𝑃𝐿 = × 100
𝑃0 𝑄0
Precio / Libra Libras Utilizadas ( cientos) Pfeb Qen Pmar QenPabr Qen PenQen indice de precios Laspeyres
Enero Febrero Marzo Abril Ener Febrero Marzo Abril FEBRERO MARZO ABRIL
Queso 2,1 2,15 2,2 2,25 o
10 12 15 12 21,5 22 22,5 21
Peperoni 1,18 1,2 1,25 1,31 8 10 8 10 9,6 10 10,48 9,44 102,75581 105,05231 109,51773
Salchichas 1,25 1,31 1,31 1,42 7 6 7 7 9,17 9,17 9,94 8,75
Sumatoria 40,27 41,17 42,92 39,19

d) Índice de precios de Paasche.

𝑃𝑡 𝑄𝑡
𝐼𝑃𝑃 = × 100
𝑃𝑜 𝑄𝑡

Precio / Libra Libras Utilizadas ( cientos)


Enero Febrero Marzo Abril Enero Febrero Marzo Abril
Queso 2,1 2,15 2,2 2,25 10 12 15 12
Peperoni 1,18 1,2 1,25 1,31 8 10 8 10
Salchichas 1,25 1,31 1,31 1,42 7 6 7 7

Pfeb Qfeb Pmar Qmar Pabr Qabr PenQfeb PenQmar PenQabr


25,8 33 22,5 25,2 31,5 25,2
12 10 10,48 11,8 9,44 11,8
7,86 9,17 9,94 7,5 8,75 8,75
Sumatoria 45,66 52,17 42,92 44,5 49,69 45,75

indice de precios Paasche


FEBRERO MARZO ABRIL

102,61 104,99 93,81

Nota: todos los cálculos fueron realizados en Excel aplicando las formulas de
estadísticas

También podría gustarte