Está en la página 1de 4

PROBABILIDAD Y ESTADÍSTICA II - IIND-2107

DEPARTAMENTO DE INGENIERÍA INDUSTRIAL


Periodo 2019-20

TAREA 4 REGRESION
La tarea podrá solucionarse en grupos de máximo dos personas.
Fecha de entrega: 1 de noviembre del 2019 hasta las 8:00 a.m.
Lugar de entrega: Casillero del 7 piso del edificio ML.
La tarea debe entregarse a doble cara. Incumplir este requisito tendrá una penalización de -0.25 en su
nota. Sea responsable con los recursos naturales.
Respuesta sin justificación no será calificada por lo tanto debe ser explícito en su procedimiento. No olvide
explicitar claramente la hipótesis nula y alterna, el estadístico de prueba, la región de rechazo y la
conclusión.
El informe debe incluir los siguientes formatos en la primera página, de lo contrario se tendrá una
penalización de -0.25.

Integrantes Código Sección Magistral

Punto Puntaje Calificación


1 0.5
2 0.4
3 0.4
4 1.7
5 2
Total 5

PARTE A. EJERCICIOS TEÓRICOS

Punto 1 Un analista de mercado quiere evaluar el nivel de ventas (𝑦) para mercados de grandes superficies teniendo
en cuenta la utilidad bruta del supermercado (𝑥) y la cadena a la que pertenece. Entonces, se plantean los siguientes
modelos de regresión lineal

Modelo 1
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝑂 + 𝛽3 𝐶 + 𝛽4 (𝑂𝑥) + 𝛽5 (𝐶𝑥)
Modelo 2
𝑦 = 𝛼0 + 𝛼1 𝑥 + 𝛼2 𝑂 + 𝛼3 𝐽 + 𝛼4 (𝑂𝑥) + 𝛼5 (𝐽𝑥)

Donde

1 𝑠𝑖 𝑒𝑙 𝑠𝑢𝑝𝑒𝑟𝑚𝑒𝑟𝑐𝑎𝑑𝑜 𝑒𝑠 𝑂𝑙í𝑚𝑝𝑖𝑐𝑎 1 𝑠𝑖 𝑒𝑙 𝑠𝑢𝑝𝑒𝑟𝑚𝑒𝑟𝑐𝑎𝑑𝑜 𝑒𝑠 𝐶𝑎𝑟𝑢𝑙𝑙𝑎


𝑂={ } 𝐶={ } 𝐽
0 𝑑. 𝑙. 𝑐 0 𝑑. 𝑙. 𝑐
1 𝑠𝑖 𝑒𝑙 𝑠𝑢𝑝𝑒𝑟𝑚𝑒𝑟𝑐𝑎𝑑𝑜 𝑒𝑠 𝐽𝑢𝑚𝑏𝑜
={ }
0 𝑑. 𝑙. 𝑐

a) (0.2/5) Explique los problemas asociados a la estimación por mínimos cuadros del modelo 𝑦𝑖 = 𝛽0 +
𝛽1 𝑥 + 𝛽2 𝑂 + 𝛽3 𝐶 + 𝛽4 𝐽 + 𝜀𝑖
Departamento de Ingeniería Industrial
Carrera 1 Este No. 19 A 40 Bogotá, Colombia Tel. (57.1) 3324320 | (57.1) 3394949 Ext. 2880/2881 http://industrial.uniandes.edu.co

Universidad de los Andes | Vigilada Mineducación. Reconocimiento como Universidad: Decreto 1297 del 30 de mayo de 1964. Reconocimiento
personería jurídica: Resolución 28 del 23 de febrero de 1949 Minjusticia.
b) (0.3/5) Además, se cuenta con la siguiente información: 𝛽 𝑇 = [12.5 8 4.5 3 2 7]. Calcule el
vector 𝛼 𝑇 de coeficientes para el modelo 2.

Punto 2 Investigue sobre la prueba F para restricciones lineales.

a) (0.2/5) Muestre las hipótesis y el estadístico de prueba con sus grados de libertad asociados.
b) (0.2/5) Considere el modelo 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 . Muestre cómo realizaría la
siguiente prueba estadística

𝛽1 + 8 = 0
𝛽2 = 0
𝐻0 : {
1
𝛽4 + 5𝛽3 + 𝛽0 = −4
2
𝐻1 ¬𝐻0

Punto 3 Se desea realizar una prueba de significancia global en un modelo de regresión lineal:

𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀

Encuentre una expresión para el estadístico de prueba 𝐹 en términos del 𝑅2. Teniendo en cuenta este resultado,
determine a partir de cuál valor de 𝑅2 se rechaza la hipótesis nula de significancia global.

PARTE B. EJERCICIOS PRÁCTICOS

Punto 4 La alcaldía está buscando diseñar una política para aumentar el acceso a la educación escolar en la ciudad.
Entonces, quieren entender que factores influyen en el número de estudiantes inscritos en los colegios públicos de
la ciudad. En la pestaña “Colegios” del archivo “Datos Tarea 4.xlsx” se encuentra la información de las siguientes
variables de interés para 408 instituciones, donde:

• B: Porcentaje de alumnos que tienen algún beneficio otorgado por el colegio como por ejemplo becas,
alimentación gratuita, subsidio de transporte, entre otros.
• E: Número de estudiantes inscritos en el colegio.
• P: Cantidad de personal por cada 1000 estudiantes.
• M: Valor de la matrícula por estudiante. ($)
• S: Salario promedio de los profesores del colegio. ($)
• BP: Beneficios otorgados a los profesores del colegio como por ejemplo pensión, seguro médico, entre
otros. ($)
• D: Tasa de deserción de estudiantes del colegio.
• G: Tasa de estudiantes graduados del colegio.
• MA: Porcentaje de estudiantes de grado undécimo que aprueban el examen de matemáticas que exige la
Universidad para ingresar a realizar sus estudios universitarios.
• SC: Porcentaje de estudiantes de grado undécimo que aprueban el examen de ciencias que exige la
Universidad para ingresar a realizar sus estudios universitarios.

a) (0.3/5) Realice un modelo de regresión lineal con todas las variables, y concluya sobre la significancia global
del modelo y la significancia individual de cada variable.

Departamento de Ingeniería Industrial


Carrera 1 Este No. 19 A 40 Bogotá, Colombia Tel. (57.1) 3324320 | (57.1) 3394949 Ext. 2880/2881 http://industrial.uniandes.edu.co

Universidad de los Andes | Vigilada Mineducación. Reconocimiento como Universidad: Decreto 1297 del 30 de mayo de 1964. Reconocimiento
personería jurídica: Resolución 28 del 23 de febrero de 1949 Minjusticia.
b) (0.2/5) A partir de los resultados del literal anterior, determine estadísticamente si es pertinente remover
simultáneamente todas las variables no significativas.
c) (0.3/5) Determine cuál de los dos modelos del literal anterior es mejor para predecir la variable de
2
respuesta, utilizando el criterio del AIC y el 𝑅𝑎𝑑𝑗 . Comente las diferencias.
d) (0.5/5) Utilizando el modelo resultante del literal anterior, determine si el valor medio de alumnos inscritos
al colegio superará los 2550, si se le otorgan beneficios al 55% de los estudiantes, hay 402 personas por
cada 1000 estudiantes, se cobran $4900 de matrícula, se les otorgan $1090 en beneficios a los profesores
y se les paga $5600 de salario, se estima una tasa de deserción del 23%, una tasa de estudiantes graduados
del 59%, y que el 67% de los alumnos aprueben el examen de matemáticas y ciencias.
e) (0.4/5) Utilizando las variables del modelo resultante del literal b), encuentre el conjunto de 3 variables
que mejor predice la variable de respuesta.

Punto 5 Una empresa dedicada a la fabricación y venta de automóviles está interesada en sacar un nuevo producto
al mercado, y desea conocer que factores influyen en las ventas del primer año. En este orden de ideas, es necesario
estudiar el comportamiento histórico de las ventas de los diferentes elementos del catálogo de la compañía en los
últimos años. Dicho análisis permitirá saber qué características deberá tener el producto a partir de las
características del mercado. En la pestaña “Autos” del archivo “Datos Tarea 4.xlsx” se encuentra la información de
las siguientes variables de interés para 125 modelos, donde:

• V: Ventas (Millones de $USD)


• P: Precio del modelo (Miles de $USD)
• W: Peso del auto (Kilogramos)
• Pb: Presupuesto de publicidad (Millones de $USD)
• Hp: Caballos de fuerza del auto (Hp)
• T: (1) Si el auto tiene transmisión manual. (0) Si el auto tiene transmisión automática
• G: Clasificación del auto de acuerdo con la gama fabricada por la empresa Alta (A) Media (M) Baja (B)

Además de estas variables, deberán considerar variables adicionales correspondientes a las interacciones tales
como:

• Interacción entre la variable dicotómica T y la variable peso W: (TW)


• Interacciones resultantes de la variable Precio P y la variable categórica dificultad: (AP, MP, BP)
• Interacciones resultantes de la variable Presupuesto de publicidad Pb y la variable categórica G: (APb, MPb,
BPb)

Escoja una gama de autos cómo base y desarrolle los siguientes literales

a) (0.2/5) Estime el modelo de regresión correspondiente e interprete el significado de cada uno de los
coeficientes.
b) (0.2/5) Evalúe si el modelo es significativo, y determine si es apropiado tener en el modelo las variables
correspondientes al presupuesto publicitario, a los caballos de fuerza y las interacciones entre la gama y el
presupuesto publicitario.
c) (0.2/5) Utilizando el modelo resultante, muestre la ecuación del modelo de regresión para cada una de las
gamas para las que están diseñadas los autos, teniendo en cuenta si transmisión es manual o mecánica.
d) (0.4/5) El gerente de la empresa afirma que producir modelos con transmisión manual o mecánica es
indiferente, ya que su nivel de ventas es igual. Concluya sobre su afirmación.
e) (0.4/5) El gerente financiero de la compañía afirma que no existe una diferencia significativa entre las
ventas de los autos de gama media y baja. Confirme o refute esta afirmación (puede cambiar de base si lo
considera necesario). Bono de 0.1: Utilizar el nivel Alto cómo base.
f) (0.4/5) Se quiere determinar cuál de los siguientes prototipos tendría un mejor nivel de ventas

Departamento de Ingeniería Industrial


Carrera 1 Este No. 19 A 40 Bogotá, Colombia Tel. (57.1) 3324320 | (57.1) 3394949 Ext. 2880/2881 http://industrial.uniandes.edu.co

Universidad de los Andes | Vigilada Mineducación. Reconocimiento como Universidad: Decreto 1297 del 30 de mayo de 1964. Reconocimiento
personería jurídica: Resolución 28 del 23 de febrero de 1949 Minjusticia.
• Opción 1: Un modelo con transmisión mecánica con un precio de $10000 dólares, un
presupuesto de publicidad de $2’500,000 dólares, 1040 Kilogramos de peso, 226 caballos de
fuerza y gama media.
• Opción 2 Un modelo con transmisión automática con un precio de $20000 dólares, un
presupuesto de publicidad 30% superior al de la opción 1, 1305 Kilogramos de peso, 157 caballos
de fuerza y gama alta.
g) (0.2/5) Realice e interprete un intervalo de confianza y predicción para el nivel de ventas utilizando la
opción resultante de su análisis en el literal f).

Departamento de Ingeniería Industrial


Carrera 1 Este No. 19 A 40 Bogotá, Colombia Tel. (57.1) 3324320 | (57.1) 3394949 Ext. 2880/2881 http://industrial.uniandes.edu.co

Universidad de los Andes | Vigilada Mineducación. Reconocimiento como Universidad: Decreto 1297 del 30 de mayo de 1964. Reconocimiento
personería jurídica: Resolución 28 del 23 de febrero de 1949 Minjusticia.

También podría gustarte