Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En el caso de la regresión corrida en la tabla anterior el hecho de que alguien fume tiene un
efecto significativo, ya que, en la realización de la prueba de hipótesis de su estimador, este
en la distribución estadísticamente toma un valor diferente a cero. (t-valor>valor crítico y
p-valor<α)
c) ¿Cuál es la probabilidad de que Juan sufra un infarto en la próxima década si tiene
68 años, fuma y su presión sanguínea es de 175? ¿Qué recomendará el médico a
este paciente?
La probabilidad de que Juan sufra el infarto está dada por la ecuación dada en el punto a:
Y i=−93.15+1.10∗68+0.25∗175+7.83∗1+0
Y i=−93.15+126.38
Y i=3 3.23
Este resultado establece que Juan, con sus condiciones de hábitos que lo caracterizan, tiene
una probabilidad de tener un ataque al corazón aproximado del 33.23% Dicho médico
podría recomendarle dos cosas al paciente, como primera y algo más al alcance de sus
decisiones, es la posibilidad de que deje de fumar, ya que esto reduciría su riego de sufrir
un infarto cerca de un 25% de su riesgo incial. Como segundo, le podría recomendar un
chequeo para revisar las causas de su nivel de tensión, y a su vez poder identificar si este
puede reducir, inclusive, el identificar si el fumar puede incidir en este (inclusive teniendo
en cuenta que en la regresión no existe autocorrelación entre estas dos variables)
d) Estimar dos regresiones, una para fumadores y otra para no fumadores. Comparar
resultados.
-> Fumar = 0
-> Fumar = 1
Corriendo dos modelos separados por la característica de fumador nos arrojan resultados
más claros y diferenciados en los términos del riesgo de sufrir infarto. A nivel general,
ambos modelos son estadísticamente significativos a un 99.9% sin embargo uno parece
arrojar mayor nivel de explicación debido al R2 (el modelo de los fumadores, aunque puede
estar dado debido a una relación espuria en el número de observaciones).
Sin embargo, se observa que todas las variables son significativas al 99.9% como se
observa una clara mayor magnitud en el valor de las estimaciones del modelo regresado
para los fumadores, lo que puede indicar, de acuerdo a lo hablado por expertos que el hecho
de ser fumador aumenta la probabilidad de sufrir enfermedades de este tipo en comparación
de quienes no lo hacen.
Y i=1.164 +0.069 X 1 i +ε i
Dónde:
c) Estimar el tiempo de viaje para un conductor que recorre 95 Km para realizar tres
entregas.
3. Una empresa vende sus productos en varios territorios, cada uno de los cuales está
asignado a un representante de ventas. Se realizó el análisis de regresión para
determinar si diversas variables independientes podrían explicar las ventas en cada
territorio. Se dispone de una muestra aleatoria de 50 territorios de ventas.
Variable Definición
Ventas Total de ventas acreditadas al representante de ventas
Antigüedad Antigüedad del empleado en meses
Potencial Mercado Ventas industriales totales en unidades en el territorio de
ventas
GastosPublicidad Gastos de publicidad en el territorio de ventas
Participación Promedio de participación en el mercado de los últimos cuatro años
Cuentas Cuentas asignadas a los representantes de ventas
Trabajo Carga de trabajo: índice basado en compras anuales
Raiting Evaluación general del representante de ventas (escala de 1-7)
Ventas 1.0000
Antigüedad 0.6070* 1.0000
Potencial 0.5825* 0.4299* 1.0000
GastoPubl 0.6294* 0.2737* 0.2012 1.0000
Participac~n 0.5519* 0.1628 -0.1717 0.3260* 1.0000
Cuentas 0.7415* 0.7348* 0.4627* 0.2250 0.4407* 1.0000
Trabajo -0.0273 -0.0882 -0.1844 -0.2310 0.3141* -0.1691 1.0000
Rating 0.3380* 0.0268 0.3037* 0.3531* 0.0407 0.2027 -0.2082
Rating
Rating 1.0000
Esta correlación negativa del trabajo se mantiene respecto a la mayoría de las otras
variables, solo siendo positiva respecto a la participación de la empresa en el mercado
durante los años. La matriz de correlaciones muestra una fuerte y significativa correlación
(0.7348) entre la variable Antigüedad y Cuentas, lo que puede verse incidido en la
regresión que se plantee para determinar los efectos respecto a las ventas, teniendo en
cuenta esto, es más clara una correlación mayor de las “cuentas” respecto a las ventas que
la misma antigüedad respecto a la variable de interés, esto puede ayudar a determinar la
ecuación de regresión del siguiente punto.
b) Obtenga la ecuación de regresión estimada que relacione las ventas territoriales con
algunas o todas las variables descritas, y que mejor explique el comportamiento de esas
ventas.
Luego de la realización de diferentes modelos, se llegó a dos posibles que cumplían con las
condiciones de MCO como con un nivel de significancia adecuado de modelo y de sus
variables. Luego de correr diferentes intentos la mejor ecuación de regresión múltiple está
dada por las siguientes relaciones:
Dónde:
El procedimiento para llegar a esta ecuación se dio de la siguiente forma. Para comenzar se
realizó una regresión que incluyera a todas las variables involucradas en la base, dicha
orden en el programa arrojó un cuadro de resultados donde a nivel general, el modelo es
significativo estadísticamente, sin embargo, al revisar sus variables a nivel individual, tres
de ellas cero estadísticamente al 10% (Antigüedad, Trabajo y Rating) y una que es
significativa después del 5% (Cuentas).
. reg Ventas Antigüedad- Rating