UNIVERSIDAD DE EL SALVADOR FACULTAD DE INGENIERÍA Y ARQUITECTURA ESCUELA DE INGENIERÍA INDUSTRIAL ANÁLISIS FINANCIERO

PRONOSTICOS (Regresió n Mú ltiple)
Catedrático: Ing. Mauricio Antonio Gonzáles Berrios Grupo de Discusión: 1

Integrantes: Alvarado Guardado, Blanca Roxana Flamenco Montenegro, Ricardo Armando Orellana Rosales, Francisco José Pérez De León, Salvador Emmanuel Zavala Najarro, Mayra Elizabeth AG01017 FM06030 OR07002 PD07001 ZN07001

Ciudad Universitaria, 25 de Octubre del 2012

........................... 5 Pregunta 2: ............................... 7 CONCLUSIONES ............................................................................................................................................................................. 4 Hechos Relevantes ................ 8 ANEXOS ............................................ 9 1|P á gin a ... 4 Problema Central ................................................................................................................................................................................................................................................................................................................ 3 MARCO DE DESARROLLO.................................................................................................................................................................................. 3 Objetivo General ...................................................... 4 Factores que inciden en el problema ............................................. 5 Pregunta 1............................................................................................................Pronósticos (Regresión Múltiple) INDICE Contenido INTRODUCCION ...................................................................................................................................................................................................................................................................................................................... 2 OBJETIVOS .............................................................................................................................................................................................................................................. 4 DESARROLLO DE LA SOLUCIÓN......................................................................................................................

normalmente estas variables tienen poca o mucha relación entre ellas. donde siempre nos encontraremos una variable dependiente (es la variable que definirá nuestro objetivo principal) y una o más variables independientes.Pronósticos (Regresión Múltiple) INTRODUCCION En muchas situaciones de la vida nos podemos encontrar con problemas donde se deba de tomar una decisión ya sea invertir en un nuevo negocio. se usó MiniTab como herramienta para establecer la ecuación de regresión y generar la gráfica de regresión para poder observar de mejor manera la distribución. 2|P á gin a . para lograr una mejor visión de esta tendencia se auxiliará de la gráfica de dispersión de regresión donde nos brindara como el valor de las independientes afecta o altera el valor de la dependiente. producir un nuevo producto o formar un equipo ganador. Todas estas circunstancias normalmente involucran mas de una variable. El análisis de regresión múltiple es una técnica basada en la estadística donde por medio de variables independientes se lograra encontrar los valores de la dependiente. En este trabajo se resolvió el problema de Cindy ella debía de elegir los parámetros para establecer un equipo “ganador” usando las estadísticas que se encuentran en Sporting New 1992 Baseball yearbook. será nuestro deber lograr definir que variables son las más adecuadas para cada caso en estudio.

ya que es una herramienta útil para solucionar problemas estadísticos. 3|P á gin a .Pronósticos (Regresión Múltiple) OBJETIVOS Objetivo General Resolver problemas con análisis de regresión múltiple donde se deba de tomar decisiones que involucre más de dos variables independientes. Aprender el funcionamiento de MiniTab. Objetivo Específico    Comprender cuales son las variables mas adecuadas para el análisis de regresión múltiple por medio de una matriz de regresión Analizar la gráficas obtenidas después de definir las variables mas importantes en el análisis del problema.

escriba un reporte para Cindy Información Adicional: Libro: Pronóstico en los negocios autor: John E. Hanke  Capítulo 7  Ejercicio 16  Página 308  Tema: análisis de regresión múltiple Factores que inciden en el problema Uno de los principales factores es que Cindy no conoce como determinar un equipo ganador por lo que deberá hacer un análisis previo de todas las estadísticas que se disponen para así hacer una mejor decisión. ya que al analizar el Sporting New 1992 Baseball yearbook.16 y corre un programa de regresión por pasos 1. ¿Qué ecuación debe utilizar Cindy para predecir las victorias? 3. Cindy le pide a usted estudiar el problema y escribirle un reporte. 4|P á gin a .Pronósticos (Regresión Múltiple) MARCO DE DESARROLLO Problema Central Cindy Lawson acaba de comprar un equipo de béisbol de las grandes ligas ha recibido consejos sobre lo que debe de hacer para crear un equipo ganador. este almanaque nos brinda diferente valores estadísticos pero no todos nos ayudara para darle solución al problema planteado. Usted decide usar el análisis de regresión múltiple para determinar cuales son las estadísticas importantes para desarrollar un equipo ganador (medido por el número de juegos ganados durante la temporada de 1991) . el cual muestra los datos de las variables cuales utilizaremos en la ejecución de este método. Hechos Relevantes La siguiente tabla fue tomada de Sporting News Baseball Yearbook del año 1991.Usted reúne las siguientes estadísticas del Sporting news 1992 Baseball year-book como se muestra en la tabla P. Determinar que variables son las mas importantes para lograr solucionar el problema. discuta la importancia de cada variable 2.

en español: promedio de carreras ganadas) es el promedio de carreras limpias abandona un lanzador por cada nueve entradas lanzadas . SO: Ponches (Stroke Outs) número de veces que se han ponchado a un jugador. Se ejecuta como resultado de errores defensivos (incluidos los errores defensivos de los lanzadores) se registran como carreras sucias y no se utilizan para determinar la efectividad.Pronósticos (Regresión Múltiple) DESARROLLO DE LA SOLUCIÓN Pregunta 1 Significado de cada variable según el orden de la tabla   Victorias: Número de veces que un equipo de beisbol a ganado un juego ERA: (Earned Run Average. Se calcula dividiendo el número de carreras limpias permitidas por el número de entradas lanzadas y multiplicando por nueve. 5|P á gin a  .

abreviado BA o AVG) es la estadística en béisbol que representa la razón entre la cantidad de hits y el número de turnos al bate. sino como un número decimal que representa la fracción formada por la fórmula de la estadística. además estas variables no tienen mucha relación con las otras por lo que son las mejores. SB: base robada (stolen base) ocurre con mayor frecuencia cuando un corredor con éxito avanza a la siguiente base. ya que con eso lograremos establecer un equipo ganador. entonces la estadística sería representada en forma de porcentaje. CARRERAS: vueltas terminadas en el diamante por cada jugador. La fórmula para esta estadística es AVG = H/AB.    Como se da nota al ver las explicaciones de cada variable involucrada el hecho de ganar un juego no sólo es relevante el hecho de que los jugadores anoten la mayor cantidad de carreras. Y las variables independientes son las home run (HR). promedio de carreras ganadas (ERA). En las estadísticas de béisbol . donde H=hits y AB=turnos al bate. La estadística es representada en sí no como un promedio. sino que también están involucradas otros factores como robar bases (anotar carreras sin necesidad de batear). bases robadas se indican mediante " SB”.Pronósticos (Regresión Múltiple)  BA: El promedio o porcentaje de bateo (en inglés batting average. es cuando un jugador batea y lanza la bola lejos del estadio (normalmente a las graderías) y logra hacer una carrera limpia sin el peligro que otro jugador lo saque. porcentaje de bateo (BA) y bases robadas (SB) ya que estas son las que más inciden al momento que un equipo gana juegos. HR: home run. si la defensa no hace ningún intento para poner el corredor fuera (por ejemplo si el receptor no tiene ni siquiera mirar a su manera) el juego se puntúa de la indiferencia defensiva (también llamado indiferencia del cuadro). y no se acredita base robada al corredor. mientras que el lanzador está entregando la pelota al plato . esto se puede notar con mejor claridad al momento de ver la matriz de dispersión 6|P á gin a . estas pueden ser por un home run o por bateo de otros jugadores. cada una de las variables nos brinda información muy valiosa en donde nosotros vamos a tener que analizar cuales son las más importantes para que un equipo gane los juegos y así logre estar entre las mejores estadísticas Para nuestro análisis se tomo como variable dependiente las victorias. aunque es muy poco común verla de esta forma. el tiempo que estén con el bate. Si este número decimal se multiplica por 100.

0538 SB Donde Victorias es la variable dependiente dentro de esta ecuación.7 BA + 0.148 Carreras .Pronósticos (Regresión Múltiple) Pregunta 2: Para este problema la Ecuación de Regresión Generada por este método es la siguiente: Ecuación de Regresión: Victorias = . Cada variables está acompañada por un coeficiente los cuales cada uno representa un porcentaje de las carreras que maneja.31. si es positivo aumento.117 HR + 0.4.8 .0. si es negativo disminuyó 7|P á gin a . incluso se puede estimar el valor de esta variable por medio de dar valores a las siguientes variables independientes:     BA: Porcentaje de bateado Carrera: Vueltas terminadas en el diamante por jugador HR: Home Run SB: Base Robada.

cuando están involucradas más de dos variables independientes. pero tiene inconvenientes ya que el usuario debe de estar consciente del uso y/o utilidad de cada elemento de la herramienta 8|P á gin a .  MiniTab es una herramienta muy útil al momento de realizar los cálculos estadísticos.Pronósticos (Regresión Múltiple) CONCLUSIONES  El análisis de regresión múltiple es una técnica muy efectiva dado que nos permite encontrar valores reales.

El área de trabajo inferior la cual es similar a la hoja de calculo de Excel es en la cual ingresamos todos los datos de nuestras variables tal como se muestra en la siguiente imagen. Para el caso que se nos presenta contamos con dos tipos de variables una dependiente y otra independiente y para encontrar la solución a estas variables nos apoyamos del método de regresión múltiple. El método es utilizado cuando tenemos una serie de variables entre ellas dependientes e independientes. Esta ventana al contener dos áreas de trabajo nos facilita el observar los resultados que podemos obtener. La manera de resolver nuestro problema fue apoyándonos de una herramienta llamada MiniTab la cual nos ayuda a resolver problemas de multivariables. Como primer paso lo que se hace es abrir MiniTab previamente instalado y nos aparecerá una ventana muy semejante a las hojas de calculo de Excel con la diferencia que esta ventana tiene dos áreas de trabajo tal como se muestra en la figura a continuación.Pronósticos (Regresión Múltiple) ANEXOS PASOS PARA LA SOLUCION Cuando queremos dar solución a cualquier problema que se presente siempre aparecerán algunas variables las cuales indican las incógnitas del problema a resolver. 9|P á gin a .

10 | P á g i n a .Pronósticos (Regresión Múltiple) Hacer la matriz de correlación Después de ingresar los datos nos interesa conocer los resultados a través de la matriz de regresión para ello seleccionamos de la barra de tareas la opción de Star-basica-correlacion tal como se muestra en la siguiente imagen.

000 0.148 Carreras . SO.30 -1.31. es decir bajo y negativo. con esto se evita la colinelidad por ejemplo carreras y sb.05384 SE Coef 15.74680 R-cuad.94 -1.404 SO BA Carreras HR -0.494 0. y las variables independientes.67 0.06062 0.7% A continuación se presentan las graficas de dispersión de las variables utilizadas en nuestro análisis.190 ERA -0.765 0.8 . Esto lo se puede lograr siguiendo dos criterios: El primero que la variable dependiente debe de ser de gran correlación con la variable independiente. HR.112 0. SB La ecuación de regresión es Victorias = .114 0.393 0.14825 -0.0538 SB Predictor Constante BA Carreras HR SB Coef -4. por ejemplo victorias y carreras. BA. Carreras.168 S = 6.7 BA + 0.(ajustado) = 51.209 -0. sb Correlaciones: Victorias.444 -0.39 0.4.067 0. Bajo este criterio se establece que las variables relevantes para el análisis de regresión son: ba. en este caso las victorias. hr. Carreras.93 1.252 0.Pronósticos (Regresión Múltiple) Después obtenemos la matriz de correlación la cual es usada para determinar la correlación entre la variable dependiente.68 16.627 0.279 0.43 P 0. ERA.162 -0.209 0.11712 0.664 -0. SB ERA SO BA Carreras HR SB Victorias -0.0.215 -0.067 0.5% R-cuad. Y segundo que la variable independiente debe ser pobremente correlacionada con las otras variables independientes relevantes.490 -0. BA.93 4.305 Contenido de la celda: Correlación de Pearson Luego de la matriz encontramos el análisis de regresión que nos brinda siempre MiniTab Análisis de regresión: Victorias vs. es decir que sea grande y positivo.76 -31.062 0. Esto nos ayuda a determinar las variables independientes que realmente son relevantes para determinar la ecuación de regresión y su representación de la varianza.117 HR + 0. = 59.03004 0. carreras.161 -0. 11 | P á g i n a .482 0.03769 T -0. HR.049 0.

39 3.86 80.246 0.55 0.256 0.59 -0.253 0.89 12 | P á g i n a .81 -1.20 -0. 29.45 2.08 -0.25 2.87 1.90 2357.70 P 0.95 74.93 0.69 86.00 Ajuste 72.86 10.52 90.56 1.258 0.69 79.00 77.68 -0.56 2.10 1.33 67.262 0.86 -0.244 0.57 Residuo estándar 0.13 -4.Pronósticos (Regresión Múltiple) Grafica de dispersión y curva de aproximación de las variables.254 0.46 1.00 94.258 0.00 78.28 2.29 3.269 0.95 4.01 -0.00 87.253 0.246 0.18 -9.48 -3.71 1.87 71.56 1.00 84.79 1.49 45.59 Residuo 2.82 74.52 1007.58 2.68 83.00 84.42 6.61 1.254 0.00 71.27 76.31 -2.52 F 7.07 -1.71 94.51 -0.69 5.28 2.00 98.255 0. Análisis de varianza Fuente Regresión Error residual Total GL 4 21 25 SC 1401.20 1.00 91.00 83.43 0.255 0.99 -0.001 Fuente BA Carreras HR SB GL 1 1 1 1 SC Sec.36 89.00 83.00 65.70 0.48 73.78 3.26 75.257 0.78 271.93 78.69 13.11 2.00 85.248 Victorias 75.06 90.52 10.43 0.20 -1.26 -4.244 0.06 3.00 67.90 81.22 -0.77 92.59 5.65 4.710 0.00 84.29 -9.87 Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 BA 0.27 76.85 MC 350.00 84.80 -0.78 3.00 84.57 EE de ajuste 2.263 0.47 0.20 2.00 93.470 0.27 -2. Después de obtener las graficas que también se hacen a través de la herramienta MiniTab presentamos el cálculo de la varianza.60 0.14 X -1.84 2.73 0.244 0.00 77.59 72.69 92.07 2.94 955.07 83.71 82.73 0.241 0.05 -3.33 -10.00 71.00 57.36 -5.00 74.00 3.270 0.

0538 SB 13 | P á g i n a .31.148 Carreras .43 4.22 -0.280 82.0.00 95.00 87.Pronósticos (Regresión Múltiple) 24 25 26 0.7 BA + 0.48 -5.00 81.37 5.8 .84 0. y así obtenemos la ecuación de regresión Victorias = .4.95 2.78 2.15 1.117 HR + 0.84 0.264 0.67 X denota una observación cuyo valor X le concede gran apalancamiento.37 75.255 0.57 90. En base a todos los cálculos realizamos el análisis de regresión con dichas variables.