UNIVERSIDAD DE EL SALVADOR FACULTAD DE INGENIERÍA Y ARQUITECTURA ESCUELA DE INGENIERÍA INDUSTRIAL ANÁLISIS FINANCIERO

PRONOSTICOS (Regresió n Mú ltiple)
Catedrático: Ing. Mauricio Antonio Gonzáles Berrios Grupo de Discusión: 1

Integrantes: Alvarado Guardado, Blanca Roxana Flamenco Montenegro, Ricardo Armando Orellana Rosales, Francisco José Pérez De León, Salvador Emmanuel Zavala Najarro, Mayra Elizabeth AG01017 FM06030 OR07002 PD07001 ZN07001

Ciudad Universitaria, 25 de Octubre del 2012

......................................................................................................................Pronósticos (Regresión Múltiple) INDICE Contenido INTRODUCCION .................................................................. 2 OBJETIVOS ................................................................. 3 Objetivo General .................................................................................................................................................................................................................................................................................................................................................................................................................................................... 4 Factores que inciden en el problema ................................................................... 9 1|P á gin a .... 4 Hechos Relevantes .............................................................................................................. 5 Pregunta 2: ................................................................................................................................................................................................................................................................. 3 MARCO DE DESARROLLO............................................................................................................................................................................................................................................................... 7 CONCLUSIONES ......... 5 Pregunta 1..................................... 4 DESARROLLO DE LA SOLUCIÓN............................................................................................................................................................................. 4 Problema Central ................... 8 ANEXOS .................................

donde siempre nos encontraremos una variable dependiente (es la variable que definirá nuestro objetivo principal) y una o más variables independientes. se usó MiniTab como herramienta para establecer la ecuación de regresión y generar la gráfica de regresión para poder observar de mejor manera la distribución. En este trabajo se resolvió el problema de Cindy ella debía de elegir los parámetros para establecer un equipo “ganador” usando las estadísticas que se encuentran en Sporting New 1992 Baseball yearbook. será nuestro deber lograr definir que variables son las más adecuadas para cada caso en estudio. El análisis de regresión múltiple es una técnica basada en la estadística donde por medio de variables independientes se lograra encontrar los valores de la dependiente. Todas estas circunstancias normalmente involucran mas de una variable.Pronósticos (Regresión Múltiple) INTRODUCCION En muchas situaciones de la vida nos podemos encontrar con problemas donde se deba de tomar una decisión ya sea invertir en un nuevo negocio. producir un nuevo producto o formar un equipo ganador. para lograr una mejor visión de esta tendencia se auxiliará de la gráfica de dispersión de regresión donde nos brindara como el valor de las independientes afecta o altera el valor de la dependiente. 2|P á gin a . normalmente estas variables tienen poca o mucha relación entre ellas.

ya que es una herramienta útil para solucionar problemas estadísticos. Objetivo Específico    Comprender cuales son las variables mas adecuadas para el análisis de regresión múltiple por medio de una matriz de regresión Analizar la gráficas obtenidas después de definir las variables mas importantes en el análisis del problema.Pronósticos (Regresión Múltiple) OBJETIVOS Objetivo General Resolver problemas con análisis de regresión múltiple donde se deba de tomar decisiones que involucre más de dos variables independientes. Aprender el funcionamiento de MiniTab. 3|P á gin a .

discuta la importancia de cada variable 2.16 y corre un programa de regresión por pasos 1. este almanaque nos brinda diferente valores estadísticos pero no todos nos ayudara para darle solución al problema planteado. ya que al analizar el Sporting New 1992 Baseball yearbook. Cindy le pide a usted estudiar el problema y escribirle un reporte. 4|P á gin a . escriba un reporte para Cindy Información Adicional: Libro: Pronóstico en los negocios autor: John E.Usted reúne las siguientes estadísticas del Sporting news 1992 Baseball year-book como se muestra en la tabla P. Usted decide usar el análisis de regresión múltiple para determinar cuales son las estadísticas importantes para desarrollar un equipo ganador (medido por el número de juegos ganados durante la temporada de 1991) . Hanke  Capítulo 7  Ejercicio 16  Página 308  Tema: análisis de regresión múltiple Factores que inciden en el problema Uno de los principales factores es que Cindy no conoce como determinar un equipo ganador por lo que deberá hacer un análisis previo de todas las estadísticas que se disponen para así hacer una mejor decisión. el cual muestra los datos de las variables cuales utilizaremos en la ejecución de este método.Pronósticos (Regresión Múltiple) MARCO DE DESARROLLO Problema Central Cindy Lawson acaba de comprar un equipo de béisbol de las grandes ligas ha recibido consejos sobre lo que debe de hacer para crear un equipo ganador. Hechos Relevantes La siguiente tabla fue tomada de Sporting News Baseball Yearbook del año 1991. Determinar que variables son las mas importantes para lograr solucionar el problema. ¿Qué ecuación debe utilizar Cindy para predecir las victorias? 3.

SO: Ponches (Stroke Outs) número de veces que se han ponchado a un jugador. Se ejecuta como resultado de errores defensivos (incluidos los errores defensivos de los lanzadores) se registran como carreras sucias y no se utilizan para determinar la efectividad. en español: promedio de carreras ganadas) es el promedio de carreras limpias abandona un lanzador por cada nueve entradas lanzadas .Pronósticos (Regresión Múltiple) DESARROLLO DE LA SOLUCIÓN Pregunta 1 Significado de cada variable según el orden de la tabla   Victorias: Número de veces que un equipo de beisbol a ganado un juego ERA: (Earned Run Average. Se calcula dividiendo el número de carreras limpias permitidas por el número de entradas lanzadas y multiplicando por nueve. 5|P á gin a  .

ya que con eso lograremos establecer un equipo ganador. porcentaje de bateo (BA) y bases robadas (SB) ya que estas son las que más inciden al momento que un equipo gana juegos. aunque es muy poco común verla de esta forma.Pronósticos (Regresión Múltiple)  BA: El promedio o porcentaje de bateo (en inglés batting average. bases robadas se indican mediante " SB”. el tiempo que estén con el bate. HR: home run. además estas variables no tienen mucha relación con las otras por lo que son las mejores. Y las variables independientes son las home run (HR). sino que también están involucradas otros factores como robar bases (anotar carreras sin necesidad de batear). La estadística es representada en sí no como un promedio. esto se puede notar con mejor claridad al momento de ver la matriz de dispersión 6|P á gin a . SB: base robada (stolen base) ocurre con mayor frecuencia cuando un corredor con éxito avanza a la siguiente base. si la defensa no hace ningún intento para poner el corredor fuera (por ejemplo si el receptor no tiene ni siquiera mirar a su manera) el juego se puntúa de la indiferencia defensiva (también llamado indiferencia del cuadro). donde H=hits y AB=turnos al bate. abreviado BA o AVG) es la estadística en béisbol que representa la razón entre la cantidad de hits y el número de turnos al bate. promedio de carreras ganadas (ERA). La fórmula para esta estadística es AVG = H/AB. sino como un número decimal que representa la fracción formada por la fórmula de la estadística. y no se acredita base robada al corredor. mientras que el lanzador está entregando la pelota al plato .    Como se da nota al ver las explicaciones de cada variable involucrada el hecho de ganar un juego no sólo es relevante el hecho de que los jugadores anoten la mayor cantidad de carreras. Si este número decimal se multiplica por 100. CARRERAS: vueltas terminadas en el diamante por cada jugador. cada una de las variables nos brinda información muy valiosa en donde nosotros vamos a tener que analizar cuales son las más importantes para que un equipo gane los juegos y así logre estar entre las mejores estadísticas Para nuestro análisis se tomo como variable dependiente las victorias. En las estadísticas de béisbol . entonces la estadística sería representada en forma de porcentaje. estas pueden ser por un home run o por bateo de otros jugadores. es cuando un jugador batea y lanza la bola lejos del estadio (normalmente a las graderías) y logra hacer una carrera limpia sin el peligro que otro jugador lo saque.

31. si es negativo disminuyó 7|P á gin a .4.148 Carreras . Cada variables está acompañada por un coeficiente los cuales cada uno representa un porcentaje de las carreras que maneja.0538 SB Donde Victorias es la variable dependiente dentro de esta ecuación.8 .Pronósticos (Regresión Múltiple) Pregunta 2: Para este problema la Ecuación de Regresión Generada por este método es la siguiente: Ecuación de Regresión: Victorias = . si es positivo aumento. incluso se puede estimar el valor de esta variable por medio de dar valores a las siguientes variables independientes:     BA: Porcentaje de bateado Carrera: Vueltas terminadas en el diamante por jugador HR: Home Run SB: Base Robada.117 HR + 0.7 BA + 0.0.

cuando están involucradas más de dos variables independientes.Pronósticos (Regresión Múltiple) CONCLUSIONES  El análisis de regresión múltiple es una técnica muy efectiva dado que nos permite encontrar valores reales. pero tiene inconvenientes ya que el usuario debe de estar consciente del uso y/o utilidad de cada elemento de la herramienta 8|P á gin a .  MiniTab es una herramienta muy útil al momento de realizar los cálculos estadísticos.

La manera de resolver nuestro problema fue apoyándonos de una herramienta llamada MiniTab la cual nos ayuda a resolver problemas de multivariables. Esta ventana al contener dos áreas de trabajo nos facilita el observar los resultados que podemos obtener. El método es utilizado cuando tenemos una serie de variables entre ellas dependientes e independientes. Como primer paso lo que se hace es abrir MiniTab previamente instalado y nos aparecerá una ventana muy semejante a las hojas de calculo de Excel con la diferencia que esta ventana tiene dos áreas de trabajo tal como se muestra en la figura a continuación. El área de trabajo inferior la cual es similar a la hoja de calculo de Excel es en la cual ingresamos todos los datos de nuestras variables tal como se muestra en la siguiente imagen.Pronósticos (Regresión Múltiple) ANEXOS PASOS PARA LA SOLUCION Cuando queremos dar solución a cualquier problema que se presente siempre aparecerán algunas variables las cuales indican las incógnitas del problema a resolver. Para el caso que se nos presenta contamos con dos tipos de variables una dependiente y otra independiente y para encontrar la solución a estas variables nos apoyamos del método de regresión múltiple. 9|P á gin a .

10 | P á g i n a .Pronósticos (Regresión Múltiple) Hacer la matriz de correlación Después de ingresar los datos nos interesa conocer los resultados a través de la matriz de regresión para ello seleccionamos de la barra de tareas la opción de Star-basica-correlacion tal como se muestra en la siguiente imagen.

209 0. por ejemplo victorias y carreras. SO. en este caso las victorias.67 0.31.93 4.7 BA + 0. carreras.76 -31.43 P 0. Carreras. SB ERA SO BA Carreras HR SB Victorias -0.117 HR + 0.000 0.067 0.14825 -0. Bajo este criterio se establece que las variables relevantes para el análisis de regresión son: ba.0538 SB Predictor Constante BA Carreras HR SB Coef -4. es decir bajo y negativo.664 -0.8 . HR. BA.06062 0. es decir que sea grande y positivo.627 0. hr.5% R-cuad.209 -0.4.444 -0. Esto lo se puede lograr siguiendo dos criterios: El primero que la variable dependiente debe de ser de gran correlación con la variable independiente.03769 T -0.94 -1.74680 R-cuad.049 0.03004 0.490 -0. y las variables independientes.93 1. SB La ecuación de regresión es Victorias = .393 0.0.494 0.(ajustado) = 51.279 0.067 0. Carreras.7% A continuación se presentan las graficas de dispersión de las variables utilizadas en nuestro análisis. Y segundo que la variable independiente debe ser pobremente correlacionada con las otras variables independientes relevantes. = 59. sb Correlaciones: Victorias.168 S = 6.161 -0. ERA.404 SO BA Carreras HR -0.39 0.062 0. con esto se evita la colinelidad por ejemplo carreras y sb. HR.305 Contenido de la celda: Correlación de Pearson Luego de la matriz encontramos el análisis de regresión que nos brinda siempre MiniTab Análisis de regresión: Victorias vs.482 0.252 0. Esto nos ayuda a determinar las variables independientes que realmente son relevantes para determinar la ecuación de regresión y su representación de la varianza.162 -0.765 0.Pronósticos (Regresión Múltiple) Después obtenemos la matriz de correlación la cual es usada para determinar la correlación entre la variable dependiente.114 0.190 ERA -0.11712 0.05384 SE Coef 15.112 0.68 16.148 Carreras . BA.215 -0. 11 | P á g i n a .30 -1.

248 Victorias 75.86 10.86 80.00 3.85 MC 350.39 3.00 78.82 74.65 4.29 3.43 0.00 84.00 71.00 83.00 94.48 73.51 -0.253 0.87 1.00 84.710 0.59 72.00 67.77 92.56 1.00 83.253 0.36 89.00 71.06 90.43 0.87 Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 BA 0.69 13.00 Ajuste 72.78 271.20 1.254 0.27 76.01 -0.71 1.27 -2.93 78.93 0. 29.20 -1.89 12 | P á g i n a .241 0.00 98.06 3.255 0.59 5.25 2.27 76.81 -1.08 -0.05 -3.00 74.69 92.00 84.69 5.28 2.49 45.10 1.48 -3.99 -0.257 0.263 0.00 91.68 83.26 -4.00 85.31 -2.56 2.59 -0.87 71.20 -0.57 EE de ajuste 2.73 0.86 -0.95 4.46 1.00 77.52 1007.55 0.18 -9.00 84.61 1.13 -4.001 Fuente BA Carreras HR SB GL 1 1 1 1 SC Sec.52 F 7.28 2.07 -1.73 0.94 955.244 0.269 0.00 77.00 87.258 0.07 83.00 84.36 -5.470 0.246 0.69 86.71 82.60 0.80 -0. Análisis de varianza Fuente Regresión Error residual Total GL 4 21 25 SC 1401.45 2.14 X -1.244 0.244 0.00 57.68 -0.262 0. Después de obtener las graficas que también se hacen a través de la herramienta MiniTab presentamos el cálculo de la varianza.78 3.29 -9.26 75.90 81.70 0.78 3.69 79.52 90.11 2.258 0.254 0.42 6.47 0.20 2.84 2.33 67.79 1.07 2.Pronósticos (Regresión Múltiple) Grafica de dispersión y curva de aproximación de las variables.70 P 0.58 2.00 65.71 94.256 0.22 -0.270 0.33 -10.00 93.255 0.57 Residuo estándar 0.95 74.90 2357.246 0.52 10.59 Residuo 2.56 1.

95 2.4.43 4.Pronósticos (Regresión Múltiple) 24 25 26 0.22 -0. y así obtenemos la ecuación de regresión Victorias = .8 .31.7 BA + 0.48 -5.255 0.264 0.84 0.84 0.280 82.57 90.0538 SB 13 | P á g i n a .78 2.67 X denota una observación cuyo valor X le concede gran apalancamiento. En base a todos los cálculos realizamos el análisis de regresión con dichas variables.37 75.0.148 Carreras .00 81.15 1.117 HR + 0.37 5.00 87.00 95.

Sign up to vote on this title
UsefulNot useful