UNIVERSIDAD DE EL SALVADOR FACULTAD DE INGENIERÍA Y ARQUITECTURA ESCUELA DE INGENIERÍA INDUSTRIAL ANÁLISIS FINANCIERO

PRONOSTICOS (Regresió n Mú ltiple)
Catedrático: Ing. Mauricio Antonio Gonzáles Berrios Grupo de Discusión: 1

Integrantes: Alvarado Guardado, Blanca Roxana Flamenco Montenegro, Ricardo Armando Orellana Rosales, Francisco José Pérez De León, Salvador Emmanuel Zavala Najarro, Mayra Elizabeth AG01017 FM06030 OR07002 PD07001 ZN07001

Ciudad Universitaria, 25 de Octubre del 2012

........................................................................................................................ 9 1|P á gin a ................................................................................................................................................................................................................................................................................................................................................................................................ 7 CONCLUSIONES ........................... 3 MARCO DE DESARROLLO............................................................................................................................................................................................................................................... 4 Hechos Relevantes ............................ 3 Objetivo General .................... 4 Factores que inciden en el problema ........................................................................................................................................................................................................................................................ 8 ANEXOS .................................................. 5 Pregunta 2: ........................................................................................................................................................... 2 OBJETIVOS ........................................................................................................................................................................................................................ 4 DESARROLLO DE LA SOLUCIÓN................... 4 Problema Central ...........Pronósticos (Regresión Múltiple) INDICE Contenido INTRODUCCION ............................................................................................................................. 5 Pregunta 1.......

para lograr una mejor visión de esta tendencia se auxiliará de la gráfica de dispersión de regresión donde nos brindara como el valor de las independientes afecta o altera el valor de la dependiente. normalmente estas variables tienen poca o mucha relación entre ellas. se usó MiniTab como herramienta para establecer la ecuación de regresión y generar la gráfica de regresión para poder observar de mejor manera la distribución. En este trabajo se resolvió el problema de Cindy ella debía de elegir los parámetros para establecer un equipo “ganador” usando las estadísticas que se encuentran en Sporting New 1992 Baseball yearbook. producir un nuevo producto o formar un equipo ganador. 2|P á gin a . donde siempre nos encontraremos una variable dependiente (es la variable que definirá nuestro objetivo principal) y una o más variables independientes. será nuestro deber lograr definir que variables son las más adecuadas para cada caso en estudio.Pronósticos (Regresión Múltiple) INTRODUCCION En muchas situaciones de la vida nos podemos encontrar con problemas donde se deba de tomar una decisión ya sea invertir en un nuevo negocio. Todas estas circunstancias normalmente involucran mas de una variable. El análisis de regresión múltiple es una técnica basada en la estadística donde por medio de variables independientes se lograra encontrar los valores de la dependiente.

Pronósticos (Regresión Múltiple) OBJETIVOS Objetivo General Resolver problemas con análisis de regresión múltiple donde se deba de tomar decisiones que involucre más de dos variables independientes. Aprender el funcionamiento de MiniTab. Objetivo Específico    Comprender cuales son las variables mas adecuadas para el análisis de regresión múltiple por medio de una matriz de regresión Analizar la gráficas obtenidas después de definir las variables mas importantes en el análisis del problema. ya que es una herramienta útil para solucionar problemas estadísticos. 3|P á gin a .

¿Qué ecuación debe utilizar Cindy para predecir las victorias? 3.Pronósticos (Regresión Múltiple) MARCO DE DESARROLLO Problema Central Cindy Lawson acaba de comprar un equipo de béisbol de las grandes ligas ha recibido consejos sobre lo que debe de hacer para crear un equipo ganador. Hechos Relevantes La siguiente tabla fue tomada de Sporting News Baseball Yearbook del año 1991. el cual muestra los datos de las variables cuales utilizaremos en la ejecución de este método.Usted reúne las siguientes estadísticas del Sporting news 1992 Baseball year-book como se muestra en la tabla P. escriba un reporte para Cindy Información Adicional: Libro: Pronóstico en los negocios autor: John E. Cindy le pide a usted estudiar el problema y escribirle un reporte. ya que al analizar el Sporting New 1992 Baseball yearbook. 4|P á gin a . discuta la importancia de cada variable 2. este almanaque nos brinda diferente valores estadísticos pero no todos nos ayudara para darle solución al problema planteado. Usted decide usar el análisis de regresión múltiple para determinar cuales son las estadísticas importantes para desarrollar un equipo ganador (medido por el número de juegos ganados durante la temporada de 1991) . Determinar que variables son las mas importantes para lograr solucionar el problema.16 y corre un programa de regresión por pasos 1. Hanke  Capítulo 7  Ejercicio 16  Página 308  Tema: análisis de regresión múltiple Factores que inciden en el problema Uno de los principales factores es que Cindy no conoce como determinar un equipo ganador por lo que deberá hacer un análisis previo de todas las estadísticas que se disponen para así hacer una mejor decisión.

5|P á gin a  . en español: promedio de carreras ganadas) es el promedio de carreras limpias abandona un lanzador por cada nueve entradas lanzadas . Se calcula dividiendo el número de carreras limpias permitidas por el número de entradas lanzadas y multiplicando por nueve.Pronósticos (Regresión Múltiple) DESARROLLO DE LA SOLUCIÓN Pregunta 1 Significado de cada variable según el orden de la tabla   Victorias: Número de veces que un equipo de beisbol a ganado un juego ERA: (Earned Run Average. SO: Ponches (Stroke Outs) número de veces que se han ponchado a un jugador. Se ejecuta como resultado de errores defensivos (incluidos los errores defensivos de los lanzadores) se registran como carreras sucias y no se utilizan para determinar la efectividad.

cada una de las variables nos brinda información muy valiosa en donde nosotros vamos a tener que analizar cuales son las más importantes para que un equipo gane los juegos y así logre estar entre las mejores estadísticas Para nuestro análisis se tomo como variable dependiente las victorias. sino como un número decimal que representa la fracción formada por la fórmula de la estadística. HR: home run. promedio de carreras ganadas (ERA). además estas variables no tienen mucha relación con las otras por lo que son las mejores.    Como se da nota al ver las explicaciones de cada variable involucrada el hecho de ganar un juego no sólo es relevante el hecho de que los jugadores anoten la mayor cantidad de carreras. La estadística es representada en sí no como un promedio. Si este número decimal se multiplica por 100. bases robadas se indican mediante " SB”.Pronósticos (Regresión Múltiple)  BA: El promedio o porcentaje de bateo (en inglés batting average. es cuando un jugador batea y lanza la bola lejos del estadio (normalmente a las graderías) y logra hacer una carrera limpia sin el peligro que otro jugador lo saque. mientras que el lanzador está entregando la pelota al plato . sino que también están involucradas otros factores como robar bases (anotar carreras sin necesidad de batear). En las estadísticas de béisbol . entonces la estadística sería representada en forma de porcentaje. La fórmula para esta estadística es AVG = H/AB. donde H=hits y AB=turnos al bate. el tiempo que estén con el bate. si la defensa no hace ningún intento para poner el corredor fuera (por ejemplo si el receptor no tiene ni siquiera mirar a su manera) el juego se puntúa de la indiferencia defensiva (también llamado indiferencia del cuadro). ya que con eso lograremos establecer un equipo ganador. CARRERAS: vueltas terminadas en el diamante por cada jugador. aunque es muy poco común verla de esta forma. abreviado BA o AVG) es la estadística en béisbol que representa la razón entre la cantidad de hits y el número de turnos al bate. Y las variables independientes son las home run (HR). porcentaje de bateo (BA) y bases robadas (SB) ya que estas son las que más inciden al momento que un equipo gana juegos. SB: base robada (stolen base) ocurre con mayor frecuencia cuando un corredor con éxito avanza a la siguiente base. y no se acredita base robada al corredor. estas pueden ser por un home run o por bateo de otros jugadores. esto se puede notar con mejor claridad al momento de ver la matriz de dispersión 6|P á gin a .

Pronósticos (Regresión Múltiple) Pregunta 2: Para este problema la Ecuación de Regresión Generada por este método es la siguiente: Ecuación de Regresión: Victorias = . incluso se puede estimar el valor de esta variable por medio de dar valores a las siguientes variables independientes:     BA: Porcentaje de bateado Carrera: Vueltas terminadas en el diamante por jugador HR: Home Run SB: Base Robada.0. Cada variables está acompañada por un coeficiente los cuales cada uno representa un porcentaje de las carreras que maneja.31. si es positivo aumento.148 Carreras .117 HR + 0.8 .4.7 BA + 0.0538 SB Donde Victorias es la variable dependiente dentro de esta ecuación. si es negativo disminuyó 7|P á gin a .

Pronósticos (Regresión Múltiple) CONCLUSIONES  El análisis de regresión múltiple es una técnica muy efectiva dado que nos permite encontrar valores reales.  MiniTab es una herramienta muy útil al momento de realizar los cálculos estadísticos. cuando están involucradas más de dos variables independientes. pero tiene inconvenientes ya que el usuario debe de estar consciente del uso y/o utilidad de cada elemento de la herramienta 8|P á gin a .

El método es utilizado cuando tenemos una serie de variables entre ellas dependientes e independientes. Como primer paso lo que se hace es abrir MiniTab previamente instalado y nos aparecerá una ventana muy semejante a las hojas de calculo de Excel con la diferencia que esta ventana tiene dos áreas de trabajo tal como se muestra en la figura a continuación. El área de trabajo inferior la cual es similar a la hoja de calculo de Excel es en la cual ingresamos todos los datos de nuestras variables tal como se muestra en la siguiente imagen.Pronósticos (Regresión Múltiple) ANEXOS PASOS PARA LA SOLUCION Cuando queremos dar solución a cualquier problema que se presente siempre aparecerán algunas variables las cuales indican las incógnitas del problema a resolver. La manera de resolver nuestro problema fue apoyándonos de una herramienta llamada MiniTab la cual nos ayuda a resolver problemas de multivariables. Esta ventana al contener dos áreas de trabajo nos facilita el observar los resultados que podemos obtener. 9|P á gin a . Para el caso que se nos presenta contamos con dos tipos de variables una dependiente y otra independiente y para encontrar la solución a estas variables nos apoyamos del método de regresión múltiple.

Pronósticos (Regresión Múltiple) Hacer la matriz de correlación Después de ingresar los datos nos interesa conocer los resultados a través de la matriz de regresión para ello seleccionamos de la barra de tareas la opción de Star-basica-correlacion tal como se muestra en la siguiente imagen. 10 | P á g i n a .

14825 -0.05384 SE Coef 15. Esto lo se puede lograr siguiendo dos criterios: El primero que la variable dependiente debe de ser de gran correlación con la variable independiente. Bajo este criterio se establece que las variables relevantes para el análisis de regresión son: ba.393 0.664 -0.8 . hr.Pronósticos (Regresión Múltiple) Después obtenemos la matriz de correlación la cual es usada para determinar la correlación entre la variable dependiente.305 Contenido de la celda: Correlación de Pearson Luego de la matriz encontramos el análisis de regresión que nos brinda siempre MiniTab Análisis de regresión: Victorias vs.93 4.03004 0.114 0. es decir que sea grande y positivo. por ejemplo victorias y carreras.94 -1. en este caso las victorias.7 BA + 0.0. Carreras. carreras.0538 SB Predictor Constante BA Carreras HR SB Coef -4.482 0.74680 R-cuad. con esto se evita la colinelidad por ejemplo carreras y sb.490 -0.43 P 0.67 0. Esto nos ayuda a determinar las variables independientes que realmente son relevantes para determinar la ecuación de regresión y su representación de la varianza.062 0. HR.279 0.000 0.4.209 -0.(ajustado) = 51.06062 0. BA.31. Carreras.252 0.76 -31.93 1. sb Correlaciones: Victorias.765 0.7% A continuación se presentan las graficas de dispersión de las variables utilizadas en nuestro análisis. 11 | P á g i n a .494 0. HR.627 0.067 0. BA.03769 T -0.117 HR + 0.11712 0.168 S = 6.067 0. SB La ecuación de regresión es Victorias = .049 0.112 0.215 -0.209 0.39 0. Y segundo que la variable independiente debe ser pobremente correlacionada con las otras variables independientes relevantes.404 SO BA Carreras HR -0.161 -0. = 59.190 ERA -0.162 -0. y las variables independientes.5% R-cuad.68 16.444 -0.30 -1. es decir bajo y negativo. ERA.148 Carreras . SO. SB ERA SO BA Carreras HR SB Victorias -0.

253 0.28 2.29 -9.05 -3.48 73.257 0.59 -0.84 2.470 0.00 83.33 -10.20 -1.00 84.14 X -1.59 Residuo 2.56 1.55 0.255 0.29 3.Pronósticos (Regresión Múltiple) Grafica de dispersión y curva de aproximación de las variables.27 76.18 -9.99 -0.56 1.28 2.71 82.95 4.81 -1.262 0.80 -0.87 71.36 -5.36 89.87 Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 BA 0.70 P 0.254 0.46 1.001 Fuente BA Carreras HR SB GL 1 1 1 1 SC Sec.11 2.06 3.48 -3.33 67.00 77.77 92.07 2.51 -0.86 10.00 98.00 84.61 1.27 76.85 MC 350.244 0.22 -0.10 1.253 0.70 0.93 0.90 2357.71 1.00 57.78 271.52 10.45 2.43 0.71 94.258 0.244 0.07 -1.248 Victorias 75.59 5.255 0.43 0.69 79.65 4.57 Residuo estándar 0.56 2.68 83.73 0.246 0.01 -0.25 2.07 83.00 87.270 0.93 78.258 0.00 85.79 1.73 0.69 92.60 0.68 -0.39 3.00 3.00 71.00 93.58 2. Análisis de varianza Fuente Regresión Error residual Total GL 4 21 25 SC 1401.00 65.59 72.86 80.49 45.89 12 | P á g i n a .254 0.269 0.00 84.00 83.78 3. 29.244 0.00 91.00 84.27 -2. Después de obtener las graficas que también se hacen a través de la herramienta MiniTab presentamos el cálculo de la varianza.20 2.57 EE de ajuste 2.94 955.90 81.52 90.00 74.08 -0.00 77.87 1.26 -4.69 5.95 74.78 3.00 84.00 71.20 1.241 0.00 78.47 0.82 74.246 0.13 -4.69 13.52 1007.69 86.26 75.00 94.263 0.20 -0.31 -2.86 -0.256 0.52 F 7.42 6.00 67.710 0.00 Ajuste 72.06 90.

7 BA + 0.8 .0.37 75.78 2.117 HR + 0.22 -0.84 0.37 5.57 90.67 X denota una observación cuyo valor X le concede gran apalancamiento.0538 SB 13 | P á g i n a .Pronósticos (Regresión Múltiple) 24 25 26 0. En base a todos los cálculos realizamos el análisis de regresión con dichas variables.31.84 0.00 87.48 -5.255 0.280 82.4.00 81.43 4.264 0.15 1.95 2.148 Carreras .00 95. y así obtenemos la ecuación de regresión Victorias = .