Está en la página 1de 82
CAPITULO 14 Regresion lineal simple CONTENIDO ESTADISTICA EN LA PRACTICA: ALLIANCE DATA SYSTEMS 14,1 MODELO DE REGRESION LINEAL SIMPLE, Modelo de regresién y ccuacisn de regresién ouacidn de regresin estimada 142. METODO DE MiNIMos CUADRADOS 14.3 COBFICIENTE DE DETERMINACION Coeficiente de corrslacién 144. SUPUESTOS DEL MODELO AMS. PRUEBA DE SIGNIFICANCIA Estimacién de 0 Prucbar Intervalo de confianza para Prucha F ‘Algunas advertencias acerca de I incerpretacin de las pruebas de significancia 146 USO DELAECUACION DE REGRESION ESTIMADA PARA ESTIMACION ‘Y PREDICCION Estimacién puntual 47 48 49 Estimaciéa por intervalo Intervalo de confianza para cl valor medio de y Intervalo de prediecién para ua solo valor de y SOLUCION POR COMPUTADORA ANALISIS DE RESIDUALES: ‘CONFIRMACION DE LOS SUPUESTOS DEL MODELO Grifica de residuales contra x Grifica de residuales contra j Residuales estandatizados Grafica de probabilidad normat ANALISIS DE RESIDUALES: OBSERVACIONES ATIPICAS ‘Y OBSERVACIONES INFLUYENTES Deteccién de observaciones alipicas Deteccidn de observaciones influyentes Estadlstica en la prctica 561 ALLIANCE DATA SYSTEMS* DALLAS, TEXAS Alliance Data Systems (ADS) ofrece procesamiento de transacciones y servicios de crédito y marketing en Ia exe ciente industria de Ia administracidn de relaciones con el cliente (CRM, por sus silas en inglés), Las clientes de ADS. estén concentrados en custo industias: ventas al detalle, Aerivados del petrOleatiendas de conveniencia, servicios ¥y transporte, En 1983, Alliance empez6 oftecienda servi cos integrales de tramitaci6n de crédito para los sectores Iinorista, de derivados del petrOleo y de restaurantes de ‘caiegorta media atualmente emplea a més de 6500 perso ‘nas que proporcionan servicios a clients en todo el mundo. Solo en Estados Unidos, abs opera més de 140000 termi rales de punta de venta y procesa més de 2500 millones de ‘ransacciones al ao. En este pas s Ta segunda empresa en servicios de erédito de marea propia, pues maneja 49 pro- _Bramas con casi 72 millones de tajetahabientes. En 2001 hizo una oferta pablia inicaly ahora cotiza en Ta bolsa de Nueva York. ‘Come parte de sus servicios de marketing, ADS diseBia ‘campatias y promociones ditectas por correo, La empresa pposee una base de datos con informacién sobre fos habitos de consumo de més de 100 millones de consumidores, lo ue le permite dirigir sus acciones a quienes tienen la ma {Yor probabilidad de beneficiarse de la publicidad por co- ‘Heo directo, El grupo de desarrollo analiftico de ADS emplea el andlisis de regresion para construir modelos que miden ¥ predicen la receptividad del consumior a las campafas ‘de marketing directo. Algunes modelos de regresiOn predi- en la probabilidad de compra de 18s personas que reciben la publicidad y otros pronostian Ta canidad que gastarén ‘cuando eealicen una compra En una determinada campata, una cadena de tiendas rinoristas deseaba atraer a nuevos clientes, Para predecir efecto de la eampafia, Ios aalists de ADS tomaron de In base de datos una muestra de consumidores, les envia ‘on material promocional y después recabaron datos sobre ‘su respuesta, Las datos se referfan al monto de la compra realizada por los sujetos que respondieron a la campai, asi coma a diversas variables especificas del consumidor ue se consideraron stiles para predecit las ventas, La vi riable que més contribuy6 a predecir el monto de compra “los averesagadscen a Philp lenance director de Deal Ane- leo de lane Date Systems por haber proparionade se nati pare Eada nl prec Los experts de Alliance Data Systems analizan el uso de un ‘modelo de represin para predeci las ventas de una campasa de marketing diecto, © Costsia de Alliance Data Systems. fue la cantidad total de adquisiciones a crédito realizadas on liendas semejantes en los Gltimos 39 meses. Los analis- las de ADS obluvieron una ecuaci6a de regzesi6a estimada cn laque te relacionaba el monto de compra con la eantidad sgaslada en endas semejantes: 26.7 + 0.00205" onde monte de la compra ‘onto gastado en tiendas similares Con esta ecuacién pudieron predecir que uns persona que hhubiera gastado $1000 en tiendas semejantes en los 6- timos 39 meses, gastaria $47.20 como respuesta a la pu- blicidad por correo directo. En este capitulo se veré cémo oblener estas ecuaciones de egresin estimada, FE modelo final que obtavieron los analistas de ADS también inclufa otras variables que incrementaban el po- er predictivo de la ecuacién anterior, entre ella la exis- tencia 6 no de una tarjeta de crédito bancara, el ingreso estimado y la cantidad promedio gastada en cada vista ala tienda seleccionada. En el capitulo siguiente se veré cémo incorporar estas variables adicionales a un modelo de re- resin nile 562 Sir Prancis Galton (1822-1911) fue e primero ‘en empear lor méiodos Crtadlticos para estudiar Felacin ete dor variables. Galton estaba interesado en estudiar la relatn entre Tas estataras de padre e ij Karl Pearson (1857-1930), Alscpule de Galton analizs ‘a relacn de extarura de padre e hyo en 1078 parejas de ndiviues Copiulo 14 Regresién lineal simple ‘Con frecuencia las devisiones gerenciales se batan en la relacién ene dos o més variables. Por ejemplo, al analiza la relaciGn entze el gasto en publicidad y las ventas, un gereate de mazketing puede wratar de predecir as ventas correspondientes a un determinado gasto en publicidad, En ‘to caso, una empresa de servicios publicos establece la relacién ente la temperatura diaria y a demanda de electicidad para predecic la necesidad de fuido elécitico considerando las tem peraturas diarias que se esperan para el mes siguiente. Algunas veces los dicectives se apoyan cn Ia intuici6a para juzgar Ia relacién entee dos variables. Sin embargo, cuando los datos es ‘in disponibles, puede emplearse un provedimiento estadistico Uamado andlisis de regresin para obtener una ecuacién que indigue cusl es la relacidn ent las variables En la terminologfa que se emplea en la regresién, la variable a predecir se llama variable dependiente, ya la variable o variables que se usan para predecir su valor se les lama varia= bles independientes. Por ejemplo, al analiza el efecto de los gastos en publicidad sobre las ventas, como lo que busca el gerente de matketing es predecie estas iltimas, las Ventas sera la variable dependiente En este capitulo se estudia el tipo més sencillo de andlisis de regresin en el que interviene ‘una variable independiente y una variable dependiente donde la relaci6n entze estas variables se aproxima mediante una linea recta, A este ipo de andlisis te le conoce como regresisi lineal simple, Al andlisis en el que intervienen dos o més variables independientes se le Ilama andlisis de regresién miltiple; ése y los casos en los que la relacién es curvilinea se estudian en los capitulos 15 y 16. Modelo de regresion lineal simple ‘Ammand’s Pizza Parlors es una cadena de restaurantes de comida italiana que abaxca un érea de cinco estados. Las ubicaviones con mayor éxito se encuentran cefca de los campus universita- tos. Los gerentes croen que las Ventas trimestrales de estos restaurantes (denotadas por y) estan directamente relacionadas con el tamatio de Ia poblaci6n estudiantil (denotada por ); es deci, cn los establecimientos que estén cezca de algtin campus con una poblaciéa estudiantil grande se generan mis ventas que en aquellos situados cerca de algtin campus con una poblacién es- tudiancil pequesia. Empleando el andlisis de regresién, se puede desartollar una ecuacin que -nuestre cules la relacién dela variable dependiente y con la variable independiente». Modelo de regresian y ecuacian de regresin En el ejemplo de Armand’s Pizza Patlors, la poblaci6n vonsta de todos fos restaurantes de esta ‘cadena, Para cada restaurante en la poblaciéa hay un valor x (poblacién estudiaatil) y un valor conespondiente y (ventas trimestzales). La ecuacign que describe eémo se relaciona y con x,y se da un término pata el estor,se Hama modelo de regresion, El siguiente es el modelo que se ‘emplea en la rogxesi6n lineal simple ‘MODELO DE REGRESION LINEAL SIMPLE Bo + Bt (14.1) Buy fy se conocen como pardmetros del modelo, y «(la letra griega épsilon) es una vatia- ble aleatoria denomsinada 1érmino del error. ste shimo da cuenta de la variabilidad de y, que no puede ser explicada por larelacin lineal entre xy y 14.1 Modelo de regresin lineal simple 563 La poblacion de los restaurantes Armand’s puede verse también como un conjunto de subpoblaciones, una para cada uno de los valores de x. Por ejemplo, una subpablacién esté ormada por todos los restaurantes Ammand’s localizados cezca de los campus universitazios con $000 estudiantes; otra subpoblacién consta de todos los restaurantes Armand’s localiza dos cezca de los campus universitaios con 9000 estudiantes, y asf sucesivamente, Para cada subpoblacién hay una distibucién de valores y. Asf, hay una distibucién de valores y que co- responde a los restaurantes localizados cerca de los campus con 8000 estudiantes y hay otra para los restaurantes ubicados cerca de los campus con 9000 estudiantes, y asf sucesivamente Cada una de estas distribuciones tiene su propia media 0 valor esperado. A la ecuacién que describe la relacién ene el valor esperado de y, que se denota £(y), yx se le lama ecuacisn de rregresidn, La siguiente es la eouacign de regresién para la regzesida lineal simple ECUACION DE REGRESION LINEAL SIMPLE BY) By + BX (14.2) La grfica de la ecuaciGn de regresién lineal simple es una recta 8 la interseccién de la recla de regresign con el ee , Bes la pendente y E()) es la media o valor esperado de y para tun valor dado de x En la figura 14.1 se presentan ejemplos de posibles recta de regresién, La de la grélica A Indica que el valor medio de y est relacionado positivamente con x, con los valores mayores de E{y) asoviados a valores mayores de x. La recta de regresién de la grifica B indica que el valor medio de y estérelacionado negativamente con x, con valores menores de E(3) que co- responden a valores mayores de x. La grifica C muestra el caso en el que el valor medio de y 1o esti relacionado con x; es decir, el valor medio de y es el mismo para todos los valores de. Ecuacién de regresion estimada Si se conocieran los valores de los parémettos poblacionales i, y fi, se podria emplear Ia ecuacién (14.2) para calcular el valor medio de y para un valor dado de x. Sin embargo, en la préctica no se conocen los valores de estos pardmetros y es necesario estimarlos usando datos muestrales. Se calculan estadisicos muestrales (que se denotan como b, y b,) como estimae nes de los parimeitos poblacionales i, y fj. Al suaitur by b, por By y Ben la ecuacign de FIGURA 14.1. Ejemplos de ineas de regresién posibles en la regresi6n lineal simple Griticas GritieaB Gritien © Relaci lineal psitiva [Relacinlineal negativa Nohay relaciin Fy) Fo) Bi) Tapani 6, Iereca Lapendiente es 0 ‘ce negaiva ;{ ‘Recta de represion 564 La estimacin de BB, 8 tm process estado muy Dorecido aa estan de esudiada en el apn 7. Tanto, come £8 s0m os pardmerror de Imeréederconocidoe, ¥ yy, som los esadiicos acsralee gute wsan para timar ls pardmeras Copiulo 14 Regresién lineal simple regresi6n, se obliene la ecuacién de regresidn estimada. La ecuaciGn de regresién estimada de ‘una regresiGn lineal simple se da a continuacign, FECUACION DE REGRESION LINEAL SIMPLE ESTIMADA Faby tbe (14.3) ‘Alla grifica de la ecusci6n de regresién lineal simple estimada se le Hama recta de regre- 4sidn estimada; by es Ia interseccién con el ee y, y by 6s la pendiente, En la seccidn siguiente se muestra el uso del método de minimos cuadrados para calcular los valores de by y 6, en la cecuacién de regresién estimada En general, §es el estimador puntual de £(3), el valor medio de las y para un valor dado dex, Por tanto, para estimer la media 0 el valor esperado de las ventas timestrales de todas los restaurantes situados cerca de os campus con 10000 estudiantes, Armand’s tend que sustituir por 10000 en la ecuacién (14.3). Sin embargo, en algunos casos a a cadena le interesaré pre decir las ventas de un determinado restaurante. Por ejemplo, suponga que desea pronostcar las ventas trimestrales del que se encuentra cerca de Talbot College, una escuela con 10000 est sliantes, Resulta que la mejor estimacién de la y que corresponde a un determinado valor de x es ‘también la proporcionada por J. Por tanto, para predecir las ventas trimestrales del restaurante ‘en cuestién, Armand’s también sustituits la x de la ecuaci6n (14,3) por 10000, ‘Como el valor de § proporciona tanto una estimacién puntual de E(3) para un valor dado dex, como una estimacién puntual de un solo valor de y para un valor dado de x, a5 se le Ilama- 1 simplemente valor estimado de y. nla figuta 14.2 se presenta en forma resumida el proceso de estimacién en la regresién lineal simple. FIGURA 14.2 Proceso de estimacidn en la regresi6a lineal simple ‘Model de regresién ‘Datos mestaes y= Atbete ewan de regresisn BO) = By + Bes Parietros desconocidos BoB: ewan de egresin Pay dy simada proporcionan eximaciones Ps defy Bi + bye Py by 142. Método de minimos cuadrados 565 BrIZthacncn ead 1. EI anilisi de regresi6n no puede entenderse co- so un procedimiento para establecer una relacién de causa y efecto ene las variables. Slo indiea cdma 0 en qué medida las variables sin relax cionadas tuna con otra. Cualesquiera conelusiones averca de una relacién causa y efecto deben ba- tase en los conocimientos de Tos especalstas en 2, La ecuacién de regresién en Is regresin ine simple es £() ~ By + Bx Ba libros mis avanza dos sobre anisis de regresion suet esribirse la ecusci6n como Eiyta) = By + Bs enfatizando asf aque lo que proporciona esta expresign cs valor snedio de las y para ua valor dado de x ta apicacién de que se tate la regresin lineal simple ‘da obseracion cone tdedoe valores: uno para Ia variable independiente Yyotr parla variable dependiente TABLA 14.1 Método de minimos cuadrados EI método de minimos cuadrados es un procedimiento en el que se usan los datos muestra- les para encontrar la ecuacién de regresi6n estimada. Para ilustrar este método, suponga que se recolectan datos de una muestra de 10 restaurantes Armand’s Pizza Parlors ubicados todos cerca de campus universitatios. Para la iésima observaci6n o restaurance en la muestra, x, ¢8 el tamatio de Ia poblacién de estudiantes (en miles) en el campus, y y, son las Ventas trimestrales (en miles de d6tares). En la tabla 14.1 se presentan los valores de, y y, en esta muestra de 10 restaurantes, Como se puede ver, el estaurante 1, con x; 2y y, = 58, est cerca de un campus con 2000 estudiantes y sus ventas trmestrales son de $5800. El restaurante 2, con x, = 6 y ‘y; = 105, esta cerca de un campus con 6000 estudiantes y sus ventas trimestrales son de '$105000. EI valor mayor corresponde a las ventas del restaurante 10, que estécetea de un cam- us con 26000 estudiantes y sus ventas trimestrales son de $202000. La figura 14.3 es el diagranma de dispersi6n de los datos de la tabla 14.1. La pablaci6n de estudiantes (Student Population) se indica en el eje horizontal (en miles) y las ventas trimes- tales (Quarterly Sales) en el eje vertical (en miles de $). Los diagramas de dispersin para el anilisis de regresi6n se trazan colocando la variable indepediente x en el eje horizontal y la variable dependiente y en el eje vertical, Este diagrama permite observar grificamente los datos y oblener conclusiones acerca de la relacin entre las variables. {uQué conclusiGn preliminar se puede formular de la figuta 14.37 Las ventas teimestrales parecen ser mayores cerca de los campus en los que la poblacién de estudiantes es més grande ‘Ademés, en estos datos se observa que la relacién ene el tamaso de la poblacién y las ventas parece que puede aproximarse mediante una linea recta; en efecto, se observa que hay’ una fe Poblacidn de estudiantes y ventas trimestrales en 10 restaurantes Armand’s Pizza Parlors Student Population (1000s) Quarterly Sales ($1.0005) % se tos 8 ns 07 aT 1st 19 ro 2 566 Copiulo 14 Regresién lineal simple FIGURA 14.3 Diagrama de dispersién de la poblaci6n de estudiantes y ventas trimestrales ‘en Armand’ Pizza Parlors des) 02 4 6 # 102 18 16 Is 2 2 28 2 PoblaciGn de estudiantes (miles) lacién lineal positiva entre x y y. Asf, para representar Ia relacin entre las ventas timestrales y la poblacién de estudiantes, se elige el modelo de regresién lineal simple, Decidido esto, la trea siguiente es usar los datos muestrales dela tabla 14.1 para determinar los valores de b, y +, en la ecuacién de regresin lineal simple estimada. Para el restaurant iésimo, la ecuacién de regresién simple estimada es 5= by + by (144) donde valor estimado de las ventas rimestrales (en miles de délares) del iésimo restaurante intersecciGn de la recta de regresién estimada con el eje y pendiente de la recta de regresin estimada 4, = famao de la poblacin de estudiantes (en miles) del iésimo restaurante ‘Como y,denota ventas observadas (cales) para cl estaurate i, y J representa el valor estimado de las ventas Ia ecuacién (14.4, para cada uno de los restaurantes de fa muestra habré un valor de ventas observadasy, y'un valor de ventas estmadas 9, Para que la recta de regrsién cstimada proporcione un buen ajuste alos datos, las diferencias entre los valores ebservados y estimadas deben ser pequesas En el método de minimos cuadrades susan los datos musstrales para obtener los valores de by yb, que minimicen la suma de los cuadrados de la desviaciones (diferencias) ene los valores cbservados dela variable dependent y y los valores estimades de Ia variable depen- dione El esiterio que se emplea en el método de minimos cuadrados se basa en la expresion 43). Cant Friedrich Gaur lito de mines Al determinarb, com aya ‘dese calaledora en Ios cielo intermedi eben levare tates cifras sgnicaivas como sea Pontle Serecomiendan (porto menos cuatro dgtor ‘iemictvos 142. Método de minimos cuadrados 567 CCRITERIO DE MINIMOS CUADRADOS min 3(y, ~ 5) (14.5) donde: ralor observado de la variable dependiente en la observaciGn iésima 5, = valor estimado de la variable dependiente en la observacién iéima Se pueden usar céleulos diferenciales para demostrar(vea el apéndice 14.1) que los valores de by b, que minimiza la expresién (14.5) se pueden encontrar usando las ecuaciones (4.6) y (14). PENDIENTE E INTERSECCION CON HL BIE y DE LA ECUACION DE REGRESION ESTIMADA’ ZQi=DO.= 9) b= SG. - 9 (14.6) 14.7) donde: valor dela vatiable independiente en la observaciéa isima valor de la variable dependent en la observaci6n isima media dela variable independiente = media dela variable dependiente ‘n= mimero total de observaciones En la tabla 14.2 se presentan algunos edleulos necesarios para desarrollar Ia ecuacién de regresién estimada por minimos cuadrados en el ejemplo de Armand’s Piza Parlors. Como la muestra es de 10 restaurantes, tenemos n = 10 observaciones, Dado que en las ecuaciones (14.6) y (14.7) se necesitan Ty ¥, se empieza por caleularas. Sy _ 1300 Utilizando las ecuaciones (14.6) y (14.7) y la informacién de la tabla 14.2, se calcula la pen- iente y la intersecein de Ia eouacisn de regresién estimada para Atmand’s Pizza Parlors. La pendiente(b,) se calcula como se muestra enseguida, ‘Ore lo para caer Ee forme de ec 146) sul ecomorderseewende eerplea une caeledors pare deena 568 Copiulo 14 Regresién lineal simple TABLA 14.2. Calculos de Ia ecuacién de regresién estimada por minimos cuadrados para Amnand's Pizza Parlors Restaurante x,y, & DO, 1 2 st] -k tot a 2 6 | 10s 3 200 ot 5 5 = 252 36 4 s | ou = n 36 5 a] 4 6 4 6 iw | 137 2 7 “4 4 1 20 | ist 6 7 182 36 5 20 | 169 6 38 2M 36 ° nz | us 5 a 152 4 10 26 | 20 n n 864 as ‘Touales 20 | 1300 20 568 By | Ba By-H | Bay HF Debe tenere mucho dad a arf ecnacion de represin estimada para hacer predcciones fuera del range de valores de a ‘arable independiente, yo ue fuera de ee range no Durdeacegurarce que ertz "elacin ea vida. », - 2&2 BO. oy __ 2840 ~ Ses =s5 La inerseccién con el eje y (b,) se calcula como sigue. by =F be = 130 ~ sas) © Por tanto, a ecuacin de regresin estimada es 5 = 60+ Se En la figura 14.4 se ilustra esta ecuacién graficada sobre el diagrama de dispersién, ‘La pendiente de la ecuacién de regresidn estimada (b, = 5) es positiva, lo que implica que ‘a medida que aumenta el tama de la poblacién de estudiantes, las ventas se incrementan, Se concluye (con base en las ventas dadas en miles de $ y el tamato de Ia poblacién en miles) que un aumento de 1000 en el tamafo de la poblacién de estudiantes corresponde a un incre ‘mento de $5000 en las ventas esperadas; es decir, se prevé que las ventas trimestrales se in- ‘rementen $5 por cada estudiante Si se considera que la ecuacién de regresién estimada obtenida por el métoda de minimos ccuadrados describe adecuadamente [a relacién enite x y y, parecerd razonable usar esta ecua- cidn a efecto de pronasticar el valor de y para un valor dado de x. Por ejemplo, si se quisieran predecir las ventas trimestrales de un restaurant ubicado cerca de un campo de 16000 estudian- tes, se caloularia, como sigue 5 = 60 + 5116) = 140 De manera que las ventas trimestrales pronosticadas para este restaurante setfan de $140000, En las secciones siguientes se verén los métodos para evaluar el uso correcto de la ecuacién de regresi6n para hacer estimaciones y predicciones. 142. Método de minimos cuadrados 569 FIGURA 14.4 Grifica de la ecuacién de regresi6n estimada para Armand’s Pizza Parlors: 0+ Sx ‘Ventas trimestrales (miles de $) Iersecisa conelejey 02465 8 10 2 Penden by = 5 is 6 18 20 22 26 a6 Poblacin de estudiantes (miles) NOTAS Y COMENTARIOS El método de minimos cuadrados proporciona una ecuacién de regeesiGn estimada que minimizala sum de los cuadrados de las desviaciones entce los valores cobservados dela variable dependiente y,y los valo- res esimados de la variable dependiente, El citerio de minimos cuadrados permite elegir la eeuacién de ejor aust. Si se empleara oto eriterio, como mini- iat la suma de las desviaciones absolias ete y,¥ 5j, se obtendria una ecuacién diferente. Ea la prctica cl mélodo de minimos euadrados es el mis uilizado, Métodos 1. Dada as siguientes cinco cbtervacones det wate autofspteetad mw » 42) Trace el diagrama de dispersin correspondiente a estos datos. 1) {Qué indica el diagrama de dispersion del inciso a) especto de la rlacién entre las dos variables? 570 Copiulo 14 Regresién lineal simple ©) Trate de aproximar la reaci6n entte xy y trazando una tines recta que pase a través de los puntos de los datos. 44) Uulice las ecuaciones (14.6) y (14.7) para calel resin estimad 12) Use la ecuacisn de regresién estimada para predeci el valor de y cuando x = oy by y desarole a ecuacign dere 2 Daas as siguientes cinco observaciones de las variables xy y. 3 2 6 y [ss 40 55 to 1S 42) Trace el diagrama de dispersién correspondiente a estos datos. ) {Qué indica el diagrama de dispersin dl iniso a) respecto dela relacin ene las dos variables? ©) Trate de aproximar la rel Jos puntas de los datas. ) Desarrlle la ecwacién de regresinestimada correspondiente a estos datos. ©) Use la ecuacin de regresin estimada para predecit el valor de yevando x= 6. Aplicaciones 44 Los ats siguientes son elas (en plzada) y pots (es tras) de madadors Estatura | 68 64 626565 Peso 12 108 102 115 128 42) Trace el diagrama de dispersin de estos datos usando la esttura como variable indepes- diene. ») ;Que indica el diagrama de dispersia dl inciso a) respecto de la relacin ene las dos variables? €)Trate de aproximar la relacin entre estatura y peso trazando wna Inca teeta a través de los puntos de los datos, 4) Desarrolle la ecuacién de regresinestimada calculando lo valores de hy yb, €) Silaestatura de una nadadora es de 63 pulgadas, cual serésu peso estimado? 5. Las ejercitadoraselipicas se estén convirtendo en una de las méquinas de ejercicio més po- pulares. Su movimiento de bajo impacto es suave y estable, o que las vuelve la eleccign pe: ferida por las personas con problemas en rodillasytobllos. Sin embargo, elegir la eercitadora axdecuada puede resultar un proceso dificil. El precio y la eaidad son Factores importantes en ‘cualquier decisign de compra, ¢Estin asociados los precios altos con las ejecitadorat de alta calidad? Consumer Reports reali ampias prushas para desarollar una clasificacién general basada en fecilidad de uso, ergonomfa, construccin y rango de ejerccio. A continua 142. Método de imos cuadrados sn cin se muestran Tos datos de precio (Price) y calificaci6n (Rating) de ocho ejercitadoraselipt- cas probadas, de las cuales se detallan marca y modelo (Brand and Model) (Consumer Reports, a mo Eroiary (Octane Fitness 0376 2400 2 caries ‘NordicTrack AudioStrider 990. 1000 B ste ee 42) Trace un diagrama de dispersi6n tomando las millas como la Variable independiente. 1) as indica el diagrama de dispersién del inciso a) acerca de la relacién entze las dos vatiables? ©) Use el método de minimos cuadrados para desarollar la ecuaci6n de regresiGn eatimada, 4) Proporcione una interpretacién para la pendiente de la ecuacién de regresién estimada. 2) Prediga el precio de venta de un Honda Accord 2000 can 100000 mills. 572 Enron) ‘SteepingBags Copiulo 14 Regresién lineal simple 7 Un getente de ventas obtuvo Tos siguientes datos sobee ventas anusles (Annual Sales) y aos de ‘experiencia (Years of Experience) de 10 vendedores (Salesperson). Years of Annual Sales Salesperson Experience ($1005) 1 1 0 2 3 2 3 4 2 4 4 102 5 6 103, 6 s m 7 10 us 8 10 ws 5 u 47 Fr) B 16 42) Trace un diagrama de dispersin con estos dates tomando como variable independiente los atios de experiencia, ) Obienga una ecuacién de regres estimada que pueda utlizarse para predevir as ventas anuales proporcionando los afos de experiencia, €)Utllice la ecuacin de regresin estimada para predecir las ventas anvaes de un vendedor ‘con 9 alos de experiencia, Bergans of Norway fabrica equipo para depertes ala intemperie desde 1908. Los siguientes ‘datos muesiran el rango de temperatura (Temperature Rating) en “F y el precio Price) en dé: laces de 11 modelos (Model) de sleeping bags fabricadas por Rergans (Backpacker 2006 Gear Guide). Temperature Model Rating (F) Price ($) Ranger 3-Seasons 2 319 Ranger Spring M4 289 anger Winter 3 389 Rondane +Seasons B no ondane Sommer Bs us Rondane Winter 4 219 Senjaee 5 339 Sexje S10 5 259 Senja Zero 25 ns Super Light 8 9 Tight & Ligh 25 199 42) Trace un diagrama de dispersién con estos dats, en el que la variable independiente sea el rango de temperatura CF) 1) {Qué indica el diagrama de dispersion del inciso a) respecto de la relacién entre el rango de temperatura CF) y precio? 6) Use el método de minimos cuadrados para desarollar la ecuaci6a de regresién es 44). Prediga cul sera el precio de un sleeping bag sel rango de lemperatura('F) es 20. a, Con frecuencia, los viajeros de las aerelineas empacan tanto como pueden en su maleta para ‘vita ae taifas por sobreequipaje. Encontrar una maletarodante durable, con gran capacidad, y ffeil de mover puede ser diffi. La tabla siguiente muestra los resultados de pruebas realiza ‘das par Consumer Reports en 10 maletasrodantes; las puntuaciones (Score) mis alts indian mejores resultados en las prucbas en general (sitio weh Consumer Report, octubre de 2008). La abla ineluye marca (Brand) y precio (Price) de las maletas hay ExecSalary 4 10. 2 Método de 573 Brand Price ($) Score Bigs & Riley ms n Harton 350 * Heys o 56 Kenneth Cole Reston bo. 5 Liz Claiborne is 66 Samsonite 180 3 Tian 560 6 TravelPio 156 a Toni 585 "7 Vienne 400 n 42) Trace un diagrama de dispersin uilizando el precio como la variable independiente. 1b) {Qué indica el diagrama de dispersién del inciso a) acerca de la relacién entte las dos variables? ©) Use el método de minimos cuadrados pata desarollar la ecuacién de regresién estimada )_Proporcione una intexpretaci para la pendiente de la ecuaci6n de regresién estimada 1) Lamuletade la marca Bagle Creek Hovercrat tiene ua precio de $225. Usando la ecuacién de regresin estimada desarollada en cl inciso¢), prediga la puntuacin para esta malta Con base en la revision anual de sueldos de Advertising Age, Matk Hurd, de 49 afos, pre- sidente (Chaieman) y presidente ejecutiva (CHO) de Hewlett-Packard Co,, recibi6 un suelda anual de $817000, un bono de més de $5 millones y otras compensaciones que superaron los ‘$17 millones. Su compensacién total fue ligeramente mejor que el page total promedio de un (CHO, $12.4 millones La tabla siguiente muestra la edad (Age) y el sueldo anual (Salary) en mix les de délaes de. Mack Hurd y otzos 14 ejecutivos (Executive) con su respective cargo (Tile), auienesdirigen empresas que cotizan en Iz holsa (Advertsing Age, 5 de diciembre de 2008) Salary Executive Tite Company Age ($1000) Cchatles rice cumaice0 caigroup 56 1000 Hold McGraw ll ChnuvPrescn0 Meta Hl Cos. 7m Janes Dimon Preslex0 BPMorgan Chase Co, 50.1000 K Repent Murdoch Chmn/cuo News Corp. 1s 4500 Kenneth. Lewis ChinnPrefce0 Bank of America se 1500 Kenneth Chenaslt — Chmiczo ‘American Express Co, si 100 Louis C Camille ChmalcEo ‘Altra Group SL 1663 Mark Var ChmniPresiczo Hewlet-Paskard Co, ° Maria S. Sorell, co ‘wre Group sl 1562 RobertL, Naelli _ChmuvPrescn0 Home Depot st 26s Same Palmisano ChmaPresce0 1M Corp ss 630 David ©, Novak ChmaiPreniczo Yum Brande ss ums lary R Silverman Chinn/cen (Cendant Cop 6 3300 Robert. Weigh camniceo Universal 2500 Sumner Redstone ‘Eee ChmFounder_—Viaom 5807 12) Trace un diagrama de dspersién con estos datos wslizando la edad del ejecutive come la variable independiente b) QQas indica el diagrama de dispersién del inciso a) acerca de la rela entre las dos variables? ©) Use el método de minimos cuadrados para obtener a ecuacién de rogresién estimada, 4) Suponga que ill Gustin, de 72 afos, es el presidente y CHO de una de las principales em presas de electenica. Prediga su sueldo anval 574 Sponycars Copiulo 14 Regresién lineal simple n Los automoviles deportivos estén disetiados para proporciona mejor conducci6n, mayor ace leracidn y experiencia de manejo mis agradable que un sedi Upico, Sin embargo, incluso dentro de este exchusivo grupo de vehiculos, nto el desempefo com el precio pueden varat, Consumer Reports proparciona informseién de puntuaciones en pruebas de manejo (Road-Test Score) y precios (Price) de los siguientes 12 automéviles (Car) deportives (sitio web de Con: sumer Reports, octubre de 2008), Los precios estin en miles de délaes y las puntuaciones en pruebas de manejo se basan en una escala de 0 a 100, donde los valores més altos indican un mejor desempe. car Price ($1000s) —-Road-Test Score Chevtlet Cobalt ss 24s ® Dodge Caliber srt 29 56 Ford Mustang or (V8) 20 % Honda Cive Si au ” Mazda Rx8 313 36 Mini Cooper $ 2s 4 ‘Misubiht Lances voli osm sa 8 [Nissan Senta sB-& Spec V 233 66 ‘Sobor impreza Wao 252 a Subaru lpeza WAX St 376 9 Volkswagen om! 240 8 ‘Volkswagen R32 355 8 14) Trace un diagrama de dispersién tomando el precio camo la variale independiente. ) (Que indiea el diagrama de dispersin del inciso a) acerca de la relacién entre las dos variables? ©) Use el método de minimos cuadrados para desarrolla la ecuacién de regresion estimada, 44) Proporcione uns interpretacién para la pendiente de la ecuacida de regres extimada, 6) Otro automévil deportvo prabado por Consumer Reports es el BMW 138i el precio de este veh{culo fue de $36700. Prediga la pantuaci6n en la prueba de manejo para el 8MW 135i vuilizando la ecuacién de regresién estimada obtenida en el inciso c). ‘Una moto acuitica es una embateacién con propulsién a choro de agua, dseflada para set ‘conducida por una persona sentada, de pie o arroilada sobre el casco, in la década de 1970, Kaywasaki Motors Corp. U.S.A. intodujo la moto acustica TET SKIP, la primera que tuvo éxito ‘comercial. Bn la actualidad, jetski se usa en forma general como término genérico para motos scusticas personales En la tala siguiente se dan pesos (Weight) redondeadas aa decena de li ‘bras mis cerean. y previos (Price) redondeados los $50 mis cercanos, de 10 motes acuticas personales de tres plazas, con su respective fabricante y modelo (Make and Mode) (sitio web de Jetski News, 2006) ‘Make and Model Weight (b) Price ($) Honda AqueTeax P12 750 9500 Hora AquaTeax F12X 750 10500 Honda AqueTrax F-12X ceseape 300 11200 Kawasaki STX2F Jetki 140 8300 “Yama #X Cruises Waverenner 0 10000 Yamaha Px High Output Waverunner m0 10000 ‘Yamaha x Waverunner 20 9300 “Yamaha VXI1O Deluxe Waverunner no 7100 ‘Yamaha Yx110 Sport Waveranner no ‘7000 ‘Yamaha X171200 Waverunner 780 8300 4a) Trace ef diagrama de dspersin correspondiente a estos datos empleando el peso come variable independiente 1b) UQué indica el diagrams de dispersén del inciso a) respecto de a relacién entre peso y precio? 10) Use el método de minimos cuadrados para desarollar la ecvacién de regresin estimada 44) Prediga el precio de una moto acutica de tres plazas euyo peso sea de 750 libras 142. Método de B. imos cuadrados 575 ©) LaHonda Aqua Trax F-12 pesa 750 libra y su precio es de $9500, (EI precio pronasticado en el ineiso d) para una moto acustica can peso de 750 libras no deberta ser también de 95007 {f) LaKawasski sx-8 $00 Jeti iene capaidad s6lo parauna persona y pesa 350 bras. Cree ‘sted que la ecuacién de regresim estimada obtenida en el inciso c) deba emplearte para pronosticar su precio? aa el Invemal Revenue Service (Servicio de Administacign Tributatia de Bstados Unidos), cl cardcter razonable de las dedueviones declaradas por un contribuyeate depende de su ingre- so brute ajustado. Deducciones grandes que comprenden donaciones de caridad o por tencién sméica son mie apropiads para conribuyentes que lengan un ingreeo bruto astado gran- de, Silas deducciones de una persona son mayores que las deducciones declaradae promedio correspondientes a un determinado nivel de ingresos, aumentan las posibilidades de que se le realice una auditorta, Los datos (en miles de délares) sobre ingreso brutoajustado y el monto promedio o razonable de deducciones declaradas s isan a continuacién, Ingreso bruto ajustado ‘Monto razonable de las deducciones (miles de $) declaradas (miles de) 2 96 an 96 2 101 8 i 6s Bs &s 17 bo 255 42) ‘Trace un diagrama de dispersién con estos datos empleando como variable independiente cl ingreso brto ajustada 1b) Use el métado de minimos cuadrados para desarollar la ecuacién de regresién estimada ©) Calcule el mento razonable de deducciones declaradas de un contsibuyeate cuyo ingreso brute ajustado es de $52500, Si éste iene deducciones declaradas por $20400, jestaré jvsifcada una audicoria? Expligue, PCWorld valoeé cuatro componentes de 10 computadoras laptop ultraportiles:caracterit- cas, desempetio, diseio y precio. Cade elemento fue valarado utiizando una escala de pun- fos de 0 100, Luego se desarrol6 un indice general, llamado PCW World Rating, para cada laptop, La siguiente tabla muestea el fndice de earacteristicas (Features Rating) y el fndice cw Werld pata 10 modelos (Model) de computadoras (sitio web de PC World. § de Febrero de 2008), Features Pew World Model Rating Rating ‘Thinkpad X200 s nm ox.75980 5 2 sv 0 a Hlebook 25308 7 * x60 © ” “Thinkpad x300 16 * Iespad UH10 ct n ‘Micro Express 72500 B ® ‘Toughbook W7 on B LHP Voodoo Envy133 “ n 42) Trace el diagrama de dispersiGn corespondiente a estos datos empleando el indice de caraoteristicas como variable independicate. ) {Qué indies el diagrama de dispersin del iniso a) respecto de la relacién entse ambas variables? 16) Use el métado de minimos cuadrados para desarrollar la ecuacién de regresién estimada )Estime el Indice Pew World para una nueva computadaralaptep que tiene un ince de caractesiticas de 7. 576 Copiulo 14 Regresién lineal simple Coeficiente de determinacion in el ejemplo de Armand’s Pizza Parlors, para aproximar Ia relacién lineal ene el tamaio de la poblacidin de estudiantes x y las ventas teimestales y se desarrllé le eeuacién de regre- ‘sin estimada j = 60 + 5x. Ahora la pregunta cs: qué an bien se aust os dats la ccuacisn dd egresignestimada? En esta seccién se muestra que lcoefviente de determinacién propor ciona una medida de Ia bondad ée ajuste para la ecuacién de regresién estimada. ‘Ala diferencia que exist en la cbssrvacin iésima entre el valor observado de la variable dependents y,¥ valor estimada de la variable dependiente 5, sel lama residual iésimo, ste representa el eror que exist al usa j para estima y, Por tanto, para la observacidniéi- ‘ma el residual es y,~ 5, La suma de los cuadrados de estos residuals oerrores es Ia catidad «que se minisza empleando el mStodo de ls minimos cuadeados. Esta cantiad, también cono- ida como suma de cuadrados debido al ero, se denota como SCx ‘SUMA DE CUADRADOS DEBIDO AL ERROR sce = 2G, ie (14.8) El valor de la SCE es una medida del error al uilizar la ecuacién de regresin estimada para ccaleulas los valores de la variable dependiente de la muesa En Ia tabla 14.3 se indican los procedimientos que se requieren para caleular la suma de ‘cuadrados debido al error en el caso de Armand’ Pizza Parlors, Por ejemplo, los valores de las variables independiente y dependiente del restaurante I son x, = 2y y, = 58. El valor estima- do para sus ventas trimestrales obtenido con Ia ecuacién de regresign estimada es §, = 60 + (2) = 70. Por consiguiente, para el restaurante | el error al usar j, para estimar y; ey; — 5, = 58 ~ 70 = —12. Bl error al cuadrado, (—12)* = 14, aparece en la dltima columna de In tabla 14.3. Después de calcular y elevar al cuadrado los residuales de cada uno de los res- ‘wurantes de la muestra, se suman y obtenemos que SCE = 1580. Por tanto, esta suma mide clermor que existe al utilizar la ecuacién de regresiGn extimada 5 = 60 + Sx para predecir las ventas ‘Ahora suponga que se pide una estimacign de las ventas trimestrales sin conocer el tamafio de la poblacién de estudiantes, Sin tener conocimiento de ninguna otra variable relacionada, se ‘emplearia la media muestral como una estimacién de las ventas timestzales de cualquiera de TABLA 14.3. Caleulo de SCH en el ejemplo de Armand’s Pizza Parlors = poblacin jentas Ventas Error Restaurante de estudiantes trimestrales _—_pronosticadas ‘Error al euadrado i (nies) {niles de $) F604 HOI 1 2 st 10 4 a 6 105 50 ns 3 8 e 100 188 4 8 us 100 su 5 2 7 120 9 6 16 at 0 ° 1 20 1st 160 9 ® 20 169 160 a ° 2 ue 170 4a 0 26 200 190 1a 143 Coeficiente de determinacin 37 TABLA 14.4 Calculo de la suma total de cuadradas en el ejemplo Armand’ Pizza Parlors = poblacién 9, = ventas Desviacién Restaurante de estudiantes rimestrales Desviaciin al cundrado i (miles) miles de $) wre OF 1 2 st -n si 2 6 105 =35 025 3 5 ws -2 1764 4 4 ut 144 5 2 ut 168 6 16 at ° 7 20 137 n ns * 20 169 » 191 ° 2 ue io x1 10 2» 20 n “sis sre 15730 Jos restaurantes, En la abla 14,2 se mostré que con base en los datos de las ventas, By, = 1300 Asi, el valor medio de las ventas trimestrales en la muestra de los 10 restaurantes Armand’s es} = Syl = 1300/10 = 130, En la tabla 144 se presenta Ie suma de las desviaciones a ccuadrado que se obtiene cuando se usa la media muestzal ¥ = 150 para estimar el valor de las ventas trimesirales de cada tno de los restaurantes. Para el restaurante isimo de la muestra, la diferencia y, — ¥ proporciona una medida del error que implica usar V para estimar las ventas. La comespon te suma de cuadrados, llamada suma total de cuadrados, se denota $TC. UMA TOTAL DE CUADRADOS ste = 3, - 57 (14.9) Laci debao dela tina cohumna de la tabla 144s la suma total de cuadrados en et ejemplo de Armand’s Pizza Parlors; étaes STC ~ 15730 amo ast = 15720) Te la figura 145 se indica la linea de regresion estimada 3 ~ 60 + Sx y la inca comes- ‘nsck~ 1530 olnes de pondiente a ~ 130. Observe que los puntos se agripan de manera mis ceradaslededor de regresin estimada se ajusta 14 yecta de regresiGn estimada que en tomno de la Iinea } ~ 130. Por ejemplo, vemos que para riche meat dts ot 19g getarane dela mesta, el tore acho ms grand cuando se usa ~ 130 para es titnar yp que cuando se uiliza Sy, ~ 60 + 5(26) ~ 190. Se puede entender la STC como una medida de cudnto se aprupan las observacione en trno ala inea, yl SCE como una medida de cunto se agrupan las obsevaciones en tomo dela eta} Para medir cunto se desvian de 5 los valores Sen la sect de teptesion, se calcula otra suina de cuadrados, la cual se lama suma de cuadrados debido ala regesion ve dena como Sc SUMA DE CUADRADOS DERIDO ALA REGRESION sex = 265, - 9 (14.10) 578 FIGURA 14.5 Desviaciones respecto de la Iinea de regresi6n estimada y la Iinea Copiulo 14 Regresién lineal simple ‘ejemplo de Armand’ Pizza Parlors 3 , a 2 ok | al 02 4 6 § 0 12 16 18 2 22 2% 25 Poblacin de estudiantes (miles) 1a sem puede entenderre como la pare explicada dela st, y las puede fentenderse come la parte ro explcada dela $ Porlo antes dicho, se esperaria que hubiera alguna relacin entre STC, SCR y SCE. En efecto, larelacién entee estas tres sumas de cuadrados constituye uno de los resultados més importantes de la estadtica RELACIONENTRE STC, SCR Y SCE sTc = ScR + SCE (14.11) donde: STC = suma total de cuadeados SCR = suma de cuadsados debido ala egresi6n suma de cuadrados debido al error La ecuacién (14.11) indica que la suma total de cuadrados puede ser dividida on dos com- pponentes: la suma de euadrados debido a la cegresién y la suma de cuadrados debido al ertor Por consiguiente, si se conocen los valores de dos de estas sumas, es ffeil calcular la tercera ‘suma de cuadrados. Por ejemplo, en el caso de Armand's Pizza Parlors se conacen SCE = 1530 y STC = 15730; por tanto, al despejar SCR en la ecuacién (14.11), se encuentra que la summa de ‘cuadrados debido a la regresign es SCR = STC ~ SCE = 15730 ~ 1530 = 14200 143 Coeficiente de determinacin 579 ‘Ahora se verd como se usan estas tres sumas de cuadrados, STC, SCR y SCE, para obtener tuna medida de la bondad de ajuste de la ecuaciGn de regresiGn estimada. Esta ecuaciGn se ajustarfa perfectamente a los datos si cada uno de los valores de la variable dependiente y, se en- contrara sobre la recta de regresicn, En este caso, para todas las observaciones se tendsfa que y, ~ J, sexfa igual a0, con lo que SCE = 0. Como STC = SCR + SCE, vemos que para que haya tun ajuste perfecto, SCR debe ser igual a STC, y el cociente ($CR/STC) debe ser igual a 1. Cuando Jos ajustes son malos, se tendrén valores altos para SCE. Si en la ecuaci6n (14.11) despejamos sta, enemos que SCE = STC ~ SCR. Por consiguicnte, el valor més grande de SCE (y por tanto cL ajuste més pobre) se presenta cuando SCR = Oy SCE = STC. El cociente SCRISTC, que puede tomas Valores entre Oy 1, se usa para evaluar la bondad de ajuste de la ecuacién de regresién estimada. A este cociente se le ama coeficiente de determi- rnacién y se denota como 7 (COBFICIENTE DE DETERMINACION sce STC (14.12) Enel ejemplo de Armand’s Pizza Parlors, el valor del coeficiente de determinacisn es 2 SCR _ 14200 ste 15730 0.9027 Cuando se express el cocficionte de determinacién en forma de porcentae, ? se puede in- \erpretar como el porcenise de Is suma total de caadrados que se explica mediante el uso de Ja ecuacién de regres estimada. Enel ejemplo de Armand's Pizea Parlors se concluye que 90.279% de la suma toll de cuadrados se expla uilizando la ecuacién de regresién estimada 5 = 60 + Sx para predecir as ventas timesirales. En otras palabras, 90.27% de la varabilidad en las ventas se explica por Is relacién lineal que existe entre éstasy el tamafio de la pobla- cin de estudiantes, Seria saisfactorio encontrar un buen ajuste para Ia ecuacién de regresin Coeficiente de correlacion En el capitulo 3 se present el coeficiente de correlacgn como una medida desriptiva de la imtonsidad de la relacién inal ene dos variables xy y. Los valores del coetciente de corre- luvin siempre estarén ene ~1 y +1, Un valor de +1 indica que las ds variables xy y estén perfetamente relacionadas en un senido lineal postivo. Es deit, todos los puntos de ls datos se encuentran en una linea reta que tiene pendisnte posiiva. Un valor de ~1 indica que x y 1 estén perfectamente relacionadas en un sentido lineal negativo con todos los punts de los datos en una recta con pendent negativa. Los valores del coeticiente de coelacincercanos & O indican que ry yno estén relacionadas lnealmente. En la seecin 35 se presen la ecuacién para calcula l coeficiene de correlacién mucs- tral Cuando se ha realizado un andlisis de regesiény caleulado el coeticiente de determina cin re eoeiient de comelaidn muestra se puede obtener como se indice a continuacién CCOBFICIENTE DE CORRELACION MUESTRAL ry = (Signo de b, Veoetioiente de determinacion = (signo de by? aaa 580 Copiulo 14 Regresién lineal simple donde: b, = pendiente de la ecuacién de regresi6n estimada by + bx El signo del coeficiente de correlacién mucstral es positivo si la ccuacién de regresién es- timada tiene pendiente positiva (b, > 0), y es negativo si la ecuacidn de regresién estimada tiene pendiente negativa (b, < 0). En el ejemplo de Armand’s Pizza Parlor, el valor del coeficionte de determinacién corres- ppondiente ala ecuacién de regresiGn estimada § = 60 + Sx es 0.9027, Como la pendiente de esta ecuacisn es positiva, la ecuacién (14.13) indica que el cocficiente de correlacién mucs- tral es + ¥0.9027 = +0.9501. Con este coeficiente r,, = +0,9501, cancluimas que existe una fuerte relacién lineal positiva entre xy y En el caso de una relacién lineal entre dos variables, tanto el coeficiente de determinscién ‘como el coefciente de correlacién muestral proporcionan medidas de la fuerza de la relaciGn, E! primero provee una medida entre 0 y 1, mientras que el segundo proporciona una medida en- ire ~1y +1, Aunque el coeficiente de correlacién muestralestérestringido a larelacién lineal entre dos variables, coefiiente de determinacin puede emplearse para relaciones no lineales ¥y para otras en las que hay dos o mas variables independientes, Por tanto, ofrece un rango de aplicacién més amplio. NOTAS Y COMENTARIOS 1. Al desarollar Ia ecuacién de regresin estima: dda mediante el método de minimos cuadsados y caleular el coetciente de determinacin, no se hizo hingin supuesto probabilistico acetea del témi- no del eror¢;tampoco se reaiz6 ninguna prueba cestaditica de signiicancia para la relacién entre xy y. Los valores grandes de r? implican que la recta de minimos cuadrads se ajusta mejor a los dor; e¢ decir, las observacione se encuentran nds cerca de la recta de minimos cuadrados. Sin ‘embargo, usando sélo r! no se pueden formulae cconelusiones acerca de sila relacin entre x y y cs evtadisticamente signiticativa, Tal conelusién debe basarse en consideraciones que implican el tamafo de la muestra y las propiedades de la dis: tuibucién de muestreo adecuada de Tos estimado- tes de minimos cuadrados Para fines prictios, cuando se trata de datos que se manejan Upicamente en las ciencias sociales, valores de r* tan pequetios como 0.25 suelen con siderase tiles. En datos de fisica o de ciencias de la vida suclen encontrarse valores r? de 0.60 ‘o mis, en algunos casos mayores de 0.90, En lat aplicaciones de negocios, lot valores de ? vaefan ‘enotmemeate dependicnda de las earactristicas particulares de cada aplcacién, Métodos wo SEG "Vetere La eeuacin de regresinestimada para estos datos es = 0.20 + 2.60, 4a) Caleule las SCE, STC y SCR empleando las ecuaciones (14.8), (14:9) y (4.10) 2) Caleule el coeficiente de determinacin r? Haga un comentatio sobre la bondad del ajuste. (0) Determine et coeficiente de corrlacién muestral 143 Coeficiente de determinacin 581 16, Los datos que se presenta a continnasién son etomados del eerciio 2 n[3 2 6 wu ys © 3 0 1s La eouacin de egresén enimada para ets datos os § = 68 — 3 4a) Caleulelas sc, sy sc 1) Calete el coefciente de doterminacin r, Exprese un comentario sobre Ia honda dl aut, ©) Deterin el cofcieat de comeacién test 17. Los dios cotauaisn provinen los dl ecco 3 n[2 6 9 3% nl? 9 26 1a cousin de regresion estima para exon datos 8 § = 7. + 0.9 2QUE porcentje da sma toll de cuadrados puede explicaretnediante eta cousin? Culex el valor del coe fein decetelacion stl? Aplicaciones : ovo SES 19. En los datos siguientes, y coresponde a los sueldes mensuales yx es el promedio cbtenido por los estudiantes que terminaron Promedio ‘Sueldo mensual ($) 26 3300 MM 3600 35 ‘$000 32 3500 35 3900 28 3600 4) Caloule las sce, stCy sR. 1b) Caleule et coefciente de determi ©) Determine el valor del coeficiente de comrelacién muestra grado en adminstraci con especialidad en sistemas de {nformacién, La ecuacién de regresién estimada con estos datos es § 905 + SBL.Lx i6nr°, Haga un comentatio sobte Ia bondad del juste Enel eercicio7 un gerente de ventas obsuvo los siguientes datos sobre x ~ ventas anuales (An- tual Sales) yy = alos de experiencia (Years of Experience) de 10 vendedores (Salesperson) La ecuacin de regresi6n esimada para esos datos es § Years of Salesperson Experience 80 + dy, Annual Sales ($1005) 10 97 92 102 13 u 119 ms 17 16 582 Copiulo 14 Regresién lineal simple 21 2 1a) Caleule las sce, Tey SCR B) Calealeeleoeficiente de determinacin raga un comentario sobre la bondad del ajuste. ‘©) {Cuil el valor del coeficiente de corzelacién mes Consumer Reports publica extensas pruchas y evaluaciones de mis de 100 televisres de alta definicién. Para cada modelo se elaboré una puntuacién general asada prncipalmente en 1a ‘calidad de la imagen, Una puntuaci6n més alla indica un mejaefuncionamiento, Bn los datos siguientes se proporcionan el precio (Price) y la puntuacién (Score) general de 10 televisores de plasma de 42 pulgadas con su respectiva matea (Brand) (Consumer Reports, marzo de 2006) Brand Price (S) Score Dal 200 @ ivense 200 53 ita 2700 4“ Ne 3500 50 a 3300 5 Maxent 2.000 39 Panasonic 4000 65 Philips 3000 5s Proview 2500 uM Sensing 3000 39 ® ut plearse para determinar la puntuaciOn general de un televisor de plasma de 42 pulgadas dado el precio. 2) Caleule 73. :Proporcioné un buen ajuste la ecuacin de regresinestimada? }Estime la puntuacién general de un televisorcuyo precio es de $3200. 1 estos datos para desarollar una ecuacién de regresién estimada que pueda em Una aplicacin importante del andtisis de regresin en la contadria es la estimacin de costo, Pariendo de datos sobre volumen de produccién y costo, y empleando el método de minimos ‘cuadrados para dessrrollar una ecuactén de regresin estimada que relacione ambor datos, un contador puede calevlar ls costs correspondientes aun determinado votumen de produccién, Coasidere la siguiente muestza de dalos sobre volumen de producciéa y costo ‘otal de una operacin de manufactur, ‘Volumen de produccién (unidades) __Costo total (8) 400 4000 450 000 550 5400 600 5900 109 5400 150 7000 4a) Uilie estos datos para desarollar la eouacén de regresin estima il a efecto de pro. ‘nosticar ls costs totale dado un Volumen de producci6n determinado 1) {Cua es el costo variable por unidad preducida? ©) Caleule el coeficiente de determinacién. Qué porcentaje de la variaci6n en los castos \olales puede ser explicads por el volumen de produccién? 14) Conbaseen el programa de produccién de 1a empresa, el mes pr6ximo se deberin producie 500 unidades. ;Cusl es el costo total estimado para esta operacin? ise al eerecio S donde se utlizaron los siguientes datos para investiga si, porlo general, los precios allos estén o no asociados con las alas califieaciones de lat ejercitadoras (Consumer Report, febrero de 2008). La siguiente tabla presenta los datos de marca y madelo (Brand and Model, precio (Price) y calificaci6n Rating), Eiptals 144. Svovests del modelo 583 Brand and Model Price ($) Rating Precor 5.31 3700 "7 Keys Fitness co2 2500 “ Octane Fitness 376 2800 2 Lifefinets XI Basie 1900 ” NordicTrack AudoStrider 90 1000 2 Schwinn 430 300 o Vision Fitness X5100 1700) os ProFonn xP $20 Razor 600 5s on x precio (8) y y = califcacién, la ecuacin de regresién estimada es § = S8.158 + 0,008449x, Para esas datos, SCE 173.88 4) Caleule el coeficiente de determinacién 7’. b) gla ecuacién de regresién estimada proporciona un buen ajuste? Explique s respuesta, 1) {Cuil sel valor del coeticiente de cortelaciéa muesieal? ;Cémo es la relacién que releja cenlee precio y calificacin:Iuerte 0 débil? Supuestos del modelo En un anslisis de regresin se empieza por hacer un supuesto acerca del modelo apropiado para la telacin entze las vatiables dependientes ¢ independientes, En el caso de la segresiéa lineal simple, se supone que el modelo de regresién es Y= Bot Bx te Después, expleando el mftod de minim cuadrados, se obienen Ios valores de by y By, due ton las estimaciones de los pardineuos del modelo fy 8, respectivamente. Aa legs ala teuacion de regesin ean P= byt bx Como vnmos, el valor del cocficiente de determinacidn (7) es una medida de la bondad de ajuste dela ecuacién de regresién estimada. Sin embargo, aun cuando se obtenga un valor grande para la ecuaciéa de zegresién estimada no debe set usada sno hasta que se realice un sundlsis para dotermsinay si el modelo empleado es apropiado. Un paso importante para ver 3 el supuesto del modelo es adecuado, consist en probar la significancia dela telacién. Las pruc- bas de sigaificancia en el andiss de regresidn es basadas en los siguientes supuestas acerca del término del exor SUPUESTOS ACERCA DEL TERMINO DEL ERROR € EN EL MODELO DE REGRESION Ya Bot Bare 1. El téemino del error € es una variable aleatoria cuya media, o valor esperado, es cero; es decir, E(e) = 0. Inplicacién. By y Bi, son constntes, portant, E(B.) Bis a3, ara un valor dado de el valor esperado de yes £0) = Bo + Bx (14.14) Comin) 584 Copiulo 14 Regresién lineal simple Como ya se indieé, a la ecuacién (14.14) se le conoce como ecuacién de re- sresién. 2. Lavarianza de e, que se denota como o?,es la misma para todas los valores de x Implicacién, La varianza de y respecto de la recta de regresin es igual a oy es a misma para todos los valores de x 3. Los valores de € son independientes, Implicacién, Bl valor de « correspondiente a un determinado valor de x no esti relacionado con el valor de € para cualquier otro valor de x; por tanto, el valor de _y correspongiente a un valor pafticular de x no esta relacionado con el valor de y de ningsin otro valor de x 4. Bl émino del error € es una variable aleatoria distribuida normalmente. Implicacién, Como y es una funcién lineal de ¢, también y es una variable alea- ‘oria distribuida normalmente. En la figura 14.6 se ilustran los supuestos del modelo y sus implicaciones; observe que en esta interpretacién gréfica el valor de E(y) cambia con base en el valor espectfico de x que se cconsidere. Sin embargo, sea cual fuere el valor de x, la distribucin de probabilidad de ¢ y, por tanto, la distribucidn de probabilidad de y, son distribuciones normales que tienen todas la mis- ‘ma varianza. El valor espectfico del error en cualquier punto depende de si el valor real de y ‘es mayor o menor que E(9). En este punta hay que tener presente que también se hace un supuesto se tiene una hip6- tesis acerca de la forma de la relacién entre.xy y. Es decir, se supone que la base de la relacién FIGURA 14.6 Supuestos del modelo de regresisn Disribucin de Distibucin de yenx= 20 Disuibucin de xB Ly) exando FO) = bo + Bx ‘Nota, Para ca un dels valores de x as Aistribucioesy tiene la misma forma, 145. Prusba de significancia 585 entre las variables es na recta representada por fj, + fix: No te debe perder de vista el he- cho de que puede haber algiin otro modelo, por ejemplo y =, + fix’ + ¢, que result ser ‘mejor para la relacign subyacente Prueba de significancia En una ecuacin de reresin lineal simple, la media o valor esperado de yes una func lineal de x E()) = By + Bx Pro sel valor de Bes cex0, B(3) = fy + (O)x = fy Bneste caso, ch valor medio de y no depende del valor dex y, por tanta, podemos conchuir que x y y no estén relacionadas linealmente. De manera alterna, si el valor de es distnto de cero, se concliré ae las dos variables estan relacionadas. Asi para probar st existe una relacidn de regresién signifcaiva, se debe realizar una prucba de hipétesis a efecto de determinar sel valor de Bes distino de cero. Hay dos pruebas que son las ms usadas. En ambas se require una estimacién de 0°, la varianza de « en el modelo de regresién Estimacién de o? CCon hase en el modelo de regresén y sus supuests, podemos conclu que 0% la varianza de «representa también la varianza de ls valores dey respect de la ecta de reresin, Recver de que a la desviaciones de los valores dey respecto de la recta de regresin estima sles conoce como residuales. Por tanto, SCE, Ia soma de los cuadrados de los residuales, es una me- dida de la vaiabilidad de as observaiones reales respecto de I linea de regresin estimada, El error cuadrado medio (ECM) proporciona una estimacin de o*; esta estimacién es de SCE Aiviida ene sus grados de libertad Como §; = bp + by, SCH se puede expresar como sce = By, — 5° = 20) — ro — yxy CCada suma de cuadrados etd asociada con un ntimero llamado grados de libertad. Los exper tos en estadistica han demostrado que la SCE tiene n ~ 2 grados de libertad, poraue para cal Jara es nevesarioextimar dos parimetros (fy 8) El error cuadrado medio se calcula al divicir Sci entre » ~ 2, ELECAt proporciona un estimadorinseszado de 0°, Como el valor del ECM provee un estimado de 0, se empl también la notacin 5 ERROR CUADRADO MEDIO (ESTIMACION DE 0°) scx. na PEM (14.15) En la seccién 14.3 se encontré que en el ejemplo de Armand’s Pizza Parlors, SCE = 1530; por tanto proporciona un estimador insesgado de o® ara estimar 0 se calcula larafz cuadrada de s*. Al valor que se obtiene, s,s le conoce como error estindar de estimacién, ERROR ESTANDAR DE ESTIMACION Vii (14.16) 586 Ata deviatin enindar feb, se le conoce tambien ‘como ero etindat fe by At ,proporiona tia ttimactdn del error eindar de by Copiulo 14 Regresién lineal simple En elejemplo de Armand’: Pizza Parlors, s = VECM = VIOTS = 13.829. El error estin- dar de estimacién se emplea en el siguiente andlisis acerca de las pruebas de significancia de la relacisn entze xy. Prueba ¢ EI modelo de regresién lineal simple es y = hy | Byx © €. Sixy y estén selacionadas lie realmente, entonces fi # 0. El objetivo de la prueba # es determinar si se puede concluir que By # 0. Para probar la hipétesis siguiente acerca del parimetro f, se empleardn los siguientes ‘datos muestrales 5 B= 0 1B, #0 Si Hyes recherada, se concluiré que Bi, # 0'y que enlte las dos variables existe una relaciéa cestadisticamente signiicativa, S {que esta relacin signiicativa existe, La base para esta prueba de hipStesis la proporcionan las propiedades de la distribucién de muestreo de by, el estimador de Bi, obtenido mediante el mé- todo de minimos cuadrados, H, no es rechaza bri evidencia insuficiente para concluit Primero, considere qué ocurrisfa si para el mismo estudio de regresién se usara una mues- ira aleatoria diferente. Suponga, por ejemplo, que Armand’'s Pizza Parlors usa los registros de ventas de una muestra diferente de 10 restaurantes. El andlisis de regresin de esta otra muestra dard como resultado una ecuacién de regresién parecida a la ecuacién de regresién anterior 5 (una ecuacién en la que exactamente la interseccién con el ejey sea 60 y la pendiente sea 5). Los cestimadores by b, obtenidos pore] método de minimos cuadrados, son estadisticos muestrales {que tienen su propia distribucisn de muestzeo, A continuacién se presentan las propiedades de 0 + Sx. Sin embargo, no puede esperarse que se oblenga exactamente la misma ecuaciéa Ia dstsibuciéa de muestra de b, DISTRIBUCION DE MUESTREO DE b, Valor esperado EO) Desviacién estandar — 14.1 os BaF Oa) Forma de distribucién: normal ‘Observe que el valor esperado de bes igual a, por lo que byes un estimador insesgado ae, ‘Como no se conoce el valor deo, se obtiene una estimavin de ,. que se denotes, esti ‘mando o mediante sen la eouaién (14.17. De esta manera oblenemos el estimador siguiente ea, DESVIACION ESTANDAR ESTIMADA DE b, % (14.18) En lor apéndices 143 y 144 ae describe uso de Minitab y de Bxel para ‘alelare valor 145. Prusba de significancia 587 En el ejemplo de Armand’s Pizza Parlors, s = 13.829, Por tanto, dado que (x, ~ 3)? 568, como se aprecia en la tabla 14.2, tenemos 13.829 0.5803 +568 aque es la desviacién estindar estimada de b, La pruoba 1 para determinar si la relacién es significativa se basa en el hecho de que el estadistico de prueba sieve un stb ron n ~ 2 gras de iberad Sila hiptesismlassverdaders,entonses By Oy2= busy, ‘Ahora se eliza eta procs de sinificania co los dts de Armand’ Piz Parlors om pleando como nivel de signfisnca = 00, Hestaisticn de prs ss En as tablas del distsbucién rencontramos que para ~ 2 = 10 ~ 2 = 8 grados de ibertad, 1 = 3.385 proporciona un dre de 0,005 en la cola superior. Por tanto, el ea en la cola superior dela distrbucin # correspondiente al estadistico de prucha t = 8.62 dee ser menor de 0.005. ‘Como éstaes una prueba de dos clas este valor se duplicay concluimos que el valo-p asocis- do con t = 8.62 debe ser menor a 20,005) = 0,01, Empleando Excel o Minitab se encuentra el valorp = 0,000, Dado que el valorp es menor que a = 0.01, Hes rechazada y concuimos aque noes igual a cero, Esto es sufcient evidencia para asegurar que existe una relacién sig- nificativaenire la poblacén de estudiantes y las ventas trimestrales. A continuacién se presenta un resumen de Ia pruba de signiticancia para la regresi lineal simple PRUEBA 1 DE SIGNIFICANCIA PARA LA REGRESION LINEAL SIMPLE ESTADISTICO DE PRUEKA + 2 (14.19) REGLA DE RECHAZ0 ‘Método del valor-p: Rechazar H, si el valor-p = a ‘Método del valor crtico: Rechazar Hy sit = ty, 0S17= typ donde f,y. se toma de la distribucién con n ~ 2 grados de libertad Intervalo de confianza para /, La férmla den interval de confanzs para 6 siguiente: By + tairSe, 588 Copiulo 14 Regresién lineal simple Bl estimador puntual es by y el margen de error fs, El coeficiene de confanza para este intervalo 65 1 — a. fon of el valor ¢ gue proporciona un area a/2 en la cola superior dela Aistibucién 1 con n ~ 2 grados de libertad Suponga por ejemplo, que en el caso de Armand’s Pizza Pariors se desea obtener una estimacién de f, mediante un intervalo de 99% de con- fianza. En la tabla 2 del apéndice B encontramas que el valor 1 correspondiente a a = 001 y n= 2= 10 ~ 2 = 8 grados de libertad €5 fy = 3355. Por tant, Ia estimaci6n mediante ‘ intervalo de 99% de contanza de es b= tabs, 3.355(0.5803) = 5 + 1.95 ‘oclintervalo que va de 3.05 2 6.95, ‘Al emplear la prucba f de significancia, las hipétesis probadas fueron 5 6, = 0 1p, #0 Usilizando « = 0.01 como nivel de significancia, se puede usar el intervalo de 99% de con- fianza como allemativa para Hegar a la conclusidn de la prueba de hipétesis que se obtiene con los datos de Atmand's. Como 0, que es el valor hipotéico de f, no estécomprendido en el intervalo de conlianza (3,05 a 6,95), Hy puede ser rechazada y concluimos que entre el amaio de la poblacign de estudiantes y las Ventas trimestrales sf exile una relacién estadisticamente significativa, En general, se puede usar un intervalo de confianza para probar cualquier hipé- tesis de dos colas acerca de f. Si el valor hipotstico de f, esté contenido en el intervalo de cconfianca, Hf,n0 es rechazada. De lo contratio, es rechazada, Prueba F ‘Una prueba Fbasada on la distsbucién de probabilidad F también puede emplearse para probar la significancia en la regzesién. Cuando sélo se tiene una variable independiente, la prucha F leva a a misma conclusin que la prueba es deci, seat indica que B, # Oy por ant exis te una lac signilicatva, la prucba F también indicaré que existe esta relacign, Pero cuando hay més de una variable independiente, sélo la prueba F puede usarse para probar que existe ‘una zelaci signiicativa general La logica dteés del uso de la prucba F para determinar si la selai6n de regresidn es esta ticamentesigificativa se basa en el desarrollo de dos estimacionesindependientes de a”, Se cexplieé edmo ECM proporciona una estimacién de 0°. Sila hipStesis aula Hy: B, = 0 es ver dade, la sunsa de cuadeados debido a la regzesin, SCR, dividida ene sus grados de libertad proporciona otra esimaciéa independiente de 0° A esta estimacin sel lama cuadrado medio dlebido a la regresién o simplemente cuadrado medio de la regres, y se denota como CMR En general ser. ‘grados de libertad de la regresign En los modelos que se consideran en este libro, el nero de grads de libertad de la regresién ¢ siompre igual al nimero de variables independientes en el modelo: scr. emg = —___S&R_ ‘nimero de variables independientes (14.20) Como en ext capitalo sso se consideran models de regresién con una sola variable inds- pendiene, tenemos CMR = SCR/T = SCR. Por tanta en el ejemplo de Armand’s Pizza Paton, con = ScR = 14200 Si la hiptess ula (HB = 0) es verdadera, CMR y ECM son dos estimacionesindepen- dientes de o* y la distribucién de muestreo de CMR/ECM sigue una distribucién F en la que el En la regresion lineal simple. a prueba Fy la praca propertonae Tentadoeidentcos. Si es fala, wow proporciona una esimacisn Inespada dea? ye 3th subreetina 02 Si Hye erdadera; tanto HEM come ‘oak proporcionan wna cstimacininsergad deat enestecats eb ‘lor de CREE cercano a1 145. Prusba de significancia 589 snimero de grados de libertad en el numerador es igual a1 y el ndmero de grados de ibertad en ¢l denominador es igual a n ~ 2 Por consguiente, si 8, = 0 el valor de CMRVECM deberd ser un valor ceteano aI eros lahipéesis nul es fala, (f, # 0), CMR sobreestimard oye valor de CMB/ECM se infor; de esta manera valores grandes de CMR/ECM conduciré al rechazo de gy aa concusin de que la relacén eure x y yes estadisicamente significative ‘Acontinuacion se celizaré la prueba Fen el ejemplo de Arman!'s Pizza Palos. El eta- disco de prusba es p= 2K _ 14200 eM 191.25 = 14.25 En a tabla dela distribucign F (tabla 4 del apéndice B) se abserva que con un grado de liber- tad en cl numerador y n ~ 2 = 10 ~ 2 = $ grados de libertad en cl denominador, F = 11.26 proporciona un area de 0.01 en la cola superior. Por tanto, el ea en la cola superior de la disinibucidn F que corresponde al estadistico de prucha F = 74,25 debe de ser menor de 0.01, Por tanto, concuimos que el valor debe de ser menor a 0,01, Empleando Excel o Minitab se encuentra que el valor-p = 0,000, Como el valor-p es menor que «t = 0.01, Hy es rechazada y coneluimos que entre cl tamaio de la poblacién de estudiantes y las ventas trimesirales existe tuna relacién significativa, A continuacién se presenta un resumen de la prucba F de significan- cia para la regresién lineal simple PRUEBA F DE SIGNIFICANCIA EN EL CASO DE LA REGRESION LINEAL SIMPLE Hy: By = Hyp #0 ESTADISTICO DE PRUERA ae 14.21) cM REGLA DE RECHAZ0 Método del valor-p: Rechazar Hy si el valor-p = cr Método del valor crflico: Rechazar H, si F = F., donde F, es un valor de distibucién F con | grado de ibertad en el numerador y n — 2 ¢grados de libertad en el denominador, Enel capitulo 13 vimos que el andlisis de varianza (ANOVA) y la tabla de ANOVA pueden uulizarse para proporcionar una visién resumida de los célculos que se emplean en el anslisis de varianza. Una tabla de ANOVA similar se emplea para tesumir los célculos de la prueba F desig nificancia para la regresién. En Ia tabla 14.5 se presenta la forma general de una tabla ce ANOVA, para la regresién lineal simple, y en la 14.6 la tabla de ANOVA con los eélculos para la prucba F Gel ejemplo de Amand’ s Pizza Parlors. Regresi6n,e1tory total son las etiquetas de las tres fuen- tes de vatiacin, y SCR, SCE y STC son las sumas de cuadrados correspondientes que aparecen enJa columna 2. En la columana 3 se indican los grados de libertad I para SCR, n ~ 2 para SCE y n~ I para STC. Los valotes de CMR y ECM aparecen en la colurana 4, mientras que la 5S contie~ ne el valor de F = CMRIECM, y Ia 6 el valor-p que comresponde al valor de F de la column 5. Casi todos los resultados propotcionados por computadora para el andlisis de regresién inclu- yen un resumen de Ia tabla ANOVA de la prucba F de significancia, 590 En toda tabla para et nai de varia, ka uma total de cuadrador eta suma de a suma de ‘undradet dele reretién mis lasuma de cundradoe det errr: aemts, of tonal dels grades de bert ta runs de fos grades de libertad de da regresn mds le eras de tibertad del ero: tani de regresion gue ews para idea la telacn ee tas variables ro puede emplearse como (ldenciade wna Pelacn de causa y eect. Copiulo 14 Regresién lineal simple TABLA 14.5 Forma general de la tabla de ANOVA para la regresién lineal simple ore Seale Grader Cadrade devaacin cadre deiberad mmo” = Fon repsita sa 5 am 8p Bem sx at ze Algunas advertencias acerca de la interpretacion de las pruebas de significancia ‘Cuando la hipétesis nula Hy f, = 0 es rechazada, determinar que la relacién que existe en- ite xy y 68 significativa no permite que se concluya que existe una relacién de causa y efeero centre xy y. Sélo puede concluirse que existe esta relacién cuando el analista pueda dar justifica- iones teéricas de que, en efecto larelacin es causal, Enel ejemplo de Armand’s Pizza Parlor, ‘coneluimos que existe una elaci6a signticativa entre el tamafo de la poblaciéa de estudiantes yy las ventas rimestrales y; ain més, la ecuaciGn de regresin estimada f = 60 + Sxproporciona ‘una estimacién de la relaci6a obvenida por el mécodo de minimos cuadrados, Sin embargo, por cl solo hecho de que se haya encontrado que hay una relacién estadisticamente significaliva centre xy y, no podemos coneluir que cambios en la poblacién de estudiantes x causen cambios ‘en las Ventas trimeatrales y. Lo apropiado de concluir que hay una relacisn de causa y efecto se deja a las jusificaciones teéricas de soporte y al buen juicio de los analistas. Los gerentes de ‘Armand’s crefan que el aumento en la poblacign de estudiantes probablemente fuera una causa del aumento de las ventas trimestrales, Por tanto, el resultado de la prueba de significancia les permite concluir que hay una relacién de causa y efecto. ‘Ademés, el hecho de que se pueda rechazar Hi,: 6, = 0 y demostrar que hay significan- ia estadfstica no permite concluir que larelacin entze x y y sea lineal. Lo Unico que se puede cstablecer es que xy yestin relacionadas y que la rlacién lineal explica una porei6n significa. tiva de Ia vatiablidad de y sobre el rango de los valores de x observados en Ta muestra, En la figura 14.7 e ilusira esta situacién. La prueba de significancia eva al echazo de Ia hipStesis| nnula Hf = Oy a la conclusién de que x y y estén significantemente relacionadas, pero en Ia figura se observa que la verdadera elacién entze xy y no es lineal. Aungue la aproximacién TABLA 14.6 Tabla ANOVA para el ejemplo de Armand’s Pizza Parlors Fuente Sumade Grades Cuadrado dev cuadrador de libertad ‘medio F valor R 14200 1 4200 7425 o.000 areca 19125 Enor 1530 * oul 15730 ° 145. Prusba de significancia 591 FIGURA 14.7 Bjemplo de una aproximacién lineal para una relacién no lineal Fatt x Valor menor Valor mayor dex dex Rango dels valores dex observados lineal proporcionada por $ yy + byx es buena en el rango de los valores de x observados en Ja muestra, se vuelve deficiente para valores de x fuera de ese rango. Dada una relacin signticativa, la ecuacién de regresin estimada se puede usar con con- fianza para predicciones correspondientes a valores de x dentro del rango de los valores de x ‘bservados en la muestra. En el ejemplo de Armand'’s Pizza Parlors, este rango cottesponde a Jos valores de x entre 2y 26. A menos que haya otras razones que indiquen que el modelo es vi lido mas alld de este rango, las predicciones fuera del rango dela variable independiente deben realizarse con cvidado. En el ejemplo de Armand’s Pizza Parlors, como se ha encontrado que la relacién de regresicn es significativa al nivel de significancia de 0.01, se puede tener con- fianza de usarla para predecir las ventas de restaurantes en los que la poblacién de estudiantes corresponiiente esté en el intervala de 2000 a 26000. NOTAS Y COMENTARIOS A. Los supuestos acerca del témino del eror (see cidn 14.4) permiten las pruebas de significancia estadstica de osta secci6n. Las propiedades de la distibucién de muestrea de b; y las subsiguien- les pruchas ty F se derivan directamente de estos supuestos 2. No se debe confundir la significancia estadisti- a com la significancia préctica, Con tamafios de muestra muy grandes se pucden abtener resulta- dos estadisticamente signifieativos para valores pequetios de by en tales casos hay que tener eui- ddado al concluie que Ia relacién tiene significan- cia prctica na prueba de signficancia para la relacign bie neal ene x y y también se puede realizar usando cl coeficiente de comelacida muestalr,, Con py para denotar el coeficiente de corrlacién pobla- ional, las hip6tess son ls siguientes He Psy Mg Pry #0 Si Hes rechazada, podemes concluir que existe tuna relacién signifcativa Ex el apéndice 14.2 se proporcionan los detalles de esta prucha. Sin em- Dargo, las pruebas ry F presentadas en esta sec- cin sportan el mismo resultado que la prucha de significencia usando el cosfciente de corelaci6n Por consiguiente, si ya se ha realizado una prueba 10 una prueba F, no es necesario realizar Ia de significencia usando el cosficiente de corelaci6n 592 yl PX Jevaluacion| Copiulo 14 Regresién lineal simple Métodos 23. Acer 1 presentan los datos del ejecicio 1 xjl23 4 xi 7s uw 4a) Usando la ecuaciéa (14.15) caleule el error cuadrado medio 2) Calele el errr estindar de estimacin con la ecuacién (14.16) €)Utlizando la ecuacin (14.18), calcle i desviacinesténdar estimada deb, <@)_ Use la prueba s para proba las hipstesis siguientes (a = 0.05) €) Use la prueba F para probar las hipstesis del inciso d) empleando 0.05 como nivel de significancia Presente los esultadot en el formato de tabla del anise de varia 24, A continuaci6n se presentan Ios datos del ejercicio 2. 2 6 0 xls © 3 0 1S 42) Usando la ecuaci6s (14.15), caleule el ever cuadrado medio. 1b) Caleule el error esténda de estimacién usando la ecuacién (14.16). ©) Con la ecuacién (14.18), caleule la desviacién estindarestimada de by 44) Use la prueba t para proba las hipétesis siguientes («= 0.05) €) _Aplique la prueba F para probar las hipétesis del inciso d) empleando 0,05 come nivel de sigaificancia. Presente los resultados en el formato de abla de andlisis de varianza, 25. A continuacién se presentan Ios datos del ejercici 3. 2 6 9 Bb % 44) {Cuil esol valor del error estindar de estimacin? »)_ Pruehe si existe una relacin significaiva ulizando la prusba f Use @ = 0.05. ‘6)Bmplee la prucba F para ver si existe una relacin significativa, Use a ~ 0105, ¢Cuales su ‘conclusion? Aplicaciones 26, Enel ejercicio 18, los datos sobre et romeo abtenide en la Ticenciatura y Tos sueldos men. suales fueron los siguientes, Promedio Sueldo mensual ($) Promedio Sueldo mensual ($) 26 3300 32 3500 34 3500 33 3200 36 ‘4000 28 3600 SleepingBege Eliptiate 145. Prusba de significancia 593 n. 26 2» 30, 42) gL prueba indica que hay uns relac6n sigiticativa entce el promedio el sueldo men- sual? {Cul e¢ su conclusin? Use = 0.05. b)- Determine sila relacign es significativa usando laprucha F ¢Cul es su conchusién? Ute lice a = 0.05 ©) Muestre la tabla de ANOVA. La evista Outside Magazine probs 10 modelos de mochilas y botas para excursionismo. En Ja tabla siguiente se presentan Ine datos de soporte superior (Upper Support) y precio (Price) de cada fabricante y modelo (Manufacturer and Model) El soporte superior se midis con una scala del 1 al S.en la que { significa aceplable y 5 denota excelente soporte superior (Outside ‘Magazine Buyer's Guide 2001), ‘Manufacturer and Model Upper Support Price (8) Stlomon Super Raid 2 120 Merrell Chamsteon Prime 3 ns ‘Teva Challenger 5 130 ‘esque Fusion orx 3 Ls Roreal Msigme 3 130 LL. Bean GTX Super Gude 5 19 Towa Kibo 5 180 ‘Azo AEX 520 07x 4 135, Raichle Me ral arx 4 200 Scarpa Delia st M83 5 no 14) Use estos datos para desarollr Ia ecuacign de regresign estimada a efecto de estat el precio de las mechlasy las bolas para excursionismo con base en el soporte superior. +b) Empleando un nivel de significancia de 0.0, determine si hay relacién entee soporte su- petior y preci. 6) {Conflaria en usar la ecuacién de regresién estimada desarrellada en el inciso a) para estimar el precio de las mochilasy las botas con base en Ia evaluacién del soporte su- pesior? 4) Bstime el precio de una mochila que tiene 4 como evaluacin del soporte superior. Exel ejercicio 8, con los datos x = rango de temperatura (‘F) y y = precio ($) de 11 sleeping bags fabricados por Bergans of Norway se obtuvo la ecuacin de regresisn estimada § 359.2668 — 5.2772x. Empleando 0.05 como nivel de significacia, determine s el raugo de ‘temperatura y el precio estin relacionados. Muestre la tabla de ANOVA. (Cuil es suconclusién? Remitase al ejercicio 21, en el que se usaron Jos datos sobre volumen de producciGn y costos pata desarllar una ecuacin de regresin estimads que relacionaba el volumen de produc- cid y Ios costes de una detertuinada operacion de produccién, Use @ ~ 0.05 para probat sel volumea de produccién esti relacionado de manera significative com los costos toales. Mues- tue la tabla de ANOVA. {Cuil es su conclusién? Remitase al eercicio S donde se ullizaron os siguientes datos parainvestigar si, par lo general, los altos precios Price) estin 0 no asociados con lat alas calificaciones (Rating) de las ej= citadoras elipticas de acuerdo con la marea y modelo (Brand and Model) (Consumer Reports, febrero de 2008), Brand and Model Price ($) Rating Prscor 531 3100 w Keys Fitness co? 2500 a Octane Foes 576 2800 2 Lifefiness XI Basie 1300 % NordicTrack AudoStider 90 1000) B Schwinn 30 $00 @ Vision Btness X6100 700) “ Pro xP 520 Razor 100 55 594 Tato lor itera de cempanza come lor fe predic nda a recat de os resultados dela regrenin Lor Incervalor mds exrechos Droporcionan an mayor prado de precsin Copiulo 14 Regresién lineal simple Con x = precio (8) y y = califieacié, la ecuacién de regres estimada es 5 = 58.158 + (0.008449x. Para esos datos, SC — 173.88 y STC = 756, ;La evidencia indica que hay una relaciGn significativa entre precio y calficacién? 31. Enel ejericio 20, com los datos de x = precio ($) y y = puntuacién general de 10 televisores de plasma de 42 polgadas probados por Consumer Reports, se proporcioné la ecuacién de regresion estimada § = 12.0169 ~ 0,0127x. Con estos datos se obtuvieron SCE = 540.04 y STC = 982.40, Use la pructa F pata determinar si el precio de lo tleviseres y la evalsacién general estin relacionados en un nivel de significancia de 0.5, Uso de la ecuacion de regresion estimada para estimacion y prediccion Alusar el modelo de regresi6n lineal simple se hace un supuesto acerca de la relaci6n entre yy. Después se usa el método de minimos cuadrados para obtener una ecuacién de regresién lincal simple estimada, Si existe una relaci6n significaiva entre x yy, yel coefciente de deter- ‘minacidn indica que el ajuste es bueno, la ecuacién de regresisn estimada es il para estima- ign y prediccién Estimacién puntual En el ejemplo de Armanc's Pizza Parlors, la ecuacion de regresién estimada = 60 + Sx pro- pporciona una estimacién de la relacidn entre el tama de la poblacién de estudiantes x y las Ventas trimestrales y. Con la ecuacidn de regresién estimada se puede obtener tna estimacion ppuntual del valor medio de y correspondiente & un determinado valor de x, 0 se puede prode- cir el valor individual de y que corresponde aun valor determinado de x. Por ejemplo, suponga que los gerentes de Armand’s desean tuna estimacién puntual de la media de Ias ventas times- tales de todos los restaurantes que se encuentren cerca de campus universitarios con 10000 estudiantes. Usando la ecuacin de regresién estimada $= 60 + Sx, con x = 10 (0 10000 es- tudiantes) obtenemos § = 60 + 5(10) = 110. Por tanto, una estimacién puntual de la media de las ventas trimestrles de todos los restaurantes de este ejemplo con 10000 estudiantes es '$110000. Ahora suponga que los gerentes de Armand’ desean predecir las ventas de un determinado restaurante ubicado cetea de Talbot College, una escuela con 10000 alumnos. En este caso lo que inteesa noes la media correspondiente a todas los restaurantes que estén cerca de campus con 10000 estudiantes, sino tinicamente predecir ls ventas trimestrales de uno en espectico. En realidad, a estimacién puntual de un solo valor de y es igual a la estimacién puntual de la ‘media de los valores de y. Asf, la prediccién de las ventas trmestrales de este restaurante en particular sera j = 60 + 5(10) = 110.0 $110000, Estimacién por intervalo Las estimaciones puntuales no proporcionan informacién alguna acerca de la precisi6n de una estimacién. Para eso es necesario obtener estimaciones por intervalo que son muy parecidas a las estudiadas en los capitulos 8, 10 y 11. El primer tipo de estimacién por intervalo, el intervax lo de confianza es una estimacién del valor medio de las y que corresponden a un valor dado de x. Bl segundo tipo, el intervalo de prediccién, se usa cuando se necesita una estimacién por intervalo de un solo valor de y para un valor dado de x. La estimacién puntual del valor medio de yes igual a a estimacién puntual de un solo valor de y: Pero las estimaciones por intervalo que se obtienen para estos dos casos son diferentes. En un intervalo de prediccién el margen de certor es mayor. Elmargen de error asociado Iineralee tat, 146 Uso de le ecvacin de regresién esimada para esimacién y prediccién 595 Intervalo de confianza para el valor medio de y Con Ia ecuacién de regresin estimada se obliene tna estimacién puntual del valor medio de y que corresponde a un valor dado de x, Para desarrollar un intervalo de conflanza se usa la notacin siguiente ‘x, = valor panicular o determinado de la vatiable independiente x ¥y, = valor dela variable dependiente y que corresponde al valor dado x, valor medio o valor esperado de la variable dependiente y aque correspond al valor dado x, stimaci6n puntual de E(y,) cuando x = x, by + bx, Empleando esta notacién para estimar la media de las ventas de todos los restaurantes de ‘Armand’s que se encuentran cerca de un campus con 10000 estudiantes, tenemos que x, = 10, y E(),) denota el valor medio desconacido de las ventas de todos los restaurantes para los que x, = 10. La estimacién puntual de E(y,) esté dada por j, = 60 + S(10) = 110. En general, no se puede esperar que fi, sea exactamente igual a E(y,). Para hacer una infe- rencia averea de qué tan cerca esté§, de It media Verdadera E(y,), es nevesario estimar la Va: Hanza de f, La fOrmula par estimar la varianza de para un x, dado, se denota como s2, yes (14,22) La estimacidn de la desviacién esténdar de 5, esté dada por la raz cuadrada de a ecuacién 420) (14,23) En los resultados calulados en fa secci6n 14.5 para el ejemplo de Armand’s Pizza Parlors se tiene # = 15.829, Como s, = 10,7 = My 30, ~ 5) = 568, usando la ecuacién (14.28) se obtiene ( ao- 45, = spy + i jo 568 = 13.829V0.1282 = 495 AA continuacin se presenta la formula general para obtener un intervalo de confianza. INTERVALO DE CONFIANZA PARA E(),) Fp tents, (14.24) donde el coeficiente ce confianza es 1 ~ ay ,,, se basa en una distribucign con n ~ 2 arados de libertad Para obtener, con la féemula (14.24), un intervalo de 95% de confianza para Ia media de las vonta trimestrales de todos los restaurantes Armand’s ubicados cerca de campus con 10000 estudiantes, se necesita el valor de para a/2 = 0.025 y n — 2 = 10 ~ 2 = 8 grados de libertad En a tabla 2 del apéndice B se encuentra fy,.; = 2.306, Por tanto, como 5, = 110 y el margen se error de, 306(4.95) = 11.415, la estimacin del intervalo de 95% de confianza es no = 141s 596 Coptle 14. Regrsin lineal simple FIGURA 14.8 Intervalos de confianza para la media de las ventas y correspondientes a valores dados dele poblacin de estudiantes x > cy) ereeeeed 4 3 i i ‘* 82s eee Poblacin de estudiantes (miles) En délares, el intervalo de 95% de confianza para la media de las ventas trimestraes de todos los restaurantes que se encuentran cerca de un campus eon 10000 estudiantes e¢ $110000 = 1141S. Asi el intervalo de conflanza de 95% para la media de las ventas trimestrales cuando el amaso de la poblacién es 10000 es de $98585 a $121415. ‘Observe que la desviacién estindar estimada de §, dada por la ecusci6n (14.23) es menor ‘cuando x, = Fy la cantidad x, — % = 0. Bn este e480, la desviacidn estindar estimada de §, {,o-7 (ff ‘Vi 3a, Este resultado implica que se obtiene la mejor o més precisa estimacién del valor medio de y ‘cuando x, = 3. De hecho, entre mis alejado esé x, de %, mayor serd x, — % Como resultado, los intervalos de confianza para el valor medio de y son més amplios a medida que x, se aleja de, En la figura 14.8 se muestra griicamente este pateén, Intervalo de prediccién para un solo valor de y Suponga que en lugar del valor medio de las ventas de todos los restaurantes Armand’s que se encuentran cerca de campus con 10000 estudiantes, se busque estimar las ventas do ua solo es= ‘aurante que se encuentra cerca de Talbot College, una escuela de 10000 alumnos. Como ya se {ndicé, 1a esimacién puntual de y, el valor de y que cotresponde a un valor dado x, se obtiene Elmargen de er0r ‘arociado con ere interval de estimacion€ yas 146 Uso de le ecvacin de regresién esimada para esimacién y prediccién 597 mediante la ecuacién de regresiGn estimada §, = b, + byx,, En el caso del establecimiento de Talbot College, como x, = 10, las ventas trimestraes pronosticadas serin j, = 60 + 5(10) 110.0 $110000. Observe que este valores el mismo que el obtenide como estimacién puntual de la media de las ventas en todos los restaurantes que se encuentran cezca de campus con 10000, estudiantes Para obtener un intervalo de prediccién, es nevesario determinar primero la varianza co- espondiente al uso de §, como estimaciéa de un valor individual de y cuando a.x = xy. Esta Varianza esté formada pot la suma de los dos componentes siguientes. 4. La varianza de los valores individules de y eespecto de Ia media Ey). para fa cua uns estimacién esté dads por? 2. La vaianza comespondicnte al uso de para estimar E(). paral cul una estima iin est daa por #2 La formula para estinar la varianza de un valor individual de y,, que se denota como #3. 68 (14,25) (14,26) Enel ejemplo de Armand’s Pizza Parlors, la desviacin estindar estimada que corresponde ala prediccién de las ventas de un determinado restaurante ubicado cerca de un eampus con 10000 estudiantes se calcula como sigue 1, go-y fgg = 138291 4 2 ON ine Vito 568 = 13.829 Vi1282 = 1469 La formula general para un intervalo de prediccisn es la siguiente INTERVALO DE PREDICCION PARA y,, 5p Nara (1427) donde el coeficiente de confianza es 1 ~ ay ,,, se basa en una distribucién ¢ eon n — agrados de libertad El intervalo de predicei6n de 95% de las ventas trimestales del restaurante de Talbot Co- ge se encuentra usando foxy = 2.306 fag = 14.69, Por tanto, con, = 10y un margen de exr0F def :8ng = 2:306(14.69) = 33,875, el imervalo de prediccién de 95% es 110 = 33.875 598 Copiulo 14 Regresién lineal simple FIGURA 14.9 Intervalos de confianza y de prediccién para las ventas y que corresponden a valores dads de la poblacién de estudiantes x ‘Ventas trimestrales (miles de 8) Te tates et ae ont Ss “test ‘Los dos intervlos ‘iene menor ampliad en 46 8 0 «4 8 2 2 2 26 Poblacin de estudiantes (miles) En general tanto las lneas els tmites para os Interval de confine ‘emo ta de os inte pare lop tervals de predicisn Drecentan seria curvature ovo SESS En délares, este intervalo de prediccién es de $110000 $33875 0 de $76125 a $143875. ‘Observe que el intervalo de prediccién para un solo restaurante que se encuene cerca de un ‘campus con 10000 estudiantes es més amplio que el intervalo de confianza para la media de las ventas de todos los restaurantes ubicados cerca de campus con 10000 estudiantes. Esta di- [erencia releja el hecho de que se puede estimar con mis precisién la media de y que un solo valor de y ‘Tanto las estimaciones mediante un intervalo de confianza como mediante un intervalo de prediccisn son més precisas cuando el valor de Ia variable independiente es x, = ¥, En la figura 114.9 se muestra la forma general de los intervalos de confianza y de prediceign que son més anchos. Métedos 32, Los dats siguientes provienen del ejercicio 1 4a) Use laecuacién (14.23) para estimar la desviacién estindar de §, cuando x 2) Con aexpresién (14.24) ebtenga un inervale de confianza de 95% para el valor esperado dey cuando.x ~ 4 +o SS SleepingBage 146 Uso de le ecvacin de regresién esimada para esimacién y prediccién 599 (©) Use Ia ecuacién (14.26) pata estimar Ia desviaeién estindar de wn valor individual de y cuando x= 4 4) Uilice la expresin (14.27) a efecto de obtener un intesvalo de prediccién de 95% para y cuandox = 4, 33. Los datos siguientes provienen del ejrcicio 2 x [3 12 6 2 4M ys 4 55 10 15 4) Estime la desviacion esténdar de J, cuando x ~ 8 >) Oblenga un intervale de 95% de céntianza para el valeresperado de y cuando x ~ 8 16) Estime la desviacin esténdar de un valor individual de y cuando x = 8, @ Obienga un intervalo de predicei6n de 95% para y cuando x = 8. 34, Los datos siguientes corresponden al ejercicio 3 [2 6 9 B y [7 Ww 9 2% 23 ‘Obtenga los intervals de confianza y de predicci6n de 95% cuando x = 12. Explique por qué son diferentes estos dos intervales, Aplicaciones 35. Enel ejetcicio 18, con los datos sobre los promedios de calificaciones x y Ios sueldos mensua- es y se obtuvo la ecuacidn de regresidn estimada j = 1790.5 + S81.Ly 14) Proporcione un incervalo de 95% de confianza pata el susldo medio estudiantes cuyo promedio fue 3.0. b)- Desarrolle un intervalo de 95% de prediccién para cl sueldo medio incial de Joe Helle, ‘un estudkante cuyo promedio fue 4.0 Enel ejercicio 8, can los datos x ~ rango de temperatura *F) y y = preci ($) de 11 sleeping bags fabricados por Bergans of Noway, se abtuvo la ecuacién de regresién 9 = 359.2668 — 5.2772x. Para estos datos ¢ = 37.9372, 42) Obenga una estimacién puntual del precio de un sleeping bag cuyo rango de temperatura 304 30. 1) Desarrolle un intervalo de 95% de confianza para la temperatura global media de todos los sleeping bags cuyo rango de temperatura sea 30, ©) Suponga que Bergans crea un nuevo modelo cuyo rango de temperatura es 30, Obtenga ‘un intervalo de prediccién de 95% para el precio de este nuevo modelo, bs bo. 0 us bo 100, yente se elimina del conjunto de datos, la pendiente cambia a positiva y la interseccién con el je yes menor. Es claro que esta sola observacién tiene mucha més influencia sobre la recta de regiesién estimada que cualquiera otra; el efecto de la eliminacién de cualquiera de las otras jobservaciones sobre la ecuacién de regresién estimada es muy pequetio. Cuando s6lo se tiene una variable independiente, las observaciones influyentes pueden ‘demtificarse mediante un diagrama de dispersiGn. Una observacién de este tipo puede ser aifpt- ca (cuyo valor de y se desvia sustancialmente de la tendencia general), puede ser un valor de x ‘muy alejado de la media (por ejemplo, vea la figura 14.20) 0 tratarse de la combinacién de estos dos Factores (un valor de y algo fuera de la tendencia y un valor de x un poco extreme), Las observaciones influyentes deben examinarse con cuidado, dado el gran efecto que tie- ren sobre la ecuacién de regresin estimada. Lo primero que hay que hacer es verificar que no se haya cometido algtin error al recolectar los datos. Si se cometi6, se cortige y se obtiene una ‘nueva ecuacién de regresién estimada. Sila observacién es vilida, podemos consideramos afor- ‘unados. Tal dato, cuando es correcto, conitibuye a una mejor comprensidn del modelo adecua- oy conduce a una mejor ecuacién de regresin estimada. En la figura 14.20, la presencia dela ‘observaci6n inluyente, si es correcta, llevaréa trata de obtener datos con valores x intermedios que permitan comprender mejor fa relaci6n entre xy y. Las observaciones en las que la variable independiente toma valotes extremos se denomi- ‘nan puntos (datos, observaciones) de gran influencia. La observacién influyeate de la figura 14.20 es un punto de gran influencia, La influencia de una observacién depende de que tan lejos esté el valor de Ia variable independiente de su media. En el caso de una sola variable inde- pendiente, lainfluencia de la observacién i, que se denota h,, se calcula mediante la ecvacién 1433), INFLUENCIA DE LA OBSERVACION (14.33) nm” 3G,- 97 Con base en esta formula, es claro que entre mAs alejada se encuentce x, de su media ¥, ‘mayor serd la influencia de la observacién i ‘Mucho del software para estadistica identifica automticamente los puntos de gran influen- cia como parte de los resultados de regresién estndat Para ilusrar cémo Minitab identifica los puntos de gran influencia, se consideraré el conjunto de datos dela tabla 14.12. sis FIGURA 14.21 Copiulo 14 Regresién lineal simple Diagrama de dispersi6n del conjunto de datos con un punto de gran influencia 11000 Teo) 25004000 wo El software e esercia pera ceca oe clewlor fue permite denifcar as ohservaione inlaents, Agut se analiza la regla fe seleccn que emplea Mina. ‘Al revisar Ia figura 14.21, que es el diagrama de dispessin del conjunto de datos presen- tado en la tabla 14.12, vemos que la observacién 7 (x = 70, y = 100) tiene un valor extreme de-x, Por tanto, es de esperarse que sea identficado como un punto de gran influencia, La in ‘encia de esta observacién se calcula usando la ecuacisn (14.33) como sigue. (10 — 24.286)! _ 261 AS 1 14 a Sqc 7 on En ol caso de la regresin lineal simple, Minitab identifica como observaciones de gran in- fluencia aquellas para las que h, > 6/0 0,99, lo que sea menor. En el conjunto de datos de la tabla 14.12, 6/n = 677 = 0.86. Como hy = 0.94 > 0.86. Minitab identificaré la observacion 7 ‘como una observacién cuyo valor dex tiene una gran influencia, En la figura 14.22 se presenta cl esultado que proporciona Minitab para cl andlisis de regresin de este conjunta de datos. A Ja 7 (x = 70, y = 100) la identifica como una observacién de gran influenciay Ia presenta en ‘una fila especial en la parte inferior de los resultados con una X en el margen derecho, Las observaciones influyentes debido a la interacin de una observacin de gran influencia ¥y de residuales grandes suelen ser dificiles de detectar. Existen procedimientas de diagnéstico {gue toman en cuenta ambos aspectas para determinar si una observacién es influyente, En el capitulo 15 se estudiars uno de estos procedimientas, cl estadistico D de Cook. DEithac Laid ‘Una ver ienificada una ebservacién come poten cialmente inflayente debido a que tiene wn rsicual grande o por ser de gran influencia, su impacto sobre Ta ecuacién de egresin estimada debe ser evaluado, Bn Kibras més avanzados se presentan los métodos de sagnéstico apropiados. ero cuando no se ext fami liarizado con el material més avanzado, un procedi ‘miento sencillo es realizar el andlisis de regresi6n con ¥y sin esa observacién. Este método permite apreciar el impacto que tiene Ia observacién potencialmente infuyente sobre el resultado 149° Andlisis de residvales: cbservacionesatipicas y abservacione iflyyentes 419 FIGURA 14.22 Resultado de Minitab para el conjunto de datos con una observacién de gran influencia ‘The regression equation is y = 127 - 0.425 x Predictor coef SE coef Es P Constant 127.465 2.961 43.04 0.000 x 0.42507 0.08537 -4.46 0.007 S = 4.88282 Req= 79.9% R-egladj} = 75.9% analysis of Variance SOURCE oF ss us F p Regression 1 473,65 473.65 19.87 0.007 Residual Error 5 118.21 23.84 ‘total 6 592.86 unusual Observations obs x y Fit SE Fic Residual st Resid 7 70.0 100.00 97.71 4.73 2.29 1.91 X X denotes an observation whose X value gives it large influence: Métodos +o SS SL CConsidere los datos siguientes para las variables x yy x [3s 10 160120 10145175 M5 100 120 120 130 130 110 42) Caleule los residuals cstandarizados de estos datos. (stosincluyen alguna observacién aipica? Expligue, 1b) Trace una grfica de residlesestandarizados contra Se observa en esta gitica alguna lobservacign aipica? ©) Con estos datos elabore un diagrama de dispersion, (Se aprecia en este diagrama alguna ‘observacin afpiea? En general, qué consecuencias tienen estos ballazgos para laregre- 1 lineal simple? ‘Considere los dates siguientes para las variables x yy ald os 78 2 2 y [2 MW 1S 18 2% 24 19 42) Calcule Joe residuales estandarizados de exos datos. :Ldentifica alguna obssrvacién at pica? Expligue, 1b) Caleule Tos valores de intTuencia pata estos datos, {Parece haber alguna observaci6n in- ‘uyente? Explique. 16) labore un diagrama de dispersfn con estos datos. ;Se advierte alguna observacién at pica? Expligue, 620 PX Jevaluacion| archivo Hydration Copiulo 14 Regresién lineal simple Aplicaciones 32 53 Los datos siguientes muestran los gastos en medios (Media Expenditures) en millones de $ y los ‘emiparques (Shipments) en millones de hariles de 10 importantes marcas (Brand) de cervera Brand Shipments Budweiser 363 Bod Light 207 Miler Lite 159 Coors Light 2 Busch a1 ira Light m1 Miles Genuine Draft 56 Miler High Lite 44 Basch Light a Milwaukee's Best 3 42) Obtenga una ecuacién de represinestimada con estos datos. >) Emplee el anslisis residual para hallar observacionesapicasu observaciones influyentes ‘Resuma brevemente sus hallazgos y conclusiones Los experts en salud recomienvdan que os correderes bean 4 onzas de agua por cada 15 minu: tos que corran, Las personas que corten de es a ocho horas requieren sistemas de hidgatacign {que ee llevan en Ia cintur o sobre La expalda. Es los datos siguientes se proporciona el volumea, en onzas de fiuido (Volume! o7)y el precio (Price) de 26 modelos (Model) de sistemas de Inirataci6n que se Hevan en la eintura o sobre la espalda (Trail Runner Gear Guide, 2003) Volume Price Model (oa) © Eastaw 20 10 astra Pls 20 2 Fitness 20 2 ccess 20 20 ‘Acces Plat Fy 2s Solo 20 25 Serenade 20 35 Solaire 20 35 Gems “0 8 Shadow 66 0 SipSteam 96 © Expres 20 Fy Cighining a 0 Btte 0 0 Extender “0 65 Stinger 2 65 (GelFask Bel 4 20 GuDraw 4 7 (GlFlask Clip-on Holster 4 10 Gulf Hols SS 4 0 Seder (W) 20 30 Walkabout) 230 “0 Soltide LCE. 20 35 Geiaway ECE. 0 55 Profile CE. 6 50 ‘Traverse LE. 6s 0 Resumen 621 54 44) Desattolle una ecuacién de regres estimada para pronosticar el precio de un sistema de hidratacién, dado su velumen de liquide. 1b) Use el anilisis residual para determinar si hay observaciones atipicas w observaciones fnluyentes. Resuma sus hallazgos y conclusiones Ela tabla siguionte se prosentan datos del ingreso (Revenue) anual y el valor (Value) estimada el equipo (Team) en millones de $ para los 32 equipes de la National Football League (sitio web de Forbes, febrero de 2009), Team Revenue ($ millions) Value ¢$ milions) Arizona Cardinals 203 ou Aili Faleone 203 sm Balto Ravens 26 1062 Bulle Bile 206, 85 Carolina Panthers 21 1010 Chicago Beare 226 1058 Cincinnati Bengals 205 on Cleveland Browne 220 1035 Dallas Conboys 29 1612 Denver Broncos 226 1061 Destit Lions 204 317 ‘Gren Bay Packers ais 103 Houston Texans 29 1s Indianapolis Colts 203 1075 Jacksonville aguas 204 $76 Kansas City Chiefs 2a 1018 Miami Dolphins 22 ou Minnesota Vkinge 185, 8 Now Hagland Patiots 22 14 New Orleans Sainte 215 os New York Giante 24 17 New York et 213 1170 Oakland Raiders 205 61 Priladelphia Eagles 231 116 Pisbugh Steelers 216 ois San Diego Charges 20 a8 San Francisco 49ers 201 65 Seale Seahawks 21s 1010 St Louis Rams 206 929 Tampa Bay Buccaneers 24 1053 Tennesice Tans 216 904 Washington Redskins a 1538 4a) Trace un diagrama de dispersin con el ingreso en el eje horizontal y el valor en el eje vertical. Inspeccione el diagram: :paroce que hay observacionesapicasw observaciones inluyentes en os datos? ) Obenga una ecuacién de regresin estimada para predeci el valor de un equipo, dado el valor del ingreso anual, ©) Use el andisis residual para determinar si hay observaciones atfpicas v observaciones ingluyentes. Resuma brevemente su hallazgos y conclusiones. Eneste capitulo se estudié el andlisis de regresin para determinar cémo es larelacin entre una variable dependiente y y una variable independiente x. En la regresin lineal simple, el mode- lode tegresién es y jy-t e+ « La eosin de epesgn lineal simple £0) = Py * Bis describe la relaciGn de la media o valor esperado de y con x. Para obener la ecuacién de regre- sign estimada 3 ), + bx se emplearon datos muestrales y el método de minimos cuadrados. 622 Copiulo 14 Regresién lineal simple En efecto, by y b, sn esadisticos muestales dle para estima los pardmetos desconocids del modelo, py 8, Et cocficiente de dterminaci6n se presents como una medida de la bondad de aust para la ecuaciGn de regres estimada, y se puede interpreta como la proporcign dela vaiiacién cn la variable dependiente y que puede sex expicada por la ecuacién de regresin estimada ‘Asimismo, se revis6 la comrelaci6n conto una medida desriptiva de la ntesidad dela elacion lineal entre dos variables. ‘Se analizaon los supuestos acerca del modelo de regresi6n y su correspondiente témi- no de errr, y se presentaron las pruchas 'y F,basadas en esos supuests, como un medio para leterminas a atelacion entre dos vasiables es etadaticamentesigaifcativa, Se most emo ‘usar la eouaciGn de regresion estinada para obtener estimaciones de inervalos de confianza para el valor medio de y y estimaciones por meio de intervalos de predicciGn para valores individuals dey El capitulo concluyé con una sccin sobre soluciones por computadora de los problemas de regesion y dos secciones sobre el uso del andliss residual para valdar lot supuestos del ‘model eidefiar las obsevaciones apicas e influyeates. “Analisis residual Andisis de los esidvales que se usa para doterminar si parecen ser valides los supuestas planteadas acerca del modelo de regeesién. También se uiliza para ideatiticar ‘bservacionesatpicas y observaciones influyenes Coeficiente de coreelacin Medida de Ia intensidad de la relacién inal entre dos variables (ya estudiado en el capitulo 3) Coeficiente de determinacién Medida de Ia bondad de ajuste de la ecvacign de regresion stimada, Se interpreta como la proporcin de Ia varibiidad de la variable dependiente y que cs explicada por la ecuscin de regresién esimada Diagrama de dispersién Grfica de datos bivariados en la que la variable independiente se ubica en el ej horizontal y la variable dependiente ene ee vertical Eeuacién de regresién cvacién que describe cémo estérelacionada la media o valor es- perado dela variable dependiente con Is variable independiente; en la regresign lines simple, 20) = Bo + Bix Ecuacin de regresin estimacla Estimaci6n de la ecuacién de regresinobtenda a pani de datos muestalesempleando el método de minimos cuadrados. En la regresin lineal simple, la ecuacidn de regresin estimada es 5 = by + by Error cuadrado medio EstimaciOn insespada de Ia vaianza del término del eror 0% Se denota como ECM 0 s*. Error estindar deestimacién Rafa cuaérada del error uadrado medio; se denota como s. Es ‘aa esimacin deo, la desviacignestindar del tri del enor « Grafica de probabilidad normal Grética en la que ls residues estandarizados se grafican conte los puntos normale, Ayuda a determinar ai parece sr vlido el supuesto de que los tr- ‘minos del error tienen una distsbucign de probabilidad normal Grafica de residuales Representacin grtica de los residuales. Se usa para determinar si parecen ser vélidos os supuestosplanteados acerca del modelo de regesion Intervalo de confianza Bstimaci6n por intervalo del valor medio dey para un valor dado de x Inlervalo de prediccién Estimacién por intervalo de un solo valor de y para un valor dado dex ‘Método de minimos cuadados Procedimiento para obtener a eovacin de regresién estima. 4a, El objetivo es minimizar By, — 5)? “Modelo de regresin ewacin que describe cémo estén relacionadas yy x, ms un témino del error. En la egresién inal simple, el modelo de regresién es y= By + fx + € ‘Observacidn atipica Dato w observacén gue no sigue la tendencia del reso de los datos. ‘Observacién inluyente Observacién que ene una fuerte induenciao efecto en los resulta dos de rogresion. Férmulas dave 623 Puntos de gran influencia Observaciones en las que la variable independiente presenta va lores extremos. Regresién lineal simple Andliss de regresién en el que participan una variable independien- {ey una variable dependient, y la relacién ente estas variables se aproxima mediante una linea recta, Residual estandarizado Valor obtenido al dividie un residual entre su desviacign estindae Residual iésimo Diferencia que existe ene el valor observado de la variable dependiente y el valor pronosticado empleando la ecuacidn de egresin estimade; para la observaci6n iésima, cl residual ifsimo es y, — 5, Tabla de ANOVA En el andlisis de varianza, tabla que se sa para resumir los edleulos asocia- dos con la prueba F de significancia Variable dependiente Variable que se predice o explica. Se denota por y ‘Variable independiente Variable que predice o explica. Se denota por x Modelo de regresién lineal simple = hat yw te a1) Eeuas n de regresién lineal simple BO) = Bo + Bx (14.2) Eeuacién de regresin lineal simple estimada by + yx (14.3) Criterio de minimos cuadrados min By — 5) 14s) Pendiente ¢ interseccidn con el ejey de la ecuacién de regresin estimada 2Qi= D-H 5, - 2B (14.6) a7 Suma de cundrados deide al error se = 2G, (14.8) Suma total de cuadrados sre = 3, - 5) (149) Suma de cundrados debido aa rgresiin scr = 30, - 5) (14.10) Relacin entre st, SCR y SCE sre = sex + scx (aa) (Coeficiente de determinacién a (14.12) st 624 Copiulo 14 Regresién lineal simple Coeficiente de correlacién muestral ino deb, Venetians Be Ukeainaioa (sgno de bv Error cuadrado medio (estima Error estindar de estimacin, Desviacién esténdar deb, Desviacién esténdar: Estadistico de prueba t A Cundrado medio de a regresn sen com = —____Sch___ inimero de variables independientes Estadistico de prucha F pee Beat Desviacin estindarestimada de j, ea 1 &=s + 8 NA Sa oF Intervalo de confianza para E(y,) 5p tanh, Desviacin esténdar estimada para un solo valor (14.13) 4.15) (14.16) (14.17) (14.18) (14.19) (14.20) (14.21) (14.23) (14.24) (14.26) (14.27) Eercicios complementaios 625 Residual de la observacién / (14.28) Desviacién estindar del residual ésimo 25 =5NT (14.30) Residual estandarizado de la observacién i woh (14.32) Influencia dela observaci6n i (14.33) Eatin ee 55. (Un valor alto de? implica que entre las dos variables hay una relacién de cause y efecto? Expligue 56. Deseribe la diferencia entre estimacién por intervalo del valor medio de las y para un valor dado de xy estimacign porintervalo de un valor dey para una x dada 57. {Qué objeto tiene probar si 8, ~ 07 Si se rechaza que f, ~ 0, cso significa un buen ajuste? 58 En a tabla siguiente se proporciona el mimero de acciones en venta (Shares Selling) en millo- res y el precio esperado (Expected Price), es decir, el promedio del precio minimo y de precio mximo proyectado, de 10 acciones de oferta publica inicil (P0, por sus siglas en inglés) Shares Expected Company Selling (millions) Price ($) American Physician so 15 ‘Apex Silver Mines 30 ir Dan River 67 15 Franchise Mortgage 335 7 Gene Logie 30 Ibemational Home Foods 6 1» Per Groop 46 8 Rayovac 6 ir RealNetworks 30 10 Software Ac Systeme Dw a 44) Obtenga la ecuacién de regresinestimada donde la cantidad de acciones en venta se vatiable independiente y el precio esperado sea la variable dependinte b) Empleando 0.05 como nivel de sigificancia, existe una rlacin significativa ene las dos variables? ©) dLaecuacidin de regresion estimada proporeions un buen ajuste? Explique 4) Bmpleando la ecuacién de regresin estimada, determine el precio esperado en una em- presa que considera una oferta pica incial de 6 millones de acciones 59. Los datos siguientes muestran Ia estimacién del valor justo (Pair Value) de Morningstar y precio por accién (Share Price) de 28 empresas (Company). EI valor justo es una estimaci6n el valor de una empresa por accién que considera pronésticos de crecimiento, restabilidad, riesgo y otras factores de las compahias para los préximas cinco alos (Morningstar Stocks 500, edicién 2008), 626 Copiulo 14 Regresién lineal simple 60, Company Jue (S) Share Price (8) ic Products and Chemicale Pa ona Allied Waste Indarnes 1 02 ‘America Mobile 8 6139 AT&T as 4156 Banke of America 0 4126 Barclays ruc os 4037 isgroup 38 reas Costco Wholesale Corp 8 16 Covidien, Li. se 4429 Darden Restaran 3 am Dan & Bradstreet " sass gui 2 3636 Gann Co, a8 3900 (Genuine Pats 4 4530 GiaxoSiithKhine exe 7 5039 ron Mountain 3 3702 rr Corporation 8 65.08 Johnson & Johnson 0 65.70 Las Vegas Sande 98 10305 Macrovision 2 1433 MazrioIneretonal 9 sus Naleo Holding Company 8 ras National terse 2s mao Portugal Telecom 15 102 Qualcomm 4 5925 Royal Dutch Shell Lid " e420 SanDisk ca 3317 Tine Wamer 2 21.60 42) Obtenga una ecuacién de regresién estimada para ealcuar el precio por acciin dado el valor juste. 1b) Empleando 0.05 como nivel de sigiticanc ‘dos variables? (0) Utlice la ecuacin de regresinestimada para calcuarel precio por accn de una empre- s que tiene un valor justo de $50. 4d) {Cree que la ecuacién de regresin etimada proper por acca? Emplee para justifcar su respuesta {existe una relaciénsignificativa entre ne una buena predieci6n del precio ‘Uno de los mis grandes cambios en educacién superior de los ais recientes ha sido el ere cimiento de las univesidades en linea, La Online Education Database es una organizacién independiente cuya misin es consrui una lista amplia de las universidades en linea més acre sitadas. La tabla siguiente muestra los prcentajs () de la tata de retencién (Retention Rete) y atasa de graduacién (Graduation Rate) de 29 universidades (College) en linea (sitio web de Online Egucation Database, enero de 2008), Retention Graduation College Rate (%) Rate (%) Western International Univesity 1 2s South University 31 2s Universiy of Phoenix 4 Ps American lteConinental University » 2 Franklin University 3 3 erty University a 33 ‘ontineétu Ejercicioe complementaios 627 61 Retention Graduation College Rate (%) Rate (%) ‘ifn Usiversiyy o u Post University 6 % Peirce College co 36 vera Universy a 36 Upper lowa Universi o 6 Dickinson State University 6 ” ‘Wester Governors University B a Kaplan Universyy 1 38 Sete International University st » Aakford Univesity 46 4 171 Teebical nstine 8 “4 eskeley College st 4 Grand Canyon University “ 46 [Nova Southeastern University « a7 ‘Westwood Colege a « iverglades University 3 50 Likety Univerity B st LeToumesu University on 2 Rasmussen College 4 53 Keiser University 95 55 Herzing College 6s %6 Nationa University 100 s7 loréa National College 100 6 12) Trace of diagrama de dispersién con la tasa de retencién como variable independiente Qu indica el diagram respecto dela relacién ene las dos variables? b)- Obtenga la ecuacién de regresién estimada (©) Prucbe la signficancia de a relaci6n, Use a = 0.0. GLa ecuacién de regresién estimada proporciona un buen ajuste? Explique 1) Suponga que usted es el ector de South University. Luego de reviear los resultados, es ‘aria usted preaeupado por el desempefio de su insituciGn comparada con otras universi- ades en linea? A) Ahora suponga que es el rector dela Universidad de Phoenix, Lugo de revisar ls resu- {ados, jestarfa usted preocupado por el desempetio de su instueién comparada con otras suniversidades en Kinea? Jensen Tite & Auto est enel proceso de decidir si firma un contrato de mantenimiento para su ‘nueva miuina de alineacién y balanceo de neumitices por computadora. Las gerentespicnsan ‘que los gastos de mantenimiento debersn estar relacionados con el uso, y recabaton los datos siguientes acerca del uso semanal en horas (Weekly Usage/hours) y los gastos de mantenimien- to anuales (Annual Maintenance Expense) en cientos de dares Weekly Usage Annual hours) Maintenance Expense 18 110 10 20 2» 300 En 370 n 470 n 305 py mas a 390 40 sis ” 400 628 Copiulo 14 Regresién lineal simple 6 4a) Obtengs la ecuacbn de regresin estimada qu relaciona gastos anvales de mantenimiento ‘con el uso semana, 1b) Prucbe la significancia de larelacién de! inciso a) con 0.05 como nivel de signiticancia, 6) Jensen espera user La nueva méquina 30 horas ala semana, Obtenga un incervalo de pre: diccign de 95% para los gastos anuales de manlenimiento de la empress. 44) Siel precio del contrato de mantenimiento es por $3000 anvales,jrecomendaria frmarlo? Per que? En un determinado procesa de manufactura, se cree que la velocidad (pies por minuto) dela linea de ensamble afecta el aimero de pares defectuosashalladas en el proceso de inspecciéa, Para probar esto os gerentes han ideado un procedimiento en el que la misma cantidad de par tes por lote se examina visualmente a diferentes velocidades de la Kea, Se obienen los datos siguientes. Naimero de partes ‘Velocidad de a Kinea_defectuosas encontradas 20 a 20 9 0 15 20 16 ry 4 0 ” » 6n de egresiGn estimada que relaciona la velocidad dela linea de pro duccién con el nimero de partes defectucsas encontradas ») Empleando el nivel de sgnificancia 0,05, determine sila velocidad de la linea y el nimero de partes defectuosasestin relacionados ©) dLaccuavin de egresign estimada proporciona un buen ajste aos datos? 4) Obtenge un intervalo de confianza de 95% para predeci el nsimero medio de panes de ‘ectuosas sil velocidad de Ia linea es de 50 pies por minuto, Un hospital de una ciudad grande conteaté aun sociéloge para que investiga a relaién entre el nimero de das de ausencia (Number of Days Absent) sn autorizacién de los empleados por fo y la distancia en millas entre su casa y el abajo (Distance to Work/miles). Se tomé una riuesra de 10 empleados y se obuvieron los datas siguientes. Distance to Work (miles) Number of Days Absent 1 s 3 5 4 8 6 7 s 6 10 3 2 5 1% 2 4 4 18 2 42) Blabore un diagrama de dispersién con estos datos. ;Aparenta ser razonable una relaciéa lineal? Explique. B) Obienge la ecvacién de regresin estimada por minimos evadrades. (©) {Ebxiste una rlacin significatva entre las das variables? Use t= 0.05, 4) {La ecuaci6n de regresin estimada proporciona un buen ajuste? Expligue €) Utlice la ecuacién de regres estimada obtenida en el incso 6) para calcular un inter valo de confianza de 95% para el nimero esperada de dias de ausencia de los empleados ‘que viven a S milla de Ia empeesa Ejercicioe complementaios 629 64 65 a autoridad de trénsito Toc de una zona metropolitana importante desea determinar si hay relacién enre la antigdedad de un autobis (Age of Bus/years) ylos gastos anuaes deivados de su mantenimiento (Maintenance Cost). Bn una muestra de 10 autebuses se btuvieron los datos siguientes. ‘Age of Bus (years) Maintenance Cost $) 350 370 480 5x0 500 550 750 790 950 44) Con el método de minimos cuadrados, obtenga la ecuacién de regresién estimada, )- Realice una prueba para delerminar slat dos variables esta relacionadas de manera sig- nificativa con a = 0.0, ©) dLarecta de mimos cuadrados proporciona un buen ajuste a Tos datos observados? Fx- pligue. 4) Calcule un intervalo de prediccién de 95% para los gastos de mantenimiento de un deter sminado autobds cuya anigiedad es de 4 aos. Un profesor de marketing del Givens College desea saber cudl es la relacién entre las horas \destinadas al estudio (Hours Spent Studying) y la calificacién ganada (Total Points Earned) cenun curso. A continuacién se presentan Ios datos obtenides de 10 estudiantes que tomaron el curso el itimesire pasado, Hours ‘Total Spent Studying Points Farned 4s 40 30 35 50 8 © 5 105, °0 65 50 90 0 0 0 55 4s 6 6 42) Obenga la ecuacién de regresin estimada que indice la relacign entee la calficaién ‘obienida y las horas dedicadas al esto, ) Empleando « = 0.05, pruebe la sigificancia del modelo. 6) Pronostique la eaifcacién total que obtendré Mark Sweeney, quien dedicé 95 hor estudio, 4) Caloule un intervalo de prodiccién de 95% para la cliicacién de Mark Sweeney. Reuters report que la beta del mercado de Xerox era de 1.22 (sito web de Reuters, 30 de enero de 2009), La eta del mercado de cad aceién se determina mediante regresia lineal simple En cada caso, Ia variable dependiente es la rentabilidad porcentual trimestal (tevalorizacién el capital més dividendos), menos el rendimiento porcentual que se hubiera abtenido en una inversin libre de viesgo (como tas libre de riesgo se us6 la Treasury Bill). La variable inde- pendlente es la rentabilidad poreentualtrimestral para el mercado de valores (S&P 500), menos Ja rentabilidad porcenseal de una inversiGn libre de riesgo. A partir de loe datos trimesrales se desarola la ecuacién de regresin estimaa,y la beta del mercado dela accién en cuestién +a pendiente de esta ecuacién (b,). El valor de la beta del mercado sueleinterpretarse como 630 Errore) iRsauait Copiulo 14 Regresién lineal simple on, ‘una medida del riesgo asociado con la acen buts ia beta det mercado es mayor de 1, 1a volailidad dela accidn es mayoral promedio ene! mercado; ies menor de I, la volailidad de la accin es menor promedio en el mercado, Suponga que las ciftas siguientes son diferen clas entre rentablidad porcentualy renabiidad libre de riesgo af largo de 10 eimestaes para S&P 500 y Horizon Technology » » 8 a » » 2 -25 =30 20 50 12 30 -10 os 25 S&P 500 -20 55 47 18 41 26 20 m3 55 ‘Obtengs la ecuacié de regresién estimada que sirve para determinar la beta del mercado de Horizon Techaology. {Cual es la Beta del meread de esta empresa? [Empleando 0.05 como nivel de significancia, pracbe la significancia de la relacién {La ecuacién de represinestimada proporciona un buen ajute? Explique, ‘Utlice las betas del mercado de Xerox y de Horizon Techology para comparar los riesgos socials con estas dos acciones ‘La Transactional Records Access Clearinghouse de la Universidad de Syracuse publica datos {que muestan las probablidades de una auiterfa del Departamento del Tesoro de Estados Uni dos. En la tabla siguiente se muestra la media del ingreso brutoajustado (Adjusted Gross In ‘come) y el porcentaje de declaraciones que fueron auditadas (Percent Auuited) en 20 distrites. District Los Angeles ‘Steramento Alta Rie Dallas Providence San Jose (Cheyense Fago New Orleans Oklahoma City Houston Poriand Phoenix Agusta ‘Abuguergue Greesboro Columbia Nase Bato Adjusted Gross Income ($) 6668 aes 3845 usa 3581 35985, 37788 nee s0sis a0174 30060 37188 sos 33251 31508 29199 ssorz aosso 32506 31296 Percent Audited 13 1 a u 10 10 a8 os os a9 os os ca 07 na a6 08 os os os ‘Obtenge la ecuacién de regresin estimada que sirve para pronosticar el porceniaje de auditoras dado el promedio del ingreso brato ajustad report ‘Empleando como nivel de signifcancia 0.05, determine si hay relaciG entre el ingreso ‘bruto ajustado y el porcentaje de auditoras {La ecuacign de egresin estimada proporciona un buen ajuste? Explique, Jobset Caso a resolver 1 Caso @ resolver 1 Madicin del riesgo en el mercado burst 431 Con a ecuacién de regeesiéa estimada del inciso a) caleule un intervalo de 95% de con- fianza para el porcentaje esperado de auditorfas en un distrito donde el promedio del ingreso brato sjustada es $350000. 68 El State of the Service Report 2002-2003, de la Comisién de Servicio Piblico de Australia, reportéevaluaciones sobre la satisfaccién labora. Una parte la encuestaconsitia en elegir (de ‘una lista) los cinco factores principales que contibuyen ala satisfaccién laboral. Después se solicit aloe encuestados que indicaran su nivel de satistaccién com cada uno de esos cinco factores. En a tabla siguiente se presentan los porcentajes de personas para los que el factor indicado fue uno de los cinco principales, junto con una evaluacién obtenida wilizando el por centaje de empleados que consideré el factor camo uno de los cinco principales y que estaban “muy satiafechos” o “tatisfechox” con éste en su actual lugar de teabajo (www apse. gov.au/ staeoftheservice). Workplace Facor indica el factor de satisfaccin laboral, Top Five lista los cinco valores principales y Satisfaction Rating indic la evaluacién de Ia satisaccién, Satisfaction Workplace Factor ‘Top Five (‘%) ‘Rating (%) Carga de wabao apropiada x0 ~ (Oporunided de ser ceaivainovador Er 6 COporunidad para acer contibucones les ala sociedad 40 o Derechoslexpectativasclaras 40 6 Sistemas de tahaoflexibles 8 ws Buenas elaciones de abso ca 35 Trabajo interesante constant rs % (Oporunide para éeserllame en mi caeca 3 a COporunidad para desarllar mis habildades 4 6 Condiciones para uilza mis eapacidades 50 7 Retralimentacin regulareconoimient al esverzo 2 33 Salto a7 @ eros resstads tangibles demi trabajo 2 8 42) labore un diagrama de dispersin colocando en el eje horizontal los cinco Factores prin- cipales (%) y en el eje vertical el nivel de satisfacién (%). 1) {Qué indica el diagrama elaborado en el inciso a) respecto de la relaci6n entre las dos variables? 6) Obtenga la ecuacién de reresiénestimada que siva para pronostcar el nivel de stisfac- cid (%) dados los cinco factores principales (%). 4) Empleando como nivel de signficancia 0105, realice una prueba para determinar Ia sig- nificancia de la relaci, 2) gLa ecuaciGn de regresién estimada proporciona un buen ajuste? Explique A) {Cuil es el valor del coeticiente de cortelacién mvestral? Medicion del riesgo en el mercado bursatil ‘Una medida del riesgo o volatlidad de una accién bursétil es la desviaciGn esténdar del ren- sdimiento total (revalorizacién del capital més dividendos) durante vatios periodos, Aunque la sdesviacién estindar es fécil de calcula, no considera la variacién del precio de una accién en funcién de un indice estindar de! mercado, come el S&P 500, Por esta razén, muchos analistas financieros prefieren emplear otta medida, conocida come bera, para medir el riesgo. Labeta de una accién individual se determina mediante regresién lineal simple. La variable dependiente es la rentabilidad total de la acci6n de que se trate y la variable independiente es 1a rentabilidad total del mercado de valotes.* En este caso a resolver se tilizaré el indice S&P * Disnas entesenpleon dfrensméledos pore clea es bates. Por eer, eras eres, anes de cell ‘cvein de repre ema, reson dear varias tro dependent come indapendne lo veri ded qv por

También podría gustarte