Está en la página 1de 38
SISAINIS WwOLid [es 0 2p oroyurensod 3h -2h Andlisis de datos en ciencias sociales y de la salud II Antonio Pardo ¢ Rafael San Martin e m = 2 o $ 42 Anat dats. 1) 4. 1Qué modelo de ANOVA debe tsa pra enlizr estos datas? 1 Genmsoeale suit efi? Valor el efeto dl for recur, el del ctor hago ye deinen recuerdo: 4 Engué momentos (oda semana) pus afimarse uel mero medio de res Secamet en codiiones de econocimient direc que se orc en concn csv. Analisis de regresion lineal 494 Anais dodo (ol igo mds en los diferentes aspect 98), Montgomery, Peck y Vining (2 imple site pra estudir el comportamient de una v= va Y,denominada dependione o respuesta, a parir de une segunda tive ocategirica X, denominada independiente opredictona SiN, por iat a dependenca ere cos iables: permite estudiar edme earbia is es dole: (1) valoraren que Capt 10, Ans rapes ieal 415 niente permite explicarel comportamiento ele dependent dependiente. Todo ello partic del prado derelacion ables. tos de una mvestea de 20 pacientes can rastore de- 416. Asta cts ft) La variable recuperac ies las basles (los datos se eneueriran en ‘om reducido, en pagina web del manual). Tabla 10.1 depresin ham Diagramas de dispersion ‘La forma més rdpids de formarse una primera impresén sobre el tipo de rela. lente entre dos veriables cuit nl tampoco acl fer el comportamient de a otra. Un i no permite precisa sel grado de relic lineal subyecene o> {Qué poder hacer para mejorar nuetcacomprersin de una mube de puntos? (Quid basaria con deci, simple scornpaadss de mayor (menor) recuperacin;o que las ed lias enden air ecompafiaes de menor (mayor) reeupeacion, Pero esto, argue 5 poco prevsn. También podria ofrecer listado de todos ls datos pero Record Cop 1. Anis ers ne! 417 no una pat nel, 2) cent: stadosaprenderemos a resumir a ube de puntos en un rosa y 8 valorat en toro a ella (aspects que consituyen Ia esen- ‘itn gore a La recta de regresién Cuando a relacn ere dos: nc de puntos puede resumirse mediante una funcin an simple como un (ANG Andisis de datos (vot. A) Figura 102. Recon do reyes con dears oigone y pendants Tague mejor se ajusiz aa ube sci ideal on la qu odos los puntos del diagram de dispersion extu- ‘Nohara que preocuparse por encontrar la recta gue grams porque simplemente uiendo los punto ene, juste posible’. Peroen aubes de put Minimos cuadrados Pa lag ame recap icant er Rosen 1967,peocldcmmyorseepacnes el qvescbrsenlssm lscnctonbe ee sehignesptyt mar yr emepienivind swoon ee icc ern eects inn eta ae ius pons) cams ns ea sna sone pee Cop 10. Ants dagen ead 419 Figura 103. Resduos o rors do prado on un ans deren ina simple Coeficientes de regresién Los valores que minimize dervadasparcialesrespect a F-ak BL = Sol St covaines etree Y). De tol recta ue posible d ‘mo una especie de tino corrector pata ajstr la metricad ‘atable¥), peo no sporta informacion soe Ia relaién ente.XeY. 420. Ani sto Fgura 104, Recosdrogresén.Signteao des cofcetes By 8 fa y endente; diagrama dela zquietds, el velo de ompaado de un aumento 6 0,585 puntos en. recuperactdn, peto si que, ene cnjunto de pacientes cuya puntwacton Beles 'un punto mayor, espera una recuperacién media 0,385 puntos mayor, Capt 10. Anse soepsen red 424 Figura 105. Rosas de eres bsodas oer de mines cusdados | ecuacion de repesionprono sumenta de 0,675 dsviacionestipicas en recuperacion. Bondad de ajuste ‘Aumaceptando que larecta de regresion ube de punts dad, el grado de jute de esa rect recta de re stncas vercaes queyahemos identifica como residuos de predieién: B= mando delo bien o mal (bonded de ajuste) que fa recta de epresin consigue resumir Ta nube de puntos. Figura 106. Roses de ogres on distin gato de use a lanbe d pron lee ero sabemos que poor ajuse posible sed cuando ls v ‘mente independiente, es devi, cuando la recta de regres es horizontal (pendiene Capt 1, Arti co ogo eal 423. ‘ula ver Figura 10.6, grfico de Ia derocha). Y ena solamente cure cuando tds os ‘alo porgue, de predicion) evando, unc de egresion, Esta reduccindebida a la regresin puede arian) que permitencuantii de una mabe de puntos. En as medi! sla varianza de los residues 0 ervores de prediccién. Se bas en las Y,, es devtsen la cispersin de a nue de puns en ern aa recta de 424 doped cts het) Copa 10 Ani depres neal 425 ‘doen ugar de realizar prondsticosbasades en F se realzanprontsticos basados en la recta de rogrsi, ‘Uns seni transformaciones (ver Ams, ‘ue la proporsién de roporcién de varianzacomiin (vrianza expicnda) estin estechamente eiscen ches ] ‘on el coeicionte 6 correlecién de Pearson, Ry Eo concrete: 7 79811742 = 046 que ln ecta e egresion de Y sobre X permite redu- de prediceidn en un 46% y, en segundo In oH va Yes lerprcarse como proporeiin de va- mola propecidn de vrianza que compart Proporcin de la varanza de que pusde explicate entender an is ede determinacién R3, tomas iéncomo vaeresmuesrales. Pero, eal perfect), juste es iar come estimadores de sus co pore la el ariable X'no contibuyeenabeolseo de LH 17, Desviesones en un dana de dein ol etait 0.13 br fecal in, move ro pea ele’ esa sone 428 Aniisis ds detos (volt) ‘Cuando sedan cies condiciones (ver, mis aba de regresién), ambos estas 4e Student con n= 2 grados | apartado Supuesio del modelo fea que-X¢ Yao et sno quero sea podido demos quel : de valores Xo bastante amplio, puede que los erroces de med nocultando ubyacente, puede que se etéuiliando un eos p com en ade Bet intervniondo el error eusdriticn Sia oas} Esta media cand rade Y asociada i y epeesent tcando la ecuaclin de regresion, En nuestro ejemplo sobre la relacin demos recharar H,: 8, =O conelurquelapendientspoblacional es ditnn dco Cop 10. Anis do esi fea! 427 que ete las puntactonesbasalesy la recuperacién existe ‘n~2 gradosde libertad. Y,en eresinsimple, coincide con el cundredo dele Ty, dingo en " Intervalos de confianza 7d primer volume loserore tips izarse para constuirintervale deconflanza xls valores pbloals eos coef deren tc rr ejemplo, el intervalo de confianza para la pendiente de la recta de regresion poblaciona, fi, puede cbtenese mediante esto ejemplo sobre I relacién entre la receperaciény las pur Aplicada a i ‘obtenemos, eon a ~ 0,05, ‘uacioner baal IG, = 5 ste imervalo 428 prt date) Cémo efectuar pronésticos Sila peiene de la recta de reresi decir, shXe Y estin linealmente rae do pro hay que valrarloen cas contexo),entonces la ecuacin de represion od saa realizar prondsticos, in deregresin podria uilizarse para pronostcar fa f del que nicamente se concee ss puntuacion basal rondstco que ofrece epresion puede interpretaee de Enambos casos se obtiene el mine prodt lmerprete de una w otra nos ue ls pu En concreio (ver, po ejemplo, Weisberg, 2 018), 9] enlncantidad MC, Poe tant, iv ire es mayor quelavarianza de los A past de Jas ecuaciones [10.18] y [10.19] ex posible construe intervals de confianza mediante, 10.29) 021 ;psuando se construyen intervals de cone specifier con qué tipo dep ‘Eamuesro ejemplo sobre a relacién entree recuperaciny as puntuaciones basae 0.1) tenemos MC, = 9.99, E(x, - X= dai 20 y X= 28.20. ¥ el Prondtico que offece la ecuacin de regres pars el primer sujetaeuya puvasion gi vin ds ns lavas de leds Yes on Fade Cae 10, Ani ce ers nea! 429 18 +0,385(25)= 7,49. Aplcando aeste pronéstio las ecu cml ; [En este aparado vamos a extdiar dtm extender lo que hemos aprendd sobre el and- fe egresin lineal con une variable independiente (regresin simple) al caso dz ne varias ventas. Eo ian one! dmbito de ls ciencas les independients en una ecuacién de regre- coeeientesderegresién, aun no sicndo eon , mis importante, los elleulos que es neesario La ecuacién de regresién Al pretetr anki de reyes sinpe mos st ue un age de dpi sina era manera de formar uns rnin sol pode elo teisene dr vaso Capita 10, Ans do ares neat 431 ‘un diagram de dispersion resulta poco iuitvo y, por tanto, poco dil. Y con mis de ‘dos variables independiente, larepeesenacin asi no resulta posible a pest de que ura ecuacién de repre simplicidad de au expresin algsbraica Pe ae aX tS T8, 11022) En una ecuacin de estas carcterstias, los prondsticos ? se obtieach combinando amano) las p variables independiente), cada una de lls ica) con un coefilene de reprsion que representa el consiguen inimiza a suma de los residual cuadrado Cocficientes de regresién igo cuando a ecuscidn de regresiénincluye més ificado dels coeficientes de represion sigue ‘origen 0 inerseccin, Condos vriabls in ete! punto en el queel plano de regresién oma el eje comespondiente derresion cvando tos 432 Andes co dts.) 1 eso de variables, la correspondiente, aumenta una nidad. As, por sjemplo, 2, ‘eprerena la cantded que la ecuacién estima que eambia ¥ euando, pennanecichd, ‘constates el resto de variables, aumenta une wid variables edad y uo a nuestro ejemplo sobre la relacidn entre Ja (ver Tabla 10.1), la councin de egresion que uadrado es peracid ls puntuaciones Prontstio(recuperacdn)=-8,88+0,40(basal)~0.01(edad)*495(t0) (10.231 Por tanto, para una edad y un to dados, un aumento de un punto en las puntuaciones basales representa un sumento de O40 puntos 8, ~ 040). Para una purmotén basal yu de represion depende, els correspondiente variable independiente; por able edad se hublera meio en meses, se hari obenido un coef igual Cope 1, Anti drogen last 433 ites; (variables 1,2, 4/Tosprndsticos P que se devivan dela ccuscign de regzesién Bran” Ret De esta dfinicibn se deduce que 2, 44 srt ceca ct 1 fst nw 435 lcién encontrada eto n0 estaditicmeats ‘mayor de lo qu cari especa simplement ‘szar mesa ede respondese contastando la hit Riga.) = StS (027) 2p) Puede interpreta, al igual que Rien reresion simple, como propercion de veduccin de lo errors de predict (etacon ‘roporcn de varianza conn oexpieada (x sgado de su corespon- imaclonesinfladss) Este sesgo de ‘ependienis (p),y del nimero de casos (x). Cuanto rnimero de variables, mayor es el sesgo" iguient eorreein: yr que el cuantil 100 En nuesto ejemplo hemos 1025) f= @0-3-DOP . 2095 Ennutsr compl sobr presivo hemos obtenido ‘ue es un valor Iigeramer 436. Anus ots ft 1) i {es palates, A pesar de que la edad ent si ‘que Is corespondiente contrib no rechazo indica que lacorespondients, puede loque los cox 1032) 033) tn de Student con np 1 valor abseluto de Ty es ents deregresiin son coeficien- ramente relacionadas com la rec Capi 10. Aso mgrosin et 37 pera (Ry = ~0,58, p= 0,007), esta relacion se desvanece cuando enran en juego Los erore tpicosSy (ver nota pe de pi decoiianzasiguiendo le msm Importancia relativa de las variables "No existe una nica forma de valorr la importanciao peso rlative de una variable 438 Anis do tes 1) ron briny eae ect el efecto atribuble ico y ens do de sin ep Capo 10 Ani dope ines! 439 @ una eevacidn que ya cation lv también puede 03s) ese cot 11036) ‘oafcientes de corclacin semipacil entre 4os independients valen 0,438 para basal y ccuncion de 440, sna tof Variables independientes categéricas Una variable con J eategorias puede =1 variables dicotmicss. A exes vas 8 cenro_A (con codigo | para el conto A YC)y centro_B eon cigol paral cer By ebdigo para ‘atables cemro_Ay centro do con el eédigo | ence con el edi O en centro_Ay el cdigo centro C, eon el ebdigo O tanto en cenro_A como en centro B, No variable par identificr el centr C Prondstico(recuperaciin) = 8,25 + 52(ceniro_A) +025 (centro_B) 0 les pacientes del cenro A en comparacin ferencin de 5,42 punto e signifeativamente di 92845 p= Y el coeficienteassiado« centro_6 (0,25) esl eeuperacionextinda para fos del cero B en comparacién con la de los pacientes del centro (eta iferens 25 puntos noes signi 359 = 0,897), Por ant, del centro A (eenro sels 8254542 = to B (cen 0.25 8,50 (centro_A=0,entro_B=0) ul noe ora cose que la reeuperaciin maa deca contr, Copal 10. Aris oer tinal 441 Por upuesto, si seafaden nuevas variables ho (es deci, cenro_A = 0, cen 063 25,38) = rminto estan Regresién jerdrquica 0 por pasos tos apartaos previos hemos esumnido en todo momento que la dcisin de qué va 442 Aisi 82 dos (vo) rile cuyo coeiclente de 5 sungue de forest, so que cen sills pr pat ese erin ne pra eneplda etcnon ac también es posible proceder al revés, es a smenterelevantes (ver Henderson y Deni usin de oda esta problemi) se obtiene con p~ 1 variables (Ra, Independiente cuye contribucin al Bobal so ets Capo 10. Anse ooagrstin neat 443 En ald, Rg, et candad del cetcemte de consacién somparil epantse variable cay incoporacion oclimincion vest vee de Aga, pro ebleces contro ais teil de ques valor pols sedi basco ‘Métodos para selecctonar variables les que finalmentefrmartn parte de uns ecuncion de rere sin puede proceders de diferentes formas: 4a detante orvord). Se comienza con ecuacign qe tniamente inluye la mer pas te elige, entre las variables que superan el eiteio Ko correlaiona (en valor abeolto) on la variable depen- | 44 poss dtr. opi 10, Asse de egostn moat 445 | siempre en orden inverse tamato de Raya, climincion de variables se detiene cuando todas las de seleccien, 3, Pato sucesivosatpwise. Este metodo es una mezia de los metodos hacia delante _Yhacia nis. Se comienza, al igual queenel métods hacia delane, con ecuscion Supuestos del modelo de regresién lineal Cada vez que inecrpora sleecionadas hasta ese momento son, lede las yaselecionadas de de cumplitel rt de se i esuncién El proceso se detiene cuando no quedan vera. sci que superen el eitero de seleccin y toda las vari én por pasos puede i incorpoarse 0 es utiliza para canal loque completo de variables que se desea orden en el que se incorporan as eregesion aplicando tna ‘loracion que se hace de la contribucién al ajusteglobl del variable que se incorpo, ra la cuncion se bas en as variable te selecionaas, ro en In variables cin inal MAB Anais te dies oH tuna eovcién lineal sila elaci6nsubyacente entre las dos partes de a eeuacion no es Tinea. acionsubysce ‘eal importante. El diagram de la Figura toe basal yrecuperacié El dingrama ce dsp pntscines ol re neem regresidn, a inccuscién de 0 muestra tos dels diagrams de dispersin paciles c ales conespor- euacién de reresin que incluye las variable independiente barf, edad Capit 1. Ais compe foa! 447 > fo, El diagram de la inqierda recoge Ia rlacién enre las variables Bosal y reen- ibuiblea las variables edad y 10, El dela ‘A pesar de i uldad,conviene sear que ‘pueden resulta engafioros cuando la eeuocion de rer ‘iontes relevant cuando existe una eleada coliea Fgura 16.10, Dagramas de depen carci nce areca de eres nino cuneis) ices : ta ecuacion de regres estima ndependientes et deci, suman ola. ¥ esto implica que el exmbio estimado para ¥ por cada unidad que aumentaX, (pormanceiendo el eto de variables costanes) es siempre el mismo ee ode cotnealidad. e problema de una colincaliad elevada ei lo er delasesti vo sin embargo, no lo sea ning sin lo cul puede ocurir cuando es varianzas de los coefcintes son muy gra © que alin coefciente de regresion tenga un signocistnt dl espera: 0 que Linea del mend Anan para occeder al cuadro de logo Regresin inal la variable recuperacid a cusdro Dependant Independents, i de completar estos de confianza de los coefeiertes de epresin, = cominzan con la Tabla 102, acu inchye informacion re de regresén el coet en segundo liga dela vari 2, eocer ls puntuaciones bales ce | ben permite entender (antcipar, expican, su reeuperacién, slnanerador ol dnomtador Senco (ve euntn 1020), Capt 10. Anis erst tea! 464 rites residual coresponden Prondstico (reeuperoc abl 104, Copies de regrsn = -8,88 +040 (basal Ne Anais ca cate (veh 3) (os coefcientstiptiadostam- se coeficiente de regresion no tratamiento ifead por Sy 5, El valor de ets cocfces et la que mas peo tiene en os prondsicos ‘Significacidn de los ceficientes de regresiin ‘La mitad dereeha de la 2 ofree el procedimiento por dfeco, Para cub ses necesarosoliitar informacion de ferme exp Aue offece In ecuscin de retest, subcuadeo de dilogo Reg cin Notnicades del recundro Valores po. oateadosy a op vidos del recuadro ltrs de prondeco, Eas sclecsone ren one archivo de datos cnc vrables, La opin No pcan los: PRE_¥. La opcién Meta crea dos variables oon 24 de los po ios crea dos variables con Importancia relativa de las variables Recordemns que la importance elativa de rosin puede valoarsstendiendoa slob viene dda lovados al cuadrado, Pata obtene eten Tela 105, Coetcenios ein de coves pat y compa (bass, ce) tote _| te fomeners| Pcs | somamem | SS a a ee oa Ae 464 pra co cts.) Chequeo de los supuestos ‘Antes de interpretar una ecuacin de regres comprobar que sedan ls ‘condiciones para poder hacerlo, Es sleumplimiento de os supuestosy fed, En primer gar hay que asegure in deregesin esti tnealmente sae botén Gees para acoder al subeuadro 4 disogo Rewresin linea: Graficos y marca la opin Generar todo los gress aes, sta open permite obtener un grtico de dispersion parcial por cada variable inde pendiente. Los dagramas crrespondieetes resentado en la Figura 10.10 qu offecea os cocfcen 5). Vlasignticacionestadisen de estos re eded y recuperaciin dy que valorar el rao de relcion independiente, En nuestro ejemplo no se cbserva inguno de losindicios que podian deatar a Cantu 10 Anis deren ta! 465 486 Antisis do deo (vo. Paraob duos en el vertical grande cispersdn can los casos en el ee horizontal y ls ee- ‘Que generar primero los residuos. Pat ll, principal, pulsar el bot Gus paraaccederal subcutdro idea de queno se observa una puta leem el tamatio de los residues (ver Figura 10.11} 6, Dayar de depen de ks reidos ssn secvencamerte Woe a aa feos y mares las opciones Histo 3 eeuadro Grificos de lo elev tind 3 esis hay que vil as prota os 8 desde cl més pequetoal mds grande; en el vertical Copa 10. ant do rapatn eat 487 Figura 10.17, Histagrame dele resus ycgrama de isparson noma r fu! 468 Anis dle) Caps 10. Ani eee ns! 89 Fgura 18.18, Daxrana de dpe rodsios pr eiucs >» Enel cua de dislogo principal, pulsar el botdn Guardar para accede al subeus- Aro de dislogo Regresin tinea: Guardar, mi opciones inuenlay Cook marearlas opciones DBetasipicadasy Dijutecade el recuadro Estates feel oe > Sclecsionar I pcion Regrsién> Lineal dl mend Analtar para acceder al cuadto de in lineah > Traslaaria variable reeuperacin al cundroDepandante yas variables basal edad 1 Ho aa lisa Independents y sleccionar la opciénHadl dante del reo den, Plegable Método, 05 pr acederalsubcundro de dilogo Regret nea opciones Cambio en R evaraeoy Corlacones prc y Enel segundo paso ble Basa (también se indica en una nota pie deta. forma del ccfcinte de determinacdn en cada paso (Revadrado y R Wa) Y, como novedad respecto de ia taba resumen ya etudiada (er in entre un paso el i trad ene rier paso indica. {eR ewadrad cuando no hay vavables en la ceucién. Este cambio op !euarado dol cocficiene de crrlacion semiparcil (ver evuaion 0 del cambio (ver ccuscitn (10.39) (sig. de la F del cambio) permite co bio en coe sos inicamen varente al just Tabi 104. Reson dels madlos Capi 10, Ants dergrsin ivan 474 ie fw inetd can oon Fda Tl 108, cu Sie commie gu atowts ened dieser sehr 29) oon ons nora ees ul d gue tees vaca ena cin, a tiene asociado el coeficiente de correle- 472 Anis tate ot) (2) que noes signiicativamen el paso 2 porgue no quedan a [Regresién jerrquica 0 por pasos con variables categéricas ‘Yasobemos(verla Tala 10.1 el apatado Variables independents coteyricas). irse en una eewacin do tant, al epic un metodo de selscion de variables ay que tn Silent dl recuadro Bloque 1 ‘oA conto_ a ist independant, abe Comentarios finales Validacién de una ecuacién de regresi6n Capt 30, Ans ogra neal 473 ¥ Aiken (2003, pigs 90-95; ver también Mennell, Kelley y ! problema det tamao muestra desde el punto de vita dela depend catia ints de Potencia de 0,80 y un nivel de significacén de 0,05, hacen fata 48 casas are una correlacién milipe de 030 = 009), Con 6 (2003) proponen una estates, Aeseada par as ex emis, con muestras pequedas te eore el esgo de obs, ne cuasiones uno finionen bien al apical 3 otras musts. Pod dec gr, a rela de més er msjor- Pro sin lvidr que, con mucsray ieeg0 de declarar estadisticarente significaives efectos too. ‘Se ER ARORA Apéndice 10 Regresién curvitinea on de regres ie icaent es una forma pric de regtesn Y, da exsen cones ca gos eta ncn ent as variables siege (mea en ea eseala de indice in Regrsin > Estima cares cet i Anlar para acceer Eulinacin curlinee op 10. Ants regen rea! 475 Fu 0.19, Osama d prin: ans pareeren "a ena uno de dillgo Ess ere permiten cei ono vated sett pon wom abl crcl con slr sina cai, eda vai we wlend co operate Veta Lagarti Canta 1. Anite oes sna! 477 oe lube de pun seriblemenie | ylepsitien ‘eer 1.28, Oana de sper ta portion fan cine pty cut) (478. Anais dears (vot) ny Bolger, oe i que est esate sea conc como el neu ¥ ten esar relacionadas cs decir el cofcen cde a Figura 10.21 1 de cro ea deci espe. Pra cota exa conde sun (4 Yeahs vertu edu lama de cnet e emo un co mayor es! pated mein, opt 10, Ane ore Saal 79 ‘Figure 10.21. Elemento de model de mesaco de Barony Kenny (188) i 1, Bctotot ¢ ab +e" x 2 Bleeto deco: «= €~ ab pier Ejercicios toa, ua bla musta cl eaindoobteniocon una mica de 0 estan de ensefan rable: =" pomedia de or semanales"6 Y= "er ico como la sua de ls caleaiones chelate ga ‘laconads? (= 0.05) abla cofccnes de epresion once onl cocci de coreacn Caso 1. Ani epee ne! 481 104. Cop 10. Anis de regain oa! 483) nn cul nd ar pn nis est conando con od nos ex can cl rendimieato en ua prueba de dine coficene de repre, En tlm 7, = 6 See anes de Xi Sig Bilao eaeee las ariabies. tn Hel err i cee ds cotchsn Sone asoaede un vel eee mena qe | poaescoefeete de coma 005. Parez ponilea en a pi de una sine? [Enum ann de regen simple de Ysobre. a no qucnecacén de resesién en puntaciooes compar amas ales 10.10, Syet Suse? 484 Anatete co to (ot. lesesin nsimene eloionadasmesinte, on ome) AZ el que P(N, <42)> 0.999, 8 Fins =2) (> 0.05). igvenesafisciones eri oe cdi, anteriores es correcta, = Apéndice final Tablas estadisticas Distribucion Distrbuciones na centadss CCosficientes de polinomios ontogoraes zorvOzEr RSE OBH OED 486 ed 494 295 196 47 199 soi a $02 so de Dunn-Bonferond +... $03 de Dunnett. 505 jones del rango stlcntizado .. $07 509 409 510

También podría gustarte