Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica PARA Ingenieros
Estadistica PARA Ingenieros
Prof. Dr. Antonio Jos Sez Castillo Dpto de Estadstica e Investigacin Operativa Universidad de Jan
Esta obra est bajo una licencia Reconocimiento-No comercial-Sin obras derivadas 3.0 Espaa de Creative Commons. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by-nc-nd/3.0/es/ o envie una carta a Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA.
ndice general
1. Introduccin
IFIF u signi( istdstic F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IFPF v istdsti en el mito de l gieni y l sngenier F F F F F F F F F F F F F F F F F F F F F IFPFIF ijemplo de ls ps de xido de siliio F F F F F F F F F F F F F F F F F F F F F F F F F F IFPFPF ijemplo de l omill de jo onsumo F F F F F F F F F F F F F F F F F F F F F F F F F F IFPFQF ijemplo de los niveles de plomo F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IFPFRF ijemplo de los ojinetes F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IFPFSF ijemplo de l sorin de un ompuesto distints dosis y en distintos tiempos de sorin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IFPFTF ijemplo de los identes lorles F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IFPFUF ijemplo de l oertur de l nten de telefon mvil F F F F F F F F F F F F F F F F F IFPFVF ijemplo de l sel letori F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IFQF he(niiones sis F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
11
II IP IP IP IR IR IR IS IS IS IS
I Estadstica descriptiva
2. El tratamiento de los datos. Estadstica descriptiva
PFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFPF ipos de dtos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFQF wtodos gr(os y numrios pr desriir dtos ulittivos F F F F F F F F F F F F F F F F F F PFRF wtodos gr(os pr desriir dtos untittivos F F F F F F F F F F F F F F F F F F F F F F F F PFSF wtodos numrios pr desriir dtos untittivos F F F F F F F F F F F F F F F F F F F F F F PFSFIF wedids de tendeni entrl F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFSFIFIF wedi F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFSFIFPF wedin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFSFIFQF wod o intervlo modl F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFSFPF guntiles F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFSFQF wedids de vriin o dispersin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F Q
17
19
IW IW PH PI PS PS PS PT PT PU PV
PFSFQFIF rinz muestrl F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFSFQFPF hesviin tpi o estndr muestrl F F F F F F F F F F F F F F F F F F F F F F PFSFQFQF goe(iente de vriin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFSFRF wedids de formF goe(iente de simetr F F F F F F F F F F F F F F F F F F F F F F F F PFSFSF rmetros muestrles y prmetros polionles F F F F F F F F F F F F F F F F F F F F PFTF wtodos pr detetr dtos untittivos tpios o fuer de rngo F F F F F F F F F F F F F F PFTFIF wedinte l regl empri F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFTFPF wedinte los perentiles F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PFUF ore el ejemplo de ls ps de dixido de siliio F F F F F F F F F F F F F F F F F F F F F F F F F
PV PW QH QI QP QQ QQ QQ QR
II Clculo de Probabilidades
3. Probabilidad
QFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFPF ixperimentos letorios y experimentos determinstios F F F F F F F F F F F F F F F F F F F F F QFQF he(niin de proilidd F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFQFIF lger de onjuntos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFQFPF ispio muestrl F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFQFQF punin de proilidd F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFRF snterpretin freuentist de l proilidd F F F F F F F F F F F F F F F F F F F F F F F F F F F QFSF snterpretin sujetiv de l proilidd F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFTF ispio muestrl on resultdos equiprolesF prmul de vple F F F F F F F F F F F F F F QFUF roilidd ondiiondF sndependeni de suesos F F F F F F F F F F F F F F F F F F F F F F F QFVF eorem de l proilidd totl y eorem de fyes F F F F F F F F F F F F F F F F F F F F F F QFWF ws sore el eorem de fyes F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFWFIF ijemplo del juez F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F QFWFPF ijemplo de l mquin de detein de fllos F F F F F F F F F F F F F F F F F F F F F F F
37
39
QW RH RH RH RI RQ RS RS RT RT SI SS ST SU
61
TI TP TP TP TQ TQ TR TS
RFQFPF histriuin de oisson F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFQFQF histriuin geomtri F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFQFRF histriuin inomil negtiv F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFRF rile letori ontinu F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFRFIF he(niin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFRFPF ristogrm F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFRFQF punin de densidd F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFRFRF punin de distriuin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFRFSF punin de distriuin empri F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFRFTF wedi y vrinz de un vFF ontinu F F F F F F F F F F F F F F F F F F F F F F F F F F F RFSF wodelos de distriuiones de proilidd pr vriles ontinus F F F F F F F F F F F F F F F RFSFIF histriuin uniforme @ontinuA F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFSFPF histriuin exponenil F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFSFQF histriuin qmm F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFSFRF histriuin norml F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFTF guntiles de un distriuinF epliiones F F F F F F F F F F F F F F F F F F F F F F F F F F F F RFTFIF v omill de jo onsumo mr exi F F F F F F F F F F F F F F F F F F F F F F F F RFTFPF vs visits l peditr de los pdres preoupdos F F F F F F F F F F F F F F F F F F F F F
TV UH UI UQ UQ UQ US UT UU UV VP VP VP VR VT WP WQ WR
97
WU WW WW
SFPFPF histriuiones mrginles F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IHI SFPFQF histriuiones ondiionds F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IHQ SFQF sndependeni estdsti F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IHU SFRF wedisD vrinzs y ovrinzs soids un vetor letorio F F F F F F F F F F F F F F F F F III SFRFIF govrinz y oe(iente de orrelin linel F F F F F F F F F F F F F F F F F F F F F F F III SFRFPF etor de medis y mtriz de vrinzsEovrinzs de un vetor F F F F F F F F F F F F IIV SFSF histriuin norml multivrinte F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IIW
125
127
TFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IPU TFPF wuestreo letorio F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IPV TFQF histriuiones en el muestreo F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IPV TFRF histriuiones en el muestreo relionds on l distriuin norml F F F F F F F F F F F F F F IPW
Prof. Dr. Antonio Jos Sez Castillo
133
UFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IQQ UFPF istimin puntul F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IQR UFPFIF he(niin y propieddes deseles de los estimdores puntules F F F F F F F F F F F F F IQR UFPFPF istimin de l medi de un vFF v medi muestrl F F F F F F F F F F F F F F F F F F IQS UFPFQF istimin de l vrinz de un vFF rinz muestrl F F F F F F F F F F F F F F F F F IQS UFPFRF istimin de un proporin polionl F F F F F F F F F F F F F F F F F F F F F F F F F IQU UFPFSF ytenin de estimdores puntulesF wtodos de estimin F F F F F F F F F F F F F F F IQV UFPFSFIF wtodo de los momentos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IQV UFPFSFPF wtodo de mxim verosimilitud F F F F F F F F F F F F F F F F F F F F F F F F F IQW UFPFTF l resumen de los estimdores de los prmetros de ls distriuiones ms omunes IRP UFQF istimin por intervlos de on(nz F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IRP UFQFIF sntervlos de on(nz pr l medi F F F F F F F F F F F F F F F F F F F F F F F F F F F F IRR UFQFPF sntervlos de on(nz pr un proporin F F F F F F F F F F F F F F F F F F F F F F F F IRT UFQFQF sntervlos de on(nz pr l vrinz F F F F F F F F F F F F F F F F F F F F F F F F F F IRT UFQFRF ytros intervlos de on(nz F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IRU UFRF esoluin del ejemplo de los niveles de plomo F F F F F F F F F F F F F F F F F F F F F F F F F F IRV
149
VFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IRW VFPF irrores en un ontrste de hiptesis F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ISI VFQF pEvlor de un ontrste de hiptesis F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ISQ VFQFIF he(niin de pEvlor F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ISQ VFQFPF glulo del pEvlor F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ISS VFRF gontrste pr l medi de un polin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IST VFRFIF gon muestrs grndes @n 30A F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IST VFRFPF gon muestrs peques @n < 30A F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ISV VFSF gontrste pr l difereni de medis de poliones independientes F F F F F F F F F F F F F F ISW VFSFIF gon muestrs grndes @n1 , n2 30A F F F F F F F F F F F F F F F F F F F F F F F F F F F F ISW VFSFPF gon muestrs peques @n1 < 30 o n2 < 30A y vrinzs igules F F F F F F F F F F F F F ITH VFSFQF gon muestrs pequesD vrinzs distints y mismo tmo muestrl F F F F F F F F F ITI VFSFRF gon muestrs pequesD vrinzs distints y distinto tmo muestrl F F F F F F F F ITI VFTF gontrste pr l difereni de medis de poliones preds F F F F F F F F F F F F F F F F ITP VFTFIF gon muestrs grndes @n 30A F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ITP VFTFPF gon muestrs peques @n < 30A F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ITP VFUF gontrste pr l proporin en un polin F F F F F F F F F F F F F F F F F F F F F F F F F F ITR VFVF gontrste pr l difereni de proporiones F F F F F F F F F F F F F F F F F F F F F F F F F F F F ITT
VFWF gontrste pr l vrinz de un polin F F F F F F F F F F F F F F F F F F F F F F F F F F F F ITU VFIHF gontrste pr el oiente de vrinzs F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F ITU VFIIF gontrste pr ls medis de ms de dos poliones independientesF exye F F F F F F F F F ITV VFIPF il prolems de ls prues mltiplesF wtodo de fonferroni F F F F F F F F F F F F F F F F F F IUI VFIQF esoluin del ejemplo del del dimetro de los ojinetes F F F F F F F F F F F F F F F F F F F F F IUP
173
WFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IUQ WFPF gontrstes de ondd de juste F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IUQ WFPFIF est 2 de ondd de juste F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IUR WFPFPF est de uolmogorovEmirno' F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IUV WFQF gontrste de independeni 2 F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IUW WFRF esoluin del ejemplo de los identes lorles F F F F F F F F F F F F F F F F F F F F F F F F F IVQ
185
IHFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IVS IHFPF istimin de los oe(ientes del modelo por mnimos udrdos F F F F F F F F F F F F F F F F IVV IHFQF upuestos diionles pr los estimdores de mnimos udrdos F F F F F F F F F F F F F F F IWP IHFRF snferenis sore el modelo F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IWQ IHFRFIF snfereni sore l pendiente F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IWQ IHFRFPF snfereni sore l ordend en el origen F F F F F F F F F F F F F F F F F F F F F F F F F F IWU IHFSF il oe(iente de orrelin linel F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F IWW IHFTF piilidd de l ret de regresinF il oe(iente de determinin linel F F F F F F F F F F F F PHP IHFUF rediin y estimin prtir del modelo F F F F F F F F F F F F F F F F F F F F F F F F F F F F PHQ IHFVF hignosis del modelo F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PHT IHFVFIF xormlidd de los residuos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PHT IHFVFPF qr( de residuos frente vlores justdos F F F F F F F F F F F F F F F F F F F F F F F PHT
IV Procesos aleatorios
11.Procesos aleatorios
209
211
IIFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PII IIFIFIF he(niin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PIP IIFIFPF ipos de proesos letorios F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PIP IIFPF hesripin de un proeso letorio F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PIS IIFPFIF hesripin estdsti medinte distriuiones multidimensionles F F F F F F F F F F F PIS IIFPFPF punin medi y funiones de utoorrelin y utoovrinz F F F F F F F F F F F F F PIS IIFQF ipos ms omunes de proesos letorios F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PIU
Prof. Dr. Antonio Jos Sez Castillo
IIFQFIF roesos independientes F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PIU IIFQFPF roesos on inrementos independientes F F F F F F F F F F F F F F F F F F F F F F F F F PIV IIFQFQF roesos de wrkov F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PIV IIFQFRF roesos dilmente estionrios F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PIW IIFQFSF roesos ergdios F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PPI IIFRF ijemplos de proesos letorios F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PPP IIFRFIF uidos lnos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PPP IIFRFPF roesos gussinos F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PPQ IIFRFQF roesos de oisson F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F PPR
Prlogo
il ojeto fundmentl de l ediin de este doumento es filitr los lumnos de ingenier de l isuel olitni uperior de vinres el desrrollo de los ontenidos terios de l signtur EstadsticaF hesde un punto de vist menos lolD espero que se tilD en lgun medidD todo quel que neesite onoimientos sios de ls tnis estdstis ms usules en el miente ient(oEtenolgioF e todos ellosD lumnos y letores en generlD quiero filitrles el privilegio de prender de quienes yo he prendidoD sugirindoles utro mnules que pr m hn sido referenis fundmentlesF e trtD en primer lugrD del mgn(o liro de heldon wF ossD
Introduccin a la EstadsticaF
in l puede enontrrse l
myor prte de lo que vmos estudir quD explido de form senill y lrD pero tmin omentrios histriosD reses iliogr(s sore mtemtios y estdstios relevntes y ejemplos muy propidosF in segundo lugrD reomiendo los trjos de illim xvidiD ty hevoreD
Estadstica para ingenieros y cientcosD
de sus ejemplos y por mo enftizn el rter plidoD prtioD de l istdsti en el mito de l gieni y l enologF pinlmenteD deo menionr tmin el liro de wendenhl 8 inihD
y Estadstica para Ingeniera y CienciasD
propuestos mgn(osF in el tul ontexto del ispio iuropeo de iduin uperiorD l signtur Estadstica tieneD en l myor prte de los grdos en ingenierD un rter sio y un dotin de T rditos igF es ourreD por ejemploD en ls rms de industriles o teleomuniiones que se imprten en l niversidd de tnF ytrs rmsD omo l de ingenier ivilGminerD hn optdo por inluirl omo signtur oligtoriD omprtid on un signtur de mpliin de mtemtis en l que se proponen Q rditos ig de estdstiF gon todoD reo que estos puntes pueden dptrse esos distintos ontextosD lrndo qu tems pueden ser ms deudos pr d titulinF in onretoX IF r ls distints espeiliddes de l rm de industriles sern oportunos los ptulos ID PD QD RD TD UD VD W y IHF il ptulo WD sore ontrstes no prmtrios puede drse modo de seminrioD si el desrrollo de l doeni s lo sugiereF in emrgoD el ptulo IHD sore regresin linel simpleD me pree impresindile en l formin de un futuro ingeniero industrilF PF in los grdos de l rm de teleomuniionesD reo que son neesrios los ptulos ID PD QD RD SD TD UD V y IIF esult s el temrio quiz ms exigenteD deido l neesidd de introduir un ptulo sore vetores letorios previo otro sore proesos estostiosF ued iniitiv del doente l posiilidd de reortr lgunos spetos en los tems trtdos en rs her ms liger l rg doenteF QF pinlmenteD en los grdos de l rm ivil y minerD donde l dotin de rditos es menorD reo que W
son deudos los ptulos ID PD QD RD TD UD V y IHD si ien eliminndo lgunos de sus prtdosD uestin st que dejoD de nuevoD juiio del doenteF min sugiero que se trjen los prolems sore estos ptulos diretmente en el ontexto de uns prtis on ordendorF lo me qued pedir disulps de ntemno por ls errts queD prolementeD ontienen ests pginsF ys ruego que me ls hgis llegr pr orregirls en posteriores ediionesF vinresD junio de PHIPF
10
Captulo 1
Introduccin
vlegr un d en el que el rzonmiento estdstio ser tn neesrio pr el iuddno omo hor lo es l hilidd de leer y esriir rFqF ells @IVTTEIWRTA
Resumen. il ptulo inluye un introduin del trmino Estadstica y present los oneptos ms sios
reltivos poliones y muestrsF
Palabras clave: estdstiD polinD polin tngileD polin oneptulD vrileD muestrD muestr
letori simpleF
Estudio de los datos cuantitativos de la poblacin, de los recursos naturales e industriales, del trco o de cualquier otra manifestacin de las sociedades humanas.
PF QF
Conjunto de estos datos. Rama de la matemtica que utiliza grandes conjuntos de datos numricos para obtener inferencias basadas en el clculo de probabilidades.
rolemente el ms omn de los signi(dos onoidos de l plr se el segundoD y por ello solemos ver en los medios de omuniin que ulquier reopilin de ifrs referentes lgn sunto es llmdo @de form muy reduionistA
estadstica
estadsticasF
Estadstica
epin del heiF gonretmenteD el primero de los signi(dos se orresponde on lo que vmos estudir donde l istdsti se utiliz pr resumirD desriir y explorr dtosD y el
Inferencia EstadsticaD
II
es utilizr dtos de un onjunto reduido de sos pr inferir rterstis de stos l onjunto de todos ellosF
un proeso pr el reimiento de un p delgd de dixido de siliio sore pls de siliio que se usn en l friin de semiondutoresF in l preen dtos reltivos ls mediiones del espesorD en ngstroms @AAD de l p de xido pr prues relizds en PR plsX en onretoD se relizron W mediiones en d un de ls PR plsF vs pls se friron en dos series distintsD IP pls en d serieF ists pls ern de distintos tipos y se proesron en distints posiiones en el hornoD y que entre otros spetosD el propsito de l reopilin de los dtos er determinr si el espesor de l p de xido est fetdo por el tipo de pl y por l posiin en el hornoF or el ontrrioD el experimento se dise de tl mner que no se esper ningun difereni sistemti entre ls dos seriesF vos dtos se muestrn en l l IFIF vo primero que slt l vist l mirr esos dtos es que es muy omplido herse un ide glol de los resultdosF reen estr en torno WH AD pero on vriiones importntes respeto de ese vlorF elguns de ess vriiones son espeilmente llmtivs @UUFSD IHTFUD FFFAX qu ps en ess plsc in sumD es evidente que se he neesri un mner sistemti de nlizr los dtosD trtndo de desriirlos de form preis y ojetivD respondiendo ls pregunts que suyen en el diseo del experimentoX son ls dos series de experimentos homognesc fet el tipo de plc fet l posiin en el hornoc FFF
heo reonoer de que tengo mis dudsF r empezrD es que los V osD de repenteD l lmpr se rompec or otr prteD reo que todos nosotros hemos experimentdo el heho de que sts lmprs que supuestmente tienen un durin myor que ls trdiionles lmprs inndesentes @segn el envoltorioD V vees myorAD sin emrgoD se rompen on filiddF vuegoD qu quiere deir extmente el envoltorio l (rmr que su durin es de V osc
12
erie I I I I I I I I I I I I P P P P P P P P P P P P
l I P Q R S T U V W IH II IP I P Q R S T U V W IH II IP
WHFHH WIFVH WHFQH WPFTH WIFIH UTFIH WPFRH WIFQH WTFUH WPFHH WRFIH WIFUH WQFHH WIFRH WIFWH WHFTH WQFIH WHFVH VVFHH VVFQH WRFPH IHIFSH WPFVH WPFIH
WPFPH WRFSH WIFIH WHFQH VWFVH WHFPH WIFUH WHFIH WQFUH WRFTH WIFSH WUFRH VWFWH WHFTH WIFVH WIFQH WIFVH WIFSH WIFVH WTFHH WPFPH IHQFIH WHFVH WQFRH
WRFWH WQFWH WQFQH WPFVH WIFSH WTFVH WIFTH WSFRH WQFWH WQFUH WSFQH WSFIH WQFTH WPFPH WPFVH WRFWH WRFTH WIFSH WHFSH WPFVH WSFVH IHQFPH WPFPH WRFHH
WPFUH UUFQH WQFSH WIFTH WIFSH VRFTH WIFIH VWFTH VUFWH WRFHH WPFVH WTFUH VWFHH WIFWH WTFRH VVFQH VVFWH WIFSH WHFRH WQFUH WPFSH IHQFSH WIFUH WRFUH
A WIFT WPFH VUFP WPFU WHFT WQFQ VVFH WHFU WHFR VWFQ WQFR UUFS WQFT WPFR WQFV VUFW WHFH WRFH WHFQ VWFT WIFH WTFI VWFH WHFV
VVFPH VWFWH VVFIH WIFUH WQFIH WSFUH WPFRH WSFVH WPFHH WHFIH WPFPH WIFRH WHFWH VUFTH VTFSH WPFPH WUFWH WIFHH WIFSH VWFTH WIFRH IHPFSH VVFSH WPFIH
WPFHH VUFWH WHFIH VWFQH VVFWH WHFWH VVFUH WIFUH WHFSH WIFQH VWFRH WHFSH VWFVH VVFWH WPFUH WHFUH WPFIH WPFIH VWFRH WHFPH WPFVH IHPFHH VUFSH WIFPH
WVFPH WPFVH WIFWH WSFSH WPFSH IHHFQH WPFWH WUFWH WSFPH WPFUH WRFSH WSFPH WPFRH WHFWH WHFWH WIFQH WIFTH WIFVH WQFPH WSFQH WQFTH IHTFUH WQFVH WPFQH
WTFHH WQFQH WRFSH WQFTH WPFRH WSFPH WPFTH WSFUH WRFQH WRFSH WSFRH WQFIH WQFHH WPFVH WPFVH WQFTH WVFRH WRFHH WQFWH WQFHH WIFHH IHSFRH WIFRH WIFIH
13
in reliddD nosotros deeremos prender nlizr este prolemD sumiendo que l durin de est omill no es un vlor (jo y onoidoD sino que est sujeto inertidumreF vo que hremos ser dotrnos de un modelo mtemtio que nos permit vlorr si es prole o no que un lmpr exi se romp ntes de un oD despus de tres osD etF
posed esidentil gonstrution steD present un estudio de l ontminin en sureros que ontienen desehos de onstruin y desperdiios de demoliionesF he un sitio de prue se tomron RP muestrs de lixidoD de ls ules PT ontienen niveles detetles de plomoF e pone s de mni(esto que slo un prte de los sureros est ontmind por plomoF v uestin es qu proporin supone est prte ontmind de l super(ie totl de los surerosc i un ingenier dese otener prtir de esos dtos un estimin de l proporin de los sureros que ontiene niveles detetles de plomo dee ser onsiente de dos uestionesX IF is imposile nlizr todos los rinones de todos los surerosF PF i se s slo en los dtos del rtuloD es estimin ser slo esoD un estimin sd en es muestrD que es de slo RP dtosF heerD por tnto otener tmin un estimin del error que est ometiendo l her l estiminF gon mos resultdosD l estimin en s y un unti(in del error que podr ometer on ellD inluso podr otener un rngo donde l verdder proporin se enuentrD on un lto nivel de on(nzF
14
vo que los investigdores se uestionn es si l ntidd de ompuesto por un ldo y el tiempo de exposiin l que se somete por otroD in)uyen en el porentje que se soreF he ser sD ser interesnte estimr el porentje de sorin de persons que se sometn un exposiin de un determind ntiddD por ejemploD durnte V horsF
gon es informinD los responsles de seguridd de l empres deen deidir si hy frnjs horris donde los identes son ms proles o siD por el ontrrioD stos ourren solutmente l zrF
si nos entrmos en l distni l ntenD ulquier distni es deir de ls oordends en un momento onreto del mvilc
qu podemos
15
e denomin
or ejemploD si estmos onsiderndo el estudio de l ltur de los lumnos de l isuelD el onjunto de estos lumnos es un polin tngileF n polin experimentoF or ejemploD undo plntemos ls prues sore pls de siliioD vemos que hy tntos sos omo prueE s puedn herseD lo que supone un onjunto in(nito de sosF in poliones oneptules es imposileD por tntoD onoer todos los sosD y tenemos que onformrnos on muestrs de los mismosF n
conceptual no tiene elementos relesD sino que sus sos se otienen por l repetiin de un
or ejemploX i onsidermos l polin de todos los lumnos de l isuelD podemos (jrnos en l vrile alturaF i onsidermos el supuesto de ls prues sore pls de siliioD podemos onsiderr l vrile espesor
de la capa de xido de silicio generadaF
e denomin
muestra ulquier suonjunto de dtos seleiondos de un polinF representen l onjunto de todos los elementos de l polinF ist uestinD l aleatorias
il ojetivo de un muestrD y se en un polin tngile o en un polin oneptul es que los elementos de l muestr
onstruin de muestrs deudsD representtivsD es uno de los spetos ms delidos de l istdstiF xosotros vmos onsiderr en est signtur slo un tipo de muestrsD denominds muestras
simplesF
in un muestr letori simpleD todos los elementos de l polin deen tener ls misms
posiiliddes de slir en l muestr yD demsD los elementos de l muestr deen ser independientesX el que slg un resultdo en l muestr no dee fetr que ningn otro resultdo slg en l muestrF or ejemploD podrmos estr interesdos en l polin de todos los espoles on dereho voto @polin tngileD pero enormeAD de los que querrmos onoer un dto o vrileD su intenin de voto en ls prxims eleiones generlesF hdo que estmos hlndo de millones de personsD prolemente deeremos esoger un muestrD es deirD un suonjunto de espoles los que se les relizr un enuestF i queremos que es muestr se letori simpleD deeremos tener uiddo de que todos los espoles on dereho voto tengn ls misms posiiliddes de er en l muestr y de que l respuest de un entrevistdo no fete l de ningn otroF gomo not uriosD sed que l myor de ls enuests nionles se hen v telefniD lo ul es un peque violin de ls hiptesis de muestr letori simpleD y que hy espoles on dereho voto que no tienen telfonoD luego es imposile que slgn en l muestrF
16
Parte I
Estadstica descriptiva
IU
Captulo 2
El tratamiento de los datos. Estadstica descriptiva
is un error pitl el teorizr ntes de poseer dtosF snsensilemente uno omienz lterr los hehos pr enjrlos en ls teorsD en lugr enjr ls teors en los hehos herlok rolmes @eF gF hoyleAD en
Un escndalo en Bohemia
Resumen. in este ptulo prenderemos mtodos pr resumir y desriir onjuntos de dtos trvs de
distintos tipos de tlsD gr(os y medids estdstisF
Palabras clave:
freuenisD digrm de rrsD digrm de setoresD histogrmD mediD medinD modD untilesD vrinzD desviin tpiD simetrD dtos tpiosF
2.1. Introduccin
ytenidos trvs de enuestsD experimentos o ulquier otro onjunto de medidsD los dtos estdstios suelen ser tn numerosos que resultn prtimente intiles si no son resumidos de form deudF r ello l istdsti utiliz tnto tnis gr(s omo numrisD lguns de ls ules desriimos en este ptuloF odemos deir que existe un lsi(inD un tnto rti(ilD de los dtosD segn se re(ern un polin tngileD en uyo so se onoern todos los sosD o un polin oneptulD en uyo so slo se onoer un muestr @letori simpleAF in emrgoD est lsi(in no tiene ningn efeto en lo reltivo lo que vmos estudir en este ptuloF
cuantitativos y cualitativos.
IW
cuantitativos son los que representn un ntidd re)ejd en un esl numriF e su vezD pueden lsi(rse omo dtos cuantitativos discretos si se re(eren l onteo de lgun rterstiD o dtos cuantitativos continuos si se re(eren un medidF
vos dtos vos dtos
in el ejemplo de los niveles de plomoD se est nlizndo si un muestr ontiene niveles detetE les o noF e trtD por tntoD de un vrile ulittiv on dos tegorsX
detectables s contiene niveles
es untittiv
vs representiones gr(s ms usules son los digrms de rrs y los digrms de setoresF vos diagramas vos
diagramas de sectores son rulos divididos en tntos setores omo tegorsD setores uyo ngulo
20
gtegor s flgi prni pinlndi elemni rolnd tpn uei uiz istdos nidos yev
preueni reltiv roporin HFHRI HFPPS HFHPH HFHUI HFHIH HFIIP HFHQI HFHIH HFRVH IFHHH
Ejemplo.
ommos omo polin los WV retores nuleres ms grndes en todo el mundoF xos
(jmos en l vrile o dto referente l ps donde estn lolizdosF vos dtos sern
Blgica, Blgica, Blgica, Blgica, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Francia, Finlandia, Finlandia, Alemania, Alemania, Alemania, Alemania, Alemania, Alemania, Alemania, Holanda, Japn, Japn, Japn, Japn, Japn, Japn, Japn, Japn, Japn, Japn, Japn, Suecia, Suecia, Suecia, Suiza, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos, Estados Unidos.
tabla de fre-
Ejemplo.
un estudio sore l lidd de produinF vos dtos siguientes informn sore el nmero de piezs defetuoss enontrds en un muestr de js exmindsX HHHHHHIIIIIIIIIPPPPPPPPPPQQQQQQQRRRRRRRSSSSTTTTTUUUVVW
Prof. Dr. Antonio Jos Sez Castillo
21
10
20
30
40
Alemania
Blgica
EEUU
Finlandia
Francia
Holanda
Japn
Suecia
Suiza
EEUU
Blgica
Alemania
Suiza Suecia
Finlandia
Japn
Holanda Francia
il digrm de rrs soido preen en l pigur PFQF in emrgoD l myor de vriles untittivs son de tipo ontinuoD de mner que tomn demsidos vlores omo pr que l representin de su distriuin de freuenis se til1 F or ello el mtodo gr(o ms omn y trdiionl pr dtos untittivos es el histogrmF il histograma es un vrinte del digrm de rrs donde se grupn los vlores de l vrile en intervlos pr que estos intervlos tengn freuenis myores que unoF r otener un histogrm de form mnul deen seguirse los siguientes psosX IF glulmos el nmeroD N D de intervlos que vmos utilizrF e reomiend que se proximdmente igul l rz udrd del nmero de dtosF in emrgoD los progrms estdstios suelen utilizr otro mtodoD llmdo
Mtodo de SturgesD
22
pigur PFQX higrm de rrsF PF glulmos el rngoD RD del histogrmD que ser ligermente ms mplio que el rngo de los dtosF il histogrm dee omenzr en un nmero @xm A ligermente por dejo del mnimo de los dtos y terminr en un nmero @xM A ligermente por enim del mximoF il rngo del histogrm serD por tntoD R = xM xm F QF glulmos l longitudD LD de los intervlosD omo el oiente entre el rngo del histogrm y el nmero de intervlosD es deirD L =
R NF
Nota. or uestiones que detllremos ms delnte es importnte destr que el porentje de dtos
que e dentro de un intervlo es proporionl l re de l rr que se onstruye sore ese intervloF or ejemploD si el re de un rr es el QH 7 del re totl del intervloD entones el QH 7 de los dtos estn en diho intervloF
Prof. Dr. Antonio Jos Sez Castillo
23
Tiempos de procesado
9 Frecuencia 1 0.00 2 3 4 5 6 7 8
0.96
1.92
2.88
3.84
4.80
or otr prteD qu psr si tommos un nmero muy grnde de dtosc il nmero de intervlos del histogrm ser tmin muy grndeD y ls rrs sern muy estrehsD de mner que en vez de preer un digrm de rrsD preer l gr( de un funin rel de vrile relF rlremos de est funin y del re dejo de ell en reveF or iertoD mo se lul el re jo est funinc
25 = 5D utilizremos S intervlosF
PF il mnimo de los dtos es HFHP y el mximo RFUSD de mner que podemos onsiderr omo rngo del histogrm el intervlo [0, 4.8]D uy longitud @rngo del histogrmA es RFV. QF v longitud de los intervlos esD en ese soD RF gonstruimos los intervlosX
4.8 5
= 0.96F
I1 = [0, 0.96) I2 = [0.96, 1.92) I3 = [1.92, 2.88) I4 = [2.88, 3.84) I5 = [3.84, 4.8)
24
[0, 0.96) [0.96, 1.92) [1.92, 2.88) [2.88, 3.84) [3.84, 4.8)
@medids de posiinAD
@medids de dispersinA y
@medids de formAF
medidas de tendencia central son medids de posiin que trtn de estleer un vlor que pued
el centro
onsiderrse
2.5.1.1. Media
e un onjunto de dtos de un vrile untittivD x1 , ..., xn F v
x =
n i=1
xi
centro de gravedad
de los
is inmedito ompror que si se reliz un mio de origen y esl sore los dtosD del tipo y = ax + bD l medi sufre el mismo mioD es deirD y = ax + bF he igul formD si tenemos dtos de l sum de dos o ms vrilesD l medi de l sum es l sum de ls medis de d vrileF
Prof. Dr. Antonio Jos Sez Castillo
25
2.5.1.2. Mediana
e un onjunto de dtos de un vrile untittivD x1 , ..., xn F yrdenemos l muestr de menor myorD
mediana es el vlor de l vrile que dej el mismo nmero de dtos ntes y despus que lD un vez
ordendos estosF
il lulo de l medin depender de si el nmero de dtosD nD es pr o imprX i n es imprD l medin es el vlor que oup l posiin
n+1 2
@en orden reiente o dereienteAD porque ste es el vlor entrlF is deirX Me = x( n+1 ) F 2 i n es prD l medin es l medi ritmti de ls dos oserviones entrlesF gundo n es prD los dos x n +x n ( 2 ) ( 2 +1) n dtos que estn en el entro de l muestr oupn ls posiiones n y +1 F is deirX M = F e 2 2 2 v medin orresponde extmente on l ide de vlor entrl de los dtosF he hehoD puede ser un vlor ms representtivo de stos que l mediD y que es ms un ejemploF
robusta
= 2.1429D y su medin PF
ero imginemos que por error o por sulidd otenemos un nuevo dto enormemente grnde en relin l resto de dtosD VHF in ese soD l medi ser
0 + 0 + 1 + 2 + 3 + 4 + 5 + 80 = 11.875 8
y l medin PFSF is deirD un solo dto puede desplzr enormemente l mediD hst onvertirl en un medid poo representtivD pero slo desplzr ligermente l medinF ise es el motivo por el que se die que l medin es un medid
robustaF
moda se de(ne omo el vlor ms freuente de los dtosF vo que ourre es que si stos son intervalo modalD qul on myor freueni soidF
dtos de un vrile ontinu o disret on muhos vloresD puede que los dtos pens se repitnF in ese soD en el queD omo vimos en ls representiones gr(sD se dee grupr por intervlosD no dee drse un vlor omo modD sino un
26
2.5.2. Cuantiles
vos
que responden es muy senill y muy prtiF e trt de vlorr de form reltiv mo es un dto respeto del onjunto glol de todos los dtosF iD por ejemploD un nio de R os pes IQ kilosD est desnutridoc est snoc v respuest dee ser que
dependeF
hnde vive el nioc is importnte porqueD por ejemploD en istdos nidos los nios son en generl
ms grndes queD por ejemploD en tpnF uiz ms que el peso nos interese ser qu posiin reltiv tiene el peso del nio dentro de l polin de l que form prteF or ejemploD si nos dien que el nio est entre el I 7 de los nios que menos pesnD prolemente tiene un prolem de reimientoF il
cuantil p @Qp A de unos dtos (0 p 1)D ser un vlor de l vrile situdo de modo que el 100p % de
xo ostnteD en l prti vmos enontrr un prolem pr enontrr untilesD sore todo on poos dtosX lo ms hitul es que no exist el vlor exto que deje l izquierd el 100p % de los vlores y el resto l derehF or ese motivoD los progrms estdstios utilizn uns frmuls de interpolin pr otener el vlor del until entre los dos vlores de los dtos que lo ontienenF in nuestro soD l hor de otener untilesD l pliin de ess frmuls de interpolin orrespondiente de l siguiente formX IF i el 100p % de nD donde n es el nmero de dtosD es un enteroD k D entones Qp =
x(k) +x(k+1) . 2
a mano
los lulosD por lo que vmos plir un onvenio muho ms senilloX proximremos el vlor del until
PF i el 100p % de n no es un enteroD lo redondemos l entero siguienteD k D y entones Qp = x(k) F xo olvidemosD sin emrgoD que los progrms estdstios vn utilizr ls frmuls de interpolin pr lulr el vlor de los untilesD de mner que no dee extrr si se oservn peques diferenis l omprr nuestros resultdos
a mano
ixisten diversos nomres pr referirse lgunos tipos de untilesF intre ellosX vos
percentiles
son los untiles que dividen l muestr en IHH prtesD es deirD son los untiles
HFHI @perentil IAD HFHP @perentil PAD FFFD HFWW @perentil WWAF i notmos por P l perentil D on
cuartiles
27
mos lulr distints medids de posiin y omentrlsF in primer lugrD l medi es IFTQF v medin oup el lugr IQ en l muestr ordendD y su vlor es IFQVF ysrvese que l medi es lgo myor que l medinX esto es deido l preseni de lgunos vlores signi(tivmente ms ltos que el restoD omo pudimos ver en el histogrmF or su prteD el P25 o until HFPS oup l posiin UD y que el PS 7 de PS es TFPSF or tntoD P25 = 0.82F he igul formD P75 = Q0.75 = 2.16D el vlor que oup l posiin IWF odemos verD por tntoD que los vlores ms jos estn muy grupdos l prinipioD y se vn dispersndo ms onforme se hen ms ltosF
lo que pretenden es unti(r mo de onentrdos o dispersos estn los dtos respeto ests medidsF xosotros nos vmos limitr dr medids de dispersin soids l mediF v ide de ests medids es vlorr en qu medid los dtos estn grupdos en torno l mediF ist uestin tn simple es uno de los motivos ms surdos de l ml prens que tiene l istdsti en l soiedd en generlF v gente no se f de lo que ellos llmn
la Estadstica
el mundo ree que un medi tiene que ser un vlor vlido pr todosD y eso es mterilmente imposileF
Ejemplo. ensemos en l medi del slrio de los espolesF in PHHS fue de IVFUSH euros l oF ehor ienD
es medi inluye tnto ls regiones ms desrrollds omo ls ms desfvoreids yD evidentementeD l ifr generr muho mlestr en grn prte de l polin @on tod seguriddD ms del SH 7AD uyo slrio est por dejoF
Ejemplo. ixiste un frse muy onoid que die que la Estadstica es el arte por el cul si un espaol se
come un pollo y otro no se come ninguno, se ha comido medio pollo cada uno F
is frse se us en muhs
osiones pr ridiulizr l istdstiD undo en relidd deer servir pr desreditr quien l dieD por su ignorniF ry que deir que l istdsti no tiene l ulp de que l gente espere de un medi ms de lo que es pz de drD ni de que muy po gente onoz medids de dispersin soids l mediF
s2 n1 =
n i=1
(xi x ) . n1
28
Nota. r lulr a mano l vrinz result ms modo desrrollr un poo su frmulD omo vmos
verX
s2 n1 = =
x )2 = n1 n 2 2 i=1 xi nx . n1
n i=1 (xi
n i=1
x i=1 xi + nx 2 x2 i 2 = n1
n i=1
xnx + nx 2 x2 i 2 n1
gunto myor se l vrinz de unos dtosD ms dispersosD heterogneos o vriles son esos dtosF gunto ms peque se un vrinz de unos dtosD ms grupdos u homogneos son dihos dtosF
Ejemplo. n muestr letori simple de l ltur de S persons rroj los siguientes resultdosX
1.76 1.72 1.80 1.73 1.79
xi = 8.8 y
5 i=1
x =
y
8.8 = 1.76 5
s2 n1 =
in lo que respet l omportmiento de l vrinz muestrl frente mios de origen y eslD slo le
2 2 fetn los segundosF is deirD si tenemos que y = ax + bD se veri( que s2 y ;n1 = a sx;n1 F
pinlmenteD si ien hmos omentdo que en el so de l mediD si tenemos l sum de vris vrilesD l medi totl es l sum de ls medis de d vrileD no ourre s on l vrinz en generlF
s2 n1 D
29
Regla EmpricaX
IF eproximdmente el TV 7 de los dtos estr en el intervlo ( x sn1 , x + sn1 ) . PF eproximdmente el WS 7 de los dtos estr en el intervlo ( x 2sn1 , x + 2sn1 ) . QF gsi todos los dtos estrn en el intervlo ( x 3sn1 , x + 3sn1 ) .
coeciente de variacin.
de variacin omo
CV =
sn1 . |x |
v prinipl ventj del oe(iente de vriin es que no tiene uniddes de medidD lo que he ms fil su interpretinF
30
lgo ms del UH 7 de l mediF isto indi que los dtos no estn muy onentrdos en torno l mediD prolemente deido l preseni de los vlores ltos que hemos omentdo ntesF
Nota.
il oe(iente de vriinD tl y omo est de(nidoD slo tiene sentido pr onjuntos de dtos
on el mismo signoD es deirD todos positivos o todos negtivosF i huier dtos de distinto signoD l medi podr estr prxim ero o ser eroD imposiilitndo que prez en el denomindorF
NotaF uele ser freuente el error de pensr que el oe(iente de vriin no puede ser myor que ID lo
ul es rigurosmente flsoF i lo expresmos en porentjeD el oe(iente de vriin puede ser superior l IHH 7 sin ms que l desviin tpi se myor que l mediD os stnte freuenteD por iertoF
depende del ontexto de los dtos que estemos nlizndoF iD por ejemploD estmos nlizndo unos dtos que por su nturlez deen ser muy homogneosD un oe(iente de vriin del IH 7 ser enormeD pero si por el ontrrio estmos nlizndo dtos que por su nturlez son muy vrilesD un oe(iente de vriin del IH 7 ser muy pequeoF or todo elloD lo reomendle es nlizr el oe(iente de vriin entendiendo su signi(do numrioD es deirD entendiendo que se re(ere l omprin de l desviin tpi on l mediD e interpretndo su vlor en relin l ontexto en el que estemos trjndoF
medidas de forma omprn l form que tiene l representin gr(D ien se el histogrm o el
digrm de rrs de l distriuinD on un situin ideal en l que los dtos se reprten en igul medid l dereh y l izquierd de l mediF is situin en l que los dtos estn reprtidos de igul form uno y otro ldo de l medi se onoe omo medinD su mod y su medi oinidenF or ontrD se die que un distriuin es asimtrica
simetraD y se die en ese so que l distriuin de los dtos es simtriF in ese soD demsD su a la derecha si ls freuenis @soluts o reltivsA asimtrica a la izquierdaF
desienden ms lentmente por l dereh que por l izquierdF i ls freuenis desienden ms lentmente por l izquierd que por l dereh diremos que l distriuin es r vlorr l simetr de unos dtos se suele utilizr el
n )3 i=1 (xi x
As =
Prof. Dr. Antonio Jos Sez Castillo
n1
s3 n1
31
ysrvese que pr evitr el prolem de l unidd y her que l medid se eslr y por lo tnto reltivD dividimos por el uo de su desviin tpiF he est form podemos vlorr si unos dtos son ms o menos simtrios que otrosD unque no estn medidos en l mism unidd de medidF v interpretin de este oe(iente de simetr es l siguienteX nto myor se el oe(iente en vlor solutoD ms simtrios sern los dtosF il signo del oe(iente nos indi el sentido de l simetrX i es positivo indi que l simetr es l derehF i es negtivoD indi que l simetr es l izquierdF
parmetros muestralesF
prtimente siempre se trj on muestrsD y que o ien trjmos on poliones oneptules o on poliones tngiles @(nitsD por tntoAD pero on muhsimos elementosF prente estos prmetros muestrles se enuentrn los prmetros nlogos referidos tod l polinF istos prmetrosD llmdos parmetros
ploD l medi polionl se lulr igul que l medi muestrl de unos dtosD pero plid l frmul todos los elementos de l polinF gomo eso es prtimente imposile de poner en l prtiD veremos
3 Salvo
32
en ptulos posteriores que los prmetros muestrles se utilizn en l prti pr proximr o estimr los prmetros polionlesF
istos vlores son triuilesD por lo generlD un de ls siguientes ussX IF il vlor h sido introduido en l se de dtos inorretmenteF PF il vlor proviene de un polin distint l que estmos estudindoF QF il vlor es orreto pero represent un sueso muy poo omnF e ontinuin vmos proponer dos mners de determinr si un dto es un vlor fuer de rngoF
egn ellD el WWFS 7 de los dtos estn en el intervlo [ x 3sn1 , x + 3sn1 ]D luego
xi
[ x 3sn1 , x + 3sn1 ] .
@IR o
RI AD
IR = P75 P25 F
PF e onsidern
33
erie I erie P
g PSFRH PRFVT
Ejemplo. mos ver si hy lgn dto tpio entre los dtos de tiempo de proesdo en un g de
PS tresF hdo que el histogrm no ten form de mpnD el mtodo de l regl empri no es el mtodo ms deudo pr l detein de vlores tpiosF or su prteD P50 = 1.38D P25 = 0.82 y P75 = 2.16F or tntoD IR = 2.16 0.82 = 1.34D y el intervlo fuer del l onsidermos vlores fuer de rngo es [0.82 1.5 1.34, 2.16 + 1.5 1.34] = [1.19, 4.17]F he est formD el vlor RFUS es un vlor fuer de rngoF ry un versin gr( de este mtodo pr detetr vlores tpios medinte los perentilesX se llm
diagrama de caja o diagrama de cajas y bigotes o @en inglsA boxplotF iste digrm inluye en un
gr(oX IF il vlor de l medin @o segundo urtilD Q2 AX ese es el entro de l jF
PF il vlor de los perentiles PS y USD urtiles primero y terero respetivmente @Q1 y Q3 AX son los ldos inferior y superior de l jF QF il digrm no represent los lmites P25 1.5 IR y P75 + 1.5 IRF in su lugrD sel los ltimos puntos no tpios por dejo @Li A y por enim @Ls AD es deirD sel el ltimo dto por enim de
P25 1.5 IR y el ltimo dto por dejo de P75 + 1.5 IRD y los represent omo
de l jF RF xormlmente represent on rulos los dtos tpiosF
bigotes
que slen
34
pigur PFUX hesripin de un digrm de jF puenteX httpXGGesFwikipediForgGwikiGhigrmdej simetri de EIFUWAD mientrs que los de l segund serie son lrmente simtrios l dereh @oe(iente de simetr de IFUIAF hdo que no er esperle que surgiern diferenis entre ls dos seriesD deemos preguntrnos qu psF r trtr de nlizr ms profundmente los dtosD vmos proporionr tmin los dos digrms de j de ms seriesF epreen en l pigur PFVF gon ellsD vmos resumir hor ls deisiones que los utores tomron en vist de los resultdos y ls onlusiones ls que llegronF ysrvese que ls diferenis entre ls series no fetn sorprendentemente l onjunto de ls muestrsD sino slo los vlores tpios que se ven en mos digrms de jF iso probara queD en efetoD no hy ningun difereni sistemti entre ls seriesF v siguiente tre es l de inspeionr los dtos tpiosF i mirmos on tenin los dtosD vemos que ls V mediiones ms grndes de l segund serie ourrieron en l pl IHF el ver este hehoD los utores del trjo inspeionron est pl y desurieron que se h ontmindo on un residuo de l pelulD lo que osion ess mediiones tn grndes del espesorF he hehoD los ingenieros eliminron es pl y tod l serie enter por rzones tnisF in l primer serieD enontrron tmin que ls tres mediiones ms js se hn deido un lirdor ml on(gurdoD por lo que ls eliminronF xo se pudo determinr us lgun l existeni de los dos dtos tpios restntesD por lo que permneieron en el nlisisF or ltimoD ntese que despus de este proeso de depurin de los dtos que el nlisis medinte istdsti hesriptiv h motivdoD l distriuin de los dtos tiene un evidente form de mpnF
Prof. Dr. Antonio Jos Sez Castillo
35
36
Parte II
Clculo de Probabilidades
QU
Captulo 3
Probabilidad
emos que l teor de l proilidd en el fondo slo es sentido omn reduido luloY nos he preir on extitud lo que ls mentes rzonles tomn por un tipo de instintoD inluso sin ser pes de drse uentFFF is sorprendente que est ieniD que surgi del nlisis de los juegos de zrD llegr ser el ojeto ms importnte del onoimiento humnoFFF vs priniples uestiones de l vid sonD en grn medidD meros prolems de proiliddF ierre imonD wrqus de vple
Resumen. il ptulo proporion un trtmiento de los experimentos uyos resultdos no se pueden predeir
on ertez trvs del onepto de proiliddF e nlizn ls propieddes de l proilidd y se introdue tmin el onepto de proilidd ondiiondD que surge undo un sueso modi( l signin de proiliddes previF
Palabras clave: experimento letorioD experimento determinstioD espio muestrlD suesoD proiliddD
proilidd ondiiondD independeni de suesosF
3.1. Introduccin
onsiderndo
probables quellos eventos en los que tenemos un lto grdo de reeni en su ourreniF in est lneD Probabilidad es un onepto soido l medid del azarF min pensmos en el zr
vinuldoD fundmentlmenteD on los juegos de zrD pero desde es pti tn reduid se nos espn otros muhsimos ejemplos de fenmenos de l vid otidin o soidos disiplins de distints ienis donde el zr jueg un ppel fundmentlF or itr lgunosX u nmero de uniddes de produin slen d d de un den de montjec xo existe un nmero (jo que pued ser onoido prioriD sino un onjunto de posiles vlores que podrn drseD d uno de ellos on un ierto grdo de ertezF gul es el tmo de un pquete de informin que se trnsmite trvs de rc xo existe en relidd un nmero (joD sino que ste es desonoido prioriF QW
gul es l posiin de un ojeto detetdo medinte qc hiho sistem otieneD relmenteD un estimin de dih posiinD pero existen mrgenes de error que determinn un regin del plno donde el ojeto se enuentr on lt proiliddF u ruido se dhiere un sel que se env desde un emisor un reeptorc hependiendo de ls rterstis del nlD diho ruido ser ms o menos relevnteD pero su preseni no podr ser onoid prioriD y deer ser diferenid de l sel primitivD sin que se onoz stD teniendo en uent que se trt de un ruido
aleatorioF
in todos estos ejemplos el zr es un ftor insoslyle pr onoer el omportmiento del fenmeno en estudioF
experimento aleatorioF
1F
que
conjunto es un olein de elementosF e die que B es un subconjunto de A si todos sus elementos lo son tmin de AD y se notr B AF
1 Es mejor que aceptemos desde el principio que la Estadstica no es la ciencia de la adivinacin: tan slo se ocupa de cuanticar cmo de incierto es un evento y, ocasionalmente, de proponer estrategias de prediccin basadas en dicha medida de la incertidumbre.
40
unin
interseccin
particin
Ac D est formdo por todos los elementos de que conjunto complementario de un onjunto AD A
= AA = AA (Ac ) = A = B Si B A A = B. Si A = B A
pinlmenteD menionemos ls llmds veyes de worgnX
c
B AB =A
B. AB =A
41
il onjunto formdo por todos los posiles resultdos del experimento letorio reie el nomre de espacio
ensayo o realizacin
suceso o eventoF
si se oserv en diho ensyo ulquier
ocurre un suceso A
n oservin importnte es que el espio muestrl no tiene por qu ser nioD sino que depender de lo que deseemos oservr del experimento letorioF mos poner este heho de mni(esto en los siguientes ejemplosF
Ejemplo. n experimento hitul en fiolog onsiste en extrerD por ejemploD pees de un roD hst
dr on un pez de un espeie que se dese estudirF il nmero de pees que hr que extrer hst onseguir el ejemplr desedo de l espeie en estudio formr el espio muestrlD = {1, 2, 3, ...}D si es que el investigdor dese oservr extmente el nmero de pees hst extrer ese ejemplr desedoF ysrvese que se trt de un onjunto no otdoD pero numerleF gomo ejemplos de posiles suesos de inters podrmos poner los eventos {IDPDQDRDS}D {myor o igul S}DFFF upongmos hor que el investigdor slo est interesdo en ompror si hen flt ms de S exE triones pr otener un ejemplr de l espeie en estudioF in ese soD el espio muestrl ser
= {> 5, 5}F
Ejemplo.
zr entre H y ID un espio muestrl ser = [0, 1]F e difereni de los nteriores ejemplosD este espio muestrl no es (nitoD ni siquier numerleF gomo ejemplo de suesos posiles en este espio muestrl podemos destrD entre otrosD {menor que HFS} D {myor que HFPS}D {menor que HFUS} DFFF ytro espio muestrl podr ser oservr el vlor deiml myor ms ernoF or ejemploD si sle HFPSD me interes HFQF in ese so el espio muestrl ser = 0.1, 0.2, ...1F iste espio muestrl servirD por ejemploD pr sorter nmeros entre I y 10D sin ms que multiplir el resultdo otenido por IHF
42
in estos ltimos ejemplos podemos ver que hy dos grndes tipos de espios muestrles segn el nmero de suesos elementlesF n espio muestrl se die elementlesF or el ontrrioD un espio muestrl se die suesos elementlesF
discreto si est formdo por un onjunto (nito o in(nito numerle de suesos continuo
si est formdo por un onjunto no numerle de
funcin de probabilidad
pr ese espio muestrl es ulquier funin que signe d sueso un nmero en el intervlo [0, 1] y que
P [n i=1 Ai ] =
i=1
P [Ai ] .
Nota. ry que notr que se puede dr ms de un funin de proilidd soid l mismo espio
muestrlF or ejemploD soido l espio muestrl = {cara, cruz }, del lnzmiento de un monedD pueden drse un nmero in(nito no numerle de medids de l proiliddY onretmenteD soids d elein
P [cara] = p P [cruz ] = 1 p,
pr d p [0, 1] . eunque si l moned no est rgdD omo suede hitulmenteD se onsider el so en que p = 1 2.
Ejemplo. olviendo sore el lnzmiento del ddoD si ste no est rgdoD podemos de(nir l siguiente
funin de proiliddX
P [{i}] =
1 , i = 1, 2, ..., 6. 6
43
Ejemplo. il iruito que pree en l pigur QFI est onstituido por dos interruptores @switches A en
prleloF v proilidd de que ulquier de ellos est errdo es de 1 2F r que pse orriente trvs del iruito st on que pse orriente por lguno de los dos interrupE toresD esto esD que l menos uno de ellos est errdoF or tntoD si notmos por
corriente a travs del circuito E
l sueso
que pase
Ei
l sueso
que el interruptor
est cerrado,
entonesD
44
N de lanzamientos N de caras
N. de caras N. de lanzamientos
IH R HFR
IHH RT HFRT
P [A] = l m
nA , n n
donde nA es el nmero de ourrenis de A en n ensyos del experimentoF ist interpretin se onoe omo
denicin frecuentista de la probabilidad.
e trt de un interpretin
de rter eminentemente prtio porque permite un proximin fsi l onepto de proiliddD pero se ve limitd por ls ompliiones que supone l de(niin en trminos de un lmite queD omo tlD slo se lnz
en el innitoF
Ejemplo. e hn relizdo IHHH lnzmientos de un monedF in el gudro QFI pree un resumen de ese
proesoF uede oservrse omo unto myor es el nmero de lnzmientosD ms se proxim l freueni
1 reltiv l vlor 2 D de mner que podrmos pensr que l proilidd de r es igul que l proilidd
de ruz e igules ms
1 2D
estritmente l de(niin freuentist deermos ontinur hst el in(nitoD lo que result imposileF ist interpretin freuentist de l proilidd permite inferir lo que podemos llmr
radas. frecuencias espe-
n veesD
Ejemplo. iguiendo on el ejemplo de l monedD si l lnzmos QRV veesD lo esperle es que slgn
lrededor de 348 0.5 = 174 rsF
muhs vees y
ontr unts vees llueveF odrmos pensr si hubiera muchos das como el de maana, aproximadamente ero eso no tiene sentido porque el d de mn es nioF
45
v interpretin sujetiv de l proilidd tiene que ver on l vinulin de este onepto on el grdo de inertidumre que tenemos sore ls ossF i tenemos un experimento letorioD el resultdo de diho experimento es iniertoF v proilidd de un resultdo del experimento es el grdo de reeni que yo tengo en l ourreni de diho resultdoF ise grdo de reeni es personlD luego es sujetivoD pero lgimenteD deer estr orde on l informin que tenemos sore el experimentoF
de r y l proilidd de ruz son ms del SH 7F in generlD si el espio muestrl est formdo por N resultdos posiles y todos ellos tienen l mism proilidd @equiprolesAD podrmos deir que l proilidd de un evento A, P [A] , es
P [A] =
NA , N
donde NA es el nmero de resultdos fvorles l ourreni de A. ist frmulD onoid omo permite deduir que
frmula de Laplace
P [cara] =
1 2
en el lnzmiento de un moned sin tener que lnzr l moned un grn nmero de veesF in emrgoD l de(niin tiene dos grndes inonvenientesX el onjunto de resultdos posilesD N D tiene que ser (nito yD demsD todos los resultdos posiles deen tener l mism proilidd @on lo ulD lo de(nido qued implitmente inmerso en l de(niinAF
yvimenteD l proilidd P [A] ser menor que l proilidd P [A | B ] , y que el heho de que est
46
siempre que P [B ] = 0. n funin de proilidd ondiiond P [/B ] es un funin de proilidd en tod reglX por tntoD umple ls misms propieddes que ulquier funin de proilidd sin ondiionrF gomo hemos omentdoD l ide de l proilidd ondiiond es utilizr l informin que nos d un sueso onoido sore l ourreni de otro suesoF eroD omo y hemos puesto de mni(esto en un ejemploD or tntoX hos suesos A y B se dien independientes si P [A | B ] = P [A] , o equivlentemente si P [B | A] = P [B ]D o equivlentemente si P [A B ] = P [A] P [B ] . no siempre un sueso d informin sore otroF in este so se die que mos suesos son independientesF
Ejemplo. gontinundo on el ijemplo QFQFQD lo ms lgio es pensr que los dos interruptores tn
de form independienteD en uyo so P [E1 E2 ] = P [E1 ] P [E2 ] y tenemos queD
P [E ] =
1 1 + P [E1 E1 ] 2 2 1 1 11 3 = + = . 2 2 22 4
47
una parte
un todoF
gundo l proilidd es
todo
es l interseinF
Nota. min suele ser stnte omn l onfusin entre suesos independientes y suesos inompE
tiles o mutumente exluyentesF in este sentidoD reordemos que dos suesos A y B son inomptiles o mutumente exluyentes si
A B = , en uyo so P [A B ] = 0F
or su prteD A y B sern independientes si P [A B ] = P [A] P [B ]F vs diferenis entre mos oneptos son ovisF
Ejemplo. v proilidd de que el produto no se elordo tiempo es HFHSF e soliitn tres pedidos
del produto on l su(iente seprin en el tiempo omo pr onsiderrlos eventos independientesF IF gul es l proilidd de que todos los pedidos se enven tiempoc in primer lugrD notemos Ei l sueso enviar
a tiempo el pedido i-simoF
P [Ei ] = 0.95.
or su prteD nos piden
48
1 E2 E3 E1 E 2 E3 E1 E2 E 3 P E
1 E2 E3 + P E1 E 2 E3 + P E1 E2 E 3 =P E
= 0.05 0.952 + 0.05 0.952 + 0.05 0.952 = 0.135, 1 E2 E3 , E1 E 2 E3 y E1 E2 E 3 son inomptilesF donde se h utilizdo que los suesos E
QF gul es l proilidd de que dos o ms pedidos no se enven tiempoc engmos en uent que y hemos luldo l proilidd de que todos se enven tiempo y de que todos menos uno se enven tiempoF intonesD
Ejemplo.
esquem se pone de mni(esto que un unidd ser produidd on xito si ps en primer lugr un hequeo previo @eAY despus puede ser montd diretmente @fAD redimensiond @gA y despus montd @hA o dptd @iA y despus montd @pAY posteriormente dee ser pintd @qA y (nlmente emld @rAF gonsideremos que ls proiliddes de psr exitosmente d suproeso son tods ells igules HFWSD y que los suproesos tienen lugr de form independiente unos de otrosF mos lulr en ess ondiiones l proilidd de que un unidd se exitosmente produidF i nos dmos uentD eD q y r son ineludilesD mientrs que un unidd puede ser produid si ps por fD por g y h o por i y pF in notin de onjuntosD l unidd ser produid si se d
A (B C D E F ) G H.
gomo los proesos son independientes unos de otrosD no tenemos prolems on ls proiliddes de ls interseionesD pero tenemos que lulr l proilidd de un unin de tres onjuntosD B C D E F F in generlD
P [A1 A2 A3 ] = P [(A1 A2 ) A3 ] = P [A1 A2 ] + P [A3 ] P [(A1 A2 ) A3 ] = P [A1 ] + P [A2 ] P [A1 A2 ] + P [A3 ] P [A1 A3 A2 A3 ]
49
in estos ejemplosD el lulo de l proilidd de ls interseiones h resultdo trivil porque los suesos son independientesF on emrgoD esto no siempre ourreF gmo podemosD en generlD otener l proilidd de l intersein de dos o ms suesos no neesrimente independientesc in el so de slo dos suesosD A y B D podemos deduir que
P [A B ] = P [A|B ] P [B ]
diretmente de l de(niin de proilidd ondiiondF e prtir de est frmulD por induinD se puede otener l llmd frmul produtoD que se enuni de l siguiente formX si A1 , A2 , ..., An son suesos de un espio muestrl no neesrimente independientesD se veri(
P [A1 A2 ... An ] = P [A1 ]P [A2 |A1 ]...P [An |A1 A2 ... An1 ]
50
Ejemplo. n lote de SH rndels ontiene QH rndels uyo grosor exede ls espei(iones de diseoF
upong que se seleionn Q rndels l zr y sin reemplzo del loteF IF gul es l proilidd de que ls tres rndels seleionds sen ms gruess que ls espei(E iones de diseoc gomenzmos notndo los suesos Ai X l Esim rndel extrid es ms grues que ls espei(E iones de diseo, i = 1, 2, 3F intonesD nos piden
P A3 /A 1 A 2 =
30 . 48
respetivmenteD y juegn un importnte ppel l hor de lulr proiliddesF vos dos utilizn omo
Prof. Dr. Antonio Jos Sez Castillo
{A1 , ..., AN } F un prtiin del espio muestrl y se B un sueso ulquierF intonesD P [B ] = P [B | A1 ] P [A1 ] + ... + P [B | AN ] P [AN ] .
Ejemplo.
PHHH omponentesD on un S 7 de defetuossY l j P ontiene SHH omponentesD on un RH 7 de defetuossY ls js Q y R ontienen IHHH omponentesD on un IH 7 de defetuossF IF gul es l proilidd de esoger l zr un omponente defetuosc xotemos D : omponente defetuos y Ci : omponente de l j iEsimF intonesD se tiene que
P [C1 ] =
2000 2000 + 500 + 1000 + 1000 500 P [C2 ] = 2000 + 500 + 1000 + 1000 1000 P [C3 ] = 2000 + 500 + 1000 + 1000 1000 P [C4 ] = 2000 + 500 + 1000 + 1000
4 9 1 = 9 2 = 9 2 = 9 =
P [D] = P [D | C1 ] P [C1 ] + P [D | C2 ] P [C2 ] + P [D | C3 ] P [C3 ] + P [D | C4 ] P [C4 ] 4 1 2 2 = 0.05 + 0.4 + 0.1 + 0.1 = 0. 11111 9 9 9 9
PF i se esoge un omponente l zr y result ser defetuosD ul es l proilidd de que pertenez l j Ic
P [C1 | D] =
52
xmero I PH SS UH IRS
en d P WS QS VH PIH
j Q PS US IRS PRS
Ejemplo. e disponen tres js donde se lmenn umuldores segn pree en el gudro QFPF
e esoge l zr un j y de ellD su vezD un umuldorF IF gul es l proilidd de que se hy seleiondo un umuldor de HFHIF c xotemos 0.01F, 0.1F y 1.0F los suesos
caja 3D extraer un acumulador de
P [0.01F ] = P [0.01F / c1] P [c1] + P [0.01F / c2] P [c2] + P [0.01F / c3] P [c3] 95 1 25 1 5903 20 1 + + = = 0.23078. = 145 3 210 3 245 3 25 578
PF i h sido seleiondo un umuldor de IFHF D ul es l proilidd de que proed de l j Ic tilizndo el teorem de fyesD
P [c1 / 1.0F ] =
or su prteD
P [1.0F ] = P [1.0F / c1] P [c1] + P [1.0F / c2] P [c2] + P [1.0F / c3] P [c3] 70 1 80 1 145 1 6205 = + + = = 0.48518, 145 3 210 3 245 3 12 789
luego
70 1 145 3 6205 12 789
P [c1 / 1.0F ] =
53
Ejemplo.
que el dgito Q es envido tres vees ms freuentemente que ID y P dos vees ms freuentemente que IF glulemos l proilidd de que un dgito ulquier envido trvs del nl se reiido orretmenteF in primer lugrD si notmos P [X = 1] = pD entones P [X = 2] = 2p y P [X = 3] = 3pF or otr prteD omo
1 = P [X = 1] + P [X = 2] + P [X = 3] = 6p,
se tiene que
P [X = 1] =
1 1 1 , P [X = 2] = y P [X = 3] = . 6 3 2
EjemploF
P [X = 1 / Y = 1] =
P [Y = 1 / X = 1] P [X = 1] . P [Y = 1]
54
or su prteD
P [Y = 1] = P [Y = 1 / X = 1] P [X = 1] + P [Y = 1 / X = 2] P [X = 2] + P [Y = 1 / X = 3] P [X = 3] =
luego
1 + + , 6 6 4
1 6 1 + 6 6
P [X = 1 / Y = 1] =
=2
1 + . 2 + 2 2 3
is posile que no tengmosD en prinipioD dtos pr onoer de form ext ul es l proilidd de AF en sD podrmos trevernosD como e est proilidd iniil que dmos l vmos llmr
probabilidad a priori.
ehor ienD hemos ddo un proilidd priori P [A] sin ningun informin sore AF upongmos hor
Prof. Dr. Antonio Jos Sez Castillo
55
que tenemos nuev informin que nos dr pists er de si A h ourrido o noD y que dih informin est reogid en un sueso que llmremos B1 F in ese soD podrmos y deermos actualizar la probabilidad de A sndonos en est nuev informinD proporionndo un nuev proilidd de A que teng en uent
probabilidad a posterioriF
P [A |B1 ] =
ysrvese que l proilidd posteriori es proporionl l proilidd prioriF pinlmenteD es muy importnte ver que podemos extender est form de trjr plindo el teorem de un form reursivF hespus de onoer B1 D nuestr nuev proilidd pr A es P [A |B1 ]F eusndo de l notinD podemos deir que es es nuestr nuev proilidd priori y siD por ejemploD tenemos ms informin sore AD dd por otro sueso B2 D posteriori ser
P [A |B1 B2 ] = =
P [B2 |AB1 ] P [A |B1 ] |B P [B2 |AB1 ] P [A |B1 ] + P B2 |A B1 P A 1 P [B2 |A ] P [A |B1 ] |B . P [B2 |A ] P [A |B1 ] + P [B2 |A ] P A 1
is muy importnte oservr que en este oiente P [A |B1 ] oup el lugr que ntes oup l proilidd prioriF edemsD est segund proilidd posteriori podr onsiderrse omo l nuev proilidd priori pr un nuev pliin del teorem sd en el onoimiento de nuev informin dd por un sueso B3 F iste proeso de tulizin de ls proiliddes priori sd en l informin disponile puede relizrse unts vees se neesrioF mos ilustrr esto en un pr de ejemplosF
56
P [culpable |ADN + ] =
P [ADN + |culpable ] P [culpable] P [ADN + |culpable ] P [culpable] + P [ADN + |inocente ] P [inocente] 0.995 0.1 = = 0.999548 0.995 0.1 + 0.00005 0.9
is deirD hor piens que el sospehoso es ulple on un WWFWSRV 7 de ertezF pijmonos en que nuestr proilidd priori pree en los trminos HFI en el numerdor y HFI y HFW en el denomindorF isD HFID er l proilidd que tenmos
in emrgoD el sospehoso insiste en su inoeniD y propone someterse un prue de un detetor de mentirsF vos expertos sen que un ulple es pz de engr est mquin en el IH 7 de ls veesD y que l mquin dir el I 7 de ls vees que un inoente mienteF xuestro sospehoso se somete l mquin y st die que es inoenteF gul ser hor l proilidd que el juez sign l ulpilidd del sospehosoc eniendo en uent queX
P [culpable |maquina ] =
P [maquina |culpable ] P [culpable] P [maquina |culpable ] P [culpable] + P [maquina |inocente ] P [inocente] 0.1 0.999548 = 0.9955431. = 0.1 0.999548 + (1 0.01) (1 0.999548)
is deirD n on es prue negtivD el juez n tiene un WWFSSRQI 7 de ertidumre de que el sospehoso es ulpleF he nuevoD podemos resumir este pso diiendo que proilidd prioriAD mientrs que
nuestr
proilidd de que fuer ulple er de HFWWWSRV @que pree en l frmul oupndo l posiin de l
57
Antes de la prueba
HFI HFWWWSRV
P [Culpable]
P [ADN +|culpable ]0.1 P [ADN +|culpable ]0.1+P [ADN +|inocente ](10.1) = 0.999548 P [maquina|culpable ]0.999548 P [maquina|culpable ]0.999548+P [maquina|inocente ](10.999548) = 0.9955431
Despus de la prueba
gudro QFQX isquem del proeso itertivo del teorem de fyes en el ejemplo del juezF v proilidd a @ntes de d prueA es l que se utiliz en l frmul pr otener l proilidd a posteriori @desps de d prueAF v proilidd a posteriori @despusA de un prue es l proilidd a priori @ntesA de l siguiente prueF upongmos que un piez ps ls tres vees y d no defetuosX ul es l proilidd de que relmente se no defetuosc mos empezr notndo deudmente los suesosF xotremos D l sueso ser defetuos y por + dr positivo omo defetuos en l prue de l mquinF emos queX
|+ P D =
is proilidd ps ser l proilidd priori pr l segund vez que d no defetuosF or tntoD l proilidd de que se no defetuos si d negtivo por segund vez es
|+ P D + =
|D P [+ ] 0.9944904 |D ] (1 0.9944904) P [+ |D ] 0.9944904 + P [+ 0.95 0.9944904 = = 0.9994172. 0.95 0.9944904 + 0.1 (1 0.9944904)
|+ P D + + =
|D P [+ ] 0.9994172 |D |D ] (1 0.9994172) P [+ ] 0.9994172 + P [+ 0.95 0.9994172 = = 0.9999386. 0.95 0.9994172 + 0.1 (1 0.9994172)
gomo podemos verD si un piez d no defetuos tres veesD l proilidd de que se relmente no defetuos es ltsimD del orden del WWFWW 7D s que el mtodo idedo por el responsle de lidd pree onsistenteF
58
Antes de la prueba
HFWS HFWWRRWHR HFWWWRIUP
P D
|D P [+ ]0.95 |D |D ](10.95) = 0.9944904 P [+ ]0.95+P [+ |D ]0 .9944904 P [+ |D ](10.9944904) = 0.9994172 |D P [+ ]0.9944904+P [+ |D P [+ ]0.9994172 |D |D ](10.9994172) = 0.9999386 P [+ ]0.9994172+P [+
Despus de la prueba
gudro QFRX isquem del proeso itertivo del teorem de fyes en el ejemplo de l mquin de detein de fllosF v proilidd a priori @ntes de d prueA es l que se utiliz en l frmul pr otener l proilidd a posteriori @desps de d prueAF v proilidd a posteriori @despusA de un prue es l proilidd a priori @ntesA de l siguiente prueF
59
60
Captulo 4
Variable aleatoria. Modelos de distribuciones de probabilidad
ws pesr de todo esoD unque l ml suerte existD muy poos reporteros veternos reen de verdd en ellF in l guerrD ls oss suelen disurrir ms ien segn l ley de ls proiliddesX tnto v el ntro l fuente que l (nl he ngF erturo rez everteD en
Territorio Comanche
Palabras clave: vrile letoriD vrile disretD funin ms de proiliddD vrile ontinuD funin
de densidd de proiliddD funin de distriuinD mediD vrinzD distriuin inomilD distriuin de oissonD distriuin geomtriD distriuin uniformeD distriuin exponenilD distriuin qmmD distriuin normlF
4.1. Introduccin
in el tem nterior hemos visto que l istdsti se oup de experimentos letoriosF in generlD en gieni y enolog se suele nlizr ulquier experimento medinte un o vris medids del mismoF or ejemploD se nliz un ojeto segn su pesoD su volumenD su densiddD su ontenido de guFFFY o se nliz el tr(o de snternet segn el nmero de onexiones un servidorD el volumen totl de tr(o generdoD l veloiddFFF in estos senillos ejemplos oservmos que se h desrito un fenmeno fsioD omo puede ser un ojeto o el estdo de un red de omuniiones en un momento ddoD medinte uno o vrios nmeros o vrilesF gundo ese fenmeno es de tipo letorioD vmos llmr es signin de proilidd P [] . TI
variable aleatoria F
variable aleatoria @ prtir de hor v.a.A es un nmero rel soido l resultdo de un experimento
letorioF e trtD por tntoD de un funin rel on dominio en el espio muestrlD X : R. odemos pensr en un vFF omo en un vrile soid un polin oneptulD y que slo podr oservrse undo se tomen muestrs suysF in l notin que vmos utilizr representremos ls vriles letoris omo funiones siempre en mysulsD y sus vlores onretos siempre en minsulF is deirD si queremos referirnos un vFF ntes de oservr su vlorD podemos notrl omo X, por ejemploY pero un vez que se oserv el vlor de dih vrile @y no esD por tntoD lgo letorioAD deemos notr ese vlor en minsulD por ejemploD omo xF or ejemploD podemos deir que l vrile letori X que orresponde l puntuin otenid l lnzr el ddo puede tomr los vlores x = 1, 2, 3, 4, 5, 6F odremos preguntrnos por l proilidd de que X tome el vlor x = 4 o de que X 6F i lnzmos el ddo y oservmos que h slido un TD diremos que x = 6F xo olvidemos que el ojeto de l istdsti on respeto l oservin de fenmenos letorios es medir l ertidumre o l inertidumre soid sus posiles resultdosF el desriir estos resultdos medinte vriles letorisD lo que tenemos son resultdos numrios sujetos inertidumreF il ojetivo hor es unti(r l proilidd de esos resultdos numrios de lgun formF
discreta
pr d x R.
62
Nota. ysrvese que un funin ms de un vFF disret est de(nid en todos los puntos de l ret
relD pero slo vldr distinto de ero en un onjuntoD lo sumoD numerleD que orresponde on los nios vlores que pueden drse de l vrileF e X un vFF disret y f (x) su funin msF intonesX IF f (x) 0 pr todo x R. PF
xR
f (x) = 1.
P [X B ] =
xi B
f ( xi ) ,
i tenemos un olein de posiles resultdos de l vrile X D x1 , ..., xN , est funin sign l vlor x l freueni on l que diho vlor se d en l muestrD es deirD
femp (x) =
se mo proporionn proiliddes teris y empris stnte preidsF xo ostnteD deermos onluir l luz de estos THH dtos que el ddo no est rgdoc
EX =
x
x f (x).
63
pigur RFIX punin ms empri de un muestr de THH lnzmientos de un ddoF gomo en el so de l medi muestrl de unos dtosD l medi de un vFF se interpret omo el entro de grvedd de los vlores que puede tomr l vrileD on l difereni que en un medi muestrlD el d vlor lo d l freueni de diho vlor en los dtos y qu el por l funin msF hd un vFF disretD X D on funin ms de proilidd f (x)D se de(ne su vrinz omo
peso peso
de
lo determin l proiliddD dd
V arX =
x
(x EX )2 f (x).
v form ms mod de lulr en l prti l vrinz es desrrollndo previmente el udrdo que pree en su de(niinD y que
V arX =
x
(x EX )2 f (x) =
x
=
x
x2 f (x) 2EX
f (x)
=E [X 2 ] 2EX 2 + EX 2 = E [X 2 ] EX 2 .
el igul que ourre on l vrinz muestrl es onveniente de(nir l desviin tpi de un vFFD omo = V arX D que tiene ls misms uniddes que l medi y que se puede interpretr omo un medi del grdo de vriin del onjunto de vlores que puede tomr l vFF respeto del vlor de l mediF
64
proilidd soid los resultdos de l vrile l vmos llmr prtir de hor distribucin de probabilidad de un vFF hmonos uent queD omo mos de omentrD pr determinr l distriuin de proilidd de un vFF slo tenemos que dr su funin funin ms de proiliddF in emrgoD deemos tener en uent que en l vid rel ndie onoe ul es l utnti distriuin de proilidd de un vFFD porque ndie se priori ul es l funin ms de dih vrileF odo lo msD podemos lulr l funin ms empri prtir de los dtos de un muestrF en sD llegr el momento de
pasar al lmiteD
que proponemos y que se prez l distriuin empri de los dtos de l muestrF r yudr ese
babilidadF e trt de frmuls teris de funiones ms que pueden resultr deuds pr determinds
vriles letorisF ry un metfor que puede yudr entender mo se sign un distriuin de proilidd y sore l que undremos en lo suesivoX qu ourre undo queremos omprr unos pntlonesc in generl udimos un tiend de mod yX IF he entre un serie de modelosD elegimos el modelo que reemos que mejor nos vF PF fusmos l tll que he que mejor se juste nosotrosD segn nuestrs rterstisF ues ienD en el so de ls vFF
nuestras caractersticas
en istdsti se estudin
son ls posiles oserviones que tenemos sore l vFF queD por ejemploD
de l tiendD entre los que elegimos el que ms nos gustD son los modelos terios que
que he que los pntlones se justen nosotros deudmente son los prmetros de los
modelos teriosF in lo que rest de este ptulo vmos desriir lgunos de los modelos terios de proilidd ms hitules en el mito de ls sngeniersD omenzndo por el so de vFF disretsF
f (x) = =
px (1 p)
n! nx px (1 p) , x = 0, 1, 2, ..., n. x! (n x)!
65
0.4 B(10,0.25) 0.3 0.2 0.1 0 0.4 B(10,0.5) 0.3 0.2 0.1 0 0.4 B(10,0.75) 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
EX = np V arX = np (1 p) .
se repite n vees de form independiente y que en ese experimento hy un sueso que denominmos
que ourre on proilidd onstnte pF in ese soD l vrile letori X que mide el nmero de xitos in est rterizin es importnte oservr que ls dos hiptesis fundmentles de est distriuin sonX los experimentos se repiten de form l proilidd de xito es
independiente y
constanteF
in l medid en que ests dos hiptesis no sen vlidsD l distriuin inomil no ser deud pr l vrile que uent el nmero de xitosF n ejemplo prtiulr de distriuin inomil lo onstituye l denomind e trt de un distriuin B (1, p)D on funin ms
distribucin de BernouilliF
f (x) =
1 p si x = 0 p si x = 1
66
x P [X = x]
4 0
I
0 4 4 1
P
1 3 4 2
Q
2 2 4 3
R
3 1 4 4
Ejemplo.
gonsideremos omo vFF el nmero de ds l semn que un joven de hoy onsuE rolemente noD porque
me loholF odrmos pensr que se trt de un vFF on distriuin B (7, p)D donde p =
nu mero medio de d as de consumo c 7
IF uede drse el efecto resacaD es deirD si se onsume muho un dD huir del lohol l d siguienteY o el efeto inverso un clavo quita otro clavo Y o FFFY en de(nitivD irunstnis que rompn l hiptesis de independeni en el onsumo en ds distintosF PF ist lro que l proilidd de onsumir un mrtes no esD en generlD l mism que un sdoF mpoo todos los jvenes tienen l mism proilidd de onsumir lohol un d ulquierF
Ejemplo.
niiones stnte imperfetoF or estudios previosD estim que l proilidd de que un dgito se trnsmit inorretmente es del PH 7F il ingeniero env un mensje de R dgitos y se pregunt untos se reiirn inorretmenteF hesde el punto de vist estdstio nosotros no podemos responder es preguntF in reliddD ndie puede responder es pregunt on ertezD porque existe inertidumre ltente en ellX el zr deterE minr untos dgitos se ruznF vo que s podemos her es filitrle el grdo de ertezD es deirD l proiliddD de d uno de los posiles resultdosF gonretmenteD si nlizmos l vrile X X
nmero de dgitos que se reciben incorrectamenteD
teniendo
en uent que el ensyo de d envo de d dgito se hr de form independiente y que nos h diho que l proilidd de que un dgito se rei inorretmente es HFPD podemos (rmr que un modelo de proilidd deudo pr dih vrile es un distriuin B (4, 0.2)F ist distriuin nos permite lulr l proilidd de que se ruen HD ID PD Q o R de los dgitosF vo esquemtizmos en l tl djuntF istos los resultdosD deemos deirle l ingeniero que es hrtmente improle que le fllen los R dgitosD pero que tiene un proilidd @ver gudro RFIA de
67
distribucin
e X P ()F intones
EX = V arX = .
tiempo donde los xitos onteen rzn de vees por unidd de tiempo @en promedioA y de form
el promedio
Ejemplo. v distriuin de oisson suele utilizrse omo modelo pr el nmero de identes ourridos
en los individuos de un polin lo lrgo de un periodo de tiempoF vo que muh gente no termin de sumir es que her es suposiin equivle deir que todos esos individuos tienen el mismo riesgo de tener un idente y que el heho de que un individuo teng un idente no modi( pr nd l proilidd de sufrir un nuevo identeF is evidente que en muhs situiones de l vid rel eso no es iertoD s que el modelo no ser deudo en ellsF
Ejemplo. ytr pliin muy omn de l distriuin de oisson es l nmero de prtuls por unidd
de volumen en un )uido undo un disoluin est relmente ien disueltF in so de que los dtos indiquen que l distriuin de oisson no es deudD podrmos de heho inferir que l disoluin no est ien disueltF
Ejemplo.
oisson es en el mito del nmero de soliitudes de serviio un servidorF or ejemploD se suele onsiderr que el n de llmds un entrlit o el n de onexiones un servidor sigue un distriuin de oissonF
68
in emrgoD hy que deir que unque este uso de l distriuin de oisson es muy omnD es evidente que l hiptesis de que el promedio dee ser onstnteD no se d en ests pliionesD y que uno de los fenmenos ms onoidos en teleomuniiones es el de la
hora cargada X
no es el mismo promedio de
algo
llmds el que se produe ls IP del mediod que ls Q de l mnF vo que se suele her es plir uno de los prinipios ms importntes unque menos esritos de l ingenierD l ley de wurphy @si
puede ir mal, preprate para ello, porque en algun momento ir mal AX
sD ls redes de teleomuniiones
suelen dimensionrse pr ser pes de funionr en el peor de los esenrios posilesD es deirD undo el promedio de soliitudes es el que se d en l hor rgdF
ediionlmenteD supongmos que el experimento se repite un grn nmero de veesD es deirD n es grnde y que el xito es un sueso rroD es deirD p es pequeoD siendo el promedio de ourrenisD = npF in ese soD l vrile letori X que mide el nmero de xitos sigue @proximdmenteA un P ()F in est segund rterizin se suele onsiderr eptle l proximin si n > 20 y p < 0.05. i
n > 100D l proximin es generlmente exelente siempre y undo np < 10F ry que tener en uent que
pr esos vlores de los prmetrosD l distriuin inomil tendr stntes prolems pr ser omputdD y que se exigirD entre otros lulosD el lulo de n! pr un vlor de n ltoD por lo que l proximin es muy tilF
Ejemplo.
es de
1 1200 D
upongmos que un frinte de mquinri pesd tiene instldos en el mpo QVRH determinemos l proilidd de que
generdores de grn tmoF i l proilidd de que ulquier de ellos flle durnte el o en urso
a. b.
il promedio de motores que flln en el o es = np = (3840)(1/1200) = 3.2F e X l vrile que de(ne el nmero de motores que pueden fllr en el oD on vlores x =
0, 1, 2, 3, ...., 3840F
in prinipioD X B (3840, 1/1200) , pero ddo que n es muy grnde y p muy pequeoD podemos onsiderr que X P (3.2)F or tntoD
P [X = 4] =
or su prteD
P [X > 1] = 1 P [X = 0, 1] = 1
69
0.4 P(1) 0.3 0.2 0.1 0 5 0.2 P(5) 0.15 0.1 0.05 0 5 0.2 P(10) 0.15 0.1 0.05 0 5 0 5 10 15 20 25 0 5 10 15 20 25 0 5 10 15 20 25
distribucin
1p p 1p V arX = . p2 EX =
que ourre on proilidd onstnte pF in ese soD l vrile letori X que uent el nmero de
70
0.4 Geo(0.25) 0.3 0.2 0.1 0 5 0.8 Geo(0.5) 0.6 0.4 0.2 0 5 0.8 Geo(0.75) 0.6 0.4 0.2 0 5 0 5 10 15 20 25 0 5 10 15 20 25 0 5 10 15 20 25
Ejemplo. iguiendo on un ejemplo nteriorD sore el ingeniero que env dgitos trvs de un nl
imperfetoD hor se plnte untos dgitos se reiirn orretmente hst que uno se rueD siendo que l proilidd de que uno ulquier lo hg es de HFPF v vrile de inters hor es Y X n
de dgitos que se reciben bien hasta el primero que se cruzaF
ist
vrile tiene omo modelo de proilidd un distriuin Geo(0.2)F qris este modeloD podemos deirleD por ejemploD que l proilidd de que enve ien dos y que flle el terero es de
distribucin
f (x) =
donde (x) =
(a + x) x pa (1 p) pr x = 0, 1, 2, ... (a) (x + 1)
71
1p p 1p V arX = a 2 p EX = a
que ourre
on proilidd onstnte pF in ese soD l vrile letori X que uent el nmero de frsos hst xito sigue un BN (k, p)F in este soD demsD y ddo que (r) = (r 1)! si r es un
f ( x) = =
pr x = 0, 1, 2, ...
Ejemplo.
toD untos dgitos se trnsmitirn orretmente hst que dos lo hgn inorretmentec he nuevo tenemos que sumir que no hy un respuest pr estoD pero s podemos onsiderr un modelo de proilidd pr ello que nos yude tomr deisionesF e Z X
n de dgitos que se reciben bien hasta que dos se cruzanF
BN (2, 0.2)F qris este modeloD podemos deirle l ingenieroD por ejemploD que l proilidd de
que se le ruen P dgitos on IH o menos envos es
8
P [Z 8] =
z =0
P [Z = z ] =
72
0.1 BN(2.5,0.25)
0.05 0.02 0 10 0.4 BN(2.5,0.5) 0.3 0.2 0.1 0 10 0.8 BN(2.5,0.75) 0.6 0.4 0.2 0 10 0 10 20 30 40 0.3 0.2 0.1 0 10 0 10 20 30 40 0 10 20 30 40 0.15 0.1 0.05 0 10 0.4 BN(5,0.75) 0 10 20 30 40 0 10 0.2 BN(5,0.5)
10
20
30
40
10
20
30
40
continua
4.4.2. Histograma
ry un difereni fundmentl entre ls vriles disrets y ls ontinusX en ls disrets podemosD l menosD numerr los posiles vlores y ontr el nmero de vees que sle d vlor posile en un muestrF in emrgoD por el rter que tienen los intervlos de nmeros relesD por muy grnde que fuer l muestr
Prof. Dr. Antonio Jos Sez Castillo
73
0.8
Densidad
0.6
Densidad 0 1 2 3 4 5 6
0.4
0.0
0.2
0.0 0
0.2
0.4
0.6
0.8
pigur RFTX ristogrmsF que tomrmos de un vrile ontinuD jms tendrmos ms de un vlor de lgunos puntos que puede tomr l vrile1 F or es rznD en un vrile ontinu no podemos de(nir un funin ms empriD preismente porque los vlores de un vrile ontinu no tienen ms de proiliddF in emrgoD omo semosD existe un representin nlog l funin ms empri que permite proximr ls proiliddes de los vlores de un vrile ontinuX el histogrmF mos onsiderr un senillo ejemplo pr ilustrr est uestinX medinte simulmos dos muestrs de un vrileD un on N = 100 vlores y otr on N = 1000F ristogrms soidos ests muestrsD on IH y QI intervlosD respetivmenteD preen en l pigur RFTF eniendo en uent que el re de ls rrs represent l freueni reltiv on que se dn los vlores de los suesivos intervlos en l muestrD en estos histogrms podemos ver que l vrile tom myoritrimente vlores ernos eroY tnto ms lejno l ero es un vlorD menos prole pree serF iste desenso de l proilidd es demsD muy usdoD si exponenilF or otr prteD osrvese que l psr de IHH dtos en l muestr IHHH dtosD el histogrm esoz l form de un funin rel de vrile relF in generlD unto myor es N ms se proximn los histogrms l form de un funin ontinuF mos ir viendo ul es l utilidd de es funin desde el punto de vist del glulo de roiliddesF i en el histogrm de l izquierd de l pigur RFT quisirmos lulr l proilidd en l muestr de lguno de los intervlos que de(nen el gr(oD l respuest ser el re de l rr sore diho intervloF i quisirmos l proilidd en l muestr de vrios intervlosD sumrmos ls res de ls rrsF il prolem es que pr que ls proiliddes en l muestr se prezn ls verdders proiliddes es neesrio que el tmo de l muestr se grndeD unto myorD mejorF in ese soD tendrmos un
1 Esto
74
histogrm ms preido l de l dereh de l pigur RFTF in lD de nuevoD si queremosD por ejemploD lulr
P [a < X < b] ,
deermos sumr ls res de ls rrs que formn el intervlo (a, b)D si es que hy intervlos que formnD extmenteD el intervlo (a, b) . ero si el tmo de l muestr es lo su(ientemente mplio pr poder
pasar al lmite
y enontrr un
funin rel de vrile rel f (x) que represente l lne que de(ne el histogrmD lulr un proilidd del tipo P [a < X < b] sumndo ls res de ls rrs de los intervlos in(nitesimles que formn el intervlo
(a, b) equivle integrr dih funin en el intervlo (a, b)D es deirD P [a < X < b ] =
a b
f (x) dx.
que pr ulesquier a, b R o a, b = D
f (x) dx
Nota.
hdo que efetos del lulo de integrles un punto no fet l resultdo de l integrlD si
iste heho pone de mni(esto que los vlores onretos de un vrile letori ontinu no tienen ms de proiliddD y que
P [X = x0 ] =
x0
f (x) dx = 0,
x0
pero s tienen densidd de proiliddD f (x0 )F ist densidd de proilidd represent l proilidd de los intervlos in(nitesimles de vlores lrededor de x0 F esD unque P [X = x0 ] = 0D si f (x0 ) tom un vlor ltoD querr deir que los vlores lrededor de x0 son muy prolesF
75
IF f (x) 0 pr todo x R. PF
f ( x) = 1 .
P [X B ] =
B
f (x) dx.
omo
f (t) dt.
i X es un vFF ontinu on funin de densidd f (x) y funin de distriuin F (x)D entones IF l mx F (x) = 0. PF l mx F (x) = 1. QF F es reienteF RF F es ontinuF SF f (x) = F (x) .
Ejemplo.
1=
f (x) dx =
f (x) dx +
0 0
f (x) dx 2c , a
c exp (ax) dx +
c exp (ax) dx =
F (x) =
f (t) dt =
1 ax si x < 0 2e 1 1eax si x 2 + 2
or ltimoD P [X 0] =
f (x) dx = 1 2.
76
0 si x < 0 x si 0 x < 1 . 1 si x 1
f (x) = F (x) =
1 si 0 x 1 0 en otro so
qr(menteD ms funiones preen en l pigur RFVF in est vrileD todos los puntos tienen l mism densidd de proiliddD indindo que todos los intervlos de l mism longitudD dentro de
gonretmenteD si tenemos un vrile letori X y un muestr suy de tmo N, (x1 , ..., xN ) , l funcin
SN (x) =
nu mero de valores x . N
ist funin se utiliz pr proximrse l funin de distriuinD y que pr un grn nmero de vloresD
Prof. Dr. Antonio Jos Sez Castillo
77
pigur RFVX punin de densidd @izquierdA y de distriuin @derehAF l urv empri se preer stnte l funin de distriuinF hiho de otr formD
l m SN (x) = F (x) ,
pr d xF
F (x) =
in l pigur RFW hemos representdo dos funiones de distriuin empris soids sends muestrs de tmo N = 10 @izquierdA y N = 100 @derehAF ysrvese que undo ument el tmo de l muestr @N AD l funin de distriuin empri se pree d vez ms l funin de distriuinF
EX =
x f (x)dxF
v interpretin de l medi de un vFF ontinu esD de nuevoD l de un vlor entrl lrededor del que se dn el onjunto de reliziones de l vFF ytr interpretin es l de
78
si x1 x x2
0 en otro so
EX =
x2
x
x1
1 dx x2 x1
x2
x2 1 x2 x1 2
=
x1
1 x2 x2 1 2 2 x2 x1
1 ( x2 x1 ) ( x2 + x1 ) 1 = (x1 + x2 ) , = 2 x2 x1 2
es deirD el punto medio del intervlo [x1 , x2 ]F
79
glulemos su mediX
EX =
0
x ex dx u=x +
0
dv = ex dx = 1 = 0 + ex
0
x ex 1 = .
ex dx
mos introduir hor el onepto de vrinz de un vFF ontinuD que de nuevo se interpret omo un medid de l onentrin de los vlores de l vFF en torno su mediF
e un vFF X F e de(ne su
varianza omo V ar [X ] = E
(X EX )
v rz udrd de l vrinzD =
V ar [X ] se onoe omo
desviacin tpicaF
gomo en el so de ls vFF disretsD existe un mtodo ms modo pr el lulo de ulquier vrinzF in onretoD
V ar [X ] = E (X EX )
= E X 2 2X EX + (EX )
2
2 2
= E X 2 2 EX EX + (EX ) = E X 2 (EX ) .
gomo se oment nteriormenteD l interpretin de l vrinz es l de un promedio que mide l distni de los vlores de l vrile l medi de stF i l vrinz es pequeD indi un lt onentrin de los vlores de l vrile en torno l mediY y vieversD si l vrinz es grndeD indi lt dispersin de los vlores de l vrile respeto de l mediF
si x1 x x2
0 en otro so
E X
2
x2
=
x1
x2
3 1 1 x3 2 x1 dx = x2 x1 3 x2 x1
x2 + x1 x2 + x2 1 = 2 . 3
80
EX =
por tntoD
x1 + x2 , 2
V ar [X ] = E X 2 EX 2 =
2 ( x1 + x2 ) (x2 x1 ) x2 2 + x1 x2 + x1 = . 3 4 12 2 2
Nota. i tenemos un olein de vriles letoris independientesD es deirD que son oservds sin
que ningun de ells pued in)uir sore ls otrsD es muy til plnterse en osiones por l medi y l vrinz de l sum de tods ellsF mos onsiderr ls vriles X1 , ..., Xn D que pueden ser disrets o ontinusF ues ienD se tiene que l medi de l sum es l sum de ls medis y que l vrinz de l sum es l sum de ls vrinzsY
81
es deirD
E [X1 + ... + Xn ] = EX1 + ... + EXn V ar [X1 + ... + Xn ] = V arX1 + ... + V arXn
f (x) =
1 x 2 x 1
si x1 < x < x2
0 en otro so
e X U (x1 , x2 )F intones
x1 + x2 2 2 (x2 x1 ) V arX = . 12 EX =
82
e X un vFF ontinu que puede tomr vlores x 0F e die que X sigue un distribucin
exponencial
F (x) = P [X x] =
e X exp ()F intonesD
1 ex si x 0 . 0 en otro so
1 1 V arX = 2 . EX =
P [T > 10/60] =
15e15t dt = e15/6 .
1/6
Ejemplo.
ontexto de ls redes de omuniiones omo modelo pr el nmero de soliitudes un servidor por unidd de tiempoF egn est rterizin que mos de verD eso equivle deir que el tiempo que ps entre dos soliitudes un servidor sigue un distriuin exponenilF or ejemploD supongmos que el nmero de onexiones un servidor p sigue un distriuin de oisson de medi PFS onexiones l horF in ese soD podrmos preguntrnos ul es l proilidd de que psen ms de dos hors sin que se produz ningun onexinF eniendo en uent que el tiempo entre onexiones seguir un distriuin exponenil de prmetro PFSD es proilidd ser
P [T > 2] =
2
2.5e2.5x dx = e5
83
o ien
propiedad de no
Ejemplo. il tiempo de vidD T D de un iruitoD sigue un distriuin exponenil de medi dos osF
glulemos l proilidd de que un iruito dure ms de tres osX
P [T > 3] = e 2 3
upongmos que un iruito llev S os funionndoD y que nos plntemos l proilidd de que n funione Q os msF egn l propiedd de no memoriD es proilidd es l mism que si el iruito r de omenzr funionrD es deirD
distribucin Gamma de
f (x) =
donde (x) =
a1
84
1 exp(1)
0.5
0 0.2
10
12
14
16
18 exp(5)
20
0.05
10
12
14
16
18
20
in el ontexto de ls teleomuniionesD hy un so espeilmente interesnteF i a = nD nmero nturlD l distriuin se denomin del tiempo que ps entre n llmds telefnisD por ejemploF ytro so prtiulr lo onstituye l
Erlang. vo que l he interesnte es que est distriuin se utiliz omo modelo distribucin 2 con r grados de libertadD que no es ms que un
Gamma
r 1 2, 2
F ist distriuin se utilizD por ejemploD pr evlur l ondd del juste de un distriuin
a a V arX = 2 . EX =
k + rD T D es un vFF que sigue un Gamma (r, )F hdo que r es un enteroD en relidd es un Erlang (r, )F
85
Gamma(2.5,1) 0.20
Gamma(5,1)
0.00
0.10
10
15
20
25
30
10
15
20
25
30
Gamma(2.5,0.2) 0.04
0.02
0.06
Gamma(5,0.2)
0.00
10
15
20
25
30
10
15
20
25
30
0.030
Gamma(2.5,0.1)
0.010
0.020
Gamma(5,0.1)
0.000
10
15
20
25
30
10
15
20
25
30
pr todo x R.
ysrvese que es l ni distriuin que hemos visto hst hor que tom todos los vlores entre y
+ F
e X N (, )F intones
EX = V arX = 2 .
il propio nomre de l distriuin normal indi su freuente uso en ulquier mito ient(o y tenolgioF iste uso tn extendido se justi( por l freueni o normlidd on l que iertos fenmenos tienden preerse en su omportmiento est distriuinD y que muhs vriles letoris ontinus presentn un funin de densidd uy gr( tiene form de mpnF istoD su vezD es deido que hy muhs vriles soids fenmenos nturles uys rterstis son omptiles on el modelo letorio que supone el modelo de l normlX grteres morfolgios de individuos @personsD nimlesD plntsD FFFA de un espeie @tllsD pesosD envergdursD dimetrosD permetrosD FFFAF
86
0.4 N(0,1) 0.3 0.2 0.1 0 10 0.4 N(1,1) 0.3 0.2 0.1 0 10 0.4 N(1,1) 0.3 0.2 0.1 0 10 5 0 5 10 5 0 5 10 5 0 5 10
0.1 N(0,4)
0.05
0 10 0.1
10 N(1,4)
0.05
0 10 0.1
10 N(1,4)
0.05
0 10
10
pigur RFIPX puniones de densidd de l distriuin norml grteres (siolgios @efeto de un mism dosis de un frmoD o de un mism ntidd de onoAF grteres soiolgios @onsumo de ierto produto por un mismo grupo de individuosD puntuiones de exmenFFFAF grteres psiolgios @oiente inteletulD grdo de dptin un medioD FFFAF irrores ometidos l medir ierts mgnitudesF lores estdstios muestrlesD omo por ejemplo l mediF ytrs distriuiones omo l inomil o l de oisson son proximds por l normlD FFF in generlD omo veremos enseguidD ulquier rtersti que se oteng omo sum de muhos ftores independientes enuentr en l distriuin norml un modelo deudoF ixiste otr rzn ms prgmti pr el uso tn extendido de l distriuin normlX sus propieddes mtemtis sonD omo iremos viendoD si inmejorlesF iso ondue que si siempre se trte de forzar l modelo norml omo modelo pr ulquier vrile letoriD lo ulD en osiones puede onduir errores importntes en ls pliiones prtisF vo ierto es que tmin son freuentes ls pliiones en ls que los dtos no siguen un distriuin normlF in ese so puede ser relevnte estudir qu ftores son los que provon l prdid de l normlidd yD en ulquier soD pueden plirse tnis estdstis que no requiern de es hiptesisF
Prof. Dr. Antonio Jos Sez Castillo
87
e X N (, )F intonesD
Z=
propiedd que suele onoerse omo
X N (0, 1) ,
tipicacin de la normal.
ist onoid propiedd tiene un pliin prti muy usulF hds ls rterstis de l densidd gussinD no es posile lulr proiliddes soids l norml de form extD y que ls integrles del tipo
1 2 2
exp
(x ) 2 2
dx
no pueden ser expresds en trminos de ls funiones usulesD y slo pueden lulrse por mtodos nuE mriosF xo ostnteD existen tls donde preen multitud de vlores de l funin de distriuin de l distriuin N (0, 1) y prtir de ellos se pueden lulr otrs tnts proiliddesD utilizndo l propiedd de tipi(inF or ejemploD si queremos lulr l proilidd de que un vrile X N (, ) est en el intervlo [a, b]D tenemos
P [a X b] = P
a X b = FZ
FZ
donde FZ () es l funin de distriuin de un vrile Z N (0, 1)D que puede evlurse medinte el uso de tlsF mos verlo en un ejemploF
Ejemplo. in el rtulo ndies de relin pesoEtll omo indidores de ms musulr en el dulto del sexo msulino de l revist Revista Cubana Aliment. Nutr. @IWWVYIP@PAXWIESA pree un
oletivo de vrones on un peso uy medi y desviin estndr sonD respetivmenteD TSFT y IIFUF IF gmo podemosD medinte ls tls de l N (0, 1)D lulrD por ejemploD l proilidd de que uno de esos vrones pese ms de UTFPS kilosc
P [X > 76.25] = P
P [X < 60] = P
P [60 < X < 76.25] = P [X < 76.25] P [X < 60] = 0.819 (1 0.684)
88
pigur RFIQX fsqued de proiliddes en l tl de l N (0, 1)F lor de l proilidd l izquierd de HFWI
RF gunto pesr quel vrn tl que un S 7 de vrones de ese oletivo pesn ms que lc is deirD ul ser el vlor de x tl que P [X > x] = 0.05 oD equivlentementeD P [X < x] = 0.95F hdo que
P [ X < x] = P
tn slo tenemos que usr el vlor z = en uyo soD x = 65.6 + 11.7 1.645F
89
pigur RFIRX fsqued de vlores z en l tl de l N (0, 1)F lor de Z que dej l dereh un proilidd de HFWS
de proiliddD distriuin de medi X y desviin tpi X F in ese soD l sum de ests vriles sigue proximdmente un distriuin norml undo N es elevdoD es deirD
N
Xi N N X , N X .
i=1
Xi N X N (0, 1) . N X
iste teorem es el que proporion un justi(in mtemti del porqu l distriuin gussin es un modelo deudo pr un grn nmero de fenmenos reles en donde l vFF oservd en un momento ddo es el resultdo de sumr un grn nmero de suesos letorios elementlesF
Xi N 0.5N,
Xi D diujndo su histogrm
90
0.5
1.5
100 50 0 0 1 2 3 4 5
100 50 0 0 2 4 6 8 10
en d soF istos histogrms preen en l pigur RFISF in ell se pone de mni(esto omo segn
D de ls vriles X1 , ..., XN D podemos inunindo el eorem gentrl del vmite en trminos de l mediD X
deir que si N es grndeD
N (, / N ) X
91
Ejemplo. n ingeniero dise un prto de medid que reliz un proximin ms impreis que
el prto trdiionl pero muho ms rtF r reduir el mrgen de error de l medid relizdD el ingeniero propondr que se relien un nmero determindo de medids sore el mismo ojeto y que se onsidere l medi de ests medids omo vlor (nl de l medid del ojetoF sniilmenteD el ingeniero he un vlorin que le llev onluir que el prto est ien lirdoD es deirD que l medi de l medid del prto oinide on l medid relD y que l desviin tpi de ls medids del prto es igul HFUSF gunts medids dee proponer el ingeniero pr que el error de medid se inferior HFI on un WS 7 de proiliddc impeemos onsiderndo que d medidD Xi D tiene omo medi el verddero vlor de l medid del n = i=1 Xi D donde relmente nos ojetoD x0 D y desviin tpi HFUSF or su prteD l medid (nl ser X
n
interes onoer el vlor de nF r elloD tengmos en uent que se nos pide que
x0 < 0.1 = P x0 0.1 < X < x0 + 0.1 = P 0.1 n < Z < 0.1 n X 0.75 0.75 0.1 n . =12 1P Z < 0.75 x0 < 0.1 0.95D entones P Z < X
0.1 n 0.75
i queremos que P
0.975D de donde
0.1 n 0.75
1.96 y
entonesD n 216.09F gomo onlusinD ms le vle l ingeniero disminuir l desviin tpi del prto de medidF
sntesis de ellsF
cuantil
de un vFF X F e st disret o ontinuD denominemos f (x) su funin ms o de densiddF e de(ne el until pD Qp de su distriuin omo el primer vlorD xD de l vrile tl que P [X x] pX i l vrile es disretD Qp serD por tntoD el primer vlor tl que
f (x) p.
xi x
92
xtese queD l ser l vrile disretD puede que no logremos otener un iguldd del tipo
xi x
f (x) =
pF
i l vrile es ontinuD Qp s puede otenerse omo el vlor x tl que
f (t) dt = p,
o lo que es lo mismoD omo el vlor x tl que F (x) = pD siendo F l funin de distriuin de l vrileF is muy freuente que l proilidd p l que se soi un until se exprese en porentjeF in ese soD los untiles tmin se pueden llmr percentilesF or ejemploD el until HFS es el perentil SHD l medinF hesde luegoD lo ms importnte es que interpretemos qu signi( el until p de un vFF gomo en istdsti hesriptivD se re(ere l vlor de l vrile que dej por dejo de s un proporin p de vlores de l vrileF intonesD si un vlor onreto orresponde on un until ejemplosF
altoD
alto
duracin media
in segundo lugrD ddo que tenemos que proponer un modelo de distriuin de proilidd pr l duE rin de l lmprD vmos onsiderr el ms senillo que suele emplerse en este tipo de pliionesX l distriuin exponenilF ist hiptesis tmin podr ser disutidD pero otros modelos ms omplejosD omo l distriuin eiullD omplirn stnte nuestros lulos queD por otr prteD tienen slo (nes ilustrtivosF or tntoD vmos suponer que l durin de l omill es un vrile letoriD DD on distriuin exponenil de medi V os yD por tntoD on prmetro = 1/8F ehor que y tenemos un modelo proilstio podemos plnternos muhs ossX is muy prole que l lmpr lne su vid medic
P [D > 8] =
8
1 x e 8 dx = e8/8 = 0.3678794. 8
ysrvese que eso es lgo que ourrir on ulquier exponenilX l proilidd de que se supere l medi es slo del QTFUW 7F hiho de otr formD l medi es el perentil TQ proximdmenteD lo que impli que slo el QU 7 proximdmente de ls lmprs supern su vid mediFFF sorprendentec
Prof. Dr. Antonio Jos Sez Castillo
93
ul es el vlor que supern el SH 7 de ls lmprsc e trt de l medinD M e = F 1 (0.5) , donde F () es l funin de distriuinF or tntoD l medin es l soluin de l euin
1 eM e = 0.5,
que result ser M e =
log 0.5
se rompen ntes de SFSRS osF r terminrD nimo los letores interesdos que usquen informin sore el mputo de l vid medi de este tipo de lmprsD sdo en l relizin de prues elerds sore un muestr @stnte reduidD por iertoA de lmprsF
st on que me dig unto pes y mide mi hijo o mi hijD sino que me dig unto pes y unto mide en relin on los nios o nis de su mism eddF in es uestin es dnde entrn los perentilesF in este so jugmos on l ventj de que se hn heho multitud de estudios previos que determinn que tnto el peso omo l ltur son vriles que siguen un distriuin normlF ws nD se hn determindo ls medis y ls desviiones tpis de nios y nis desde los H meses hst l edd dultF mos ponernos en un situin onretD entrndonos en el pesoF engo un hijo de tres meses que pes SFT kilosF v pregunt es se por estudios
est gordo? es bajito?
in ulquier soD
il peditr
previos2
posiin se sit el peso de mi hijoD SFT kilosD dentro de es distriuinF i X es el pesoD ddo que
P [X 5.6] = 0.369,
el peditr me dir que mi hijo est en el perentil QUD lo que quiere deir que es un peln jo de pesoD pero dentro de niveles rzonlesF
2 Fuente:
http://www.familia.cl/salud/curvas_de_crecimiento/curvas_de_crecimiento.htm
Prof. Dr. Antonio Jos Sez Castillo
94
95
96
Captulo 5
Variables aleatorias con distribucin conjunta
Resumen. in el estudio de ls vriles letoris hemos psdo por lto el heho de que un onjunto de
dos o ms vriles puede verse fetdo por un serie de reliones entre ellsF il nlisis desde el punto de vist estdstio de ests reliones es el ojetivo de este ptuloF gomo so espeilD desriiremos de form detlld el modelo que pr ests reliones proporion l distriuin norml multivrinte
Palabras clave: distriuin onjuntD distriuin mrginlD distriuin ondiiondD ovrinzD oe(E
iente de orrelinD norml multivrinteF
5.1. Introduccin
il mundo rel est repleto de reliones todos los nivelesF xosotrosD por rzones ovisD estremos intereE sdos priniplmente en ls reliones que fetn vriles que desrien fenmenos propios del miente ient(oEtenolgioF ists reliones pueden tener muy diverss tipologisF or ejemploD podrmos pensr en reliones usEefetoD omo l queD por ejemploD explir que un pgin e teng un tmo onE siderle
debido
que llev inrustdo vrios rhivos de vdeo y udioD o l que se estlee entre l edd
en os de un vestigio y su ontenido en rono IR1 F ero no slo tendremos reliones usEefetoX por ejemploD semos que el peso y l esttur de un ser humno son vriles muy reliondsD hst el punto que no podemos deir que un person este oes slo on ser su pesoD sino que deemos vlorrlo
relacin a en
su estturF
or otr prteD undo un fenmeno es determinstio y est ien estudidoD ls reliones entre vriles son leyes ms o menos senillsD peroD en ulquier soD son inmutlesF or ejemploD
densidad =
1 Relacin
masa . vol.
WU
eroD qu ourre undo el fenmeno es letorioc vs vriles en ese so son letoris y ls reliones que se puedn dr entre ells no siempre tienen por qu oedeer un ley ojetiv e inmovileF or ejemploD todos somos onsientes de queD omo demosD existe un relin entre el peso y l ltur de un personD pero no existe un
razn de conversin evidente c
pz de lulr el peso exto de lguien prtir de su lturF is y de qu form es es relinc ems pregunts trtrn de ser
evidente que el tiempo de desrg de un pgin we estr reliondo on el tmo de los rhivos que l on(gurnD pero mo de ontestds lo lrgo de este ptuloF en X1 , ..., XN vriles letorisF il vetor ordendo
X1 F F F XN
es un
vector aleatorio de dimensin N F vectores aleatorios continuos o vectores aleatorios discretos undo d un de sus
vectores mixtosD
rlremos de
vriles sen ontinus o disretsD respetivmenteF odrn drse estdstio no nos interes por horF
pero su trtmiento
Ejemplo. gonsideremos el vlor de un sel nlgi que depende del tiempoD x (t)F in est notinD
entendemos que el vlor de l sel podr ser distinto en d instnte de tiempo tF is muy freuente que l sel se oserve relmente ontmind por un ruido letorio que tmin depender del tiempoD
N (t)F in ese soD si oservmos l sel en los instntes t1 , ..., tN D el vetor x (t1 ) + N (t1 ) F F F x (tn ) + N (tn )
es un vetor letorioF
Ejemplo. e estudi el tiempo que un usurio de snternet dedi ver un pgin if (T ) en relin
on vriles omo l ntidd de texto que ontiene (T x)D el nmero de imgenes (I ) y nimiones plsh (F ) de l pginF intonesD el vetor
Tx I F
es un vetor letorioF
98
T1 F F F Tn
es un vetor letorioF
se reprte l proilidd entre todos los posiles resultdos del vetorF r desriirl vmos de(nir los oneptos de funin de densidd o funin ms nlogos los soidos un vrile letoriF e (X1 , ..., XN ) un vetor letorio disretoF intonesD se de(ne su
P (X1 , ..., XN ) A RN =
ARN
99
or elloD
1=
0
ce
x y
dy dx =
0
cex 1 ex dx =
c , 2
P [X + Y 1] = =
0 0
1y
2ex ey dxdy
1
2ey ey e(1y) dy 1 2e + e2 . e2
=
@ver pigur SFIA
si 0 x 3, 0 y 5
0 en otro so
ist densidd onstnte en el retngulo de(nido indi que l distriuin de proilidd es uniforme en diho retnguloF mos lulr l proilidd de que Y se myor que X @ver pigur SFPA
P [Y > X ] =
0
x 3
1 dy dx 15
5x = dx 15 0 x x2 3 7 = | = . 3 30 0 10
100
distribucin marginalF
e (X1 , ..., XN ) un vetor letorio y (Xi1 , ..., Xik ) un suvetor de vriles suyoF in ese soX i el vetor es ontinuoD
...
xj / (xi1 ,...,xik )
dxj .
(x, y ) = x ex(y+1)
fX (x) =
fX,Y (x, y ) dy =
0
xex(y+1) dy = ex
fY (y ) =
fX,Y (x, y ) dx =
0
xex(y+1) dx =
1 (1 + y )
2
pr y > 0F
101
Ejemplo. gonsideremos dos vriles disretsD Q y GD uy funin msD fQ,G (q, g) , viene dd por
fQ,G (q, g ) q=0 q=1
us mrginles respetivs sonX
fQ (q ) =
g
fQ,G (q, g ) 0.06 + 0.18 + 0.24 + 0.12 si q = 0 0.04 + 0.12 + 0.16 + 0.08 si q = 1 0.6 si q = 0 0.4 si q = 1
si g = 0 si g = 1 si g = 2 si g = 3
=
y
si 0 x 3, 0 y 5
0 en otro so
fX (x) = =
fX,Y (x, y ) dy 5 1 dy si 0 x 0 15
1 3
0 en otro so
si 0 x 3
0 en otro so
102
fY (y ) = =
fX,Y (x, y ) dx 3 1 dx si 0 y 0 15
1 5
0 en otro so
si 0 y 5
0 en otro so
e Y es
fX,Y (x, y ) =
glulemos ms mrginlesX
2x si 0 x 1, |y | < x2 0 en otro so
fX (x) =
fX,Y (x, y ) dy
x2
x2
2xdy si 0 x 1
fY ( y ) = =
fX,Y (x, y ) dx
1 |y |
2xdx si 1 y 1 0 en otro so
1 |y | si 1 y 1 0 en otro so
103
ist distriuin vendr rterizd por su funin ms o su funin de densidd se el vetor disreto o ontinuoD y tendr l expresin
condicionadasD segn
fXi1 ,...,Xik ,Xj1 ,...,Xjl (xi1 , ..., xik , xj1 , ..., xjl ) fXj1 ,...,Xjl (xj1 , ..., xjl )
donde fXi1 ,...,Xik ,Xj1 ,...,Xjl (xi1 , ..., xik , xj1 , ..., xjl ) es l funin ms o l funin de densidd onjunt de ls vriles Xi1 , ..., Xik , Xj1 , ..., Xjl y fXj1 ,...,Xjl (xj1 , ..., xjl ) es l funin ms o l funin de densidd onjunt de ls vriles Xj1 , ..., Xjl F in el so ms hitul en el que el vetor teng dimensin dosD tenemos l densidd o l funin ms de
fY |X =x (y ) =
Ejemplo. en ls vriles X
e Y on l funin ms onjunt siguienteX y\x H I P H QGPV QGIR IGPV I WGPV QGIR H P QGPV H H
vs mrginles son
fX (x) =
y
3 3 1 28 + 14 + 28 si x = 0 9 3 28 + 14 + 0 si x = 1 3 28 + 0 + 0 si x = 2 3 9 3 28 + 28 + 28 si y = 0 3 3 14 + 14 + 0 si y = 1 1 28 + 0 + 0 si y = 2
fY (y ) =
Y = 1 y l de Y ondiiond X = 1.
3 14 6 14 3 14 6 14
si x = 0 si x = 1 . si x = 2 si y = 0 si x = 1 . si x = 2
Prof. Dr. Antonio Jos Sez Castillo
fX |Y =1 (x) =
0
6 14
fY |X =1 (y ) =
9 28 15 28 3 14 15 28
0
15 28
104
gomo es evidenteD un vez que tenemos rterizd l distriuin ondiiond de un vrile letori l vlor de otrD ulquier rtersti de dih distriuinD omo l medi o l vrinzD puede lulrse prtir de su funin ms o su funin de densiddF
EjemploF l y omo plntemos l omienzo del ptuloD supongmos que l posiin (X, Y ) de un
telfono mvil que reie oertur de un nten de telefon se enuentr dentro de un rulo de rdio
r lrededor de es ntenD que supondremos sin prdid de generlidd que se enuentr en el origen
del plnoF mos suponer que es posiin es es evidente que
completamente al azar
onsiderr que l densidd onjunt dee ser onstnte en el ruloY pr que su integrl se l uniddD
fX,Y (x, y ) =
1 r2
si x2 + y 2 r2 y ero en ulquier punto fuer del ruloF mos ver qu podemos verigur sore ls oordends X e Y por seprdo @mrginlesA y sore mo fetn l un l otr @ondiiondsAF in primer lugrD
fX (x) =
r 2 x 2
r 2 x 2
2 r 2 x2 1 dy = r2 r2
fY (y ) =
r2 y2 r2
densosD ms probablesD
si r < y < rF ist lro que pr d oordend por seprdoD los puntos ms son los ernos l origenD que es donde se d el mximo de ms funionesF
ehor supongmos que onoemos un de ls oordends y vemos qu podemos deir sore l otrX
fX |Y =y0 (x) =
si
2 <x< r 2 y0
1 r2
2 y0
2 F enlogmenteD r 2 y0
fY |X =x0 (y ) =
si
1 r 2 x2 0
r 2 x2 0 <y <
105
hitul utilizdo en telefonD X e Y son vriles letoris ontinus on densidd onjunt dd por
fX,Y (x, y ) =
2 ey si 0 x < y 0 en otro so
donde es un onstnte positivF mos lulr ls distriuiones mrginles y ondiionds que pueden drseX wrginl de X X
fX (x) =
2 ey dy = ex si 0 x,
x
fY ( y ) =
0
2 ey dx = 2 yey si y 0F
i nos (jmosD est densidd es un Gamma (2, )D es deir un irlng de prmetros 2 y F gondiiond de Y los vlores de X :
fY /X =x (y ) =
in est expresin no dee olvidrse que x es un vlor (joD ddoF gondiiond de X los vlores de Y :
fX/Y =y (x) =
is deirD onoido el instnte en que lleg l segund llmd (y )D no se se nd de undo lleg l primer llmdD y que l distriuin de X ondiiond Y = y es uniforme en (0, y )F
fX (x) =
1 2 si x = 1 1 2 si x = 1
106
fY ( y ) =
1 2 si y = 1 1 2 si y = 1
fY |X =+1 (y ) =
0.95 si y = 1 0.05 si y = 1
fY |X =1 (y ) =
v distriuin onjunt de X e Y viene dd por
0.95 si y = 1 0.05 si y = 1
fX,Y (x, y ) = P [Y = y | X = x] P [X = x] 0.95 0.5 si x = +1, y = +1 0.05 0.5 si x = +1, y = 1 = 0.05 0.5 si x = 1, y = +1 0.95 0.5 si x = 1, y = 1 0 en otro caso
v distriuin de X ondiiond l sueso Y = +1 viene dd por
fX |Y =+1 (x) =
0.95 si x = 1 . 0.05 si x = 1
fX |Y =1 (x) =
0.05 si x = 1 0.95 si x = 1
107
donde fX,Y ()D fX () y fY () son funin de densidd o funin msD dependiendo de si ls vriles son disrets o ontinusF v interpretin del heho de que dos vriles letoris sen estdstimente independientes es que el omportmiento de un no tiene ningn efeto sore l otr y vieversF ge preguntrse en ese soD qu sentido tiene un distriuin ondiiond de un vrile otr que no gurd ningun relin on ellF mos omprorlo lulndo ls distriuiones ondiionds de vriles letoris estdstimente independientesX
fX |Y =y (x) =
es deirD el omportmiento letorio de un vrile letori ondiiond l vlor de otr que es estdsE timente independiente de ell @desrito medinte l funin fX |Y =y (x)A es ompletmente igul que si no se ondiion diho vlor @desrito por l funin fX (x)AF
24xy si x, y 0 y x + y 1 0 en otro so
fX (x) =
0
1x
24xy dy = 12x (1 x) si 0 x 1
fY (y ) =
0
1y
24xy dx = 12y (1 y ) si 0 y 1.
gomo
108
fX (x) =
0
4xy dy = 2x si 0 x 1
fY (y ) =
0
4xy dx = 2y si 0 y 1.
gomo
Ejemplo. upongmos que dos omponentes eletrnis tienen un durin uy distriuin de proE
ilidd puede onsiderrse exponenil de prmetro = 2 horas1 F vs omponentes funionn en prleloD por lo que podemos onsiderr que son independientesF or lo tntoD su funin de densidd onjunt ser
P [X > 2 Y > 2] = P [X > 2] + P [Y > 2] P [X > 2 Y > 2] = P [X > 2] + P [Y > 2] P [X > 2] P [Y > 2] ,
donde se h utilizdo en l proilidd de l intersein el heho de que ls vriles son independientesF ehor slo str reordr que P [X > 2] = e22 y P [Y > 2] = e22 F gul ser l proilidd de que l durin totl de ms omponentes se inferior dos horsc v durin totl vendr dd por X + Y D luego se nos pregunt por
P [X + Y < 2] = = =
0 0 0
2x
4e2(x+y) dydx
2
2e2x 1 e2(2x)
2
dx
2e2x 2e4 dx
= 1 e4 2e4 2 = 1 5e4
he l interpretin que hemos ddo de vriles independientes se sigue de mner inmedit que si dos vriles letoris son independientesD esto esD no mntienen ningun relinD tmpoo lo hrn funiones
Prof. Dr. Antonio Jos Sez Castillo
109
suysF iste heho se reoge en el siguiente resultdoF vo podemos enunir ms formlmente diiendo que si
X e Y son vriles letoris independientes y V = g (X ) y W = h (Y ) son funiones suysD entonesD V y W tmin son independientesF
in el mito de ls eleomuniiones se dn numeross situiones donde pree un vrile letori
de convolucinF
fW (w) =
fY (y ) fX (w y ) dy
= fX fY (w)
donde fX y fY son ls funiones de densidd de X e Y D respetivmenteF i X e Y son disretsD
fW (w) =
y
fY (y ) fX (w y )
= fX fY (w)
donde fX y fY son ls funiones ms de X e Y D respetivmenteF
Ejemplo.
ponenil de prmetro F i est omponente fllD inmeditmente se pone en funionmiento un omponente extmente igul que hst entones h funiondo en standbyD uy durin notmos por
fTi (x) = ex , i = 1, 2,
pr x > 0F or tntoD
fT (z ) =
0
ex e(zx) dx = 2 zez
pr z > 0F gomo vemosD se trt de un distriuin irlng de prmetros 2 y F i reordmosD est er un de ls rteriziones de l distriuin irlngD sum de exponeniles independientesF
in el so de que en vez de dos vriles letoris se teng un vetor X = (X1 , ..., XN ) D l mner nturl de extender el onepto de independeni es inmeditF
110
componentes independientes si
independientes si
...
E [g (X1 , ..., XN )] =
donde fX1 ,...,XN (x1 , ..., xN ) es l funin de densidd o l funin ms del vetor letorio @entendiendo en este ltimo so l integrl omo un sumAF gomo onseueni inmedit de est de(niinD tenemos un primer e importnte propieddX este operdor espernz multivrinte tmin es linelD en el sentido que se reoge en el siguiente resultdoF gonretmenteD podemos formlizrlo diiendo que si tenemos un vetor letorio (X1 , ..., XN ) y 1 , ..., N eslres ulesquierD entones
111
correlacin entre X
e Y omo
covarianza entre
X e Y omo
Cov [X, Y ] V ar [X ] V ar [Y ]
mos detllr lrmente los posiles vlores de y su interpretinX iste oe(iente es siempre un nmero rel entre EI y IF i es eroD indi un useni totl de relin linel entre ls vrilesF i es uno o menos uno indi un relin linel totl entre ls vrilesD diret o invers segn lo indique el signo @esto lo veremos enseguidAF in l medid en que est ms lejos del ero indi un relin linel ms intens entre ls vrilesF
i dos vriles letoris tienen ovrinz ero o equivlentementeD si RXY = EX EY, se dien que son
ortogonalesF
hos vriles letoris son inorrelds si reen de ulquier tipo de relin linelF or otr prteD de(niE mos nteriormente el onepto de independeni entre vrile letoriD que impli l useni de relin entre ellsF enemosD sD dos oneptosD independeni e inorrelinD que estn stnte reliondosF in onretoD dos vrile letori independientesD X e Y D son siempre inorreldsD es deirD X,Y = 0. v rzn es queD por ser independientesD
112
luego
RXY =
en uyo so Cov [X, Y ] = 0. v pregunt ovi que surge l luz de este resultdo esX y l ontrrioc hos vrile letori inorrelds sern independientesc y equivlentementeD si dos vrile letori no tienen ningun relin de tipo linel @inorreldsAD ourrir que tmpoo tienen ningun relin de ningn tipo @independientesAc v respuest es que no en generlF
EX = EY = E [XY ] =
0 0 0
cos
2
1 d = 0 2 1 d = 0 2 1 d 2
sin
2
sin cos
0 2
1 = 2
sin 2d = 0,
por lo que X e Y son vriles inorreldsF in emrgoD puede demostrrse filmente que no son independientesF
Nota.
v relin ms fuerte de tipo linel que puede drse orresponde l so en que un vrile
XY = 1 signo (a) .
v demostrin es muy senillF engmos en uent que
113
luego
Cov (X, Y ) = E [XY ] EX EY = aE X 2 + bE [X ] EX (aEX + b) = a E X 2 EX 2 = aV arX V arY = E ((aX + b) (aEX + b)) = E (aX aEX ) = a2 E (X EX )
y
2 2 2
= E a2 (X EX ) = a2 V arX,
XY =
Nota. is importnte insistir en que l ovrinz y su versin estndrizdD el oe(iente de orrelin linelD proporionn un medid de l relin linealD no de otro tipoF or ejemploD supongmos que l
pigur SFQ represent los vlores onjuntos de dos vriles X e Y F ist lro que ms gurdn un lrsim relin dd por un prolX de hehoD Y = X 2 F in emrgoD el oe(iente de orrelin linel entre ms ser muy joD y que en reliddD l relin que ls une no es linel en solutoD sino prliF in este soD lo reomendle serD l vist del gr(oD deir que s existe un fuerte relin linel entre X e Y F
pigur SFQX wuestr onjunt de vlores de dos vriles letorisF gundo se tienen muestrs de pres de vriles letorisD podemos lulr l versin muestrl del oe(E iente de orrelin linelF is versin muestrl dr un estimin del verddero vlor del oe(iente de orrelin @polionlAF ist uestin se ord on ms detlle en el ptulo de regresinF equ tn slo queremos plsmr on ejemplos mo se trdue el heho de que dos vriles tengn un myor o menor oe(iente de orrelinF in l pigur SFR oservmos representiones onjunts de muestrs de pres de vriles en unos ejes rtesinos @nues de puntosAF gd punto de d eje rtesino represent un vlor
114
ddo de l muestr del pr (X, Y )F epreen R (gursD orrespondientes R simuliones de pres de vriles
ro=1 8 6 4 2 2 0 2 4 4 2 0 2 4 1 0 1 4 2 6 5 4 3
ro=1
ro=0 4 3 2 1 0 1 2 3 4 2 0 2 4 2 4 4 2 0 6 4
ro=0.7075
pigur SFRX xues de puntos orrespondientes distintos posiles oe(ientes de orrelin linelF
Ejemplo. en X
segund llmdD respetivmenteD un entrlit telefniF v densidd onjunt de ests vriles es fX,Y (x, y ) = ey pr 0 < x < y F in un ejemplo nterior y vimos queD lgimenteD el tiempo hst l segund llmd depende del tiempo hst l primer llmdD pero en qu grdoc mos ordr este prolem lulndo el oe(iente de orrelin linel entre ms vrilesF
115
gomo X,Y =
, tenemos que lulr Cov (X, Y )D V arX y V arY. E [XY ] = xyfX,Y (x, y ) dxdy y xyey dxdy = = =
0 0
yey
y y e dy = 3. 2
0 3
x2 2
dy
0
fX (x) =
luego
fX,Y (x, y ) dy =
x
ey dy = ex D pr x > 0,
EX = fY (y ) = fX,Y (x, y ) dx =
0
xfX (x) dx =
0
xex dx = 1.
ey dx = yey D pr y > 0,
luego
EY = yfY (y ) dy =
y 2 ey dy = 2.
0
or tntoD
Cov (X, Y ) = 3 1 2 = 1.
or su prteD
E X
2
x fX (x) dx =
0 2
x2 ex dx = 2
V arX = 2 12 = 1
y
E Y2 = y 2 fY (y ) dy = V arY = 6 22 = 2,
s queD (nlmenteD
y 3 ey dy = 6
X,Y =
1 = 0.707. 12
vs propieddes del operdor espernz son muy tiles en l prtiD por ejemploD undo se trt de onoer l vrinz de ominiones lineles de vris vrilesF emos lgn ejemplo l respeto y despus un resultdo generl que los engloe todosF
116
V ar (X1 + X2 ) = E (X1 + X2 )
E [X1 + X2 ]
2 2
2 2 2 2 + E X2 + 2E [X1 X2 ] EX1 = E X1 EX2 2EX1 EX2 2 2 2 2 = E X1 EX1 + E X2 EX2 + 2 (E [X1 X2 EX1 EX2 ])
V ar (X1 X2 ) = E (X1 X2 )
E [X1 X2 ]
2 2
2 2 2 2 = E X1 + E X2 2E [X1 X2 ] EX1 EX2 + 2EX1 EX2 2 2 2 2 = E X1 EX1 + E X2 EX2 2 (E [X1 X2 EX1 EX2 ])
N i=1
i Xi .
V ar [X ] =
i=1 j =1
i j Cov (Xi , Xj ) ,
117
N i=1 2
i EXi ,
X X
N
i i Xi X
i=1
i i Xi X j Xj X
=
i=1 j =1 N N
i j E
i Xi X
=
i=1 j =1
i j Cov (Xi , Xj )
V ar [X ] =
i=1 j =1
i j Cov (Xi , Xj ) =
i=1
2 i V ar [Xi ] ,
y que
Cov [X, Y ] =
0 si i = j V ar [Xi ] si i = j
E [X1 ] F , F = F E [XN ]
y su
donde
Ci,j =
ist mtriz ontiene ls vrinzs de d vrile del vetor en l digonl y en el elemento (i, j ) l ovrinz entre l isim y l j sim vrileF in form mtriilD l mtriz de ovrinzs puede de(nirse omo
CX N N = E (X X )N 1 (X X )1N .
or otr prteD
CX = E (X X ) (X X ) = E [XX ] X X ,
118
ems mtriesD CX y RX D son mtries simtrisF v linelidd del operdor medi filit rpidmente l expresin del vetor de medis y l mtriz de vrinzsEovrinzs de ominiones lineles de vetoresD omo se reoge en el siguiente resultdoF gonreE tmenteD si tenemos el vetor letorio XN 1 on vetor de medis X y mtriz de vrinzs ovrinzs CX y el vetor YM 1 = AM N XN 1 + bM 1 D entonesD el vetor de medis y l mtriz de vrinzs ovrinzs de Y vienen dds por
Y = AX + b CY = ACX A .
Ejemplo.
mos ver que l pliin de este resultdo filit stnte determindos lulosF or
X1 + X2 =
de mner que
X1 X2
V ar (X1 + X2 ) =
1 1
5X1 3X2 =
se tiene que
X1 X2
V ar (5X1 3X2 ) =
5 3
119
estr seguros de que se trt del so ms interesnte por dos motivosX porque pree omo modelo deudo en un grn nmero de fenmenos de l nturlez y porque sus propieddes mtemtis on inmejorlesF n vetor formdo por N vriles letoris X = (X1 , ..., XN ) se die que sigue un distribucin
normal
on vetor de
fX (x) =
1 1 exp (x X ) CX (x x ) , 2
1 3 1
1 0
1 . 1
120
0 0 0 0 0 0
2 1 2 0 3 1
1 3 0 1 1 1
in unto ls distriuiones ondiionlesD ulquier suonjunto de vriles de un vetor gussino ondiiondo los vlores de ulquier otro suonjunto de vriles del propio vetor sigue distriuin onjuntmente gussinF gonretmenteD l distriuin de XN 1 ondiiond YM 1 = yM 1 D siendo
yM 1 Y M 1
y mtriz de vrinzsEovrinzs
1 V ar X |Y=y = CX CXY CY CXY ,
ondiiond
X3 =0.25 ]
=0+
3 1
1 1
0.5 0 0.25 0
= 0.125
X3 =0.25 )
=2
3 1
1 1
1 0
= 1.5
121
X Y
2 Y
X Y
1 C( X,Y ) =
1 1 2
XY
1 2 Y
fX,Y (x, y ) =
1 2X Y 1 2
2 2
exp
2 (x x ) (y Y ) (y Y ) (x X ) 1 + 2 2 2 (1 2 ) X X Y Y
1 , 2X Y 12
en el punto (X , Y )F
X | Y = y0 N Y | X = x0 N
X +
X 2 (y0 Y ) ; X 1 2 Y Y 2 (x0 X ) ; Y 1 2 Y + X
ysrvese queD uriosmenteD l vrinz ondiiond no depende del vlor que ondiionF isto tendr importntes reperusiones ms delnteF
gontinundo on ls propieddesD un de ls ms tiles es su invrinz frente trnsformiones linelesF gonretmenteD si tenemos un vetor letorio XN 1 = (X1 , ..., XN ) on distriuin gussinD vetor de medis X y mtriz de ovrinzs CX D entones un ominin linel suyD
YM 1 = AM N XN 1 + bM 1
tiene distriuin gussin de vetor de medis Y = A X + b y mtriz de ovrinzs CY = A CX A F
Ejemplo.
122
pigur SFSX ijemplos de densiddes de l norml ivrintes on X = Y = 0D X = Y = 1 y = 0, 0.5D 0.5 y 0.9F @in httpXGGwwwFilriForgGsnfoervGepuGpulldosGvinerwixedwodelsGeppendixhFhtmAF
Prof. Dr. Antonio Jos Sez Castillo
123
en ls vriles
(Y1 , Y2 ) =
y mtriz de ovrinzs
2 Y 1
1 3
2 4
0 0
0 0
cY1 ,Y2
2 Y 2
cY1 ,Y2
1 3
2 4
4 3
3 9
1 2
3 4
28 66
66 252
ytr de ls ms importntes propieddes es que se trt del nio so en el que independeni e inorrelin son equivlentesF is deirD si XN 1 es un vetor on distriuin onjuntmente gussinD entones sus omponentes son inorrelds si y slo si son independientesF v demostrin es senillF semos que si son independientes son inorrelds @inluso si l distriuin no es onjuntmente gussinAF or su prteD pr pror que si son inorrelds entones son independientes slo hy que tener en uent que si son inorreldsD l mtriz de ovrinzs es digonl y l densidd onjunt puede expresrse omo produto de ls mrginlesD y que
fX (x1 , ..., xN ) =
1 (2 ) det (CX )
N
1 1 exp (x X ) CX (x X ) 2
N
=
N
1
2 ... 2 (2 ) 1 N N
1 exp 2
i=1
xi i i
=
i=1
fXi (xi ) .
CX
... FF F ...
0 F F F . 2 N
124
Parte III
Inferencia estadstica
IPS
Captulo 6
Distribuciones en el muestreo
os oserviones y muho rzonmiento onduen l errorY muhs oserviones y poo rzonmientoD l verddF elexis grrel
Resumen.
in este ptulo se pretende llmr l tenin er de que los prmetros muestrles son
en relidd vriles letorisF e nliz s l distriuin de proilidd de l medi muestrl y de l vrinz muestrl en diverss situionesF
6.1. Introduccin
el estudir el onepto de vrile letoriD dijimos que viene motivdo porque muhs de ls vriles que se oservn en l vid relD en el miente de ls sngeniers en prtiulrD estn sujets inertidumreF iso quiere deir que si nosotros otenemos lguns oserviones de ess vriles @muestrsAD los dtos no son igulesF is msD si otenemos otrs oservionesD ls dos muestrs tmpoo sern ni muho menos idntisF or tntoD l hlr de distriuiones teris de proiliddD lo que pretendmos er proponer un modelo que permitier lulr proiliddes soidsD no un muestr en prtiulr de dtosD sino tods ls posiles muestrsD on todos los posiles dtos de l vrileF eordemos el ejemplo que pusimosX ls distriuiones de proilidd son omo un trje que elegimos pr ponernos ulquier d durnte un periodo de tiempo mplioF in l medid que el trje de un vrileD su distriuinD
le quede bienD
los resultdos que otengmos medinte el lulo de proiliddes podrn un vrileD los resultdos teriosD otenidos prtir de un
plirse ulquier dto o onjunto de dtos de l vrileF ero igulmenteD si un trje @un distriuin de proilidd teriA
no le queda bien
funin ms o un funin de densidd terisD pueden no ser relists respeto los resultdos emprios que se otengn medinte muestrs de l vrileF u nos qued por her lo lrgo del ursoc hdo queD en generlD ls distriuiones teris de proilidd dependen de uno o ms prmetrosD lo que nos oupr grn prte del resto del urso es trtr de elegir IPU
deudmente esos prmetrosF in el ejemplo de los trjes podmos pensr que esto es omo prender esoger l tll del trjeF in este ptulo vmos omenzr on lguns uestiones teris er de lo que impli el proeso de muestreoD previo l elein de los prmetros yD posteriormenteD nos vmos entrr en resultdos que impli el muestreo de dtos de vriles que siguen un distriuin normlF
vndo un vrile letoriD X D en un polin determindF dijimos que un muestr letori simple de X onsiste en l reopilin de dtos de l vrileD medinte l repetiin del experimento l que est soidD on dos ondiiones sisX IF ue todos los elementos de l polin tengn ls misms posiiliddes de slir en l muestrF PF ue ls distints oserviones de l muestr sen independientes entre sF in ese soD los vlores que tom l vrile en d un de ls oserviones de un muestr de tmo
nD X1 , ..., Xn D son en s mismosD vriles letoris independientes que siguen l mism distriuin de
proiliddD llmd distriuinF
distribucin poblacionalF
que se intentr utilizr l muestr pr her infereni sore ell yD l menosD proximr l form de est
l muestrD s1 D por ejemploF ero deemos ser onsientes de lo que signi( muestr
1 x1 1 , ..., xn
aleatoriaF
2 es fruto del zrF he hehoD si otenemos otr muestrD x2 2 y 1 , ..., xn D otendremos otr mediD x
128
siD suesivmenteD otenemos un y otr muestrD otendremos un y otr medi muestrlD y un y otr desviin tpi muestrlF or lo tntoD en reliddD lo que estmos viendo es que l medi y l vrinz muestrles @y en generlD ulquier prmetro de un muestr letori simpleA sonD en reliddD vriles letoris queD omo tlesD deen tener su distriuinD su mediD su vrinzFFF mos reordr dos de(niiones que y introdujimos l omienzo del ursoF n n
parmetro muestral
letoriF
un vrile letoriF ues ienD soidos estos dos oneptos tenemos hor ls siguientes de(niionesF v il
distribucin en el muestreo de un prmetro muestrl es su distriuin de proiliddF error estandar de un prmetro muestrl es l desviin tpi de su distriuin en el muestreoF
il prolem es queD en generlD es stnte difil onoer l distriuin en el muestreo de los prmetros muestrlesF in emrgoD el so en el que result ms senillo herlo es prolemente el ms importnteF gomo vmos verD si l vrile que oservmos sigue un distriuin normlD podremos onoer de form ext ls distriuiones en el muestreo de los dos prmetros ms importntesD l medi y l vrinzF si l vrile no es normlc i lo que pretendemos es estudir l medi y l vrinz muestrlesD reordemos que el eorem gentrl del vmite nos die que si un vrile es sum de otrs vrilesD su distriuin es proximdmente normlD y l medi es sum de ls vriles de l muestrF is deirD si l vrile no es normlD todv podemos tener on(nz de que lo que hgmos pr vriles normles puede ser vlidoF
y 1 2F
129
i Z es un vrile letori norml estndr y S un 2 on n grdos de liertdD siendo ms indepenE dientesD entones
t=
sigue un distriuin llmd t
Z S/n
F =
sigue un distriuin que se denomin F importntes soidos l normlX
S1 /n1 S2 /n2
t=
X Sn1 / n
sigue un t de tudent on n 1 grdos de liertdF e un muestr X1 , ..., Xn un muestr letori simple de un vrile N (, )F intonesD el prE metro muestrl
2 =
sigue un 2 on n 1 grdos de liertdF
2 (n 1) Sn 1 2
en X1 , ..., Xn1 e Y1 , ..., Yn2 muestrs letoris simples de vriles independientes on distriuiones
1 n2
1 2 (n1 1) Sn + (n2 1) Sn 1 1 n1 + n2 2
sigue un t de tudent on n1 + n2 2 grdos de liertdF en X1 , ..., Xn1 e Y1 , ..., Yn2 muestrs letoris simples de vriles independientes on distriuiones
130
131
132
Captulo 7
Estimacin de parmetros de una distribucin
htosD dtosD dtos3 Egrit impientementeEF xo puedo her ldrillos sin rillF herlok rolmes @eF gF hoyleAD en
Las aventuras de los bombachos de cobre
Resumen.
Palabras clave: estimdor puntulD mtodo de los momentosD mtodo de mxim verosimilitudD intervlo
de on(nzD nivel de on(nzF
7.1. Introduccin
in istdsti hy tres forms de inferir un vlor un prmetro de un polinX istimndo el vlor onreto de ese prmetroF istimndo un regin de on(nz pr el vlor del prmetroF omndo un deisin sore un vlor hipottio del prmetroF
odr omprr el vlor promedio de su equipo on un vlor hipottio prD por ejemploD demosE trr l empres que tiene un mejor rendimiento que el promedio generl de l empresF
in este ptulo nos entrremos en l primer y l segund formD que onsisten en proporionr un vlor que reemos que est er del prmetro @estimin puntulA o en proporionr un intervlo en el que on(mos que se enuentr el prmetro desonoido @estimin por intervlos de on(nzAF v terer posiilidd se estudir en el ptulo de ontrstes de hiptesisF
estimacin puntualF
Ejemplo. i desemos otener estimiones de l medi de un vrile letoriD lo que pree ms lgio
ser utilizr omo estimdor l medi muestrlF gd medi muestrl de d muestr ser un estimin puntul de l medi polionlF u ser desele que le psr ulquier estimdorc u uens propieddes deer tener un uen estimdorc mos ver dos de ellsF in primer lugrD pree lgio pensr que si ien el estimdor no proporionr siempre el vlor exto del prmetroD l menos deer estleer estimiones que defetoF iste tipo de estimdores se denominn
se equivoquen
insesgados F
insesgado si
= . E
e denomin
sesgo de un estimador
. E
yservemos que pr ompror si un estimdor es insesgdoD en prinipio es neesrio onoer su distriuin en el muestreoD pr poder lulr su espernz mtemtiF edems de l flt de sesgoD nos gustr que l distriuin de muestreo de un estimdor tuvier po vrinzD es deirD que l dispersin de ls estimiones on respeto l vlor del prmetro polionlD fuer jF in este sentidoD se de(ne el error y se not
s.e.
134
il
ms peque de entre todos los estimdores insesgdosF ry que deir que no siempre es fil enontrr este estimdorD y que en osiones se dmite un ligero sesgo on tl que l vrinz del estimdor se mnimF
= X1 + ... + XN X N
es un estimdor insesgdo de E [X ] y su error estndr es
X ) = . s.e.(X N
il resultdo estlee lgo que pod herse intuido desde l de(niin de l medi o espernz mtemti de un distriuin de proiliddX si tenemos unos dtos @mas A de un vFFD un estimin deud de l medi de l vFF es l medi de los dtosF ry que tener muho uiddo on no onfundir l medi de l vFFD es deirD l medi polionlD on l medi de los dtos de l muestrD es deirD on l medi muestrlF or otr prteD el error estndr he refereni X D que es un prmetro polionl yD por lo tntoD desonoidoF vo que se suele her es onsiderr l desviin tpi muestrl omo un proximin de l polionl pr evlur este error estndrF
Xi X N 1
es un estimdor insesgdo de V ar [X ]F
Nota. el hilo del omentrio previo que hiimos sore l medi muestrl omo estimdor natural
in este sentidoD si onsidermos el estimdor
2 SX,N
de l
N i=1
Xi X N
135
cuasivarianza muestral. yjoD hy que dvertir que en lgunos liros l mner de nomrr l
Nota.
2 2 il que l vrinz muestrlD SN 1 D se un estimdor insesgdo de l vrinzD D no impli que l 2 SN 1 D se un estimdor insesgdo de D pero en este so s ourre sF
Ejemplo. wedinte hemos generdo un muestr letori simple de IHHH vlores de un distriuin
N (0, 1)F emosD por tntoD que l medi @polionlA de los dtos es H y que l vrinz @polionlA
es IF xo ostnteD vmos suponer que desonoemos de qu distriuin proeden los dtos y vmos trtr de
ajustar
x = 0.0133
y
s999 = 0.9813,
por lo que justrmos los dtos de l muestr x medinte un distriuin
N (0.0133, 0.9813) .
v densidd de est distriuin pree tmin en l pigur UFID en trzo ontinuoD y se oserv que just muy ien l form del histogrmF
136
Histograma de la muestra
0.5 Densidad 0.0 0.1 0.2 0.3 0.4
pigur UFIX ristogrm pr l muestr x11000 on QH intervlos y funin de densidd de l distriuin N (0.0133, 0.9813)F
p =
k , N
s.e.( p) =
p(1 p) N
ore el error estndrD osrvese de nuevo queD ddo que p es desonoidoD en relidd l expresin de s.e.( p) no puede evlurseF in emrgoD es stnte omn que si el tmo de l muestrD N D es grndeD se utilie el vlor de l estiminD p D en lugr de p en es expresinF he tods formsD osrvese tmin que l funin f (p) = p(1 p) es menor que
1 4
si 0 p 1D luego
s.e.( p)
is por ello que siempre podemos dr est ntiddD
1 1 = . 4N 2 N
1 D 2 N
p =
on un error estndr por dejo de
1 2 1000
137
estimin ser
1 , 2 x =f s2 n1 = g 1 , 2 .
EX n F
or tntoD dd un
or iertoD este estimdor oinide on el que hmos onsiderdo en un prinipioD que er l proporin muestrlD es deirD p = k/N D pero puede her lgun onfusin en l notinF emos porquF e supone que tenemos un muestr de tmo N de dtos de un inomil de prmetro nD es deirD tenemos n experimentosD N veesD o seD un totl de n N experimentosD on efetoD
i
xi xitosF vuegoD en
p =
x i xi = , n nN
es deirD l proporin muestrlD oiente del n de xitos entre el n totl de experimentosF xo deemos onfundirnos on l expresin k/N que pusimos ntes porque N no signi( lo mismo en mos sosF
138
1 p
1D de donde p =
1 1+EX D
luego el mtodo
p =
1 . 1+x
EX = p, V arX
se tiene que
EX p EX 2 = EX V arX = 1p V arX EX 1 VEX arX
a = EX
p = a =
x s2 X,N 1 x 2 s2 X,N 1 x .
r desrrollr el mtodo deemos tener en uent que si tenemos un muestr letori simple de un vrile X D x1 , ..., xn D y l funin ms o densidd de l vrile es p (x)D entones l funin ms o densidd de l muestr es
hd un vrile letori X on funin ms o funin de densidd p (x) , que depende de uno o dos prmetrosD y un muestr letori simple de X D x1 , ..., xn D l verosimilitud de l muestr es l funin
139
hd l verosimilitud de un muestrD LD si L depende de un slo prmetroD D entones el estimador mximo-verosmil de se otiene resolviendo el prolem de mximo siguienteX
= arg m ax L .
Nota.
hdo que el mximo de un funin oinide on el mximo de su logritmoD suele ser muy til
Ejemplo. mos lulr el estimdor mximo verosmil del prmetro p de un distriuin B (n, p)
sdo en un muestr x1 , ..., xN F in primer lugrD l funin de verosimilitud es
N
n xi nxi p (1 p) xi n xi p
N i=1
=
i=1
xi
(1 p)
nN
N i=1
xi
u logritmo result
N
n xi
+
i=1
xi
ln p +
nN
i=1
xi
ln (1 p) .
xi
p
de donde
nN i=1 xi = 0, 1p
x p x i=1 xi n = = = N 1p nx 1 nN i=1 xi
x n
vuego el estimdor es
p =
x . n
ysrvese que oinide on el estimdor que otuvimos por el mtodo de los momentosF
Ejemplo. mos lulr el estimdor mximo verosmil del prmetro de un distriuin exp ()
sdo en un muestr x1 , ..., xN F
140
punin de verosimilitudX
Lx1 ,...,xN () =
i=1
exi = N e
N i=1
xi
ln Lx1 ,...,xN () = N ln
i=1
xi .
N xi = 0, i=1
de donde
N
N i=1
xi
1 . x
he nuevo el estimdor mximo verosmil oinide on el proporiondo por el mtodo de los momentosF
Lx1 ,...,xN , 2 =
i=1
1 2 2
(xi )2
2 2
1 2 2
2 n i=1 (xi ) 2 2
u logritmoX
ln Lx1 ,...,xN , 2 =
vriles e igulmos eroX
N N ln (2 ) ln 2 2 2
N i=1
(xi ) . 2 2
d ln Lx1 ,...,xN , 2 = d
N i=1
(xi ) =0 2
N i=1
d N 1 ln Lx1 ,...,xN , 2 = 2 + 2 d 2 2
he l primer euin se sigue
N N
(xi )
2
( 2 )
=0
(xi ) =
i=1 i=1
xi N = 0,
de donde
N i=1
xi
=x .
141
Modelo
B (n, p) P () Geo (p) BN (a, p) exp () Gamma (a, ) N (, )
=x , = sn1
=x , = sn
gudro UFIX istimdores por el mtodo de los momentos y de mxim verosimilitud de los prmetros de ls distriuiones ms usulesF
(xi x )
2 ( 2 )
N , 2
de donde
2 =
N i=1
( xi x ) = s2 n. N
Nota.
he nuevo hy que llmr l tenin sore el heho de que hemos usdo un estimdorD de
mxim verosimilitudD de 2 D no de F in emrgoD no es muy difil demostrr que el estimdor de mxim verosimilitud de en l distriuin norml es l usidesviin tpi muestrlD sn F
7.2.6. Tabla resumen de los estimadores de los parmetros de las distribuciones ms comunes
in tod est seinD supongmos que tenemos un muestr x1 , ..., xN de un vrile letori X F vos estimdores segn el mtodo de los momentos y de mxim verosimilitud de los prmetros segn ls distriE uiones que hemos desrito preen en el gudro UFIF
F n
nivel de conanzaF
Prof. Dr. Antonio Jos Sez Castillo
142
50
50
| | | | | | | | | |
| | | | | | | | | |
50
| | | | | | | | | |
40
40
| | | | | | | | | |
| | | | | | | | | |
40
| | | | | | | | | |
30
30
| | | | | | | | | |
| | | | | | | | | Index |
30
| | | | | | | | | |
Index
20
Index 20
| | | | | | | | | |
| | | | | | | | | |
20
| | | | | | | | | |
10
10
| | | | | | | | | |
| | | | | | | | | |
10
| | | | | | | | | |
0.4
0.2
0.0
0.2
0.4
0.6
0.6
0.4
0.2
0.0
0.2
0.4
0.6
0 1.0
0.5
0.5
1.0
Confidence Interval
Confidence Interval
pigur UFPX histintos intervlos de on(nz pr un medi un TV 7 @izquierdAD un WH 7 @entroA y un WW 7 @derehAF uede oservrse que umentr el nivel de on(nz he ms mplios los intervlosF min puede oservrse que no todos los intervlos ontienen l medi polionl @HAD pero que el n de stos malos intervlos disminuye onforme umentmos el nivel de on(nzF
ysrvese que l (losof de ulquier intervlo de on(nz es proporionrD sndonos en los dtosD un regin donde tengmos un determindo nivel de on(nz en que el prmetro se enuentrF gomo en el so de los estimdores puntulesD el intervlo de on(nz es letorioD y que depende de los dtos de un muestrF edemsD se d por heho que existe l posiilidd de que el
verdadero
prmetro no quede
Nota. el respeto de l interpretin del nivel de on(nzD tenemos que deir queD ddo que desde el
omienzo del urso hemos doptdo un interpretin freuentist de l proiliddD un intervlo de on(nz l WS 7D por ejemploD grntiz que si tommos IHH muestrs el prmetro polionl estr dentro del intervlo en proximdmente WS intervlos onstruidosF in emrgoD est interpretin es surd en l prtiD porque nosotros no tenemos IHH muestrsD sino slo unF xosotros tenemos los dtos de un muestrF gon ellos onstruimos un intervlo de on(nzF hor slo en dos posiiliddesX o el prmetro est dentro del intervlo o no lo estF il prmetro es onstnteD y el intervlo tminF xo podemos repetir el experimento3 is por ello que se hl de intervlos
conanza D de
conanza
143
= 1 ,
,x x z1 + z1 2 2 N N
on un (1 ) 7 de on(nzF xo ostnteD hy que reonoer que en l prti es poo prole que se desonoz el vlor de l medi y s se onoz el de l vrinzD de mner que l pliin de este teorem es muy limitdF il siguiente resultdo responde preismente l neesidd de extender el nterior undo se desonoe el vlor de l vrinzF e X un vFF on distriuin norml de medi y vrinz 2 , ms desonoidsF e un muestr
x = (x1 , ..., xN ) de X D l medi muestrl x y l vrinz muestrl s2 X,N 1 F intonesD s2 X,N 1 N s2 X,N 1 N = 1 ,
P x t1 2 ; N 1
,x + t1 2 ;N 1
grdos de liertd.
2
donde t;N a es el vlor tl que FTN (t;N ) = D siendo TN un vFF on distriuin de tudent on N
x t1 2 ;N 1
ontiene l mediD que es desonoidF
s2 X,N 1 N
,x + t1 2 ; N 1
s2 X,N 1 N
Ejemplo.
desviin tpi muestrles de esos IHHH vlores resultron ser x = 0.0133 y s999 = 0.9813F or tntoD el intervlo de on(nz que se estlee l WS 7 de on(nz pr l medi es
= (0.074, 0.0475)
144
vos dos resultdos que mos de enunir se sn en que se onoe l distriuin ext de l muestrD normlD lo que permite deduir que l medi muestrl sigue tminD y de form extD un distriuin norml de medi y vrinz
2 N F
se l distriuin de ls vriles de l muestr letori simpleD l medi muestrl sigue proximdmente un distriuin norml de medi y vrinz y que se otiene omo sum de vFF independientes on
aproximado
l mism distriuinF or lo tntoD podemos otener un intervlo de on(nz medi de ulquier distriuinD omo se reoge en el siguiente resultdoF
pr ulquier
x = (x1 , ..., xN ) de X y l medi muestrlD x . intonesD si N es su(ientemente elevdo @N > 30 es su(ienteAD + z1/2 P x z1/2 , x N N 1 .
in est expresinD si es desonoidD puede sustituirse por l desviin tpi muestrlD sn1 F
Ejemplo. r dimensionr el tmo del u'er de un modem ehv es neesrio estimr el promedio
de pquetes de dtos por milisegundo que reie el modemF e onsider que el tiempo @en milisegundosA que trnsurre entre pquete y pquete sigue un distriuE in exponenil de prmetro F ysrvese que l medi de est distriuin es =
1 D
tiempo medio
entre pquetesD por lo que es preismente el promedio de pquetes por milisegundo que reie el modemF or lo tntoD el ojetivo es estimr el prmetro D que es el que se utilizr pr dimensionr el modemF wedinte un sni'er opldo l modem pr pturr dtos del tr(oD se tomn dtos de los tiempos entre pquetes de IHHI pquetesD por lo que se tienen IHHH dtos de tiempos entre pquetesF v medi de estos tiempos result ser x = 2.025D siendo l desviin tpi muestrl de 1.921F in primer lugrD vmos lulr un intervlo de on(nz @l WS 7A pr l medi de l distriuinD
el intervlo de on(nz l WS 7 de es
= (0.466, 0.525) .
e ttulo informtivoD el vlor que se onsider en el dimensionmiento del modem es un mltiplo @el doleD por ejemploA del extremo superior del intervloD en este so HFSPSF
145
P p
p z1/2
p (1 p ) ,p + z1/2 N
p (1 p ) N
1 .
0.06 1.96
< 2 <
N i=1 (Xi 2 2 ;N 1
x )
= 1 .
a El valor de 2 2 y debe buscarse en las tablas de la distribucin 2 u obtenerse mediante el ordenador. /2;N 1 1/2;N 1
146
cuadrado con N grados de libertad. NotaF n intervlo de on(nz pr l desviin tpi puede otenerse trivilmente omo l riz udrd
del intervlo de on(nz pr l vrinzF
Ejemplo. in el ejemplo donde onsidermos IHHH vlores simuldos de un N (0, 1) tenmos que x =
0.0133 y s999 = 0.9813F or tntoD teniendo en uent que
N
= (0.8838, 1.0533) .
ysrvese que = 1 pertenee l intervlo de on(nz l WS 7F uede que lguno de vosotros est pensndo ul puede ser el inters de ls estimiones puntules yD sore todoD medinte intervlos de on(nz de l vrinzF rolemente todos tenemos muy lro qu es un mediD inluso un proporinD pero quiz se nos espe l importni prti del onepto de vrinzF in este sentidoD hy que deir que en el mito de l sngenier l vrinz se utiliz muhsimo en lo que se onoe omo
control de calidadF
vos jponeses sonD en estoD los pioneros y quiz los mejores expertosF e
ellos se les triuye un prinipio sio del ontrol de lidd en ulquier proeso sio de produinX
la
ensemos en ulquier proeso de friin genrioF in l se trtr de otener un produto sujeto uns espei(iones onretsF in emrgoD el error inherente ulquier proeso experimentl provorX IF n umento o un disminuin estruturles del produto on respeto un vlor ojetivoF isto podr detetrse omo un sesgo en l medi de lo produido on respeto l vlor ojetivoF PF ns diferenis ms o menos importntes en los produtos resultntesD que podrn ser evluds medinte l vrinzF he ess dos posiles prolemtisD l ms omplejD sin dud es l segundF rolemente no es un grve prolem
calibrar
l mquin que produe pr que l medi se site en el vlor ojetivoD pero ser sin dud
bilaterales
147
xo ostnteD no vmos detllrlos quD unque su interpretin es nlog l de los intervlos de on(nz que hemos vistoF gulquier pquete de softwre estdstio puede filitr estos intervlos sin di(ultdF
trution steD en el que se present un estudio de l ontminin en sureros que ontienen desehos de onstruin y desperdiios de demoliionesF hemos ll que De
de lixiado, de las cuales 26 contienen niveles detectables de plomo. Una ingeniera desea obtener a partir de esos datos una estimacin de la probabilidad de que una muestra de un basurero contenga niveles detectables de plomo. No obstante, es consciente de que esa estimacin estar basada en esa muestra, que es de slo 42 datos, luego querr tambin obtener una estimacin del error que est cometiendo al hacer la estimacin. Finalmente, se plantea si con la estimacin y el error de sta, podr obtener un rango donde la verdadera probabilidad se encuentre con un alto nivel de conanza.
prolemF in primer lugrD tenemos que otener un estimin de l proporin de muestrs @o proiliddA que ontienen niveles detetles de plomoF remos visto que un estimdor insesgdo de mnim vrinzD que dems oinide on el estimdor de mxim verosimilitudD de l proporin es l proporin muestrlF in nuestro soD por tntoD podemos estimr l proporin en p = error estndr de est estimin en s.e.( p) = error estndr ser inferior estndr inferior un UFUI 7F que el intervlo
1 2 42 0.6190(10.6190) 42 26 42
148
Captulo 8
Contrastes de hiptesis paramtricas
v grn trgedi de l ieniX l destruin de un ell hiptesis por un ntiesttio onjunto de dtosF homs rF ruxleyF v istdsti puede pror todoD inluso l verddF xF woynihn
Resumen. in este ptulo explimos qu se entiende por ontrste de hiptesis estdsti y prendemos
relizr ontrstes de este tipo prtir de dtosD referidos lgn prmetro polionl desonoidoF
Palabras clave: ontrste de hiptesisD error tipo sD error tipo ssD estdstio de ontrsteD pEvlorD nivel de
signi(inD nivel de on(nzF
8.1. Introduccin
tesis se utilizn pr inferir deisiones que se re(eren un prmetro polionl sndose en muestrs de
l vrileF mos omenzr explir el funionmiento de un ontrste de hiptesis on un ejemploF gomo puntmos en l introduin del ptulo nteriorD ls llmds
Ejemplo. vos ient(os reomiendn que pr prever el lentmiento glolD l onentrin de gses
de efeto inverndero no dee exeder ls QSH prtes por millnF n orgnizin de protein del medio miente quiere determinr si el nivel medioD D de gses de efeto inverndero en un regin umple on ls puts requeridsD que estleen un lmite mximo de QSH prtes por millnF r ello tomr un muestr de mediiones diris de ire pr deidir si se super el lmiteD es deirD si > 350 o noF or tntoD l orgnizin dese enontrr poyo pr l hiptesis > 350D llmd
hiptesis alternativaD
oteniendo prues en l muestr que indiquen que l hiptesis ontrriD = 350 @o 350AD llmd
hiho de otr formD l orgnizin v someter juiio l hiptesis nul 350F rtir de
su
suponiendo que es iertD es deirD suponiendo queD en prinipioD no se supern los lmites de IRW
preseni de gses de efeto invernderoD y slo l rehzr en fvor de H1 si hy prues evidentes en los dtos de l muestr pr elloF v deisin de rehzr o no l hiptesis nul en fvor de l lterntiv deer srse en l informin que d l muestrD trvs de lgun medid soid ellD que se denomin estadstico de contrasteF or ejemploD si se tomn QH leturs de ire y l medi muestrl es muho myor que QSHD lo lgio ser rehzr l hiptesis nul en fvor de > 350D pero si l medi muestrl es slo ligermente myor que QSH o menor que QSHD no hr prues su(ientes pr rehzr 350 en fvor de > 350F v uestin lve es en qu momento se deide rehzr l hiptesis nul en fvor de l lterntivF in nuestro ejemploD en qu momento podemos deir que l medi muestrl es su(ientemente myor que QSHF il onjunto de estos vlores del estdstio de ontrsteD que permiten rehzr = 350 en fvor de
regin de rechazoF
e l luz de este ejemploD vmos trtr de de(nir de form generl los oneptos que mos de introduirF n contraste
de hiptesis es un prue que se s en los dtos de un muestr de un vrile letori medinte l ul podemos rehzr un hiptesis sore un prmetro de l polinD llmd hiptesis nula (H0 )D en fvor de un hiptesis ontrriD llmd hiptesis alternativa (H1 )F estadstico de
contrasteF
e rehzr l hiptesis nul en fvor de l lterntiv undo el vlor del estdstio de ontrste se site en un determind reginD llmd
regin de rechazoF
v hiptesis H0 se suele expresr omo un iguldda D del tipo H0 : = 0 D donde es un prmetro de un polin y 0 es un vlor hipottio pr ese prmetroF or su prteD H1 puede tener tener dos formsX
H1 : > 0 , en uyo so se hl de contraste unilateral a la derecha o de una cola a la derecha o de un extremo a la derecha, o H1 : < 0 , en uyo so se hl de contraste unilateral a la izquierda o de una cola a la izquierda o de un extremo a la izquierda. H1 : = 0 , en uyo so se hl de contraste bilateral o de dos colas o de dos extremos.
a De todas formas, tambin es frecuente expresar H0 como negacin exacta de H1 , en cuyo caso s puede ser una desigualdad no estricta. Matemticamente no hay diferencias en estas dos posibilidades.
no de los spetos ms importntes y que se suele prestr myor onfusin se re(ere qu hiptesis onsiderr omo H0 y ul omo H1 F n regl prti pr herlo orretmente puede ser l siguienteX IF i estmos intentndo pror un hiptesisD st dee onsiderrse omo l hiptesis lterntivF PF or el ontrrioD si desemos desreditr un hiptesisD deemos inluir st omo hiptesis nulF
Ejemplo. r un determind edi(in se exige que los tuos de gu tengn un resisteni medi
l rupturD D por enim de QH kg por entmetroF
150
gomo primer situinD supongmos que un proveedor quiere filitr un nuevo tipo de tuo pr ser utilizdo en est edi(inF vo que deer her es poner trjr sus ingenierosD que deen relizr un prue pr deidir si esos tuos umplen on ls espei(iones requeridsF in ese soD deen proponer un ontrste que inluy omo hiptesis nul H0 : 30 frente l lterntiv H1 : > 30F i l relizr el ontrste de hiptesis se rehz H0 en fvor de H1 D el tuo podr ser utilizdoD pero si no se puede rehzr H0 en fvor de H1 D no se tienen su(ientes grnts sore l lidd del tuo y no ser utilizdoF gomo segund situinD un proveedor llev suministrndo su tipo de tuo desde he osD sin que se hyn detetdoD en prinipioD prolems on ellosF in emrgoD un ingeniero que trj pr el goierno ontrolndo l lidd en ls edi(iones viene teniendo sospehs de que ese tipo de tuo no umple on ls exigenis requeridsF in ese soD si quiere pror su hiptesisD el ingeniero deer onsiderr un ontrste de l hiptesis nul H0 : 30 frente H1 : < 30F hiho de otr formD slo podr ontrstr su hiptesis si enuentr dtos emprios que permitn rehzr es hiptesis nul en fvor de su lterntivD que demuestren on un lto nivel de (ilidd que el proveedor que est siendo eptdo hor no umple on los requisitosF
he hehoD es importntsimo que desde el prinipio tengmos lro qu tipo de deisiones puede proporioE nrnos un ontrste de hiptesisF eunque y ls hemos omentdoD vmos insistir en ellsF on ls dos siguientesX IF i el vlor del estdstio de ontrste pr los dtos de l muestr e en l regin de rehzoD podremos (rmr hiptesis nul en fvor de l lterntivF PF i el vlor del estdstio de ontrste pr los dtos de l muestr no e en l regin de rehzoD no podremos (rmr
con un determinado nivel de conanza que los dtos de l muestr permiten rehzr l
con el nivel de conanza exigido que los dtos de l muestr permiten rehzr
l hiptesis nul en fvor de l lterntivF v lve rdi en que entendmos desde el prinipio que l hiptesis nul ree de on(nzF is sumid slo omo punto de prtidD pero ser ndond undo los dtos emprios muestren evidenis lrs en su ontr y fvor de l lterntivF v rg de l prue de hiptesis rdi siempre en l hiptesis lterntivD que es l ni hiptesis en l que podremos grntizr un determindo nivel de on(nzF
error tipo I o falso negativo rehzr l hiptesis nul undo es iertD y su proilidd se not por D llmdo nivel de signicacinF nivel de conanza l proilidd de eptr l hiptesis nul undo es iertD es deirD 1 . 151
e llm
e llm
error tipo II o falso positivo eptr l hiptesis nul undo es flsD y su proilidd se potencia l proilidd de rehzr l hiptesis nul undo es flsD es deirD 1 .
gul de los dos errores es ms grvec rolemente eso depende de d ontrsteD pero en generlD lo que se pretende es otr el error tipo s y trtr de minimizr el error tipo ssD es deirD trtr de elegir ontrstes lo ms potentes posiles grntizndo que l proilidd del error tipo s es inferior un determindo nivelF
Ejemplo. n frinte de miniomputdors ree que puede vender ierto pquete de softwre ms
del PH 7 de quienes omprn sus omputdorsF e seleionron l zr IH posiles omprdores de l omputdor y se les pregunt si estn interesdos en el pquete de softwreF he ests personsD R indiron que pensn omprr el pqueteF roporion est muestr su(ientes prues de que ms del PH 7 de los omprdores de l omputdor dquirirn el pquete de softwrec i p es l verdder proporin de omprdores que dquirirn el pquete de softwreD ddo que desemos demostrr p > 0.2D tenemos que H0 : p = 0.2 y H1 : p > 0.2F e X : nmero de posiles omprdores de l muestrD en uyo soD X B (10, p)F tilizremos el vlor de X omo estdstio del ontrsteD rehzndo H0 si X es grndeF upongmos que estleemos omo regin de rehzo x 4F in ese soD ddo que en l muestr x = 4D rehzrmos H0 en fvor de H1 D llegndo l onlusin de que el frinte tiene rznF eroD ul es el nivel de on(nz de este ontrstec glulemos l proilidd de error tipo sF r elloD en el gudro VFP pree l distriuin de proilidd del estdstio de ontrste que hemos elegidoD suponiendo que H0 es iertD y que deemos lulr
= P [ehzr H0 |H0
es cierta ]
2
= P [X 4|p=0.2 ]
= 0.08808 + 2.6424 10
a la luz de los datos podemos armar con un 87.913 % de conanza que p > 0.2F
si queremos un nivel de on(nz myorD es deirD un proilidd de error tipo s menorc heemos reduir l regin de rehzoF i ponemos omo regin de rehzo x 5D y no podremos rehzr H0 en
152
x H I P Q R S T U V W IH
P [X = x] 0.20 0.810 = 0.10737 0.21 0.89 = 0.26844 0.22 0.88 = 0.30199 0.23 0.87 = 0.20133 0.24 0.86 = 0.08808 10 5 5 2 5 0.2 0.8 = 2.6424 10 10 6 4 3 6 0.2 0.8 = 5.505 10 10 7 3 4 7 0.2 0.8 = 7.8643 10 10 8 2 5 8 0.2 0.8 = 7.3728 10 10 9 1 6 9 0.2 0.8 = 4.096 10 10 10 0 7 10 0.2 0.8 = 1.024 10
10 0 10 1 10 2 10 3 10 4
egin de eptin
egin de rehzo
gudro VFPX punin ms del estdstio de ontrste suponiendo iert H0 D es deirD suponiendo que p = 0.2F
= 2.6424 102 + 5.505 103 + 7.864 3 104 + 7.3728 105 + 4.096 106 + 1.024 107 = 3.2793 102 ,
luego el nivel de on(nz ser 1 3.2793 102 100 % = 96.721 %D y l onlusin ser que
luz de los datos no podemos armar que p > 0.2 con un 96.721 % de conanza.
a la
p-valorF
153
que el ontrste se reliz medinte un estdstio que notremos S D y que el vlor del estdstio pr l muestr es sF il
p-valor soido l ontrste se de(ne omo el mnimo nivel de signi(in on el que l hiptesis nul
Ejemplo. in el ijemplo VFP hemos visto mo podemos rehzr l hiptesis nul on un 87.913 % de
on(nzD pero no on un 96.721 %F hiho de otr formD podemos rehzr l hiptesis nul on un nivel de signi(in del 12.087 %D pero no on un nivel de signi(in del 3.279 %F isto impli que el pEvlor estr justo entre estos dos ltimos vloresF
hdo que normlmente se elige omo nivel de signi(in mximo = 0.05D se tiene que l regl de deisin en un ontrste on ese nivel de signi(inD ddo el pEvlorD ser l siguienteX i p < 0.05D rehzmos H0 en fvor de H1 on ms de un WS 7 de on(nzF i p 0.05D no podemos rehzr H0 en fvor de H1 on l menos un WS 7 de on(nzF in emrgoD est regl de deisinD que es l ms hitulD es demsido reduionist si no se proporion el vlor exto del pEvlorF v rzn es que no es lo mismo rehzr un hiptesis on que eso permite d letor deidir por s mismoF in resumenD el pEvlor permite utilizr ulquier otro nivel de signi(inD y que si onsidermos un nivel de signi(in X i p < D rehzmos H0 en fvor de H1 on ms de un (1 ) % de on(nzF i p D no podemos rehzr H0 en fvor de H1 on l menos un (1 ) % de on(nzF gomo onlusinD siempre que hgmos un ontrste de hiptesisD deemos filitr el pEvlor soidoF gomo not (nl sore el onepto de pEvlorD es importnte selr queD l ontrrio de lo que errnemente se piens en demsids osionesD el pEvlor no es l proilidd de l hiptesis nulF wuh gente piens esto porque es ierto que undo el pEvlor es pequeo es undo se rehz l hiptesis nulF in emrgoD pr empezrD no tiene sentido plnternos l
probabilidad al menos
un WS 7 de
on(nz si el pEvlor es HFHRW que si es HFHHIF ry que proporionr siempre el pEvlor de un ontrsteD y
flsX desde un perspetiv lsi de l proiliddD se hl de l proilidd de un sueso porque vees ourre y vees noD pero en este so no podemos pensr sD y que l hiptesis nul o se d o no se dF in reliddD el pEvlor lo que d es un indiio de l ertidumre que tenemosD de l on(nz en que l hiptesis nul se verddD teniendo en uent los dtos de l muestrF ist interpretin tiene ms que ver on l interpretin sujetiv de l proilidd de l que hlmos l prinipio de ursoF ry que deir queD en relin est interpretin sujetiv de l proiliddD existe un visin de l istdstiD llmd istdsti fyesinD en l que el pEvlor s puede entenderse omo l proilidd de l hiptesis nulD pero entendiendo que medimos l proilidd de l hiptesis nulD no porque pued ourrir o no ourrir en funin del zrD sino porque tenemos inertidumre sore ellF
154
0.4
0.3
0.2
Regin de aceptacin
0.2
0.3
0.4
Regin de aceptacin
0.1
0.0
0.1
1
0.0
0.2
0.3
0.4
Regin de aceptacin
0.1
0.0
o de dos colasD y que el rehzo de l hiptesis nul en fvor de l lterntiv puede produirse porque el
estdstio de ontrste tom vlores muy ltos o muy josF or ontrD los ontrstes del tipo H0 : = 0 D frente H1 : > 0 o H1 : < 0 son ltos @undo H1 : > 0 , llmdo
contrastes bilaterales
y que el rehzo de l
hiptesis nul en fvor de l lterntiv puede produirse slo si el estdstio de ontrste tom vlores muy
contraste a la izquierdaAF
: < 0 D
llamado 155
or tntoD teniendo en uent l de(niin de pEvlorD su lulo se reliz de l siguiente formX i el ontrste es unilterl l izquierd @H1 : < 0 AD
p = P [S s/H0 ] .
i el ontrste es unilterl l dereh @H1 : > 0 AD
p = P [S > s/H0 ] .
i el ontrste es ilterl @H1 : = 0 AD
estdstios proporionn el pEvlor omo dto pr l tom de ls deisionesF in lo que rest del tem lo que vmos her es enunir distintos ontrstes de hiptesis pr l mediD l vrinz o l proporin de un polin y pr omprr ls medisD ls vrinzs y ls proporiones en dos poliones distintsF xo nos vmos entrr en los detlles de mo se deduen sino slo en mo se utilizn en l prtiF he tods formsD es importnte her un lrinX undo los dtos proeden de un distriuin normlD es muy senillo otener l distriuin del estdstio del ontrsteD gris los resultdos que vimos en el ptulo de distriuiones en el muestreoF in emrgoD si los dtos no proeden de vriles normlesD est uestin es muhsimo ms difilF efortundmenteD si el tmo de l muestr es grndeD el eorem gentrl del vmite grntiz que los prmetros que se sn en sums sds en ls muestrs siguen proximdmente un distriuin normlF is por ello que en d tipo de ontrste que vmos desriir ontinuin se distinguen quellos que se sn en muestrs grndes y los que se sn en muestrs reduidsD que slo podrn ser utilizdos si l vrile es normlF in d soD vmos ompr el ontrste on un ejemplo que omentremos extensmenteF
156
e l izquierd H0 : = 0 H1 : < 0
z < z P [Z < z ]
e l dereh H0 : = 0 H1 : > 0
z > z1 P [Z > z ]
gudro VFQX gontrste pr l medi on muestrs grndes WFPQ IPFSU VFRP WFSW IIFQU IHFQV VFUI UFVR VFTQ IHFHT WFUT WFIT WFIT UFRV VFHW UFSV IHFVH WFRH UFUS WFIW WFWW WFVT WFHQ VFWP IHFUW WFRT UFTI WFHH IPFVS WFVP IHFIV VFWV WFPS IIFHI WFQU WFHV IHFVI IHFQW VFIW WFTT UFHW WFHS VFSH UFRR WFUS WFPS WFQW WFSI IIFTT WFTT
gudro VFRX htos del ejemplo de ls espeies pr trtr de disernir si los hmeros fsiles que enuentrn en un yimiento orresponden o no un nuev espeieF upongmos que un espeie omn en l zon donde se enlv un yimientoD l
Bichus localisD
tiene un
rzn medi longitudGnhur de WF vos rquelogos enrgdos del yimiento hn hlldo SH hmeros fsilesD uyos dtos preen en el gudro VFRF ienen los rquelogos indiios su(ientes pr onluir que hn desuierto en el yimiento un espeie distint de l
Bichus localis c
in primer lugrD oservemos que no nos hn espei(do ningn nivel de signi(in en el enunidoF in este soD lo hitul es onsiderr = 0.05F in so de que l deisin se muy relevnteD elegirmos un nivel ms joF e ontinuin deemos plnter ls hiptesis del ontrsteF in prinipioD l zon de l exvin indi que l espeie del yimiento deer ser l espeie
Bichus localisD
l hiptesis nul es H0 : = 9D donde por estmos notndo l medi de l rzn longitudGnhur del hmero de l espeie del yimientoF gomo hiptesis lterntiv nos plntemos que se trte de otr espeieD es deir H1 : = 9F e trtD por tntoD de un ontrste de dos olsF r relizrloD deemos lulr en primer lugr el estdstio de ontrsteF steD su vezD requiere del lulo de l medi y de l desviin tpi muestrl de los dtosF istos vlores sonD respetivmenteD WFRIR y IFPQWF or tntoD
z=
ehor tenemos que plnternos si este vlor del estdstio nos permite rehzr l hiptesis nul en fvor de l lterntiv o noF odemos herlo de dos formsX IF yteniendo l regin de rehzoF hdo que z10.05/2 = 1.96D l regin de rehzo es |z | > 1.96F emos queD en efetoD 2.363 > 1.96D por lo que podemos rehzr l hiptesis nul en fvor de l lterntiv on un WS 7 de on(nzD onluyendo on ese nivel de on(nz que se trt de un nuev espeieF xos quedD sin emrgoD l dud de ser qu huier psdo de tomr un nivel de signi(in ms exigenteY por ejemploD = 0.01F
Prof. Dr. Antonio Jos Sez Castillo
157
filterl e l dereh H0 : = 0 H0 : = 0 H1 : = 0 H1 : > 0 x 0 t = sn1 / n t < t;n1 |t| > t1/2;n1 t > t1;n1 P [Tn1 < t] 2P [Tn1 > |t|] P [Tn1 > t] histriuin de proilidd proximdmente norml
e l izquierd H0 : = 0 H1 : < 0
gudro VFSX gontrste pr l medi on muestrs peques PF wedinte el pEvlorF enemos que
signi(inA1 F
en el gmpo de qirltrF v
notii slo indi que el estudio se s en un muestrD dndo el vlor medio muestrl en vris zons del gmpo de qirltrD pero no el tmo ni l desviin tpi muestrlF r relizr el ejemploD nosotros vmos imginr unos dtos orrespondientes un muestr de PH hogres donde se midi l onentrin de enenoD rrojndo un medi muestrl de SFI mirogrmos por metro io y un desviin tpi muestrl de IFUF istoy seguro de queD en ese soD el peridio hr sdo grndes titulres sore l ontminin por eneno en los hogres del gmpo de qirltr peroD podemos (rmr queD en efetoD se supern los lmites de l hiretiv iurope de glidd del eirec in primer lugrD de nuevo no nos indin un nivel de signi(in on el que relizr l prueF isogemosD en prinipioD = 0.05F enemos que tener uiddoD porque el plntemiento de l prueD tl y omo se nos h plntedoD ser ontrstr l hiptesis nul H0 : = 5 frente H1 : > 5D en uyo soD un error tipo s se trdue en onluir que se viol l normtiv undo en relidd no lo heD lo ul es grve porque gener lrm injusti(d en l polinD mientrs que el error tipo ssD el que no ontrolmos on el D es onluir que
1 Debe quedar claro que, estadsticamente, lo que hemos demostrado es que la razn media es distinta de 9. Son los arquelogos los que deciden que eso implica una nueva especie.
158
se umple l normtiv undo en relidd no lo heD lo ul es grvsimo pr l polin3 gon esto quiero inidir en un uestin importnte respeto lo que se nos pide que demostremosX se nos die que nos plnteemos si se supern los lmites de l normtivD en uyo so H1 dee ser > 5D pero en reliddD deermos plnternos l pregunt de si podemos estr seguros de que se est por dejo de los lmites mximos permitidosD es deirD deermos pror H1 : < 5F gentrndonos exlusivmente en lo que se nos pide en el enunidoD tenemos que H1 : > 5 determin que se trt de un prue unilterl l derehF il estdstio de ontrste es
t=
IF i queremos onluir on l regin de rehzoD st est formd por los vlores t > t0.95;19 = 1.729D luegoD ddo que 0.263 < 1.729D no podemos (rmr on un WS 7 de on(nz que se est inumpliendo l normtivF PF il pEvlor es n ms informtivoF u vlor es p = P [T19 > 0.263] = 0.398D por lo que tendrmos que llegr hst si un RH 7 de signi(in pr rehzr l hiptesis nul en fvor de l lterntiv (rmndo que se inumple l normtivF or lo tntoD tl y omo est plntedo el prolemD no podemos (rmr que se est inumpliendo l normtiv @on un S 7 de signi(inAD por ms que un vlor muestrl de l mediD SFID prez indir que sF vo que yo reomendr los responsles del umplimiento l normtiv es que umentrn el tmo de l muestrD y queD por ejemploD si esos mismos dtos orrespondiern IHHH hogres en vez de PHD s se podr (rmr on un WS 7 de on(nz que se inumple l normtivF
en x D y D s1 n1
y s2 n1
159
filterl
H0 : 1 2 = D0 H1 : 1 2 = D0 z=
( x y )D0
( s1 n1 )
n1
(s2 n1 )
n2
z < z
|z | > z1/2
z > z1
gudro VFTX gontrste pr l difereni de medis on muestrs grndes roeso nuevo n1 = 50 y 1 = 1255 s1 = 215 roeso ntiguo n2 = 30 y 2 = 1330 s2 = 238
gudro VFUX htos del ejemplo del nuevo proeso de produin il estdstio es
z=
1255 1330
2152 50
= 1.41.
2382 30
r tomr l deisin podemos otener l regin rti o el pEvlorX IF v regin de rehzo es z < z0.05 = 1.65F hdo que z = 1.41 no e en est reginD no podemos rehzr l hiptesis nul en fvor de l lterntiv on = 0.05D es deirD no tenemos un WS 7 de on(nz en que el nuevo proeso hy disminuido el tiempo medio de produinF xo ostnteD est respuest dej iert l preguntD si no un WS 7 de on(nzD untcF PF hdo que el pEvlor es p = P [Z < 1.41] = 0.079 > 0.05D no podemos rehzr l hiptesis nul en fvor de l lterntiv on el nivel de signi(in = 0.05F ry que deir que no hemos podido pror lo que se sospehD que el nuevo proeso redu el tiempo medio de produinD pero los dtos puntn en est direinF hesde el punto de vist estdstioD deermos reomendr l ingeniero que umente el tmo de ls muestrs porque es posile que en ese so s pued pror es hiptesisF
8.5.2. Con muestras pequeas (n1 < 30 o n2 < 30) y varianzas iguales
il resumen pree en el gudro VFVF e propsito de l hiptesis de l iguldd de ls vrinzsD st dee srse en rzones no estdstisF vo hitul es que se supong que son igules porque el experto que est relizndo el ontrste tiene rzones experimentles pr herloD rzones jens l estdstiF mos onsiderr omo ejemplo el de un ingeniero que dese omprr dos equipos de trjo pr nlizr si se omportn de form homogneF r ello reliz un prue de destrez entre los trjdores de mos equiposX IQ del equipo I y IS del equipo PD uys puntuiones preen en el gudro VFWF ry indiios su(ientes de que existn diferenis entre ls puntuiones medis de los dos equiposc ( = 0.05)F
160
e l izquierd H0 : 1 2 = D0 H1 : 1 2 < D0
t=
( xy )D0 s2 p
1 n1 1 +n 2
P [Tn1 +n2 2 < t] 2P [Tn1 +n2 2 > |t|] P [Tn1 +n2 2 > t] wuestreo independiente y letorioF riles normlesF 2 2 1 = 2
gudro VFVX gontrste pr l iguldd de medis on muestrs peques iquipo I iquipo P SW UI UQ TQ UR RH TI QR WP QV TH RV VR TH SR US UQ RU RU RI IHP RR US VT QQ SQ TV QW
gudro VFWX htos de ls puntuiones de los dos equipos de trjo xos piden que ontrstemos l iguldd de ls medis @H0 : 1 = 2 AD frente l lterntiv H1 : 1 = 2 D por lo que se trt de un ontrste ilterlF in primer lugrD otenemos los estdstios muestrles de mos equiposF vs medis sonD respetivmenteD TVFP y SQFVD mientrs que ls desviiones tpis muestrles son IVFT y ISFVF gon estos vlores podemos lulr s2 pX
s2 p =
t=
68.2 53.8
1 294.09( 13 + 1 15 )
= 2.22.
eunque no hemos diho nd l respetoD vmos suponer que ls vrinzs son igulesF isto no pree deselldo si dmitimos que ls ondiiones en que trjn mos equipos determinn que no dee her diferenis en l vriilidd de sus puntuionesF ist hiptesis dee ser dmitid y propuest por el experto @en este soD el ingenieroA que mnej los dtosF r otener l onlusinD omo siempreD vmos otener l regin de rehzo y vlorr el pEvlorX IF v regin de rehzo es |t| > t0.975;26 = 2.055F hdo que t = 2.22 e en es reginD podemos rehzr l iguldd de ls medis on un WS 7 de on(nzF PF hdo que el pEvlorD p = 2P [T26 > 2.22] = 0.035 es inferior HFHSD podemos rehzr l iguldd de ls medis on un WS 7 de on(nzF he hehoD podrmos llegr un WTFS 7F
161
filterl
H0 : 1 2 = D0 H1 : 1 2 = D0 t=
1 n
( xy )D0
2 (s1 n1 ) +(sn1 ) 2
t < t;2(n1)
t > t1;2(n1)
P [T;2(n1) < t] 2P [T;2(n1) > |t|] P [T;2(n1) > t] vs dos muestrs se reogen de form independiente y letori ems vriles siguen distriuiones proximdmente normles vs muestrs tienen el mismo tmoD n1 = n2 = n
gudro VFIHX gontrste pr l iguldd de medis on muestrs peques vrinzs distints y mismo tmo muestrl ipo de prue riptesis istdstio de ontrste egin de rehzo pEvlor upuestos nilterl l izquierd H0 : 1 2 = D0 H1 : 1 2 < D0 nilterl l dereh H0 : 1 2 = D0 H0 : 1 2 = D0 H1 : 1 2 = D0 H1 : 1 2 > D0 2 2 2 s2 (s1 ( n1 ) n1 ) + filterl
n1 n2 2
t=
( xy )D0
(s1 n1 )
n1
( s2 ) + n1
n2
,v =
2 2 s1 n1 n1
(s2 n1 )
n2
2 2
n1 1
n2 1
t < t;v
t > t1;v
P [Tv < t] 2P [Tv > |t|] P [Tv > t] vs dos muestrs se reogen de form independiente y letori ems vriles siguen distriuiones proximdmente normles
gudro VFIIX gontrste pr l iguldd de medis on muestrs pequesD vrinzs distints y distinto tmo muestrl
apareadasD
(x1 , y1 ) , ..., (xn , yn )F r omprr ms vriles se onsider un nuev vrileD D = X Y F xotmos 2 l medi muestrl de x1 y1 , ..., xn yn y sd su vrinz muestrlF d n1
162
e l izquierd H0 : 1 2 = D0 H1 : 1 2 < D0
filterl H0 : 1 2 = D0 H1 : 1 2 = D0 0 z = sddD / n
n1
e l dereh H0 : 1 2 = D0 H1 : 1 2 > D0
z < z P [Z < z ]
z > z1 P [Z > z ]
gudro VFIPX gontrste pr l iguldd de medis en poliones preds on muestr grnde ipo riptesis istdstio ehzo pEvlor upuestos e l izquierd H0 : 1 2 = D0 H1 : 1 2 < D0 filterl H0 : 1 2 = D0 H1 : 1 2 = D0 0 t = sddD / n
n1
e l dereh H0 : 1 2 = D0 H1 : 1 2 > D0
t < t;n1 |t| > t1/2;n1 t > t1;n1 P [Tn1 < t] 2P [Tn1 > |t|] P [Tn1 > t] D = X Y D es proximdmente norml
gudro VFIQX gontrste pr l iguldd de medis en poliones preds y muestr peque ponente no desedo2 F entes de srlo l merdo neesit un estudio de sosEontroles que demuestre su e(iF il estudio de sos ontroles onsiste en enontrr un nmero determindo de prejs de persons on rterstis (siolgis preidsY en este soD l ms importnte de ests rterstis ser que ls prejs soEontrol tengn l iniio del estudio el mismo o muy preido nivel de preseni en sngre del omponente no desedoX en d un de ess prejsD un t omo soD tomndo l mediin en estudioD y l otr omo ontrolD tomndo un produto inouo llmdo pleoF xingun de ls dos personsD ni siquier el mdio o el frmetio que ontrol el proesoD se quin es el so y quin el ontrolF lo quien reopil y nliz los resultdosD sin ontto lguno on el pienteD tiene esos dtosF ist metodolog se onoe omo
doble ciego
en s mismoF vos dtos preen en el gudro VFIRF n nlisis ostoEene(io de l empres frmeti muestr que ser ene(ioso sr l merdo el produto si l disminuin medi del omponente perjudiil es de l menos P puntosF eliemos un nuev prue pr yudr l omp tomr l deisin orretF vos dtos son l disminuin de preseni en sngre del omponente no desedo despus de tomr el medimento o el pleoF impeemos por l notinF mos llmr muestr I l del medimento y muestr P l del pleoF gon est notinD nos piden que ontrstemos H0 : 1 2 = 2 frente H1 : 1 > 2 +2D o equivlentementeD
y el pEvlor soido es p = P [T9 > 3.375] = 0.004F emos que l signi(in determin un pEvlor inferiorD por ejemploD = 0.05D por lo que podemos onluir on ese nivel de signi(in que l mejor es superiorD en mediD P puntos yD por tntoD el medimento es rentleF
2 Podra
163
rej I P Q R S T U V W IH
wedimento QPFIH QTFIH QPFQH PWFSH QRFQH QIFWH QQFRH QRFTH QSFPH QPFUH
leo PUFIH QIFSH QHFRH PTFWH PWFWH PVFUH QHFPH QIFVH QQFTH PWFWH
hifereni SFHH RFTH IFWH PFTH RFRH QFPH QFPH PFVH IFTH PFVH
gudro VFIRX htos del ejemplo de l omp frmeti ipo de prue riptesis istdstio de ontrste pEvlor egin de rehzo upuestos nilterl l izquierd H0 : p = p0 H1 : p < p0 filterl nilterl l dereh H0 : p = p0 H1 : p > p0
H0 : p = p 0 H1 : p = p 0 z=
p p0 p0 (1p0 ) n
P [Z < z ] z < z
P [Z > z ] z > z1
ello seleionmos un muestr letori simple de tmo n y ontilizmos l proporin de xitos en l muestrD p F il resumen del ontrste pree en el gudro VFISF mos onsiderr un primer ejempo reltivo l relin entre el gnero y los identes de tr(oF e estim que el TH 7 de los ondutores son vronesF or otr prteD un estudio relizdo sore los dtos de IPH identes de tr(o muestr que en ellos el UH 7 de los identes fueron provodos por un vrn ondutorF odemosD on esos dtosD on(rmr que los homres son ms peligrosos l volntec i notmos por p l proporin de vrones usntes de identes de tr(oD l pregunt se responder (rmtivmente si logrmos ontrstr l hiptesis H1 : p > 0.6F il vlor del estdstio es
z=
0.7 0.6
0.60.4 120
= 2.236.
or su prteD l regin de rehzo ser |z | > 1.96 pr un = 0.05D luego en efetoD podemos onluir que l proporin de vrones usntes de identes es superior l proporin de vrones ondutores en generlF il pEvlorD de hehoD es HFHIQF mos nlizr on muho detlle otro ejemplo sore iguldd de proporionesF he tods formsD lo que quiero enftizros on el ejemplo no est reliondo en s on el heho de que se re(er un proporinF
Una marca de nueces arma que, como mximo, el 6 % de las nueces estn vacas. Se eligieron 300 nueces
164
al azar y se detectaron 21 vacas. Con un nivel de signicacin del 5 %, se puede aceptar la armacin de la marca?
in primer lugrD pedir un nivel de signi(in del S 7 es equivlente pedir un nivel de on(nz del WS 7 FFF sore quc xos preguntn si se puede eptr l (rmin de l mr
signicacin del 5 %, es decir, con un nivel de conanza del 95 %F iso impli que queremos
pror on mplis grnts que l mr no mienteD y l ni form de herlo es poner su hiptesis @p < 0.06A en l hiptesis lterntivF or tntoD tendrmos H0 : p 0.06 frente lo que (rm l mrD H1 : p < 0.06F
con un nivel de
ehor ienD (jmonos que l proporin muestrl de nuees vs es p = 21/300 = 0.07F is deirD nos piden que vemos si un proporin muestrl de HFHU d su(iente on(nz @WS 7 pr ser extosA de que p < 0.06FFF xo d ningun3 xi siquier he flt her el ontrste on nmerosF tms podremos rehzr l hiptesis nul en fvor de l hiptesis de l mrD es deirD en soluto podemos (rmr lo que die l mrD p < 0.06D on un WS 7 de on(nzF he tods formsD por si hy lgn inrduloD 0.070.06 el estdstio de ontrste ser z = = 0.729F v regin de rehzoD ddo que es un test l 0.060.94 izquierdD ser z < z0.05 = 1.645F gomo vemosD el vlor del estdstio de ontrste est en l ol de l dereh y l regin de rehzo en l de l izquierdF or eso de ntes que es imposile rehzr l hiptesis nul en fvor de l lterntivD independientemente del nivel de on(nz requeridoF rst hor hemos demostrdo que l mr no puede (rmr que l proporin de nuees vs es inferior l T 7 on un WS 7 de on(nzF he hehoD no lo puede (rmr on ningn nivel de on(nzD porque los dtos tomdos proporionn un estimin de HFHU que v justo en ontr de su hiptesisF ero vmos suponer que nos ponemos gllitos y deimosX es
la proporcin de nueces vacas superior al 6 % F ms, podra demostrar que hay eviden300
cias empricas que proporcionan un 95 % de conanza en que la compaa miente, siendo en realidad
(rmmos p > 0.06 on un WS 7 de on(nzD lo que equivle deir que hemos plntedo un nuevo ontrste de hiptesis en el que H0 : p 0.06 frente H1 : p > 0.06F vs uents estn si hehsD y que el vlor del estdstio de ontrste es el mismoD z = 0.729D mientrs que l regin de rehzo es
z > z0.95 = 1.645F ehor el vlor del estdstioD es deirD l informin que nos dn los dtos @PI de
QHH nuees vsAD s es oherente on l hiptesis lterntivD de h que est en l mism ol que l regin de rehzoFFF pero no e en ell3F or lo tntoD no tenemos su(ientes evidenis en los dtos pr rehzr l hiptesis nul en fvor de l lterntiv on un WS 7 de on(nzD s que no podemos demostrr on ese nivel de on(nz que l mr mienteF in resumenD unque prez prdjioD no tenemos su(ientes evidenis en los dtos pr (rmr que l omp die l verddD pero tmpoo pr demostrr que mienteF v difereni entre ms hiptesis rdi en que no tenemos ningun on(nz en l (rmin de l ompD y s lgun on(nz en l (rmin ontrriF gunt on(nz tenemos en l (rmin ontrri p > 0.06c ise vlor viene ddo por el pEvlorD P [Z > 0.729] = 0.233D que determin que el nivel de on(nz en
lo nio que podemos reomendr es umentr el tmo de l muestrD es deirD romper ms de QHH nuees pr tomr l deisinF eprentementeD l informin reogid on QHH nuees pree indir
Prof. Dr. Antonio Jos Sez Castillo
165
filterl
H0 : p1 p2 = D0 H1 : p1 p2 = D0
p 1 p 2 D0 p (1p )
1 n1 1 +n 2
z= z < z P [Z < z ]
, p =
n1 p 1 +n2 p 2 n1 +n2
z > z1 P [Z > z ]
gudro VFITX gontrste pr l difereni de proporiones que l mr mienteF he hehoD si l proporin muestrl de HFHU provinier de un muestr de ITHH nuees en vez de QHHD s huirmos podido demostrr on un WS 7 de on(nz que l mr mienteF
z=
88+15 274+1044 (1
88 274
15 1044
= 904.29. +
1 1044 )
ist lro que el vlor del estdstio es estilD sin neesidd de vlorr l regin de rehzoD que ser
z > z0.95 = 1.645D luego podemos rehzr l hiptesis nul en fvor de l lterntiv onD l menosD el WS 7
de on(nzF il pEvlorD p = P [Z > 904.29] = 0 indi que l on(nz esD de hehoD stnte myorF xo puedo resistirme onluir el ejemplo sin reordr que lo que l hq relmente querr dr entender es que el lohol es el usnte de los identes de tr(oD pero que eso no puede ser demostrdo on el ontrsteF
3 http://www.dgt.es/educacionvial/imagenes/educacionvial/recursos/dgt/EduVial/50/40/index.htm
166
filterl
2 H0 : 2 = 0 2 H1 : 2 = 0
2 = 2 < 2 ;n1
(n1)s2 n1 2 0
2 < 2 /2;n1 o 2 > 2 1;n1 2 > 2 1/2;n1 2 2 2 2 2 2 2 P [n1 < ] 2min(P [n1 < ], P [n1 > ]) P [n1 > 2 ] histriuin de proilidd proximdmente norml
gudro VFIUX gontrste pr l vrinz
es que hor no podemos plir el eorem gentrl del vmiteD por lo que slo utilizr los ontrstes undo
2 2 2 l vrile X es normlF 2 p;v es el vlor de un de v grdos de liertd tl que P < p;v = pF
vs empres idel (rm que su mquin de llendo riwe posee un desviin tpi en el llendo de ontenedores de SHHml de produto homogneo inferior HFV grF4 mos suponer que el supervisor de ontrol de lidd quiere relizr un omproin l respetoF eopil pr ello un muestr del llendo de SH ontenedoresD oteniendo un vrinz muestrl de HFT ist informin proporion prues su(ientes de que l desviin tpi de su proeso de llendo es relmente inferior HFVgrFc lntemosD en primer lugrD ls hiptesis del ontrsteF e nos pide que ontrstemos H0 : = 0.8 oD equivlentementeD H0 : 2 = 0.64 frente l lterntiv H1 : 2 < 0.64F e trtD por tntoD de un test unilterl l izquierdF il estdstio de ontrste es
2 =
WS 7 de on(nz queD en efetoD l desviin tpi de l ntidd de llendo es inferior HFVgrF PF hdo que el pEvlor es p = P [2 49 < 45.938] = 0.4D stnte ltoD tenemos muy seris duds er de queD en efetoD l desviin tpi se relmente inferior HFVgrF
OjoX ntes de que l empres idel se enfde on nosotrosD no olvidemos que los dtos son imginriosX slo
son reles ls espei(iones tnis de < 0.8gr.
4 http://www.sidel.com/es/products/equipment/the-art-of-lling/hema-gw
Prof. Dr. Antonio Jos Sez Castillo
167
nilterl l izquierd
filterl
nilterl l dereh
H0 : H1 :
2 1 2 2 2 1 2 2
=1 <1
H0 : H1 : f=
2 1 2 = 1 2 2 1 2 = 1 2 2 (s1 n1 )
H0 : H1 :
2 1 2 2 2 1 2 2
=1 >1
f < f/2;n1 1,n2 1 o f > f1;n1 1,n2 1 f > f1/2;n1 1,n2 1 P [Fn1 1,n2 1 < f ] 2min(P [Fn1 1,n2 1 < f ], P [Fn1 1,n2 1 > f ]) P [Fn1 1,n2 1 > f ] vs dos muestrs se reogen de form independiente y letori ems vriles siguen distriuiones proximdmente normles f < f;n1 1,n2 1
gudro VFIVX gontrste pr el oiente de vrinzs
(s2 n1 )
si ms vriles son normlesF il resumen del ontrste pree en el gudro VFIVF in lD fp;v1 ,v2 es el vlor de un F de v1 y v2 grdos de liertd5 tl que P [F < fp;v1 ,v2 ] = pF r prtir sore el ontrsteD onsideremos que se hn relizdo PH mediiones de l durez en l esl ikers de ero on lto ontenido en romo y otrs PH mediiones independientes de l durez de un solddur produid sore ese metlF vs desviiones estndr de ls muestrs de durez del metl y de durez de l solddur sore ste fue de IPFHTHV y IIFRIHV D respetivmenteF odemos suponer que ls durezs orresponden vriles normles e independientesF odemos onluir que l durez del metl sio es ms vrile que l durez medid en l solddurc mos llmr l durez sore el eroD X D y l durez sore l solddurD Y F e nos pide que ontrstemos
2 2 2 2 H0 : X = Y frente l lterntiv H1 : X > Y oD equivlentementeD H1 : un prue unilterl l derehF il estdstio de ontrste es
2 X 2 Y
f=
mos tomr un nivel de signi(in de = 0.05F v regin rti viene delimitd por el vlor f0.95;19,19 =
2.168F hdo que f = 1.1172 < f0.95;19,19 = 2.168D no podemos onluir l nivel de signi(in = 0.05 que
l durez del metl sio se ms vrile que l durez medid en l solddurF il pEvlorD por su prteD es p = P [F19,19 > 1.1172] = 0.4058F
factor
cara al uso de las tablas hay una propiedad bastante til: fp;v1 ,v2 = 1/f1p;v2 ,v1 es necesario, aunque s deseable, que todas las muestras tengan el mismo tamao.
Prof. Dr. Antonio Jos Sez Castillo
168
H0 : 1 = ... = m
frente
i = 1, ..., mF
iste ontrste se denomin exye omo rnimo de ls poliones de ls que proeden ls muestrsF upongmos que
juntamos Analysis of VarianceD
s en nlizr qu se dee l vriilidd totl que presentn los dtosD si l zr o ls diferenis entre tods ls muestrsD oteniendo un ni muestr glol de tmo
m
N=
i=1
ni ,
y lulmos su mediD
x =
ehorD vmos preguntrnos por ls
m i=1
ni j =1
xi j
IF in primer lugrD los dtos vrn glolmente respeto l medi totlF n medid de est vriin es l
ni
SCT =
i=1 j =1
xi j x
PF or otro ldoD puede her diferenis entre ls medis de d grupo y l medi totlF odemos medir ests diferenis on l
SCE =
i=1
ni ( xi x ) .
muestrales
i l hiptesis nul fuer iertD slo hr peques diferenis muestrD en uyo soD l
SCE
entre ls medis de d
ser grndeF
QF or ltimoD deido l vriilidd inherente tod muestrD los dtos de d muestr vn vE rir respeto su medi prtiulrF gomo medid de est vriin onsidermos l
suma de los
SCD =
i=1 j =1
xi i j x
=
i=1
(ni 1) s2 i,ni 1 .
169
de la varianzaX
teorema de particin
r ello st onsiderr queD suponiendo que l hiptesis nul es iertX sigue un 2 on N 1 grdos de liertdF sigue un 2 on m 1 grdos de liertdF sigue un 2 on N m grdos de liertdF
F =
SCE m 1 SCD N m
queD suponiendo que l hiptesis nul es iertD sigue un F de nedeor on m 1 y N m grdos de liertdF or lo tntoD el test podemos resumirlo de l siguiente formX IF glulmos
m i=1 ni j =1
x =
y on ell
m
xi j
N
m 2
SCE =
i=1
ni ( xi x ) =
i=1
ni x 2 2 . i Nx
PF glulmos
ni
SCD =
i=1 j =1
xi i j x
=
i=1
(ni 1) s2 i,ni 1 .
F =
RF ommos l deisinX
aA
SCE m1 SCD N m
i F Fm1,N m;1 D no rehzmos l hiptesis nul en fvor de l lterntiv on un nivel de signi(in F i F > Fm1,N m;1 D rehzmos l hiptesis nul en fvor de l lterntiv on un nivel de signi(in F
bA
170
gomposiin e f g h
in primer lugrD oservemos que los tmos muestrles son igulesX n1 = ... = n4 = 5F or otr prteD tenemosX
x =
F =
= 3.8734.
or su prteD el vlor de F3,16;0.95 es QFPQVWD de mner que podemos (rmr que existen diferenis signi(tivs entre ls durezs de los R ompuestosD on un WS 7 de on(nzF
Ejemplo. in fiolog woleulr se estudi l relin que puede tener el nivel de expresin de un gen
on l posiilidd de pdeer un tipo de nerF n investigdor onsigue nlizr el nivel de expresin de IH genes en un muestr de pientes y reliz IH ontrstes de hiptesis donde l hiptesis lterntiv de d uno de ellos die que un gen est reliondo on l posiilidd de pdeer ese nerF vos pEvlores otenidos son los siguientesX
(0.1, 0.01, 0.21, 0.06, 0.32, 0.24, 0.45, 0.7, 0.08, 0.0003)
171
in prinipioD tendrmos evidenis de que el P y el ltimo gen estn signi(tivmente reliondos on ese tipo de nerF in emrgoD deemos orregir el efeto de l relizin de ls IH prues simultnesF eplindo el mtodo de fonferroniD deemos multiplir por IH los pEvloresF in ese soD el segundo gen y no puede ser onsiderdo estdstimente signi(tivo pr el riesgo de pdeer el ner (0.01
10 > 0.05)Y por el ontrrioD ddo que 0.0003 10 < 0.05D el ltimo gen sigue siendo onsiderdo
signi(tivmente reliondo on el nerF
in este soD fortundmente tenemos un tmo muestrl que v permitir ovir l hiptesis de normliE ddF emos que se plnte un supuesto que puede ser nlizdo trvs de l mediD en onretoD omprndo l medi de ms mquinsF i llmmos X l dimetro de l mquin e e Y l dimetro de l mquin fD tenemos que ontrstr H0 : X = Y frente H1 : X = Y F il estdstio de ontrste es
z=
5.068 5.072
0.0112 120
= 3.013.
0.0072 65
il pEvlor soido es 2 P [Z < 3.361] = 0.002D luego tenemos evidenis de queD en efetoD el dimetro medio de ms mquins es distintoF
172
Captulo 9
Contrastes de hiptesis no paramtricas
odos prendemos de l experieniD y l lein en est osin es que nun se dee perder de vist l lterntivF herlok rolmes @eF gF hoyleAD en vs eventurs de flk eter
Resumen. gontinundo on los ontrste de hiptesisD presentmos en este ptulo nuevos ontrstes que
permitirn deidir si un juste medinte un distriuin teri es vlido y vlorr si existe relin entre vriles ulittivsF
9.1. Introduccin
odos los ontrstes que hemos desrito en el ptulo nterior se snD diret o indiretmente @ trvs del teorem entrl del lmiteA en que los dtos se justn l distriuin normlD hiendo infereni de un u otr form sore sus prmetrosF in este ptulo vmos onsiderr ontrstes que no neesitn de tl hiptesisD por lo que no se enunin omo ontrstes sore lgn prmetro desonoidoX de h que formen prte de los llmdos contrastes
si ese
juste es ueno o mloD o mo de ueno esF he hehoD en l relin de prolems orrespondiente dejmos medinte representiones gr(sD lo que slo nos dio un visin pril del prolemD que puede ser muy sujetivF vos dos ontrstes de hiptesis que vmos desriir hor vn permitir ontrstr omo hiptesis nul
esultdo I P Q R S T otl
gudro WFIX preuenis oservds y esperds en THH lnzmientos del ddoF frente l lterntiv
H0 : p1 = ... = p6 =
frente l lterntiv de H1 que lgn pi se distint de 1 6F
1 6
r relizr l prueD lnzr el ddo THH veesD notndo el nmero de vees que se d d resultdoF ists ntiddes se denominn
frecuencias observadasF
or otr prteD si el ddo fuer justo @hiptesis H0 AD en THH lnzmientos deern drse proximdmente IHH de d resultdo posileF sts freuenis se denominn
frecuencias esperadasF
il thur tomr l deisin on respeto l ddo prtir de l omprin de ls freuenis oservds y ls esperds @ver gudro WFIAF u deidirs t l luz de esos dtosc
e ontinuinD vmos desriir el test 2 D que permite relizr prues de este tipoF gomo hemos omentdo en l introduinD on ell podremos
juzgar
puntulD pero tmin podremos utilizrl en ejemplos omo el que mos de verD en el que el experto est interesdo en ontrstr dtos experimentles on respeto un distriuin teri que le result de intersF in primer lugr y de form ms generlD supongmos que tenemos un muestr de tmo N de un vFF disret o ulittivD X D justd un modelo ddo por un distriuinF
174
gonsideremos un prtiin del onjunto de vlores que puede tomr l vrileX S1 , ..., Sr F in prinipioD est prtiin podrn ser simplemente todos y d uno de los vlores que tom l vrile X D peroD omo veremosD es posile que tengmos que grupr lgunos de ellosF eguidmenteD onsideremos l proiliddD segn l distriuin dd por el juste que queremos evlurD de d un de ests prtesD
pi = P [X Si /H0 ] > 0.
he igul formD lulemos Oi D el nmero de oserviones de l muestr que en en d onjunto Si . v ide del test es omprr el nmero de oserviones Oi que en relmente en d onjunto Si on el nmero esperdo de oserviones que deern er en Si si el juste es el ddo por nuestro modeloD que ser N pi F r elloD un medid que ompr ests dos ntiddes viene dd por
r
D=
i=1
(Oi N pi ) . N pi
no cuadran
iD pr un muestr ddD est vFF tom un vlor d muy ltoD indi que los vlores oservdos
on el juste que hemos propuesto @on lo ul se rehzr l hiptesis nul en fvor de l lterntivAY siD por el ontrrioD tom un vlor d joD indi que nuestro juste orresponde ien on los dtos de l muestrD por lo que es
aceptable
l hiptesis nulF
il prolem (nl es deidir undo el vlor de l vFF D, dD es lo su(ientemente lto omo pr que nos resulte ineptle el justeF r deidirlo hy que tener en uent que undo N es rzonlemente lto y l hiptesis H 0 es iertD l distriuin de proilidd de D es 2 on r k 1 grdos de liertdD es deirD
D/H0 2 r k1 ,
donde k es el nmero de prmetros que hn sido estimdos en el justeF eniendo en uent este resultdoD se lul jo est distriuin l proilidd de que se de un vlor todv ms lto que d @el pEvlorD por tntoAD
N >>
p = P [D > d/H0 ] .
i est proilidd es inferior l S 7D se rehz l hiptesis nul en fvor de l lterntiv on un WS 7 de on(nzF hiho de otr formD se ept l hiptesis nul slo si el vlor de D entr dentro del WS 7 de resultdos ms fvorles ellF isquemtimenteD el proeso es el siguienteX IF e enuni el testX
H0 : los dtos siguen l distriuin dd por nuestro juste H1 : los dtos no siguen l distriuin dd por nuestro juste
PF i en l muestr se dn los vlores x1 , ..., xm D se luln ls freuenis esperds segn el juste propuesto de d vlor xi D N P [X = xi ]D i = 1, ..., mF i lgun de ests freuenis es inferior SD se grup on lgun de l ms ern hst que sumen un freueni myor o igul SF e onstruye s l prtiin del onjunto de vlores posiles pr X D S1 , ...Sr D uys freuenis esperds
Prof. Dr. Antonio Jos Sez Castillo
175
xi preF osF
H RP
I PV
P IQ
Q S
R U
S Q
T P
gudro WFPX preuenis oservds en l muestr de tiempos entre llegdsF son tods myores o igules SF in reliddD esto es slo un reomendin que puede reljrseX si lgun freueni esperd es slo ligermente inferior SD no es espeilmente grveF QF e luln ls freuenis oservds de d Si D y lo notmos omo Oi F RF e lul el estdstio del test en l muestr
r
d=
i=1
(Oi N pi ) . N pi
p = P [D > d/H0 ] ,
segn un distriuin 2 on r k 1 grdos de liertdF TF e tom l deisin @pr un nivel de on(nz del 95 %AX
aA bA
i p < 0.05D se rehz l hiptesis nul en fvor de l lterntivD on un 95 % de on(nzF i p 0.05D se onluye que no hy evidenis en ontr de (rmr que los dtos se justn l distriuin ddF
Ejemplo.
vos dtos que se presentn en el gudro WFP onstituyen un muestr letori simple del
tiempo en msF que trnsurre entre l llegd de pquetes trnsmitidos por un determindo protooloF in l tl preen los vlores junto l nmero de vees que hn sido oservdos en l muestrF e sospeh que un distriuin geomtri puede justr ien esos dtosF mos relizr ese juste y ontrstr si es eptle medinte el test de l hiEudrdoF in primer lugrD pr justr un distriuin geomtri deemos estimr el prmetro de l mismF mos herlo de form senill por el mtodo de los momentosF il vlor de l medi de l distriuin es 6ia de donde p =
1 1+EX .
p =
1 . 1+x
or su prteD
x =
luego 6
0 42 + 1 28 + 2 13 + 3 5 + 4 7 + 5 3 + 6 2 = 1.24, 100
176
es puesD desemos ontrstr en qu medid el juste de un Geo (0.4464) es vlido pr los dtos de l muestrF is deirD desemos ontrstr H0 : X Geo (0.4464) frente l lterntiv H1 : X
Geo (0.4464) .
mos lulr ules son ls proiliddes teris segn es distriuin de los vlores oservdos en l muestrX
d=
6.9696 0.0841 0.4624 6.6049 6.8644 + + + + = 1.7973. 44.64 27.71 13.68 7.57 9.38
pinlmenteD el pEvlor se lul omo P [D > 1.7973] , donde D sigue un 2 511 D es deirD un Gamma de prmetros (5 1 1)/2 y 1/2F or tntoD
p valor =
1 2
1 2x
3 2 1
e 2 x
1.7973
3 2
dx = 0.61552.
el ser superior @muy superiorD de hehoA HFHSD podemos (rmr que no hy evidenis en los dtos de l muestr en ontr de que stos sign un distriuin Geo (0.4464)F
177
xi 0 1 2 3 4
Oi 42 28 13 5 12
(Oi N pi )
2
(42 44.64) = 6.969 6 2 (28 27.71) = 0 .0841 2 (13 13.68) = 0.462 4 2 (5 7.57) = 6.604 9 2 (12 9.38) = 6.864 4
e l hor de lulr este mximo deemos tener en uent que l vrile x es de tipo ontinuoF v hiptesis nul ontrstr es
SN x(i) =
dN = m ax
1iN
m ax
F x(i) SN x(i)
, F x(i) SN x(i1)
100 % de on(nzF
v distriuin de proilidd de DN D neesri pr lulr el pEvlorD no es muy onoidF edemsD pr evlur est proilidd hy que tener en uent el nmero de prmetros de l distriuin en el
178
justeF n metodolog deud pr ello es onoid omo wtodos de wonte grloD unque exede los ontenidos de estos puntesF heo dvertir que muhos de los pquetes estdstios ms hitules pueden induir error en el lulo de este pEvlorD y que proporionn por defeto qul orrespondiente un juste en el que no se estime ningn prmetro en l distriuin jo l hiptesis nulD dndo lugr un soreestimin de diho pEvlorF IFRTRU HFPQQQ HFRWWS HFHVIR HFUPIT HFQHQS HFIISI IFUQSV HFPUIU HFWHPI HFUVRP HFHTTU QFWVWV HFHVTV HFIWTU HFVWHW HFVIHQ HFIIPR HFRVSR HFHSIP
Ejemplo. vos dtos que preen en el gudro WFR orresponden l tiempo en seF entre onexiones
un servidorF xos plntemos si un distriuin exponenil es deud pr su justeF in primer lugr hemos de deidir ul es el juste propuestoF il estimdor mximo verosmil del prE = 1 F in este metro de un exponenil oinide on el estimdor del mtodo de los momentosD
m1
x(i) 0.0512 0.0667 0.0814 0.0868 0.1124 0.1151 0.1967 0.2333 0.2717 0.3035
F x(i) 7.1499 102 9.2119 102 0.11125 0.11818 0.15029 0.1536 0.24798 0.28682 0.32542 0.3558
i 20
i1 20
0.05 0.1 0.15 0.2 0.25 0.3 0.25 0.4 0.45 0.5
x(i) 0.4854 0.4995 0.7216 0.7842 0.8103 0.8909 0.9021 1.4647 1.7358 3.9898
F x(i) 0.50505 0.51506 0.64849 0.67897 0.69089 0.72496 0.72938 0.88023 0.91914 0.99691
i 20
i1 20
0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95
179
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.5
1.5
2.5
3.5
pigur WFIX puniones de distriuin teri y empriF lor donde se d el estdstio de uolmogorovE mirnofF
Ejemplo.
ist reliond l ideolog polti on el gnero del votntec is deirD nos plntemos si
el que un person se delre de izquierds o de derehs depende de si es vrn o mujerF ixisten dos vriles ulittivs o rterstis que dividen l polinF vo que nos interes es si es divisin est o no reliondF ern ms onservdors ls mujeresc
gonsideremos en generl un polin en l que d individuo se lsi( de uerdo on dos rterstisD designds omo X e Y F upongmos que los posiles vlores de X son x1 , ..., xr y los posiles vlores de Y son y1 , ..., ys F henotemos por pij l proporin de individuos de l polin uys rterstis son simultnemente
P [X = xi , Y = yj ] = pij
s
P [X = xi ] = pi. =
j =1
pij
Prof. Dr. Antonio Jos Sez Castillo
180
P [Y = yj ] = p.j =
i=1
pij .
vo que pretendemos ontrstr es si ls dos rterstis son independientesD es deirD si pr todo i y pr todo j D
P [X = xi , Y = yj ] = P [X = xi ] P [Y = yj ] ,
es deirD si
observadasA,
ni. = yj .
s j =1
r i=1
he est formD
p ij =
ser un estimdor sdo en l muestr de pij D
nij n
p i. =
ser un estimdor sdo en l muestr de pi. y
ni. n
p .j =
ser un estimdor sdo en l muestr de p.j .
n.j n
or otr prteD si l hiptesis nul fuer iertD el nmero de individuos en l muestrD de tmo nD que tomn simultnemente los vlores xi y yj ser
eij = n pi . p.j .
fsdo en l muestrD los vlores
e ij = n p i. p .j ni. n.j = n
@frecuencias
pinlmenteD el estdstio del ontrste se s en omprr los vlores reles en l muestr de nij on los vlores e ij que se drn si l hiptesis nul fuer iertD es deirD si ls rterstis X e Y fuern
Prof. Dr. Antonio Jos Sez Castillo
181
d=
i=1 j =1
(nij e ij ) . e ij
uponiendo que l hiptesis nul es iertD l distriuin del estdstio del ontrste es 2 on (r 1) (s 1) grdos de liertdD por lo que deidiremos en funin del pEvlor soidoD
p = P [D > d/H0 ] ,
donde D 2 (r 1)(s1) o ienX ehzremos H0 on nivel de signi(in si d > 2 (r 1)(s1);1 . xo rehzremos H0 on nivel de signi(in si d < 2 (r 1)(s1);1 . ry que her un ltim oservinX pr que en efeto D 2 on (r 1) (s 1) es neesrio que tods @o si todsA ls freuenis esperds e ij sen myores o igules SF i lgun o lguns de ells no lo sonD l distriuin 2 podr no ser deud y el resultdo del test inorretoF r que esto no ourr es reomendle que el tmo de l muestr se grndeF
nij yD en los mrgenes inferior y lterl derehoD los vlores ni. y n.j .
mos ver si el gnero est reliondo on l ideologF i no fuer sD si l ideolog fuer independiente del gneroD se tendr en un muestr de QHH individuos ls freuenis esperds sern szquierd wujeres romres otl
156 300 300 144 300 300 120 300 120 300
hereh
156 300 300 144 300 300 128 300 128 300
gentro
156 300 300 144 300 300 52 300 52 300
IPH szquierd
182
D=
(68 62.40) (56 66.56) (32 27.04) + + + 62.40 66.56 27.04 2 2 2 (52 57.60) (72 61.44) (20 24.96) + + + = 6.433. 57.60 61.44 24.96
or su prteD 2 (21)(31);0.95 = 5.991D de mner que podemos rehzr l hiptesis nul en fvor de l lterntivD (rmndo on un WS 7 de on(nz que el genero est reliondo on l ideologF in qu sentido lo estrc i nos entrmos slo en los de izquierdsD tenemos que el porentje de homres y mujeres es de
68 120
100 % = 56.667 % y de
52 120
i nos entrmos slo en los de derehsD tenemos que el porentje de homres y mujeres es de
56 128
100 % = 43.75 % y de
72 128
pinlmenteD si nos entrmos slo en los de entroD tenemos que el porentje de homres y mujeres es de
32 52
100 = 61.538 % y de
20 52
vo que pree que ourre es que ls mujeres tienen myor prefereni por l derehF in emrgoD est (rmin no se h ontrstdoD sino que se s simplemente en dtos desriptivos1 F
xmero de identes RU SP SU TQ
Con esa informacin, los responsables de seguridad de la empresa deben decidir si hay franjas horarias donde los accidentes son ms probables o si, por el contrario, stos ocurren absolutamente al azar.
in primer lugr deemos plnternos l hiptesis que queremos ontrstrF il heho de que ourrn los identes solutmente l zr vendr deir que l proilidd de ourreni es l mism en d frnj horri @puesto que tods ells tienen l mism mplitudAF or elloD si notmos pi l proilidd de que ourr un idente en l iEsim frnj horriD nos plntemos omo hiptesis nul H0 : p1 = ... = p4 = frente l lterntiv de que no tods ls proiliddes sen igulesF r relizr el ontrste podemos onsiderr un ontrste de ondd de juste en el que l distriuin de proilidd se un uniforme disretD que no tiene prmetrosF
Prof. Dr. Antonio Jos Sez Castillo
1 4
183
2 =
(47 219 (1/4))2 (52 219 (1/4))2 (57 219 (1/4))2 (63 219 (1/4))2 + + + = 2.571. 219 (1/4) 219 (1/4) 219 (1/4) 219 (1/4)
or su prteD el pEvlor es p = P [2 401 > 2.571] = 0.462D por lo que no tenemos evidenis en estos dtos que hgn pensr en que hy frnjs horris ms propiis los identesF
184
Captulo 10
Regresin lineal simple
n poltio dee ser pz de predeir lo que psr mnD y l semnD el mes y el o prximosF tmin dee ser pz de explir por qu no ertF inston ghurhill
Resumen. in este ptulo se desrie el modelo de regresin linel simpleD que sume que entre dos vriles
dds existe un relin de tipo linel ontmind por un error letorioF eprenderemos estimr diho modelo yD prtir de ests estimiones y jo determinds hiptesisD podremos extrer prediiones del modelo e inferir l fortlez de dih relin linelF
Palabras clave: regresin linel simpleD vrile dependienteD vrile independienteD error letorioD nue
de puntosD prinipio de mnimos udrdosD oe(iente de orrelin linelD oe(iente de determinin linelD ondd del justeD prediinD estiminF
10.1. Introduccin
no de los spetos ms relevntes que ord l istdsti se re(ere l nlisis de ls reliones que se dn entre dos vriles letorisF il nlisis de ests reliones est muy freuentemente ligdo l nlisis de un vrileD llmd variable
dependiente (Y ) , y del efeto que sore ell tiene otr @u otrsA vrile@sAD llmd@sA variable(s) independiente(s) (X )D y permite responder dos uestiones sisX
is signi(tiv l in)ueni que tiene l vrile independiente sore l vrile dependientec
iD en efetoD es relin es signi(tivD mo esc y podemos provehr es relin pr predeir vlores de l vrile dependiente prtir de vlores oservdos de l vrile independientec ws nD podemos inferir rterstis sore es relin y on el fenmeno que suye ellc
Ejemplo. n equipo de investigdores que trjn en seguridd en el trjo est trtndo de nlizr
mo l piel sore un ierto omponente qumio peligrosoF r elloD olo diferentes volmenes del ompuesto qumio sore diferentes segmentos de piel durnte distintos intervlos de tiempoD midiendo l o de ese tiempo el porentje de volumen sorido del ompuestoF il diseo del experimento se h IVS
relizdo pr que l interin esperle entre el tiempo y el volumen no in)uy sore los resultdosF vos dtos preen en el gudro IHFI vo que los investigdores se uestionn es si l ntidd de ompuesto por un ldo y el tiempo de exposiin l que se somete por otroD in)uyen en el porentje que se soreF he ser sD ser interesnte estimr el porentje de sorin de persons que se sometn un exposiin de un determind ntiddD por ejemploD durnte V horsF in un primer proximin l prolemD podemos oservr un representin gr( de los dtos en los digrms de dispersin o nues de puntos de l pigur IHFIF u (rmrmosc ree que s hy un relin linel ms o menos lr @pero no de(nitivA entre el tiempo de exposiin y el porentje de sorinD pero l hy entre el volumen y el porentje de sorinc
ixperimento I P Q R S T U V W
olumen HFHS HFHS HFHS PFHH PFHH PFHH SFHH SFHH SFHH
iempo P IH PR P IH PR P IH PR
orentje esorido SHFVV RWFWT VQFTT SRFHW TVFPU VSFTS RVFQW TRFVV VVFHI
@variable
in est expresinX
Y represent l vrile dependienteD es deirD quell vrile que desemos estudir en relin
on otrsF
X represent l vrile independienteD es deirD quells que reemos que puede fetr en lgun
medid l vrile dependienteF v estmos notndo en mysulD indindo que podr ser un vrile letoriD pero hitulmente se onsider que es un onstnte que el investigdor puede (jr su ntojo en distintos vloresF
represent el error
aleatorioD es deirD quell ntidd @letoriA que provo que l relin entre
Prof. Dr. Antonio Jos Sez Castillo
l vrile dependiente y l vrile independiente no se perfetD sino que est sujet inertidumreF
186
Porcentaje.Absorbido
Porcentaje.Absorbido 5 15 Tiempo
80
70
60
50
50 0
60
70
80
Volumen
pigur IHFIX xue de puntos ry que tener en uent que el vlor de ser siempre desonoido hst que se oserven los vlores de X e
E [Y /X =x ] = 0 + 1 x + E [/X =x ] = 0 + 1 x.
is deirD ls medis de los vlores de Y pr un vlor de X ddo son un retF v pigur IHFP represent un nue de puntos y l ret de regresin que los just de unos dtos genriosF odemos ver el vlor onreto de = y E [Y /X =x ] pr un dtoD supuesto que hemos otenido un modelo de regresinF in ell se puede ver tmin l interpretin de los oe(ientes del modeloX
0 es
la ordenada al origen del modeloD es deirD el punto donde l ret interept o ort l eje yF la pendiente
de l lne yD por tntoD puede interpretrse omo el inremento de l
1 represent
187
100
105
yi
95 y
0 + 1xi
85
90
xi
50 60 70 x 80 90 100
Nota. is evidente que l utilidd de un modelo de regresin linel tiene sentido siempre que l relin
hipotti entre X e Y se de tipo linelD pero qu ourre si en vez de ser de este tipo es de otro tipo @exponenilD logrtmioD hiperlioFFFAc in primer lugrD es solutmente onveniente diujr el digrm de dispersin ntes de omenzr trtr de otener un modelo de regresin linelD y que si l form de este digrm sugiere un per(l distinto l de un ret quiz deermos plnternos otro tipo de modeloF D por otr prteD si se oserv que el digrm de dispersin es de otro tipo onoidoD puede optrse por relizr un mio de vrile pr onsiderr un modelo linelF ixisten tnis muy senills pr est uestinD pero no ls veremos quF
deeremos
estimr los oe(ientes 0 y 1 del modeloF r otener estimdores de estos oe(ientes vmos onsiderr
jo determindos supuestos que veremos en reveD los estimdores de mnimos udrdos oiniden on los
188
(x1 , y1 ) , ..., (xn , yn ) , 0 y 1 , de mner que en el modelo justdoD usremos vlores estimdos de 0 y 1 , que notremos por 0 + 1 x y x =
minimie l sum de los udrdos de los errores oservdosF eordemos que
E [Y /X =x ] = 0 + 1 x,
luego y x puede interpretrse de dos formsX IF gomo un prediin del vlor que tomr Y si X = x.
PF gomo un estimin del vlor medio de Y undo X = xF gonretndoD lo que usmos es minimizr l
SSE =
i=1
0 + 1 xi ) yi (
es deir usmos
0 , 1 = arg m n SSE .
0 ,1
dada X
e llm
0 v soluin de ese prolem de mnimo se otiene por el menismo hitulX se deriv SSE respeto de SS xy 1 , se igul ero y se despejn estosF v soluin es 1 = 1 x , donde y SSxx y 0 = y
n n
SSxy =
i=1 n
( xi x ) (yi y ) =
i=1 n
xi yi nx y
SSxx =
i=1
( xi x ) =
i=1
x2 2 . i nx
SSE =
i=1
0 + 1 xi ) yi (
=SSyy
189
in este sentidoD se de(ne omo medid de l lidd del juste de l ret de regresin el juste omo
se = =
SSE = n2
0 + 1 x yi n2
1 SSxy SSyy . n2
Ejemplo. r los dtos sore el ejemplo de l sorin del ompuestoD vmos lulr e interpretr
ls dos rets de regresin posilesF in primer lugrD vmos onsiderr l ret de regresin pr explir el porentje de sorin @y ) onoido el volumen de sustni @xAX
y x = 63.69 + 0.97 x. 1 = 0.97 es que el porentje de sorinD Y D ument en promedio HFWU por d v interpretin de 0 = 63.69 ser l del vlor inremento de I unidd de volumen de ompuestoF v interpretin de
promedio de Y undo x = 0D pero es que en este so este supuesto no tiene sentidoD s que no dee tenerse en uentF mos on l ret de regresin pr explir el porentje de sorin @y A en funin del tiempo de exposiin @xAX
190
y x = 46.82 + 1.60 x.
or d inremento de un unidd del tiempo de exposiinD el porentje de sorin ument en medi IFTHF ehor vmos representr ls nues de puntos de nuevo on sus rets de regresin justdsF he es mner podremos ompror de un form gr( mo de uens son ls rets en unto su pidd de juste de los dtosF vos resultdos preen en l pigur IHFQF odemos ver que el juste es muho mejor undo l vrile explitiv es el tiempo de sorinD mientrs que si l vrile explitiv es el volumenD l ret no puede psr er de los dtosF
Nota. ry que her un oservin importnte que suele onduir freuentes erroresF v ret de
regresin pr l vrile dependiente Y D dd l vrile independiente X no es l mism que l ret de regresin de X dd Y F v rzn es muy senillX pr otener l ret de regresin de Y ddo X deemos minimizr
n
0 + 1 xi yi
i=1
191
0 + 1 yi xi
i=1
despejandoF
0 y 1 son slo estimiones de 0 y 1 D is importnte queD pr terminr este prtdoD reordemos que
estimiones sds en los dtos que se hn otenido en l muestrF n form de hernos onsientes de que se trt de estimiones y no de vlores extos @es imposile onoer el vlor exto de ningn prmetro polionlA es proporionr ls estimiones de los errores estndr de ls estimiones de 0 y 1 F e onoe que dihs estimiones sonX
1 = s.e. 0 = s.e.
s2 e SSxx s2 e x 2 1 + n SSxx
Ejemplo.
in el ejemplo de los dtos de sorin hemos estimdo los oe(ientes de ls dos rets
de regresin del porentje de sorin en funin del volumen y del tiempo de sorinF mos ompletr ese nlisis on el lulo de los errores estndres de ess estimionesF vos resultdos preen resumidos en l siguiente tlX wodelo
0
TQFTW RTFVP
0 s.e.
VFVH QFIT
1
HFWU IFTH
1 s.e.
PFVQ HFPI
ysrvese que los errores estndr en el modelo en funin del volumen son myores proporionlmente que en el modelo en funin del tiempo de sorinF
192
ms o menos
omprole on un nue de puntosF i el speto de est nue no reuerd un lne ret sino otro tipo de funinD lgimente no hremos regresin linelF PF ue los errores tengn medi eroD independientemente del vlor de xD lo queD por otr prteD no es un hiptesis sino ms ien un requerimiento lgio l modeloF vo que hor vmos her es dir lgunos supuestos l modelo de mner que undo stos se umplnD ls propieddes de los estimdores de los oe(ientes del modelo sen muy uensF isto nos v permitir her infereni sore estos oe(ientes y sore ls estimiones que pueden drse de los vlores de l vrile dependienteF vos supuestos que podemos dir se re(eren l error del modeloD l vrile F
es normlF
soluto en l mgnitud de otros erroresF in resumenD todos los supuestos pueden resumirse diiendo que |X =x N (0, 2 ) y son independientes entre sF istos supuestos son restritivosD por lo que deen omprorse undo se pli l tniF i el tmo de l muestr es grndeD l hiptesis de normlidd de los residuos estr stnte grntizd por el teorem entrl del lmiteF in unto l vrinz onstnte respeto los vlores de xD un inumplimiento moderdo no es grveD pero s si ls diferenis son evidentesF ixisten tnis espe(s pr evlur en qu medid se umplen ests hiptesisF min existen proE edimientos pr orregir el inumplimiento de estos supuestosF istos spetos sern trtdos l (nl del temF
193
pigur IHFRX xues de puntos y rets de regresin que ls justn estrmos equivodosX si l ret de regresin trt de explir y en funin de xD unto vr y onforme vr xc hdo que l pendiente de es ret es ero o prtimente eroD por muho que mies xD eso no fet l vlor de y D es deirD x
derehD pesr de que prentemente el juste es peorD l ret justd s tiene pendiente distint de eroD luego el heho de que y vre viene ddo en uen prte por el heho de que x vrD y ello ourre porque l pendiente de es ret es distint de eroF es puesD no lo olvidemosX deir que dos vriles estn relionds linelmente equivle deir que l pendiente de l ret de regresin que just un en funin de l otr es distint de eroF ues ienD ddos los supuestos desritos en l sein nteriorD es posile otener un ontrste de este tipoD tl y omo se resumen en el gudro IHFPF in ellD siD en efetoD lo que desemos es ontrstr si el efeto de l vrile independiente es o no signi(tivo pr l vrile dependienteD el vlor de b1 ser eroF
Ejemplo. r los dtos del ejemplo sore l sorinD prtmos del deseo de ompror si l volumen
yGo el tiempo de exposiin in)un sore el porentje de sorinF vs nues de puntos y el juste de l ret y nos dieron pistsX d l impresin de que el tiempo de sorin s in)u en el porentje de sorinD pero no qued tn lro si el volumen lo hF is el momento de omprorloF xos plntemos en primer lugr si el tiempo de exposiin in)uye o no sore el porentje de sorinD es deirD nos plntemos si en el modelo linel
194
filterl
H0 : 1 = b1 H1 : 1 = b1 , s2 e =
se /SSxx
1 SSxy SSyy n2
SSE n2
t < t;n2
t > t1;n2
P [Tn2 < t] 2P [Tn2 > |t|] P [T > t] vos ddos en l ein IHFQ
gudro IHFPX gontrste sore 1
0.34] = 0.741F
in vist de los resultdosD prtir de hor dejremos de onsiderr el efeto del volumen sore el porentje de sorinD y slo tendremos en uent el efeto del tiempo de exposiinF
195
entre l onentrin verdder de gy @xA y l onentrin medid por el espetrmetro @y AF r ello tom II muestrs de ire en ls que onoe su verdder onentrin de gy y ls ompr on l onentrin medid por el espetrmetroF vos dtos son los siguientes @ls uniddes son ppmAX
x y
H I
IH IP
PH PH
QH PW
RH QV
SH RV
TH TI
UH TV
VH UW
WH WI
IHH WU
vo idelD lo desedoD ser que y = xD es deirD que el modelo linel que expli y en funin de x tuvier oe(ientes 0 = 0 y 1 = 1F or hor vmos entrrnos en el primer pso en l omproin de que el espetrmetro est ien lirdoD que impli ontrstr que 1 = 1F r elloD
SSxx = 11000; SSyy = 10506.73; SSxy = 10740 1 = 10460 = 0.976 11000 SS yy 1 SSxy s2 = 2.286 e = n2
por lo tntoD
t=
0.976 1 1.964/11000
= 1.639.
05 hdo que t1 0.2 ;112 = t0.975;9 = 2.262 y |1.639| < 2.262, no hy rzones pr onluir que 1 = 1F
y = 0 + x,
unque lo desedoD insistmosD ser que fuer
y = x,
es deirD que lo que mid el espetrmetro oinid on l ntidd rel de gy en el ireF gomo hemos dihoD eso ourrir si 0 = 0D lo que equivle deir que en useni de gyD el espetrmetro est eroF
edems del ontrste de hiptesisD es trivil proporionr un intervlo de on(nz pr l pendienteD y que onoemos su estiminD su error estndr y l distriuin en el muestreo @tEstudentD omo pree en el ontrsteAF gonretmenteD
= 1 .
Ejemplo.
on(nz pr 1 es (0.94, 1.01)F gomo podemos verD el vlor 1 = 1 es un vlor on(le del intervloD luego rti(mos que no podemos (rmr que el espetrmetro est ml lirdoF
196
filterl
H0 : 0 = b0 H1 : 0 = b0 , s2 e =
t=
s2 e
0 b0
1 x 2 n + SSxx
1 SSxy SSyy n2
SSE n2
t < t;n2
t > t1;n2
P [Tn2 < t] 2P [Tn2 > |t|] P [T > t] vos ddos en l ein IHFQ
gudro IHFQX gontrste sore 0
Ejemplo. in el ejemplo nteriorD vmos ontrstr siD en efetoD 0 = 0D lo que equivldr onluir
que no hy rzones pr pensr que el espetrmetro est ml lirdoF r elloD
0 = y 1 x = 0.636
por lo tntoD
t=
0.636 0 2.286
1 11
= 0.746.
502 11000
gomoquier que 0.746 < t0.975;9 = 2.261D tmpoo tenemos rzones pr pensr que 0 = 0 on un WS 7 de on(nzD luegoD en resumenD no existen rzones pr pensr que el espetrmetro est ml lirdoF
Ejemplo.
yhmD l tensin @V A entre los extremos de un resisteni y l intensidd de orriente @I A que irul por ell se relionn siguiendo l ley
V = R I,
donde R es el vlor de l resisteniF xosotros vmos relizr l omproin on un mism resisteniD vrindo los vlores de l intensiddD por lo que l euin equivle
V = 0 + 1 I,
siendo 0 = 0 y 1 = RF vos dtos son los que preen en el gudro IHFRF enemos que relizr un ontrsteD H0 : 0 = 0 frente H1 : 0 = 0 que equivle ontrstr en relidd
197
yservin I P Q R S T U V W IH II
s @meA HFIT TFSR IPFUT IWFPT PSFTQ QIFVI QVFPI RUFRH SRFHH THFVH TVFHH
@A HFPT IFHR PFHP QFHS RFHT SFHQ TFHQ UFHQ VFHT VFWW IHFHI
que nuestros prtos de medid estn ien lirdosD puesto que l ley de yhm olig que 0 = 0F mos llX
t=
0.25 0 0.022
1 11
= 3.531.
33.142 5105.90
Ohm! vo que este nlisis pone de mni(esto es que tenemos lgn prolem en nuestrs mediionesF
contradice la ley de
hejemos un poo de ldo este ltimo resultdoF i queremos estimr el vlor de l resisteniD un 1 = 0.14D y un intervlo de on(nz l WS 7 de on(nz = estimin puntul esD omo hemos vistoD R @omitimos los detlles de los lulosA result ser (0.141, 0.149)F pinlmenteD podemos tmin proporionr un intervlo de on(nz pr l ordend en el origenD ddo por
= 1 .
Ejemplo.
(1.29, 2.57)D luego es on(le pensr que 0 = 0F in sumD hemos omprodo que es posile 1 = 1 y 0 = 0D luego hemos omprodo que l euin y = x no puede ser rehzd on los dtos disponilesD
es deirD que no hy rzones pr pensr que el espetrmetro est ml lirdoF
198
entre sF
coeciente de correlacin linealD que ofree un medid 1 D es untittiv de l fortlez de l relin linel entre X e Y en l muestrD pero que difereni de
in est sein vmos de(nir el llmdo dimensionlD y que sus vlores siempre estn entre 1 y 1D sen ules sen ls uniddes de medid de ls vrilesF hd un muestr de vlores de dos vriles (x1 , y1 ) , ..., (xn , yn )D el
r=
SSxx 1 . SSyy
Nota.
in l pigur IHFS preen lgunos de los supuestos que mos de enunir respeto los
distintos vlores de rF ry que her hinpi en que r slo es pz de desurir l preseni de relin de tipo linelF iD omo en el ltimo gr(o l dereh de est (gurD l relin entre X e Y no es de tipo linelD r no es deudo omo indidor de l fuerz de es relinF
Nota. in l pigur IHFT pree un vlor tpio entre un onjunto de dtos on un relin linel ms
que evidenteF or ulp de este dtoD el oe(iente de orrelin linel ser joF u dee herse en
199
100
20
60 40 20
80
60
10
40
10
100
30
20
60
100
20
60
100
20
60
100
0 0
2000
20
20
6000
10000
20
60
100
Correlacin parablica
este soc in generlD no se deen eliminr dtos de un muestrD pero podr ourrir que dtos tpios orrespondn errores en l tom de ls muestrsD en el registro de los dtos oD inlusoD que relmente no proedn de l mism polin que el resto de los dtosX en ese soD eliminrlos podr estr justi(do de r nlizr de un form ms preis l relin linel entre los dtosF
Nota.
pretiones del oe(iente de orrelin linelF is muy freuente que se utilie pr justi(r reliones usEefetoD y eso es un grve errorF r slo indi preseni de relin entre ls vrilesD pero eso no permite inferirD por ejemploD que un inremento de X se l us de un inremento o un disminuin de Y F
r=
vemos que l relin es muy pequeY de hehoD ompromos medinte un ontrste de hiptesis sore
1 que er no signi(tivF
in el so del porentje de sorin en funin del tiempo de sorinD
r=
ist relin s result ser muy fuerte y en sentido diretoF or eso l relizr el test sore 1 D ste s result ser signi(tivoF xo podemos olvidr que el oe(iente de orrelin linel muestrlD rD mide l orrelin entre los vlores
200
LS Line
Add Point 4
Delete Point
4 x
10
Move Point
de X y de Y en l muestrF ixiste un oe(iente de orrelin linel similr pero que se re(ere todos los posiles vlores de l vrileF ividentementeD r es un estimdor de este oe(iente polionlF
snmeditmente surge l uestin de ls inferenisF odemos y deemos utilizr r pr her inferenis sore F he tods formsD en relidd ests inferenis son equivlentes ls que hemos sore 1 D y que l relin entre 1 y provo que l hiptesis H0 : 1 = 0 se equivlente l hiptesis H0 : = 0F odemosD por lo tntoD utilizr el ontrste resumido en el gudro IHFP pr b1 = 0 y teniendo en uent que
r n2 t= . 1 r2
0 .944 92 10.9442
: = 0 frente H1 : = 0 de nuevo en el ejemplo de l sorinF = 7.60D que oinide on el vlor de t undo ontrstmos
201
SSyy =
i=1
(yi y ) ,
de tl mner que unto ms vren los dtos de Y myor ser SSyy F or otr prteD undo justmos por 0 + 1 xD medimos el error que ometemos en el juste on l ret de regresin y x =
n
SSE =
i=1
(yi y x ) .
mos ponernos en ls dos situiones lmite que pueden drse en unto l preisin de un ret de regresinX i X no tiene ningn tipo de relin linel on Y D entones = 0D en uyo so 1 = l ret es simplemente
V arY V arX
=0y
y i = 0 + 1 xi =y .
is deirD si X no tiene ningn tipo de relin linel on Y D entones l mejor prediin que podemos dr por el mtodo de mnimos udrdos es l mediF edemsD en ese so
n
SSE =
i=1 n
(yi y i )
=
i=1
(yi y ) = SSyy ,
es deirD SSE es el totl de l vriin de los vlores de Y F ist lro que est es l peor de ls situiones posiles de r l preisinF i l relin linel entre X e Y es totlD entones = 1, en uyo so 1 =
V arY F V arX
edemsD si l
202
SSE =
i=1
(yi y i ) = 0.
istD desde luegoD es l mejor de ls situiones posilesF v ide de l medid que vmos utilizr es unti(r en qu medid estmos ms er o ms lejos de ests dos situionesF hdo que SSE D que es l medid del error de l ret de regresinD puede ir de 0 @mejor situin posileA SSyy @peor situin posileAD tn slo tenemos que reltivizr en un esl mod un medid de este errorF e de(ne el
xtese que l notin es r l udrdoD y queD en efetoD en un regresin linel simple oinide on el oe(iente de orrelin linel l udrdoF or lo tntoD l interpretin de r2 es l medid en que X ontriuye l expliin de Y en un esl de H ID donde el H indi que el error es el totl de l vriin de los vlores de Y y el I es l preisin totlD el error HF v medid suele drse en porentjeF hiho de otr formX
Aproximadamente 100 r2 % de la variacin total de los valores de pueden ser explicada mediante la recta de regresin de Y dada X F
respecto de su media
0 + 1 x y x =
yD por otro ldoD
E [Y /X =x ] = 0 + 1 x,
luego y x puede interpretrse de dos formsX IF gomo
undo X = xF
203
PF gomo
pr el vlor X = x, es deirD de E [Y /X =x ]F
ems ntiddes estn sujets inertidumreD que ser tnto myor unto ms vriilidd teng Y, yGo peor se el juste medinte l ret de regresinF vo que vmos ver en est sein pr onluir el tem es mo estleer
regiones de conanza
pr ests
prediiones de los vlores de Y y pr ls estimiones de los vlores medios de Y ddos vlores de X F istos resultdos requieren que se veri(quen los supuestos diionles sore los errores ddos en l sein IHFQF odemos grntizr on un (1 ) 100 % de on(nz que undo X = xD el vlor medio de Y se enuentr en el intervlo
y x t1/2;n2 se
es deirD podemos grntizr que
1 (x x ) + ,y x + t1/2;n2 se n SSxx
1 (x x ) + , n SSxx
P E [Y /X =x ] y x t1/2;n2 se
(x x )2 1 + |X =x = 1 . n SSxx
esimismoD podemos grntizr on un (1 ) 100 % de on(nz que undo X = xD el vlor Y se enuentr en el intervlo
y x t1/2;n2 se
es deirD podemos grntizr que
1 (x x ) 1+ + ,y x + t1/2;n2 se n SSxx
2 1 (x x ) 1+ + , n SSxx
P Y y x t1/2;n2 se
1 (x x )2 1+ + |X =x = 1 n SSxx
Nota. xo deemos olvidr que los modelos de regresin que podemos estimr lo son prtir de los dtos
de un muestr de vlores de X e Y F e prtir de estos modelos podemos otenerD omo mos de reordrD prediiones y estimiones pr vlores ddos de X. hdo que el modelo se s preismente en
Ejemplo. in l pigur IHFU pree l ret de regresin pr los dtos del ejemplo sore l sorin
del ompuesto junto on lnes que ontienen los intervlos de on(nz l WS 7 pr ls prediiones y ls estimiones soids los distintos vlores de X F
204
110
105
100
Resistencia
95
90
85
80
50
60
70
80
90
100
Velocidad
pigur IHFUX et de regresin on intervlos de on(nz l WS 7 pr ls prediiones @frnjs ms exteE rioresA y pr ls estimiones @frnjs interioresA en el ejemplo de l sorinF
ysrvese que l mplitud de los intervlos se he myor en los vlores ms extremos de X F is deirD los errores en ls estimiones y en ls prediiones son myores en estos vlores ms extremosF isto dee ser un motivo dir l omentrio nterior pr no her estimiones ni prediiones fuer del rngo de vlores de X en l muestrF or otr prteD nos plntemos l omienzo de ptulo que ser de inters estimr el porentje de sorin que tendr lguien que se somet un tiempo de exposiin l ompuesto de V horsF iso es un prediinD s que omo estimin puntul dremos
y x t1/2;n2 se
or el ontrrioD imginemos que los trjdores de un empres vn estr sometidos todos ellos un tiempo de exposiin de V horsF in ese soD no tiene sentido que nos plnteemos un prediin pr ser ul v ser su porentje de sorinD y que d uno de ellos tendr un porentje distintoY lo que s tiene sentido es que nos plnteemos ul v ser el porentje medio de sorin de los trjdores sometidos V hors de exposiin l ompuestoF isto es un ejemplo de l estimin de un vlor promedioF v estimin puntul es l mism que en l prediinD es deirD SWFSWD pero el intervlo de on(nz l WS 7 es
y x t1/2;n2 se
x )2
205
= yi y i
siguen un distriuin normlF xi que deir tiene que ompror est hiptesis en trivilX str on lulr los residuosD justrles un distriuin norml y relizr un ontrste de ondd de juste medinteD por ejemploD el test de uolmogorovE mirno'F
= yi y i F
ritulmenteD se le de est gr( l ret de regresin de l nue de puntos resultnteF mos ir viendo mo dee ser est gr( en el so de que se umpln d uno de los supuestosX IF i l medi de los residuos es eroD l nue de puntos de l gr( dee hernos pensr en un ret de regresin horizontl situd en el eroD indindo que se ul se el vlor y i D l medi de los residuos es eroF PF i los errores son independientesD no dee oservrse ningn patrn en l gr(D es deirD ningn efeto en ell que hg pensr en lgn tipo de relin entre y i y
iF
homocedasticidadAD l dispersin
vertil de los puntos de l gr( no dee vrir segn vre el eje F in so ontrrioD se hl de
heterocedasticidadF
n ltim oservinX si se dn tods ls ondiiones que mos de menionr sore l gr( de residuos frente vlores justdosD entones es del modelo sen iertosF
probableD
206
Residuals vs Fitted 5
5 4
Residuals
15 10
50
55
60
65
70
75
80
85
Ejemplo.
requeridsX
gr(o de residuos vs vlores justdos y podemos ver que primer vist pree que se dn ls ondiiones
IF vos puntos se sitn en torno l eje Y = 0D indindo que l medi de los residuos pree ser eroF PF xo se oservn ptrones en los residuosF QF xo se oserv myor vriilidd en lguns prtes del gr(oF ry que tener en uent que son muy poos dtos pr sr onlusionesF
207
208
Parte IV
Procesos aleatorios
PHW
Captulo 11
Procesos aleatorios
Resumen.
desriir fenmenos reles no determinstiosX onretmenteD se trt de fenmenos letorios que dependen del tiempoF e desrien priniplmente en trminos de sus medis y sus ovrinzsF in este ptulo se inluyen dems lgunos de los ejemplos ms omunes de tipos de proesos y su omportmiento undo se trnsmiten trvs de sistems lineles invrintes en el tiempoF
Palabras clave.
poteniF
zD proesos estionriosD proesos gussinosD proeso de oissonD sistems linelesD densidd espetrl de
11.1. Introduccin
in muhos experimentos de tipo letorio el resultdo es un funin del tiempo @o del espioAF or ejemploD en sistems de reonoimiento de voz ls deisiones se tomn sore l se de un ond que reprodue ls rterstis de l voz del interloutorD pero l form en que el mismo interloutor die un mism plr sufre ligers vriiones d vez que lo heY en un sistem de olD por ejemploD en un servidor de teleomuniionesD el nmero de lientes en el sistem l esper de ser tendidos evoluion on el tiempo y est sujeto ondiiones tles que su omportmiento es
impredecible Y
en un sistem de omuniin tpioD l sel de entrd es un ond que evoluion on el tiempo y que se introdue en un nl donde es ontmind por un ruido letorioD de tl mner que es imposile seprr ul es el mensje originl on solut FFF PII
certezaF
hesde un punto de vist mtemtioD todos estos ejemplos tienen en omn que el fenmeno puede ser visto omo uns funiones que dependen del tiempoD pero que son desonoids prioriD porque dependen del
azarF
in este ontexto vmos de(nir el onepto de proeso letorioF xuestro ojetivoD omo en ptulos
nteriores dedidos vriles y vetores letoriosD es desriir desde un punto de vist estdstio el fenmenoD proporionndo medids de posiinD medids sore l vriiliddD etF
11.1.1. Denicin
gonsideremos un experimento letorio sore un espio muestrl . upongmos que pr d resultdo posileD A, tenemos un oservin del fenmeno dd por un funin rel de vrile relD x (t, A)D on
t I RF ritulmenteD t represent l tiempoD pero tmin puede referirse otrs mgnitudes fsisF
r d A vmos denominr x (t, A)
{X (t, A) : t I, A }
lo denominmos
i reordmos ls de(niiones de vrile letori y vetor letorioD podemos ver en qu sentido estn reliondos los oneptos de vrileD vetor y proeso letorioF gonretmenteD si es un espio muestrlD un vrile letori es un funin
X:R
que d sueso posile le sign funin
un vector realF
he r esriir de hor en delnte un pFFD lo notremos normlmenteD por ejemploD omo X (t)D ovindo s l vrile que he refereni l elemento del espio muestrl l que v soid l funin muestrlF iste onvenio es el mismo que nos llev esriir X re(rindonos un vFF o un vetorF
or esoD
en el mito de los proesos @no slo estostiosA es importnte preguntrse si el fenmeno que represent o slo
en momentos concretos del tiempoF
Prof. Dr. Antonio Jos Sez Castillo
212
{X (t, A) : t I, A } ,
se die que el proeso es un
es un onjunto numerleF
X (n)F or otr prteD el onjunto I normlmente es el onjunto de los enteros o de los enteros positivosD
unque tmin puede ser un suonjunto de stosF in lgunos liros los proesos en tiempo disreto tmin son denomindos hdo un espio muestrl y un pFF de(nido en lD
secuencias aleatoriasF
{X (t, A) : t I, A } ,
se die que el proeso es un junto de stosF i nos dmos uentD est primer lsi(in de los pFF l hemos heho en funin del rter disreto o ontinuo del tiempoD es deirD del onjunto I F ixiste otr lsi(in posile en funin de mo son ls vriles letoris del proesoD disrets o ontinusF in emrgoD mos tipos de proesosD on vriles disrets o on vriles ontinusD pueden estudirse si siempre de form onjuntF or ello slo distinE
Prof. Dr. Antonio Jos Sez Castillo
es un intervloF
213
pigur IIFQX histints funiones muestrles de un proesoF guiremos pFF on vriles disrets y pFF on vriles ontinus si es neesrioF in este sentidoD undo nos re(rmos l funin ms @si el pFF es de vriles disretsA o l funin de densidd @si el pFF es de vriles ontinusAD hlremos en generl de funin de densiddF
Ejemplo.
Ejemplo.
214
pr d t I. xtese queD omo su nomre indiD se trt de un funin determinstiF xo tiene ningun omponente letoriF xtese tmin que unque se est esriiendo el smolo integrlD podrmos estr re(rindonos un vrile disretD en uyo so se trtr de un sumF
e de(ne l
funcin de autocovarianza
o simplemente l
CX (t, s) = Cov [X (t) , X (s)] = E [(X (t) mX (t)) (X (s) mX (s))] = (x1 x (t)) (x2 x (s)) fX (t),X (s) (x1 , x2 ) dx2 dx1
215
e de(ne l
funcin de autocorrelacin
o simplemente l
centrado en mediaD
V ar (X (t)) = CX (t, t) F
v interpretin de l funin de utoovrinz CX (t, s) es l de un funin que proporion un medid de l interdependeni linel entre dos vFF del proesoD X (t) y X (s)D que distn = s t uniddes de tiempoF he hehoD y semos que podrmos nlizr est relin medinte el oe(iente de orrelin linel
X (t, s) =
eprentemente es esperle que tnto ms rpidmente mie el proesoD ms derez l utoorrelin onforme ument D unque por ejemploD los proesos peridios no umplen es propieddF in el mpo de l teor de l sel lettoriD prtir de l funin de utoorrelin se puede distinguir un sel uyos vlores min muy rpidmente frente un sel on vriiones ms suvesF in el primer soD l funin de utoorrelin y de utoovrinz en instntes t y t + dereern lentmente on D mientrs que en el segundoD ese desenso ser muho ms rpidoF in otrs plrsD undo l utoorrelin @o l utoovrinzA es ltD entre dos instntes ernos del proeso tendremos vlorer similresD pero undo es jD podremos tener fuertes diferenis entre vlores ernos en el tiempoF v grn importni de ests funiones soids un proesoD medi y utoovrinz @o utoorrelinAD es por tnto que portn tod l informin er de l relin linel que existe entre dos vFF ulesquier del proesoF gomo hemos dihoD en l prtiD result extremdmente omplido onoer ompletmente l distriuin de un proeso yD undo esto ourreD no siempre es senillo utilizr ls tnis del lulo de proiliddes pr el trtmiento de estos proesosF in emrgoD tn slo on l informin dd por l funin medi y l funin de utoorrelin pueden ofreerse resultdos muy relevntes er de los proesosD tl y omo hemos visto en el so de vriles y vetores letoriosF
Ejemplo. v sel reiid por un reeptor ew de rdio es un sel sinusoidl on fse letoriD dd
por X (t) = A cos (2fc t + ) , donde A y fc son onstntes y es un vFF uniforme en (, ) .
1 Esta
frmula es la misma que cuando veamos la covarianza entre dos variables, calculable como la media del producto menos
216
in ese soD
E [X (t)] =
A cos (2fc t + )
A (sin (2fc t) cos ( ) + cos (2fc t) sin ( ) sin (2fc t) cos ( ) cos (2fc t) sin ( )) 2 A = [0 + 0] = 0. 2
RX (t, t + ) = E [X (t + ) X (t)] = E A2 cos (2fc t + 2fc + ) cos (2fc t + ) = A2 A2 E [cos (4fc t + 2fc + 2)] + E [cos (2fc )] 2 2
A2 = 2
A2 cos (2fc ) . 2
fX (t1 ),...,X (tn ) (x1 , ..., xn ) = fX (t1 ) (x1 ) ... fX (tn ) (xn ) ,
se die que el proeso es
independiente.
v interpretin de este tipo de proesos es l de quellos en donde el vlor de l vFF que es el proeso en un momento ddo no tiene nd que ver on el vlor del proeso en ulquier otro instnteF hesde un punto de vist fsio estos proesos son muy
caticos
217
10
pigur IIFRX punin muestrl de un proeso independiente formdo por vF gussins de medi ero y vrinz unoF
X (t1 ) , X (t2 ) , ..., X (tN )D on t1 < t2 < ... < tN son tles que los inrementos X (t1 ) , X (t2 ) X (t1 ) , ..., X (tN ) X (tN 1 )
son independientes entre sF
X (t + ) | {X (s) = xs pr todo s t} .
istoD en generlD es stnte omplejoF edemsD tiene sentido pensr que l evoluin del proeso en el instnte t + se ve fetd por tod l histori del proesoD desde el instnte iniil s = 0 hst el ltimo instnte de es histori s = tc ree lgio pensr que l evoluin del proeso teng en uent l histori ms reiente de steD pero no tod l historiF ist hipotesis se ve vld por los per(les ms hitules de ls funiones de utoorrelinD donde oservmos que l relin entre vriles del proeso suele dereer en l myor de ls osiones onforme ument l distni en el tiempo entre ls mismsF vos proesos de wrkov son un so donde esto ourreF e trt de proesos que evoluionn de mner que en d instnte
olvidan
218
markoviano o de Markov
fX (tn+1 )|X (t1 )=x1 ,...,X (tn )=xn (xn+1 ) = fX (tn+1 )|X (tn )=xn (xn+1 ) .
ist de(niin se suele enunir oloquilmente diiendo que un proeso de wrkov es
depende del pasado sino tan slo del presenteF
X (t) es un proeso
dbilmente estacionario si
mX (t) es independiente de t y C (t, s) @o R (t, s)A depende tn slo de s tD en uyo so se not C (s t) @ R (s t)AF
is importnte destr que l primer de ls ondiiones es irrelevnteD y que siempre se puede entrr en medi un proeso pr que st se eroD onstnteF is deirD en l prti es indiferente estudir un proeso
X (t) on funin medi X (t) que estudir el proeso Y (t) = X (t) X (t)D on medi eroF
v propiedd ms exigente y relmente importnte es l segundF iene deir que l relin entre vriles letoris del proeso slo depende de l distni en el tiempo que ls seprF
Nota.
delnteF emos de ver que si un proeso es dilmente estionrioD sus funiones de utoovrinz y de utoorrelinD C (s, t) y R (s, t) no dependen en relidd de s y de tD sino tn slo de t sF or eso introduimos l notin
C (t, s) C (s t) R (t, s) = R (s t) .
or lo tntoD qu queremos deir si esriimos diretmente C ( ) o R ( )c ue tenemos un pFF dilE mente estionrio y que hlmos de
C ( ) = C (t, t + ) R ( ) = R (t, t + ) .
n medid importnte soid un proeso dilmente estionrio es l oservremos on detenimiento est medidF
Prof. Dr. Antonio Jos Sez Castillo
potencia promedioD
2
de(niE
. ws delnte
219
or otr prteD l peuliridd que de(ne los proesos dilmente estionrios le on(ere su funin de utoorrelin y utoovrinz dos propieddes interesntesX se X (t) un proeso estionrio @dilAF intonesD si notmos RX ( ) = E [X (t) X (t + )] pr todo t, su funin de utoorrelin y por CX ( ) su funin de utoovrinzX
Ejemplo. in el ejemplo del osildor vimos que l sel reiid por un reeptor ew de rdio es un
sel sinusoidl on fse letoriD dd por X (t) = A cos (2fc t + ) , donde A y fc son onstntes y
RX (t, t + ) =
A2 cos (2fc ) . 2
Ejemplo.
vrinz onstnte e igul 2 F mos onsiderr tmin otro proeso que en d instnte de tiempo onsider l medi de X en ese instnte y el nteriorD es deirD
Yn =
Xn + Xn1 . 2
E [Yn ] = E
Xn + Xn1 = 0. 2
220
or otr prteD
1 E [(Xn + Xn1 ) (Xn+m + Xn+m1 )] 4 1 = (E [Xn Xn+m ] + E [Xn Xn+m1 ] + E [Xn1 Xn+m ] + E [Xn1 Xn+m1 ]) 4
ehor deemos tener en uent que
CX (n, m) = RX (n, m) =
y que Xn es un proeso independienteF or lo tntoD
0 2
si n = m si n = m
si m = 0 si m = 1 si m = 1 en otro so
odemos deirD por tntoD que el proeso Yn tmin es dilmente estionrioD porque su medi es onstnte @eroA y CY (n, n + m) no depende de n sino tn slo de mF
E [X (t)] = mX (t) = mX =
RX ( ) = E [X (t) X (t + )] =
rst hor quiz no lo hmos pensdoD pero ms ll de los tpios ejemplosD mo podrmos trtr de lulr o estimr l menos ests ntiddesc i plimos lo que hemos prendido hst horD estimrmosD por ejemploD l medi on l medi muestrlD pero pr ello neesitrmos un muestr muy grnde de
Prof. Dr. Antonio Jos Sez Castillo
221
funiones muestrles del proesoD y eso no siempre ourreF he hehoD no es nd rr l situin en l queD en reliddD slo es posile oservr un ni funin muestrl del proesoF ehor ienD dd un ni funin muestrl de un proesoD x (t)D en es funin hy muhos dtosD tntos omo instntes de tiempo t hymos sido pes de oservrF xo podr ourrir que utilizrmos todos esos dtos que hy en x (t)pr estimr ls medis y ls utoorrelionesc or ejemploD si tenemos oservd l sel x (t) en un montn de vlores t1 , ...tn D qu tendr que ver
1 2T
x (t) dt.
T
estadstica A
in el so de l utoorrelin psr igulD tendrmos que podrmos oservr un montn de pres de vlores de l sel en los instntes t1 , ..., tn y t1 + , ..., tn + en el intervlo [T, T ] y on ellos podrmos estimr
1 2T
x (t) x (t + ) dt
T
vo que no semosD en generlD es si es integrl tiene lgo que ver on RX ( )D que es un integrl estadsticaF ues ienD se die que un proeso estionrio es
de un sol funin muestrl x (t)F is deirD que un sol relizin es representtiv de todo el proesoF ws onretmenteD un proeso ser ergdio en medi y en utoorrelin si
limT
y
1 2T
x (t) dt = mX
T
1 limT 2T
x (t) x (t + ) dt = RX ( ) .
T
in este prtdo nos referimos revemente un modelo gstnte omn pr los fenmenos de ruidoD llmdo ruido lnoF
222
N0 2 F
or
CN (t, t + ) =
1 si t = 0 (t) = , 0 en otro so
est funin de utoovrinz puede esriirse omo
CN ( ) =
N0 ( ) . 2
v justi(in de que este se un modelo hitul pr los ruidosD onsiderndo que los vlores del ruido estn inorreldos unos on otrosD es que suelen ser deidos fenmenos ompletmente letorios y tiosD por lo que no es esperle que exist relin entre vlores del ruidoD ni siquier undo stos son muy ernos en el tiempoF
onjuntmente gussinF is deirD si ulquier olein X (t1 ) , ..., X (tn ) tiene funin de densidd onjunt
x = (x1 , ..., xn ) , = (E [X (t1 )] , ..., E [X (tn )]) , C = (Ci,j )i,j =1,..,n , Cij = Cov [X (ti ) , X (tj )] .
xtese que un proeso gussino est ompletmente desrito un vez que se onoen su funin medi y su utoovrinz o su utoorrelinF
Prof. Dr. Antonio Jos Sez Castillo
223
ixisten dos rzones fundmentles por ls queD omo hemos omentdoD los proesos gussinos son l fmili de proesos ms relevnteX or un prteD ls propieddes nltis que veri(n los hen filmente mnejlesD omo veremos ontinuinF or otr prteD estos proesos hn demostrdo ser un exelente modelo mtemtio pr grn nmero de experimentos o fenmenos reles @resultdo mprdo en el eorem gentrl del vmiteAF
Ejemplo. is muy hitul onsiderr que los ruidos lnos son gussinosF in ese soD si onsidermos
ruidos lnos gussinosD sus vriles no slo son inorreldsD sino que tmin son independientesF
Ejemplo.
y t2 = t1 +
1 2
25 25e6/2
25e3/2 25 25e3/2
25e6/2
25e3/2 . 25
elguns propieddes de inters de los proesos gussinosX n proeso gussino es independiente si y slo si C (ti , tj ) = 0 pr todo i = j. e X (t) un proeso gussinoF iste proeso es mrkovino si y slo si
CX (t1 , t3 ) =
pr ulesquier t1 < t2 < t3 F
elgunos de los ejemplos ms omunes en el mpo de ls eleomuniiones son el proeso que uent el nmero de llmds reiids en un entrlit telefni o el que uent el nmero de visits un pgin ifF in otros mitosD omo l psiD estos proesos pueden servirD por ejemploD pr ontilizr el nmero de prtuls emitids por un uerpoF
224
N (t) =
n=1
u (t T [n]) ,
donde T [n] es un proeso en tiempo disreto que represent el momento de l nsim llegd que uent el proeso y
0 si t < t 0 u (t t0 ) = 1 si t t 0
es l funin umrlF il
n=1
es un sum de n exponeniles independientes del mismo prmetro , lo que gener un distriuin de irlng de prmetros n y , on funin de densidd
fT [n] (t) =
elterntivmenteD puede deirse que
n1
llegadas,
Ejemplo.
= 1F mos interpretr l funin muestrl de l izquierd pensndoD por ejemploD que represent
el nmero de visits un pgin ifX se oserv que poo depus de los tres minutos se hn ddo Q visitsY despus psn si S minutos sin ningun visitY ontinuin se produen un uen nmero de visits en poo tiempoY FFF i oservmos tn slo el eje del tiempoD podrmos selr los instntes en que se produen ls llegdsF emos que esos inrementos en el tiempo desde que se produe un llegd hst l siguiente siguen un distriuin exponenilD en este so de prmetro IF mos desriir lguns de ls propieddes ms interesntes de los proesos de oissonX e N (t) un proeso de oisson de prmetro F intonesD pr todo t se tiene que N (t) P (t)F v medi de un proeso de oisson de prmetro es N (t) = t. or tntoD el proeso de oisson no es estionrioF e N (t) un proeso de oisson de prmetro F intonesD el proeso tiene inrementos independientes
Prof. Dr. Antonio Jos Sez Castillo
225
pigur IIFSX epresentin gr( de un funin muestrl de un pFF de oissonF y pr ulesquier t1 < t2 D el inremento N (t2 ) N (t1 ) sigue un distriuin de oisson de prmetro
(t2 t1 )F
e N (t) un proeso de oisson de prmetro . intones
CN (t1 , t2 ) = m n (t1 , t2 ) .
e N (t) un proeso de oisson de prmetro F intonesD pr ulesquier t1 < ... < tk D
fN (t1 ),...,N (tk ) (n1 , ..., nk ) nk nk1 n2 n1 1 1 n 2 2 k 2 1 e e ... e n1 ! (n2 n1 )! (nk nk1 )! si n1 ... nk , = 0 en otro so
donde i = (ti ti1 ) . il proeso de oisson es de wrkovF en N1 (t) pFF de oisson de prmetro 1 , N2 (t) pFF de oisson de prmetro 2 , mos indepenE dientesF intonesD N1 (t) + N2 (t) es un pFF de oisson de prmetro 1 + 2 F ist propiedd se onoe omo
propiedad aditivaF
e N (t) un pFF de oisson de prmetro F upongmos que de todos los eventos que uent el proesoD slo onsidermos un prte de ellosY onretmente los que presentn un rtersti que tiene proilidd p entre todos los eventosF in ese soD si notmos por Np (t) l proeso que uent
226
pigur IIFTX puniones muestrles de un proeso de oisson de prmetro IF los eventos on l rtersti ddD diho proeso es de oisson de prmetro p. ist propiedd se onoe omo
propiedad de descomposicinF
il tiempo W que trnsurre desde un instnte ritrrio t0 hst l siguiente disontinuidd de un proeso de oisson de prmetro es un vrile letori exponenil de prmetro D indepenE dientemente de l elein del punto t0 F ist propiedd prentemente prdji se onoe omo
propiedad de no memoria del proeso de oissonF ysrvese queD en reliddD est propiedd de no
memori lo es de l distriuin exponenilF
Ejemplo.
segundoF
is freuente onsiderr que el proeso que uent el nmero de prtuls emitids por un
mteril rditivo es un proeso de oissonF mos suponer por tntoD que estmos oservndo el omportmiento de un determindo mteril del que se onoe que emite rzn de prtuls por upongmos que se oserv el proeso que uent el nmero de prtuls emitids desde un instnte
P [N (t + T0 ) N (t) > N0 ] =
k=N0 +1
eT0
(T0 ) =1 k!
N0
eT0
k=0
(T0 ) , k!
Ejemplo.
trvs de sxixi es deudmente desrito medinte un proeso de oissonF iendo que durnte un hor se reien un promedio de S visitsD
227
P [N (0.5) = 0] = e50.5
pens un V 7 de proiliddF
PF gul es el promedio de visits en S hors l ifc E [N (5)] = 5 5 = 25 visitas. QF v empres sore otr empres del setor y opt por estleer un enle diretmente desde l pgin de su (lil l propiD grntizndose que todos los lientes de l (lil visitn su pginF i el promedio de lientes que visitn l pgin de l (lil er de P lientes l horD ul es l proilidd de que trs l fusin no se rei ningun visit en IH minutosc el herse on los lientes de l otr empres @notemos por M (t) l proeso de oisson que ont sus visitsD de prmetro = 2 visitas/horaAD lo que h ourrido es que hor el nmero de visits l if de l empres es l sum de mos proesosX T (t) = N (t) + M (t) . uponiendo que los proesos de oisson que ontn ls visits ms empress fuern indeE pendientesD se tiene que T (t)D en virtud de l propiedd ditiv del proeso de oissonD es tmin un proeso de oissonD de prmetro = 5 + 2 = 7 visitas/horaF or tntoD
P T
un proilidd del QI 7F
1 6
=0 =e
7 1 6
1 7 6 0!
= 0.3114,
228
Bibliografa
gnvosD qF gF @IWVVA gnvosD qF gF @IWVVAF roilidd y istdstiF epliiones y wtodosF wqrwErillF heoreD tF vF @PHHRA heoreD tF vF @PHHRAF roilidd y estdsti pr ingenier y ienis @T ediinAF homsonF tohnsonD F eF @IWWUA tohnsonD F eF @IWWUAF roilidd y estdsti pr sngenieros @S ediinAF renE tie rllF veonEqriD eF veonEqriD eF @IWWRAF roility nd ndom roesses for iletril ingineering @Pnd editionAF eddisonEesleyF vipshutzD F 8 hillerD tF @PHHHA vipshutzD F 8 hillerD tF @PHHHAF sntroduin l roilidd y l istdstiF wqrwErillF wendenhlD 8 inihD F @IWWUA wendenhlD 8 inihD F @IWWUAF roilidd y istdsti pr sngenier y gienis @R ediinAF rentie rllF wontgomeryD hF gF 8 ungerD qF gF @PHHPA wontgomeryD hF gF 8 ungerD qF gF @PHHPAF roilidd y estdsti plids l sngenier @P ediinAF ileyF xvidiD F @PHHTA xvidiD F @PHHTAF istdsti pr ingenieros y ient(osF wqrwErillF ossD F wF @PHHSA ossD F wF @PHHSAF sntroduin l istdstiF iditoril evertF piegel et lF @PHIHA piegelD wF FD hillerD tF y rinivsnD F eF @PHIHAF roilidd y estdsti @Q ediinAD serie humF wqrwErillF lpoleD F i
et al
PPW
ndice alfabtico
exyeD ITV!IUH fonferroniD mtodo deD IUID IUP goe(iente de simetrD QI goe(iente de orrelin linelD IIPD IWS!IWWD PIP goe(iente de vriinD QHD QUD QV gontrste de hiptesisD IQRD IRW!ISP gontrste pr el oiente de vrinzsD ITU histriuin normlD VT histriuin norml multivrinteD IPHD PIW histriuin t de tudentD IQHD ISVD ITI!ITRD IWRD IWSD PHHD PHI histriuin uniformeD VP histriuiones ondiiondsD IHR irror tipo sD ISI!ISQD ISVD IUI
irror tipo ssD ISPD ISV gontrste pr l difereni de medisD ISWD ITHD ITP ispio muestrlD RQ!RSD RVD SHD SQD TID TPD IQU gontrste pr l difereni de proporionesD ITT istdstio de ontrsteD ISH!ISQD ISSD ISUD ISWD ITID gontrste pr l mediD ISTD ISV ITRD ITT!ITVD IUHD IUQD IVID IVRD IVSD IWV gontrste pr l vrinzD ITU gontrste pr proporinD ITR govrinzD IIP guntilD PUD WPD WQ htos ulittivosD PH htos untittivosD PID PPD PSD QR de ol pesdD QP istimdor puntulD IQRD IUSD IUT punin de utoorrelinD PIPD PIS punin de utoovrinzD PIID PIS punin de densiddD US!UVD VI!VRD VTD VVD WID WPD IPUD IPWD IQTD IQUD IQW punin de densidd onjuntD WW punin de distriuinD UT!UVD VQD VVD WQD IUW!IVI
hesviin tpi o estndrD PW!QID QUD TRD VHD VVD punin ms onjuntD WW IPVD IPWD IRSD ISU punin ms de proiliddD TPD TQD TVD UHD UID URD higrm de rrsD PPD PQD PSD QI VID WPD IPUD IQW higrm de js y igotesD QSD QTD QV higrm de setoresD PHD PI higrms de rrsD PH!PR histriuin inomilD TSD TTD TWD VUD WID IQV histriuin inomil negtivD UID UPD IQW histriuin 2 D IPW histriuin 2 D VSD IQHD IRTD ITUD IUHD IUUD IUVD IVRD IVS histriuin de oissonD TVD VQD VUD PPP histriuin exponenilD VP!VRD IRSD IVID PPID PPQ histriuin p de nedeorD IQHD IQID IUH histriuin qmmD VRD VSD IPWD IQVD IUWD PPI histriuin geomtriD UHD UID IQWD IUV histriuin mrginlD IHI PQH punin mediD PII punin muestrlD PHV ristogrmD PP!PSD PVD QHD QID QR!QUD UQ!USD UUD WHD WID IQTD IQU snorrelinD IIP sndependeni de suesosD RV!SHD SPD SQD TVD IVI sndependeni estdstiD PIQD PIR snsesgdezD IQR!IQUD IRV sntervlos de on(nzD IQRD IRP!IRVD PHH wtodo de los momentosD IQV!IRPD IUSD IUVD IVI wtodo de mxim verosimilitudD IQW!IRPD IRVD IUSD IVID IWH
wtriz de orrelionesD IIV wtriz de vrinzsEovrinzsD IIV wediD PSD TRD IQSD IST
rile letoriD TID TPD TSD VUD IPU!IPWD IQVD IQWD IRPD ISHD IVW rile letori ontinuD UQD UTD UV
wedi muestrlD PSD PTD PV!QID QRD TRD VID VUD IPVD rile letori disretD TP!TR rinz muestrlD PVD PWD TRD VID IPWD IQSD IQTD IRRD IPWD IQSD IRR!IRTD ISHD ISTD ITWD PIU wedi polionlD QRD TQD TRD UVD VHD VID WHD WID IPWD IQSD IRR!IRUD ISHD ISTD IWPD IWWD PHP wedinD PTD PVD QID QS wodD PTD QI ISTD ITPD ITUD ITW rinz polionlD TQD TRD UVD VHD VID IPWD IQR!IQTD IQVD IRR!IRVD ISTD ITUD IUHD IWQD PHPD PIP etor letorioD WV etor de medisD IIV
muestraD IS
wuestr letori simpleD PHD PWD QQD QTD QUD TQD TSD URD IVQD IWTD IWU xivel de on(nzD IRP!IRRD IRVD ISI!ISRD ISUD ISVD ITHD ITID IUID IUUD IUVD IVHD IVRD IWRD PHH yrtogonliddD IIP pEvlorD ISQD ISRD ISTD ISV!ITID ITRD ITT!ITVD IUI! IUQD IUT!IVID IVQD IVSD IWR erentilD PUD QRD QSD QUD QVD WP!WR roiliddD RID RPD RSD RUD RV roilidd ondiiondD RV!SH roeso letorioD PHV roeso letorio en tiempo ontinuoD PHW roeso letorio en tiempo disretoD PHW roeso dilmente estionrioD PIS roeso de wrkovD PISD PPH roeso de oissonD PPI roeso ergdioD PIV roeso gussinoD PIW roesos independientesD PIQ et de regresinD IWI uido lnoD PIW l de freuenisD PI eorem de fyesD SQ!SS eorem de l proilidd totlD SQ!SS est chi2 de ondd de justeD IUTD IUV est chi2 de independeniD IVI est de uolmogorovEmirno'D IUWD IWID IWPD IWTD IWV! PHP lores z D QRD WH
Prof. Dr. Antonio Jos Sez Castillo
231