Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Esta Di Stica Ingeniero S
Esta Di Stica Ingeniero S
para Ingenieros
Versin 1.3, junio de 2012
Apuntes de
Estadstica para Ingenieros
Prof. Dr. Antonio Jos Sez Castillo
Departamento de Estadstica e Investigacin Operativa
Universidad de Jan
Versin 1.3
Junio de 2012
ndice general
1. Introduccin
11
II
IP
IP
IP
IR
IR
IR
IS
IS
IS
IS
I Estadstica descriptiva
17
19
PFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
IW
IW
PH
PI
F F F F F F F F F F F F F F F F F F F F F F
PS
PS
PFSFIFIF wedi F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
PS
PFSFIFPF wedin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
PT
PT
PFSFPF guntiles F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
PU
PV
PV
PW
QH
QI
QP
F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
QR
II Clculo de Probabilidades
37
3. Probabilidad
39
QFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
QW
RH
RH
RH
RI
RQ
RS
RS
RT
RT
SI
SS
ST
SU
61
RFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
RFPF rile letori disret F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
TP
RFPFIF he(niin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
TP
TP
TQ
TQ
TR
TI
TS
TV
UH
UI
F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
UQ
RFRFIF he(niin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
UQ
RFRFPF ristogrm F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
UQ
US
UT
UU
UV
VP
VP
VP
VR
VT
WP
WQ
WR
97
SFIF sntroduin F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
WU
WW
WW
125
6. Distribuciones en el muestreo
127
133
149
173
185
F F F F F F F F F F F F F F F IWP
IV Procesos aleatorios
209
11.Procesos aleatorios
211
Prlogo
il ojeto fundmentl de l ediin de este doumento es filitr los lumnos de ingenier de l isuel
olitni uperior de vinres el desrrollo de los ontenidos terios de l signtur EstadsticaF hesde un
punto de vist menos lolD espero que se tilD en lgun medidD todo quel que neesite onoimientos
sios de ls tnis estdstis ms usules en el miente ient(oEtenolgioF
e todos ellosD lumnos y letores en generlD quiero filitrles el privilegio de prender de quienes yo he
prendidoD sugirindoles utro mnules que pr m hn sido referenis fundmentlesF e trtD en primer
lugrD del mgn(o liro de heldon wF ossD
Introduccin a la EstadsticaF
in l puede enontrrse l
myor prte de lo que vmos estudir quD explido de form senill y lrD pero tmin omentrios
histriosD reses iliogr(s sore mtemtios y estdstios relevntes y ejemplos muy propidosF
in segundo lugrD reomiendo los trjos de illim xvidiD
ty hevoreD
Probabilidad
propuestos mgn(osF
in el tul ontexto del ispio iuropeo de iduin uperiorD l signtur Estadstica tieneD en l myor
prte de los grdos en ingenierD un rter sio y un dotin de T rditos igF es ourreD por
ejemploD en ls rms de industriles o teleomuniiones que se imprten en l niversidd de tnF ytrs
rmsD omo l de ingenier ivilGminerD hn optdo por inluirl omo signtur oligtoriD omprtid
on un signtur de mpliin de mtemtis en l que se proponen Q rditos ig de estdstiF gon
todoD reo que estos puntes pueden dptrse esos distintos ontextosD lrndo qu tems pueden ser
ms deudos pr d titulinF in onretoX
IF r ls distints espeiliddes de l rm de industriles sern oportunos los ptulos ID PD QD RD TD
UD VD W y IHF il ptulo WD sore ontrstes no prmtrios puede drse modo de seminrioD si el
desrrollo de l doeni s lo sugiereF in emrgoD el ptulo IHD sore regresin linel simpleD me
pree impresindile en l formin de un futuro ingeniero industrilF
PF in los grdos de l rm de teleomuniionesD reo que son neesrios los ptulos ID PD QD RD SD TD
UD V y IIF esult s el temrio quiz ms exigenteD deido l neesidd de introduir un ptulo
sore vetores letorios previo otro sore proesos estostiosF ued iniitiv del doente l
posiilidd de reortr lgunos spetos en los tems trtdos en rs her ms liger l rg
doenteF
QF pinlmenteD en los grdos de l rm ivil y minerD donde l dotin de rditos es menorD reo que
W
son deudos los ptulos ID PD QD RD TD UD V y IHD si ien eliminndo lgunos de sus prtdosD uestin
st que dejoD de nuevoD juiio del doenteF min sugiero que se trjen los prolems sore estos
ptulos diretmente en el ontexto de uns prtis on ordendorF
lo me qued pedir disulps de ntemno por ls errts queD prolementeD ontienen ests pginsF ys
ruego que me ls hgis llegr pr orregirls en posteriores ediionesF
vinresD junio de PHIPF
10
Captulo 1
Introduccin
Resumen. il ptulo inluye un introduin del trmino Estadstica y present los oneptos ms sios
reltivos poliones y muestrsF
Palabras clave: estdstiD polinD polin tngileD polin oneptulD vrileD muestrD muestr
letori simpleF
Estadstica
plr1 X
Estudio de los datos cuantitativos de la poblacin, de los recursos naturales e industriales, del trco o
de cualquier otra manifestacin de las sociedades humanas.
PF
QF
Rama de la matemtica que utiliza grandes conjuntos de datos numricos para obtener inferencias
basadas en el clculo de probabilidades.
rolemente el ms omn de los signi(dos onoidos de l plr se el segundoD y por ello solemos
ver en los medios de omuniin que ulquier reopilin de ifrs referentes lgn sunto es llmdo
@de form muy reduionistA
estadstica
Estadstica
estadsticasF
epin del heiF gonretmenteD el primero de los signi(dos se orresponde on lo que vmos estudir
omo
Estadstica DescriptivaD
Inferencia EstadsticaD
II
es utilizr dtos de un onjunto reduido de sos pr inferir rterstis de stos l onjunto de todos
ellosF
un proeso pr el reimiento de un p delgd de dixido de siliio sore pls de siliio que se usn en
l friin de semiondutoresF in l preen dtos reltivos ls mediiones del espesorD en ngstroms
resultdosF reen estr en torno WH AD pero on vriiones importntes respeto de ese vlorF elguns de
ess vriiones son espeilmente llmtivs @UUFSD IHTFUD FFFAX qu ps en ess plsc in sumD es evidente
que se he neesri un mner sistemti de nlizr los dtosD trtndo de desriirlos de form preis
y ojetivD respondiendo ls pregunts que suyen en el diseo del experimentoX son ls dos series de
experimentos homognesc fet el tipo de plc fet l posiin en el hornoc FFF
ahorradora de energa.
Duracin 8 aos F
heo reonoer de que tengo mis dudsF r empezrD es que los V osD de repenteD l lmpr se
rompec or otr prteD reo que todos nosotros hemos experimentdo el heho de que sts lmprs que
supuestmente tienen un durin myor que ls trdiionles lmprs inndesentes @segn el envoltorioD
V vees myorAD sin emrgoD se rompen on filiddF vuegoD qu quiere deir extmente el envoltorio l
(rmr que su durin es de V osc
12
erie
I
I
I
I
I
I
I
I
I
I
I
I
P
P
P
P
P
P
P
P
P
P
P
P
l
I
P
Q
R
S
T
U
V
W
IH
II
IP
I
P
Q
R
S
T
U
V
W
IH
II
IP
WHFHH
WIFVH
WHFQH
WPFTH
WIFIH
UTFIH
WPFRH
WIFQH
WTFUH
WPFHH
WRFIH
WIFUH
WQFHH
WIFRH
WIFWH
WHFTH
WQFIH
WHFVH
VVFHH
VVFQH
WRFPH
IHIFSH
WPFVH
WPFIH
WPFPH
WRFSH
WIFIH
WHFQH
VWFVH
WHFPH
WIFUH
WHFIH
WQFUH
WRFTH
WIFSH
WUFRH
VWFWH
WHFTH
WIFVH
WIFQH
WIFVH
WIFSH
WIFVH
WTFHH
WPFPH
IHQFIH
WHFVH
WQFRH
WRFWH
WQFWH
WQFQH
WPFVH
WIFSH
WTFVH
WIFTH
WSFRH
WQFWH
WQFUH
WSFQH
WSFIH
WQFTH
WPFPH
WPFVH
WRFWH
WRFTH
WIFSH
WHFSH
WPFVH
WSFVH
IHQFPH
WPFPH
WRFHH
WPFUH
UUFQH
WQFSH
WIFTH
WIFSH
VRFTH
WIFIH
VWFTH
VUFWH
WRFHH
WPFVH
WTFUH
VWFHH
WIFWH
WTFRH
VVFQH
VVFWH
WIFSH
WHFRH
WQFUH
WPFSH
IHQFSH
WIFUH
WRFUH
A
WIFT
WPFH
VUFP
WPFU
WHFT
WQFQ
VVFH
WHFU
WHFR
VWFQ
WQFR
UUFS
WQFT
WPFR
WQFV
VUFW
WHFH
WRFH
WHFQ
VWFT
WIFH
WTFI
VWFH
WHFV
VVFPH
VWFWH
VVFIH
WIFUH
WQFIH
WSFUH
WPFRH
WSFVH
WPFHH
WHFIH
WPFPH
WIFRH
WHFWH
VUFTH
VTFSH
WPFPH
WUFWH
WIFHH
WIFSH
VWFTH
WIFRH
IHPFSH
VVFSH
WPFIH
WPFHH
VUFWH
WHFIH
VWFQH
VVFWH
WHFWH
VVFUH
WIFUH
WHFSH
WIFQH
VWFRH
WHFSH
VWFVH
VVFWH
WPFUH
WHFUH
WPFIH
WPFIH
VWFRH
WHFPH
WPFVH
IHPFHH
VUFSH
WIFPH
WVFPH
WPFVH
WIFWH
WSFSH
WPFSH
IHHFQH
WPFWH
WUFWH
WSFPH
WPFUH
WRFSH
WSFPH
WPFRH
WHFWH
WHFWH
WIFQH
WIFTH
WIFVH
WQFPH
WSFQH
WQFTH
IHTFUH
WQFVH
WPFQH
WTFHH
WQFQH
WRFSH
WQFTH
WPFRH
WSFPH
WPFTH
WSFUH
WRFQH
WRFSH
WSFRH
WQFIH
WQFHH
WPFVH
WPFVH
WQFTH
WVFRH
WRFHH
WQFWH
WQFHH
WIFHH
IHSFRH
WIFRH
WIFIH
13
in reliddD nosotros deeremos prender nlizr este prolemD sumiendo que l durin de est
omill no es un vlor (jo y onoidoD sino que est sujeto inertidumreF vo que hremos ser dotrnos
de un modelo mtemtio que nos permit vlorr si es prole o no que un lmpr exi se romp
ntes de un oD despus de tres osD etF
posed esidentil gonstrution steD present un estudio de l ontminin en sureros que ontienen
desehos de onstruin y desperdiios de demoliionesF he un sitio de prue se tomron RP muestrs de
lixidoD de ls ules PT ontienen niveles detetles de plomoF e pone s de mni(esto que slo un prte
de los sureros est ontmind por plomoF v uestin es qu proporin supone est prte ontmind
de l super(ie totl de los surerosc
i un ingenier dese otener prtir de esos dtos un estimin de l proporin de los sureros que
ontiene niveles detetles de plomo dee ser onsiente de dos uestionesX
IF is imposile nlizr todos los rinones de todos los surerosF
PF i se s slo en los dtos del rtuloD es estimin ser slo esoD un estimin sd en es
muestrD que es de slo RP dtosF heerD por tnto otener tmin un estimin del error que est
ometiendo l her l estiminF gon mos resultdosD l estimin en s y un unti(in del
error que podr ometer on ellD inluso podr otener un rngo donde l verdder proporin se
enuentrD on un lto nivel de on(nzF
14
vo que los investigdores se uestionn es si l ntidd de ompuesto por un ldo y el tiempo de exposiin
l que se somete por otroD in)uyen en el porentje que se soreF he ser sD ser interesnte estimr
el porentje de sorin de persons que se sometn un exposiin de un determind ntiddD por
ejemploD durnte V horsF
xmero de identes
RU
SP
SU
TQ
gon es informinD los responsles de seguridd de l empres deen deidir si hy frnjs horris donde
los identes son ms proles o siD por el ontrrioD stos ourren solutmente l zrF
igualmente probable c
qu podemos
15
e denomin
conceptual no tiene elementos relesD sino que sus sos se otienen por l repetiin de un
experimentoF
or ejemploD undo plntemos ls prues sore pls de siliioD vemos que hy tntos sos omo prueE
s puedn herseD lo que supone un onjunto in(nito de sosF in poliones oneptules es imposileD
por tntoD onoer todos los sosD y tenemos que onformrnos on muestrs de los mismosF
n
or ejemploX
i onsidermos l polin de todos los lumnos de l isuelD podemos (jrnos en l vrile alturaF
i onsidermos el supuesto de ls prues sore pls de siliioD podemos onsiderr l vrile espesor
de la capa de xido de silicio generadaF
e denomin
simplesF
aleatorias
in un muestr letori simpleD todos los elementos de l polin deen tener ls misms
posiiliddes de slir en l muestr yD demsD los elementos de l muestr deen ser independientesX el que
slg un resultdo en l muestr no dee fetr que ningn otro resultdo slg en l muestrF
or ejemploD podrmos estr interesdos en l polin de todos los espoles on dereho voto @polin
tngileD pero enormeAD de los que querrmos onoer un dto o vrileD su intenin de voto en ls prxims
eleiones generlesF hdo que estmos hlndo de millones de personsD prolemente deeremos esoger
un muestrD es deirD un suonjunto de espoles los que se les relizr un enuestF i queremos que
es muestr se letori simpleD deeremos tener uiddo de que todos los espoles on dereho voto
tengn ls misms posiiliddes de er en l muestr y de que l respuest de un entrevistdo no fete l
de ningn otroF gomo not uriosD sed que l myor de ls enuests nionles se hen v telefniD
lo ul es un peque violin de ls hiptesis de muestr letori simpleD y que hy espoles on
dereho voto que no tienen telfonoD luego es imposile que slgn en l muestrF
16
Parte I
Estadstica descriptiva
IU
Captulo 2
El tratamiento de los datos. Estadstica
descriptiva
is un error pitl el teorizr ntes de poseer dtosF snsensilemente uno omienz lterr
los hehos pr enjrlos en ls teorsD en lugr enjr ls teors en los hehos
herlok rolmes @eF gF hoyleAD en
Un escndalo en Bohemia
Resumen. in este ptulo prenderemos mtodos pr resumir y desriir onjuntos de dtos trvs de
distintos tipos de tlsD gr(os y medids estdstisF
Palabras clave:
freuenisD digrm de rrsD digrm de setoresD histogrmD mediD medinD modD untilesD vrinzD
desviin tpiD simetrD dtos tpiosF
2.1. Introduccin
ytenidos trvs de enuestsD experimentos o ulquier otro onjunto de medidsD los dtos estdstios
suelen ser tn numerosos que resultn prtimente intiles si no son resumidos de form deudF r
ello l istdsti utiliz tnto tnis gr(s omo numrisD lguns de ls ules desriimos en este
ptuloF
odemos deir que existe un lsi(inD un tnto rti(ilD de los dtosD segn se re(ern un polin
tngileD en uyo so se onoern todos los sosD o un polin oneptulD en uyo so slo se
onoer un muestr @letori simpleAF in emrgoD est lsi(in no tiene ningn efeto en lo reltivo
lo que vmos estudir en este ptuloF
cuantitativos y cualitativos.
IW
cuantitativos son los que representn un ntidd re)ejd en un esl numriF e su vezD
pueden lsi(rse omo dtos cuantitativos discretos si se re(eren l onteo de lgun rterstiD o
dtos cuantitativos continuos si se re(eren un medidF
vos dtos
vos dtos
espesor
es untittiv ontinuF
in el ejemplo de los niveles de plomoD se est nlizndo si un muestr ontiene niveles detetE
les o noF e trtD por tntoD de un vrile ulittiv on dos tegorsX
detectables
s contiene niveles
de accidentes laborales
es untittiv
vs representiones gr(s ms usules son los digrms de rrs y los digrms de setoresF
vos diagramas
diagramas de sectores son rulos divididos en tntos setores omo tegorsD setores uyo ngulo
20
gtegor
s
flgi
prni
pinlndi
elemni
rolnd
tpn
uei
uiz
istdos nidos
yev
preueni
xmero de retores nuleres
R
PP
P
U
I
II
Q
I
RU
WV
preueni reltiv
roporin
HFHRI
HFPPS
HFHPH
HFHUI
HFHIH
HFIIP
HFHQI
HFHIH
HFRVH
IFHHH
Ejemplo.
ommos omo polin los WV retores nuleres ms grndes en todo el mundoF xos
tabla de fre-
Ejemplo.
un estudio sore l lidd de produinF vos dtos siguientes informn sore el nmero de piezs
defetuoss enontrds en un muestr de js exmindsX
HHHHHHIIIIIIIIIPPPPPPPPPPQQQQQQQRRRRRRRSSSSTTTTTUUUVVW
Prof. Dr. Antonio Jos Sez Castillo
21
10
20
30
40
Alemania
Blgica
EEUU
Finlandia
Francia
Holanda
Japn
Suecia
Suiza
EEUU
Blgica
Alemania
Suiza
Suecia
Japn
Finlandia
Holanda
Francia
Mtodo de SturgesD
22
10
R
NF
I1 = [xm , xm + L)
I2 = [xm + L, xm + 2L)
I3 = [xm + 2L, xm + 3L)
...
IN = [xm + N L, xM ).
SF r d intervloD ontmos el nmero de dtos que hy en lD es deirD l freueni del intervloF
TF il histogrm es un digrm de rrs donde en el eje se olon los intervlos y sore ellos se
onstruyen rrs uy ltur se l freueni o l freueni reltiv del intervloF in este soD ls
rrs deen diujrse sin espio entre ellsF in osionesD en vez de tomr l freueni reltiv omo
ltur de ls rrsD se tom dih freueni reltiv omo re de ls rrsX en ese soD se hl de
un histogrm en esl de densiddF
Nota. or uestiones que detllremos ms delnte es importnte destr que el porentje de dtos
que e dentro de un intervlo es proporionl l re de l rr que se onstruye sore ese intervloF
or ejemploD si el re de un rr es el QH 7 del re totl del intervloD entones el QH 7 de los dtos
estn en diho intervloF
Prof. Dr. Antonio Jos Sez Castillo
23
5
4
1
Frecuencia
Tiempos de procesado
0.00
0.96
1.92
2.88
3.84
4.80
or otr prteD qu psr si tommos un nmero muy grnde de dtosc il nmero de intervlos
del histogrm ser tmin muy grndeD y ls rrs sern muy estrehsD de mner que en vez de
preer un digrm de rrsD preer l gr( de un funin rel de vrile relF rlremos de
est funin y del re dejo de ell en reveF or iertoD mo se lul el re jo est funinc
IFTI
IFIT
IFQV
QFSQ
IFPQ
QFUT
IFWR
HFWT
RFUS
HFIS
PFRI
HFUI
HFHP
IFSW
HFIW
HFVP
HFRU
PFIT
PFHI
HFWP
HFUS
PFSW
QFHU
IFR
25 = 5D utilizremos S intervlosF
PF il mnimo de los dtos es HFHP y el mximo RFUSD de mner que podemos onsiderr omo rngo
del histogrm el intervlo [0, 4.8]D uy longitud @rngo del histogrmA es RFV.
QF v longitud de los intervlos esD en ese soD
4.8
5
= 0.96F
I1 = [0, 0.96)
I2 = [0.96, 1.92)
I3 = [1.92, 2.88)
I4 = [2.88, 3.84)
I5 = [3.84, 4.8)
24
preueni
[0, 0.96)
[0.96, 1.92)
[1.92, 2.88)
[2.88, 3.84)
[3.84, 4.8)
@medids de posiinAD
por dnde
@medids de dispersinA y
qu
@medids de formAF
medidas de tendencia central son medids de posiin que trtn de estleer un vlor que pued
onsiderrse
el centro
2.5.1.1. Media
e un onjunto de dtos de un vrile untittivD x1 , ..., xn F v
x=
n
i=1
xi
centro de gravedad
de los
dtosF
is inmedito ompror que si se reliz un mio de origen y esl sore los dtosD del tipo y = ax + bD
l medi sufre el mismo mioD es deirD y = a + bF
x
he igul formD si tenemos dtos de l sum de dos o ms vrilesD l medi de l sum es l sum de ls
medis de d vrileF
Prof. Dr. Antonio Jos Sez Castillo
25
2.5.1.2. Mediana
e un onjunto de dtos de un vrile untittivD x1 , ..., xn F yrdenemos l muestr de menor myorD
mediana es el vlor de l vrile que dej el mismo nmero de dtos ntes y despus que lD un vez
ordendos estosF
n+1
2
@en orden reiente o dereienteAD porque ste es el vlor entrlF is deirX Me = x( n+1 ) F
2
i n es prD l medin es l medi ritmti de ls dos oserviones entrlesF gundo n es prD los dos
x n +x n
( ) ( +1)
dtos que estn en el entro de l muestr oupn ls posiiones n y n +1F is deirX Me = 2 2 2
F
2
2
v medin orresponde extmente on l ide de vlor entrl de los dtosF he hehoD puede ser un vlor
ms representtivo de stos que l mediD y que es ms
robusta
un ejemploF
0+0+1+2+3+4+5
7
= 2.1429D y su medin PF
ero imginemos que por error o por sulidd otenemos un nuevo dto enormemente grnde en
relin l resto de dtosD VHF in ese soD l medi ser
0 + 0 + 1 + 2 + 3 + 4 + 5 + 80
= 11.875
8
y l medin PFSF is deirD un solo dto puede desplzr enormemente l mediD hst onvertirl en un
medid poo representtivD pero slo desplzr ligermente l medinF ise es el motivo por el que se
die que l medin es un medid
robustaF
moda se de(ne omo el vlor ms freuente de los dtosF vo que ourre es que si stos son
dtos de un vrile ontinu o disret on muhos vloresD puede que los dtos pens se repitnF in ese
soD en el queD omo vimos en ls representiones gr(sD se dee grupr por intervlosD no dee drse
un vlor omo modD sino un
26
2.5.2. Cuantiles
vos
que responden es muy senill y muy prtiF e trt de vlorr de form reltiv mo es un dto respeto
del onjunto glol de todos los dtosF
iD por ejemploD un nio de R os pes IQ kilosD est desnutridoc est snoc v respuest dee ser que
dependeF
hnde vive el nioc is importnte porqueD por ejemploD en istdos nidos los nios son en generl
ms grndes queD por ejemploD en tpnF uiz ms que el peso nos interese ser qu posiin reltiv tiene
el peso del nio dentro de l polin de l que form prteF or ejemploD si nos dien que el nio est entre
el I 7 de los nios que menos pesnD prolemente tiene un prolem de reimientoF
il
cuantil p @Qp A de unos dtos (0 p 1)D ser un vlor de l vrile situdo de modo que el 100p % de
xo ostnteD en l prti vmos enontrr un prolem pr enontrr untilesD sore todo on poos
dtosX lo ms hitul es que no exist el vlor exto que deje l izquierd el 100p % de los vlores y el
resto l derehF or ese motivoD los progrms estdstios utilizn uns frmuls de interpolin pr
otener el vlor del until entre los dos vlores de los dtos que lo ontienenF in nuestro soD l hor
de otener untilesD l pliin de ess frmuls de interpolin
a mano
los lulosD por lo que vmos plir un onvenio muho ms senilloX proximremos el vlor del until
orrespondiente de l siguiente formX
IF i el 100p % de nD donde n es el nmero de dtosD es un enteroD k D entones Qp =
x(k) +x(k+1)
.
2
a mano
percentiles
son los untiles que dividen l muestr en IHH prtesD es deirD son los untiles
HFHI @perentil IAD HFHP @perentil PAD FFFD HFWW @perentil WWAF i notmos por P l perentil D on
cuartiles
27
HFHP
HFUS
IFIU
IFTI
PFSW
HFIS
HFVP
IFPQ
IFWR
QFHU
HFIW
HFWP
IFQV
PFHI
QFSQ
HFRU
HFWT
IFRH
PFIT
QFUT
HFUI
IFIT
IFSW
PFRI
RFUS
lo que pretenden es unti(r mo de onentrdos o dispersos estn los dtos respeto ests medidsF
xosotros nos vmos limitr dr medids de dispersin soids l mediF
v ide de ests medids es vlorr en qu medid los dtos estn grupdos en torno l mediF ist uestin
tn simple es uno de los motivos ms surdos de l ml prens que tiene l istdsti en l soiedd en
generlF v gente no se f de lo que ellos llmn
la Estadstica
el mundo ree que un medi tiene que ser un vlor vlido pr todosD y eso es mterilmente imposileF
Ejemplo. ensemos en l medi del slrio de los espolesF in PHHS fue de IVFUSH euros l oF ehor ienD
es medi inluye tnto ls regiones ms desrrollds omo ls ms desfvoreids yD evidentementeD l
ifr generr muho mlestr en grn prte de l polin @on tod seguriddD ms del SH 7AD uyo slrio
est por dejoF
Ejemplo. ixiste un frse muy onoid que die que la Estadstica es el arte por el cul si un espaol se
come un pollo y otro no se come ninguno, se ha comido medio pollo cada uno F
is frse se us en muhs
osiones pr ridiulizr l istdstiD undo en relidd deer servir pr desreditr quien l dieD
por su ignorniF
ry que deir que l istdsti no tiene l ulp de que l gente espere de un medi ms de lo que es pz
de drD ni de que muy po gente onoz medids de dispersin soids l mediF
s2 =
n1
28
n
i=1
(xi x)
.
n1
Nota. r lulr a mano l vrinz result ms modo desrrollr un poo su frmulD omo vmos
verX
s2 =
n1
=
n
i=1 (xi
x)2
=
n1
n
2
x2
i=1 xi n
.
n1
n
i=1
x
x
x2 2 i=1 xi + n2
i
=
n1
n
i=1
x x
x
x2 2n + n2
i
n1
gunto myor se l vrinz de unos dtosD ms dispersosD heterogneos o vriles son esos dtosF gunto
ms peque se un vrinz de unos dtosD ms grupdos u homogneos son dihos dtosF
Ejemplo. n muestr letori simple de l ltur de S persons rroj los siguientes resultdosX
1.76
1.72
1.80
1.73
1.79
5
i=1
xi = 8.8 y
5
i=1
x=
s2 =
n1
8.8
= 1.76
5
15.493 5 1.762
= 0.00125
4
in lo que respet l omportmiento de l vrinz muestrl frente mios de origen y eslD slo le
2 2
fetn los segundosF is deirD si tenemos que y = ax + bD se veri( que s2
y;n1 = a sx;n1 F
pinlmenteD si ien hmos omentdo que en el so de l mediD si tenemos l sum de vris vrilesD
l medi totl es l sum de ls medis de d vrileD no ourre s on l vrinz en generlF
s2 D
n1
29
Regla EmpricaX
coeciente de variacin.
CV =
de variacin omo
sn1
.
||
x
v prinipl ventj del oe(iente de vriin es que no tiene uniddes de medidD lo que he ms fil
su interpretinF
30
1.19
1.63
lgo ms del UH 7 de l mediF isto indi que los dtos no estn muy onentrdos en torno l mediD
prolemente deido l preseni de los vlores ltos que hemos omentdo ntesF
Nota.
il oe(iente de vriinD tl y omo est de(nidoD slo tiene sentido pr onjuntos de dtos
on el mismo signoD es deirD todos positivos o todos negtivosF i huier dtos de distinto signoD l
medi podr estr prxim ero o ser eroD imposiilitndo que prez en el denomindorF
NotaF uele ser freuente el error de pensr que el oe(iente de vriin no puede ser myor que ID lo
ul es rigurosmente flsoF i lo expresmos en porentjeD el oe(iente de vriin puede ser superior
l IHH 7 sin ms que l desviin tpi se myor que l mediD os stnte freuenteD por iertoF
depende del ontexto de los dtos que estemos nlizndoF iD por ejemploD estmos nlizndo unos dtos
que por su nturlez deen ser muy homogneosD un oe(iente de vriin del IH 7 ser enormeD pero
si por el ontrrio estmos nlizndo dtos que por su nturlez son muy vrilesD un oe(iente de
vriin del IH 7 ser muy pequeoF
or todo elloD lo reomendle es nlizr el oe(iente de vriin entendiendo su signi(do numrioD
es deirD entendiendo que se re(ere l omprin de l desviin tpi on l mediD e interpretndo
su vlor en relin l ontexto en el que estemos trjndoF
medidas de forma omprn l form que tiene l representin gr(D ien se el histogrm o el
digrm de rrs de l distriuinD on un situin ideal en l que los dtos se reprten en igul medid
l dereh y l izquierd de l mediF
is situin en l que los dtos estn reprtidos de igul form uno y otro ldo de l medi se onoe
omo
simetraD y se die en ese so que l distriuin de los dtos es simtriF in ese soD demsD su
desienden ms lentmente por l dereh que por l izquierdF i ls freuenis desienden ms lentmente
por l izquierd que por l dereh diremos que l distriuin es
r vlorr l simetr de unos dtos se suele utilizr el
asimtrica a la izquierdaF
n
x 3
i=1 (xi )
As =
Prof. Dr. Antonio Jos Sez Castillo
n1
s3
n1
31
ysrvese que pr evitr el prolem de l unidd y her que l medid se eslr y por lo tnto reltivD
dividimos por el uo de su desviin tpiF he est form podemos vlorr si unos dtos son ms o menos
simtrios que otrosD unque no estn medidos en l mism unidd de medidF v interpretin de este
oe(iente de simetr es l siguienteX
nto myor se el oe(iente en vlor solutoD ms simtrios sern los dtosF
il signo del oe(iente nos indi el sentido de l simetrX
i es positivo indi que l simetr es l derehF
i es negtivoD indi que l simetr es l izquierdF
parmetros muestralesF
ploD l medi polionl se lulr igul que l medi muestrl de unos dtosD pero plid l frmul
todos los elementos de l polinF gomo eso es prtimente imposile de poner en l prtiD veremos
3 Salvo
32
en ptulos posteriores que los prmetros muestrles se utilizn en l prti pr proximr o estimr los
prmetros polionlesF
lgicos
egn ellD el WWFS 7 de los dtos estn en el intervlo [ 3sn1 , x + 3sn1 ]D luego
x
atpicos los
xi
se considerarn datos
[ 3sn1 , x + 3sn1 ] .
x
rango intercuartlico
PF e onsidern
@IR o
RI AD
IR = P75 P25 F
33
erie I
erie P
wedis
WPFHI
WPFUR
hesvF pi
QFTP
QFUQ
g
PSFRH
PRFVT
goefF esimetr
EIFUW
IFUI
Ejemplo. mos ver si hy lgn dto tpio entre los dtos de tiempo de proesdo en un g de
PS tresF
hdo que el histogrm no ten form de mpnD el mtodo de l regl empri no es el mtodo ms
deudo pr l detein de vlores tpiosF
or su prteD P50 = 1.38D P25 = 0.82 y P75 = 2.16F or tntoD IR = 2.160.82 = 1.34D y el intervlo fuer
del l onsidermos vlores fuer de rngo es [0.82 1.5 1.34, 2.16 + 1.5 1.34] = [1.19, 4.17]F he
est formD el vlor RFUS es un vlor fuer de rngoF
ry un versin gr( de este mtodo pr detetr vlores tpios medinte los perentilesX se llm
diagrama de caja o diagrama de cajas y bigotes o @en inglsA boxplotF iste digrm inluye en un
gr(oX
IF il vlor de l medin @o segundo urtilD Q2 AX ese es el entro de l jF
PF il vlor de los perentiles PS y USD urtiles primero y terero respetivmente @Q1 y Q3 AX son los ldos
inferior y superior de l jF
QF il digrm no represent los lmites P25 1.5 IR y P75 + 1.5 IRF in su lugrD sel los ltimos
puntos no tpios por dejo @Li A y por enim @Ls AD es deirD sel el ltimo dto por enim de
P25 1.5 IR y el ltimo dto por dejo de P75 + 1.5 IRD y los represent omo
bigotes
que slen
de l jF
RF xormlmente represent on rulos los dtos tpiosF
34
35
36
Parte II
Clculo de Probabilidades
QU
Captulo 3
Probabilidad
emos que l teor de l proilidd en el fondo slo es sentido omn reduido luloY nos
he preir on extitud lo que ls mentes rzonles tomn por un tipo de instintoD inluso
sin ser pes de drse uentFFF is sorprendente que est ieniD que surgi del nlisis de los
juegos de zrD llegr ser el ojeto ms importnte del onoimiento humnoFFF vs priniples
uestiones de l vid sonD en grn medidD meros prolems de proiliddF
ierre imonD wrqus de vple
Resumen. il ptulo proporion un trtmiento de los experimentos uyos resultdos no se pueden predeir
on ertez trvs del onepto de proiliddF e nlizn ls propieddes de l proilidd y se introdue
tmin el onepto de proilidd ondiiondD que surge undo un sueso modi( l signin de
proiliddes previF
Palabras clave: experimento letorioD experimento determinstioD espio muestrlD suesoD proiliddD
proilidd ondiiondD independeni de suesosF
3.1. Introduccin
in nuestr vid otidin soimos usulmente el onepto de
probables quellos eventos en los que tenemos un lto grdo de reeni en su ourreniF
in est lneD Probabilidad es un onepto soido l medid del azarF min pensmos en el zr
onsiderndo
vinuldoD fundmentlmenteD on los juegos de zrD pero desde es pti tn reduid se nos espn otros
muhsimos ejemplos de fenmenos de l vid otidin o soidos disiplins de distints ienis donde
el zr jueg un ppel fundmentlF or itr lgunosX
u nmero de uniddes de produin slen d d de un den de montjec xo existe un nmero
(jo que pued ser onoido prioriD sino un onjunto de posiles vlores que podrn drseD d uno
de ellos on un ierto grdo de ertezF
gul es el tmo de un pquete de informin que se trnsmite trvs de rc xo existe en
relidd un nmero (joD sino que ste es desonoido prioriF
QW
aleatorioF
experimento aleatorioF
1F
probabilidad
coherenteF
axiomasD
que
1 Es mejor que aceptemos desde el principio que la Estadstica no es la ciencia de la adivinacin: tan slo se ocupa de
cuanticar cmo de incierto es un evento y, ocasionalmente, de proponer estrategias de prediccin basadas en dicha medida de
la incertidumbre.
40
r d A se veri( A A .
i C B y B AD entonesD C A. isto se onoe omo propiedd trnsitivF
v
unin
interseccin
es vD es deirD A B = .
i dos onjuntos A y B son disjuntosD su unin suele notrse A + B F
vos onjuntos A1 , ..., AN se dien
n
particin
A A1 ... AN =
A Ai Aj = pr todo i = j.
il
conjunto complementario de un onjunto AD A Ac D est formdo por todos los elementos de que
no perteneen AF
e sigue por tntoD
AA=
AA=
c
(Ac ) = A
Si B A A B
Si A = B A = B.
pinlmenteD menionemos ls llmds veyes de worgnX
AB =AB
A B = A B.
41
il onjunto formdo por todos los posiles resultdos del experimento letorio reie el nomre de espacio
ensayo o realizacin
suceso o eventoF
ocurre un suceso A
Ejemplo. n experimento hitul en fiolog onsiste en extrerD por ejemploD pees de un roD hst
dr on un pez de un espeie que se dese estudirF il nmero de pees que hr que extrer hst
onseguir el ejemplr desedo de l espeie en estudio formr el espio muestrlD = {1, 2, 3, ...}D si es
que el investigdor dese oservr extmente el nmero de pees hst extrer ese ejemplr desedoF
ysrvese que se trt de un onjunto no otdoD pero numerleF
gomo ejemplos de posiles suesos de inters podrmos poner los eventos {IDPDQDRDS}D {myor o igul
S}DFFF
upongmos hor que el investigdor slo est interesdo en ompror si hen flt ms de S exE
triones pr otener un ejemplr de l espeie en estudioF in ese soD el espio muestrl ser
= {> 5, 5}F
Ejemplo.
zr entre H y ID un espio muestrl ser = [0, 1]F e difereni de los nteriores ejemplosD este espio
muestrl no es (nitoD ni siquier numerleF
gomo ejemplo de suesos posiles en este espio muestrl podemos destrD entre otrosD {menor que
HFS} D {myor que HFPS}D {menor que HFUS} DFFF
ytro espio muestrl podr ser oservr el vlor deiml myor ms ernoF or ejemploD si sle HFPSD
me interes HFQF in ese so el espio muestrl ser = 0.1, 0.2, ...1F iste espio muestrl servirD
por ejemploD pr sorter nmeros entre I y 10D sin ms que multiplir el resultdo otenido por IHF
42
in estos ltimos ejemplos podemos ver que hy dos grndes tipos de espios muestrles segn el nmero de
suesos elementlesF
n espio muestrl se die
elementlesF
or el ontrrioD un espio muestrl se die
continuo
suesos elementlesF
funcin de probabilidad
pr ese espio muestrl es ulquier funin que signe d sueso un nmero en el intervlo [0, 1] y que
veri(que
P [n Ai ] =
i=1
P [Ai ] .
i=1
Nota. ry que notr que se puede dr ms de un funin de proilidd soid l mismo espio
muestrlF or ejemploD soido l espio muestrl = {cara, cruz}, del lnzmiento de un monedD
pueden drse un nmero in(nito no numerle de medids de l proiliddY onretmenteD soids
d elein
P [cara] = p
P [cruz] = 1 p,
pr d p [0, 1] . eunque si l moned no est rgdD omo suede hitulmenteD se onsider el
so en que p = 1 .
2
Ejemplo. olviendo sore el lnzmiento del ddoD si ste no est rgdoD podemos de(nir l siguiente
funin de proiliddX
P [{i}] =
1
, i = 1, 2, ..., 6.
6
43
P [] = 0.
Ejemplo. il iruito que pree en l pigur QFI est onstituido por dos interruptores @switches A en
prleloF v proilidd de que ulquier de ellos est errdo es de 1 F
2
r que pse orriente trvs del iruito st on que pse orriente por lguno de los dos interrupE
toresD esto esD que l menos uno de ellos est errdoF or tntoD si notmos por
corriente a travs del circuito
Ei
l sueso
que el interruptor
est cerrado,
l sueso
que pase
entonesD
44
N de lanzamientos
N de caras
N. de caras
N. de lanzamientos
IH
R
HFR
IHH
RT
HFRT
PSH
IPR
HFRWT
SHH
PRR
HFRVV
USH
QUW
HFSHSQ
IHHH
SHI
HFSHI
nA
,
n n
P [A] = l
m
e trt de un interpretin
en el innitoF
Ejemplo. e hn relizdo IHHH lnzmientos de un monedF in el gudro QFI pree un resumen de ese
proesoF uede oservrse omo unto myor es el nmero de lnzmientosD ms se proxim l freueni
1
reltiv l vlor 2 D de mner que podrmos pensr que l proilidd de r es igul que l proilidd
de ruz e igules ms
1
2D
estritmente l de(niin freuentist deermos ontinur hst el in(nitoD lo que result imposileF
ist interpretin freuentist de l proilidd permite inferir lo que podemos llmr
radas.
frecuencias espe-
n veesD
lo ms esperable
lo ms esperable.
Ejemplo. iguiendo on el ejemplo de l monedD si l lnzmos QRV veesD lo esperle es que slgn
lrededor de 348 0.5 = 174 rsF
de maana
muhs vees y
ontr unts vees llueveF odrmos pensr si hubiera muchos das como el de maana, aproximadamente
llovera en el 35 % de ellos c
45
v interpretin sujetiv de l proilidd tiene que ver on l vinulin de este onepto on el grdo
de inertidumre que tenemos sore ls ossF i tenemos un experimento letorioD el resultdo de diho
experimento es iniertoF v proilidd de un resultdo del experimento es el grdo de reeni que yo tengo
en l ourreni de diho resultdoF ise grdo de reeni es personlD luego es sujetivoD pero lgimenteD
deer estr orde on l informin que tenemos sore el experimentoF
ms probable
P [A] =
NA
,
N
frmula de Laplace
P [cara] =
1
2
en el lnzmiento de un moned sin tener que lnzr l moned un grn nmero de veesF
in emrgoD l de(niin tiene dos grndes inonvenientesX el onjunto de resultdos posilesD N D tiene que
ser (nito yD demsD todos los resultdos posiles deen tener l mism proilidd @on lo ulD lo de(nido
qued implitmente inmerso en l de(niinAF
yvimenteD l proilidd P [A] ser menor que l proilidd P [A | B] , y que el heho de que est
nuldo refuerz nuestr reeni en que lluevF
46
4 sotas
1
=
40 cartas
10
4 sotas
1
P [A | B1 ] =
=
12 f iguras
3
1 sota de copas
1
P [A | B2 ] =
=
.
10 copas
10
P [A] =
gomo puede verseD B1 modi( l proilidd prioriD pero no s B2 F uede deirse que B2 no ofree
independientesF
de(niin de probabilidad condicionada
P [A | B] =
P [A B]
,
P [B]
no siempre un sueso d informin sore otroF in este so se die que mos suesos son independientesF
or tntoX
hos suesos A y B se dien independientes si P [A | B] = P [A] , o equivlentemente si P [B | A] = P [B]D o
equivlentemente si P [A B] = P [A] P [B] .
Ejemplo. gontinundo on el ijemplo QFQFQD lo ms lgio es pensr que los dos interruptores tn
de form independienteD en uyo so P [E1 E2 ] = P [E1 ] P [E2 ] y tenemos queD
1 1
+ P [E1 E1 ]
2 2
1 1 11
3
= +
= .
2 2 22
4
P [E] =
47
todo
una parte
un todoF
gundo l proilidd es
parte
todo
es l interseinF
Nota. min suele ser stnte omn l onfusin entre suesos independientes y suesos inompE
tiles o mutumente exluyentesF
in este sentidoD reordemos que dos suesos A y B son inomptiles o mutumente exluyentes si
A B = , en uyo so P [A B] = 0F
or su prteD A y B sern independientes si P [A B] = P [A] P [B]F
vs diferenis entre mos oneptos son ovisF
Ejemplo. v proilidd de que el produto no se elordo tiempo es HFHSF e soliitn tres pedidos
del produto on l su(iente seprin en el tiempo omo pr onsiderrlos eventos independientesF
IF gul es l proilidd de que todos los pedidos se enven tiempoc
in primer lugrD notemos Ei l sueso enviar
P [Ei ] = 0.95.
or su prteD nos piden
48
P E1 E2 E3 E1 E2 E3 E1 E2 E3
= P E1 E2 E3 + P E1 E2 E3 + P E1 E2 E3
Ejemplo.
esquem se pone de mni(esto que un unidd ser produidd on xito si ps en primer lugr un
hequeo previo @eAY despus puede ser montd diretmente @fAD redimensiond @gA y despus montd
@hA o dptd @iA y despus montd @pAY posteriormente dee ser pintd @qA y (nlmente emld
@rAF gonsideremos que ls proiliddes de psr exitosmente d suproeso son tods ells igules
HFWSD y que los suproesos tienen lugr de form independiente unos de otrosF mos lulr en
ess ondiiones l proilidd de que un unidd se exitosmente produidF
i nos dmos uentD eD q y r son ineludilesD mientrs que un unidd puede ser produid si ps
por fD por g y h o por i y pF in notin de onjuntosD l unidd ser produid si se d
A (B C D E F ) G H.
gomo los proesos son independientes unos de otrosD no tenemos prolems on ls proiliddes de ls
interseionesD pero tenemos que lulr l proilidd de un unin de tres onjuntosD BC DEF F
in generlD
49
P [B C D E F ] = P [B] + P [C D] + P [E F ]
P [B C D] P [B E F ] P [C D E F ]
+ P [B C D E F ]
= 0.95 + 2 0.952 20.953 0.954 + 0.955
= 0.9995247
estmos en ondiiones de otener l proilidd que se nos pideX
in estos ejemplosD el lulo de l proilidd de ls interseiones h resultdo trivil porque los suesos son
independientesF on emrgoD esto no siempre ourreF gmo podemosD en generlD otener l proilidd
de l intersein de dos o ms suesos no neesrimente independientesc
in el so de slo dos suesosD A y B D podemos deduir que
P [A B] = P [A|B] P [B]
diretmente de l de(niin de proilidd ondiiondF e prtir de est frmulD por induinD se puede
otener l llmd frmul produtoD que se enuni de l siguiente formX si A1 , A2 , ..., An son suesos de
un espio muestrl no neesrimente independientesD se veri(
P [A1 A2 ... An ] = P [A1 ]P [A2 |A1 ]...P [An |A1 A2 ... An1 ]
50
Ejemplo. n lote de SH rndels ontiene QH rndels uyo grosor exede ls espei(iones de diseoF
upong que se seleionn Q rndels l zr y sin reemplzo del loteF
IF gul es l proilidd de que ls tres rndels seleionds sen ms gruess que ls espei(E
iones de diseoc
gomenzmos notndo los suesos Ai X l Esim rndel extrid es ms grues que ls espei(E
iones de diseo, i = 1, 2, 3F
intonesD nos piden
P A3 /A1 A2 =
30
.
48
respetivmenteD y juegn un importnte ppel l hor de lulr proiliddesF vos dos utilizn omo
Prof. Dr. Antonio Jos Sez Castillo
51
Ejemplo.
P [B | Ai ] P [Ai ]
.
P [B | A1 ] P [A1 ] + ... + P [B | AN ] P [AN ]
2000
2000 + 500 + 1000 + 1000
500
P [C2 ] =
2000 + 500 + 1000 + 1000
1000
P [C3 ] =
2000 + 500 + 1000 + 1000
1000
P [C4 ] =
2000 + 500 + 1000 + 1000
P [C1 ] =
4
9
1
=
9
2
=
9
2
=
9
=
P [C1 | D] =
52
0.05 4
P [D | C1 ] P [C1 ]
9
=
= 0.2
P [D]
0.11111
F
HFHI
HFI
IFH
otl
xmero
I
PH
SS
UH
IRS
en d
P
WS
QS
VH
PIH
j
Q
PS
US
IRS
PRS
otl
IRH
ITS
PWS
THH
Ejemplo. e disponen tres js donde se lmenn umuldores segn pree en el gudro QFPF
e esoge l zr un j y de ellD su vezD un umuldorF
IF gul es l proilidd de que se hy seleiondo un umuldor de HFHIF c
xotemos 0.01F, 0.1F y 1.0F los suesos
extraer un acumulador de
P [0.01F ] = P [0.01F / c1] P [c1] + P [0.01F / c2] P [c2] + P [0.01F / c3] P [c3]
95 1
25 1
5903
20 1
+
+
=
= 0.23078.
=
145 3 210 3 245 3
25 578
PF i h sido seleiondo un umuldor de IFHF D ul es l proilidd de que proed de l j
Ic tilizndo el teorem de fyesD
P [c1 / 1.0F ] =
or su prteD
P [1.0F ] = P [1.0F / c1] P [c1] + P [1.0F / c2] P [c2] + P [1.0F / c3] P [c3]
70 1
80 1 145 1
6205
=
+
+
=
= 0.48518,
145 3 210 3 245 3
12 789
luego
P [c1 / 1.0F ] =
70 1
145 3
6205
12 789
2058
= 0.33167.
6205
53
= P [A3 |A1 A2 ]P [A1 ]P [A2 |A1 ] + P [A3 |A1 A2 ]P [A1 ]P [A2 |A1 ]
+P [A3 |A1 A2 ]P [A1 ]P [A2 |A1 ] + P [A3 |A1 A2 ]P [A1 ]P [A2 |A1 ]
Ejemplo.
28 30 29 29 20 30
+
48 50 49 48 50 49
29 30 20 30 20 19
+
.
48 50 49 48 50 49
que el dgito Q es envido tres vees ms freuentemente que ID y P dos vees ms freuentemente
que IF glulemos l proilidd de que un dgito ulquier envido trvs del nl se reiido
orretmenteF
in primer lugrD si notmos P [X = 1] = pD entones P [X = 2] = 2p y P [X = 3] = 3pF or otr prteD
omo
1 = P [X = 1] + P [X = 2] + P [X = 3] = 6p,
se tiene que
P [X = 1] =
1
1
1
, P [X = 2] = y P [X = 3] = .
6
3
2
+ P [dgito OK / X = 2] P [X = 2]
+ P [dgito OK / X = 3] P [X = 3]
= P [Y = 1 / X = 1] P [X = 1]
+ P [Y = 2 / X = 2] P [X = 2]
+ P [Y = 3 / X = 3] P [X = 3]
1
1
1
= (1 ) + (1 ) + (1 ) = P.
6
3
2
EjemploF
envido un Ic
tilizndo el teorem de fyesD
P [X = 1 / Y = 1] =
54
P [Y = 1 / X = 1] P [X = 1]
.
P [Y = 1]
or su prteD
P [Y = 1] = P [Y = 1 / X = 1] P [X = 1]
+ P [Y = 1 / X = 2] P [X = 2]
+ P [Y = 1 / X = 3] P [X = 3]
=
luego
P [X = 1 / Y = 1] =
1
+ + ,
6
6
4
1
6
1
+
6
6
=2
1 +
.
2 + 2 2 3
Estadstica BayesianaF
probabilidad de que A
expertos en el temaD
probabilidad a priori.
ehor ienD hemos ddo un proilidd priori P [A] sin ningun informin sore AF upongmos hor
Prof. Dr. Antonio Jos Sez Castillo
55
que tenemos nuev informin que nos dr pists er de si A h ourrido o noD y que dih informin
est reogid en un sueso que llmremos B1 F in ese soD podrmos y deermos actualizar la probabilidad
de A sndonos en est nuev informinD proporionndo un nuev proilidd de A que teng en uent
probabilidad a posterioriF
in es
actualizacin de la probabilidad
P [A |B1 ] =
P [B1 |A ] P [A]
.
P [B1 |A ] P [A] + P [B1 |A ] P A
posteriori ser
P [A |B1 B2 ] =
=
P [B2 |A ] P [A |B1 ]
.
is muy importnte oservr que en este oiente P [A |B1 ] oup el lugr que ntes oup l proilidd
prioriF edemsD est segund proilidd posteriori podr onsiderrse omo l nuev proilidd
priori pr un nuev pliin del teorem sd en el onoimiento de nuev informin dd por un
sueso B3 F iste proeso de tulizin de ls proiliddes priori sd en l informin disponile
puede relizrse unts vees se neesrioF
mos ilustrr esto en un pr de ejemplosF
56
P [culpable |ADN + ] =
is deirD hor piens que el sospehoso es ulple on un WWFWSRV 7 de ertezF pijmonos en que nuestr
proilidd priori pree en los trminos HFI en el numerdor y HFI y HFW en el denomindorF isD HFID
er l proilidd que tenmos
P [culpable |maquina ] =
nuestr
proilidd de que fuer ulple er de HFWWWSRV @que pree en l frmul oupndo l posiin de l
proilidd prioriAD mientrs que
57
1 prueba: ADN +
2 prueba: maquina
Antes de
la prueba
HFI
HFWWWSRV
P [Culpable]
Despus de
la prueba
gudro QFQX isquem del proeso itertivo del teorem de fyes en el ejemplo del juezF v proilidd a
@ntes de d prueA es l que se utiliz en l frmul pr otener l proilidd a posteriori
@desps de d prueAF v proilidd a posteriori @despusA de un prue es l proilidd a priori
@ntesA de l siguiente prueF
priori
v proilidd priori de que un piez se no defetuos es de HFWSD pero si es detetd omo defetuos
un primer vezD dih proilidd ps ser
P [+ |D ] P D
|D ] P D + P [+ |D ] P [D]
P [+
0.95 0.95
=
= 0.9944904.
0.95 0.95 + 0.1 0.05
P D |+ =
P [+ |D ] 0.9944904
|D ] 0.9944904 + P [+ |D ] (1 0.9944904)
P [+
0.95 0.9944904
=
= 0.9994172.
0.95 0.9944904 + 0.1 (1 0.9944904)
P D |++ =
P [+ |D ] 0.9994172
P [+ |D ] 0.9994172 + P [+ |D ] (1 0.9994172)
0.95 0.9994172
=
= 0.9999386.
0.95 0.9994172 + 0.1 (1 0.9994172)
P D |+++ =
gomo podemos verD si un piez d no defetuos tres veesD l proilidd de que se relmente no
defetuos es ltsimD del orden del WWFWW 7D s que el mtodo idedo por el responsle de lidd pree
onsistenteF
58
1 prueba: +
2 prueba: +
3 prueba: +
Antes de
la prueba
HFWS
HFWWRRWHR
HFWWWRIUP
P D
Despus de
la prueba
P [+|D ]0.95
P [+|D ]0.9944904+P [+|D ](10.9944904) = 0.9994172
P [+|D ]0.9994172
gudro QFRX isquem del proeso itertivo del teorem de fyes en el ejemplo de l mquin de detein
de fllosF v proilidd a priori @ntes de d prueA es l que se utiliz en l frmul pr otener l
proilidd a posteriori @desps de d prueAF v proilidd a posteriori @despusA de un prue es
l proilidd a priori @ntesA de l siguiente prueF
59
60
Captulo 4
Variable aleatoria. Modelos de
distribuciones de probabilidad
ws pesr de todo esoD unque l ml suerte existD muy poos reporteros veternos reen de
verdd en ellF in l guerrD ls oss suelen disurrir ms ien segn l ley de ls proiliddesX
tnto v el ntro l fuente que l (nl he ngF
erturo rez everteD en
Territorio Comanche
Palabras clave: vrile letoriD vrile disretD funin ms de proiliddD vrile ontinuD funin
de densidd de proiliddD funin de distriuinD mediD vrinzD distriuin inomilD distriuin
de oissonD distriuin geomtriD distriuin uniformeD distriuin exponenilD distriuin qmmD
distriuin normlF
4.1. Introduccin
in el tem nterior hemos visto que l istdsti se oup de experimentos letoriosF in generlD en gieni
y enolog se suele nlizr ulquier experimento medinte un o vris medids del mismoF or ejemploD
se nliz un ojeto segn su pesoD su volumenD su densiddD su ontenido de guFFFY o se nliz el tr(o
de snternet segn el nmero de onexiones un servidorD el volumen totl de tr(o generdoD l veloiddFFF
in estos senillos ejemplos oservmos que se h desrito un fenmeno fsioD omo puede ser un ojeto o
el estdo de un red de omuniiones en un momento ddoD medinte uno o vrios nmeros o vrilesF
gundo ese fenmeno es de tipo letorioD vmos llmr es signin
variable aleatoria F
variable aleatoria @ prtir de hor v.a.A es un nmero rel soido l resultdo de un experimento
discreta
pr d x R.
62
Nota. ysrvese que un funin ms de un vFF disret est de(nid en todos los puntos de l ret
relD pero slo vldr distinto de ero en un onjuntoD lo sumoD numerleD que orresponde on los
nios vlores que pueden drse de l vrileF
e X un vFF disret y f (x) su funin msF intonesX
IF f (x) 0 pr todo x R.
PF
xR
f (x) = 1.
P [X B] =
f (xi ) ,
xi B
i tenemos un olein de posiles resultdos de l vrile X D x1 , ..., xN , est funin sign l vlor x l
freueni on l que diho vlor se d en l muestrD es deirD
femp (x) =
x f (x).
EX =
x
63
peso
peso
de
lo determin l proiliddD dd
(x EX)2 f (x).
V arX =
x
(x EX)2 f (x) =
V arX =
x
x2 f (x) 2EX
=
x
x f (x) + EX 2
x
f (x)
x
= V arX D que tiene ls misms uniddes que l medi y que se puede interpretr omo un medi del
grdo de vriin del onjunto de vlores que puede tomr l vFF respeto del vlor de l mediF
64
proilidd soid los resultdos de l vrile l vmos llmr prtir de hor distribucin de
probabilidad de un vFF hmonos uent queD omo mos de omentrD pr determinr l distriuin
de proilidd de un vFF slo tenemos que dr su funin funin ms de proiliddF
in emrgoD deemos tener en uent que en l vid rel ndie onoe ul es l utnti distriuin de
proilidd de un vFFD porque ndie se priori ul es l funin ms de dih vrileF odo lo msD
podemos lulr l funin ms empri prtir de los dtos de un muestrF en sD llegr el momento
de
pasar al lmiteD
paso al lmiteD
en istdsti se estudin
babilidadF e trt de frmuls teris de funiones ms que pueden resultr deuds pr determinds
vriles letorisF
ry un metfor que puede yudr entender mo se sign un distriuin de proilidd y sore l que
undremos en lo suesivoX qu ourre undo queremos omprr unos pntlonesc in generl udimos
un tiend de mod yX
IF he entre un serie de modelosD elegimos el modelo que reemos que mejor nos vF
PF fusmos l tll que he que mejor se juste nosotrosD segn nuestrs rterstisF
ues ienD en el so de ls vFF
nuestras caractersticas
son ls posiles oserviones que tenemos sore l vFF queD por ejemploD
de l tiendD entre los que elegimos el que ms nos gustD son los modelos terios que
la talla
que he que los pntlones se justen nosotros deudmente son los prmetros de los
modelos teriosF
in lo que rest de este ptulo vmos desriir lgunos de los modelos terios de proilidd ms
hitules en el mito de ls sngeniersD omenzndo por el so de vFF disretsF
es
f (x) =
=
n
x
nx
px (1 p)
n!
nx
px (1 p)
, x = 0, 1, 2, ..., n.
x! (n x)!
65
0.4
B(10,0.25)
0.3
0.2
0.1
0
10
0.4
B(10,0.5)
0.3
0.2
0.1
0
10
0.4
B(10,0.75)
0.3
0.2
0.1
0
10
EX = np
V arX = np (1 p) .
se repite n vees de form independiente y que en ese experimento hy un sueso que denominmos
xito,
que ourre on proilidd onstnte pF in ese soD l vrile letori X que mide el nmero de xitos
sigue un B (n, p)F
in est rterizin es importnte oservr que ls dos hiptesis fundmentles de est distriuin sonX
los experimentos se repiten de form
l proilidd de xito es
independiente y
constanteF
in l medid en que ests dos hiptesis no sen vlidsD l distriuin inomil no ser deud pr l
vrile que uent el nmero de xitosF
n ejemplo prtiulr de distriuin inomil lo onstituye l denomind
distribucin de BernouilliF
f (x) =
66
1 p si x = 0
p si x = 1
x
P [X = x]
4
0
I
0
0.2 0.8
= 0.41
4
1
P
1
0.2 0.8
= 0.41
4
2
Q
2
0.2 0.8
= 0.15
4
3
R
3
0.2 0.8
= 0.03
4
4
0.24 0.80
= 0.00
Ejemplo.
me loholF odrmos pensr que se trt de un vFF on distriuin B (7, p)D donde p =
nmero medio de das de consumo
u
c
7
IF uede drse el efecto resacaD es deirD si se onsume muho un dD huir del lohol l d siguienteY o
el efeto inverso un clavo quita otro clavo Y o FFFY en de(nitivD irunstnis que rompn l hiptesis
de independeni en el onsumo en ds distintosF
PF ist lro que l proilidd de onsumir un mrtes no esD en generlD l mism que un sdoF
mpoo todos los jvenes tienen l mism proilidd de onsumir lohol un d ulquierF
Ejemplo.
niiones stnte imperfetoF or estudios previosD estim que l proilidd de que un dgito se
trnsmit inorretmente es del PH 7F il ingeniero env un mensje de R dgitos y se pregunt untos
se reiirn inorretmenteF
hesde el punto de vist estdstio nosotros no podemos responder es preguntF in reliddD ndie
puede responder es pregunt on ertezD porque existe inertidumre ltente en ellX el zr deterE
minr untos dgitos se ruznF vo que s podemos her es filitrle el grdo de ertezD es deirD l
proiliddD de d uno de los posiles resultdosF
gonretmenteD si nlizmos l vrile X X
teniendo
en uent que el ensyo de d envo de d dgito se hr de form independiente y que nos h diho
que l proilidd de que un dgito se rei inorretmente es HFPD podemos (rmr que un modelo de
proilidd deudo pr dih vrile es un distriuin B(4, 0.2)F ist distriuin nos permite
lulr l proilidd de que se ruen HD ID PD Q o R de los dgitosF vo esquemtizmos en l tl
djuntF istos los resultdosD deemos deirle l ingeniero que es hrtmente improle que le fllen
los R dgitosD pero que tiene un proilidd @ver gudro RFIA de
67
distribucin
x
, x = 0, 1, 2, ...
x!
e X P ()F intones
EX =
V arX = .
tiempo donde los xitos onteen rzn de vees por unidd de tiempo @en promedioA y de form
independienteF in ese so
independencia de ls reliziones y
el promedio
Ejemplo. v distriuin de oisson suele utilizrse omo modelo pr el nmero de identes ourridos
en los individuos de un polin lo lrgo de un periodo de tiempoF vo que muh gente no termin
de sumir es que her es suposiin equivle deir que todos esos individuos tienen el mismo riesgo
de tener un idente y que el heho de que un individuo teng un idente no modi( pr nd l
proilidd de sufrir un nuevo identeF is evidente que en muhs situiones de l vid rel eso no
es iertoD s que el modelo no ser deudo en ellsF
Ejemplo. ytr pliin muy omn de l distriuin de oisson es l nmero de prtuls por unidd
de volumen en un )uido undo un disoluin est relmente ien disueltF in so de que los dtos
indiquen que l distriuin de oisson no es deudD podrmos de heho inferir que l disoluin no
est ien disueltF
Ejemplo.
oisson es en el mito del nmero de soliitudes de serviio un servidorF or ejemploD se suele onsiderr
que el n de llmds un entrlit o el n de onexiones un servidor sigue un distriuin de oissonF
68
in emrgoD hy que deir que unque este uso de l distriuin de oisson es muy omnD es evidente
que l hiptesis de que el promedio dee ser onstnteD no se d en ests pliionesD y que uno de
los fenmenos ms onoidos en teleomuniiones es el de la
hora cargada X
no es el mismo promedio de
llmds el que se produe ls IP del mediod que ls Q de l mnF vo que se suele her es plir
uno de los prinipios ms importntes unque menos esritos de l ingenierD l ley de wurphy @si
puede ir mal, preprate para ello, porque en algun momento ir mal AX
algo
sD ls redes de teleomuniiones
suelen dimensionrse pr ser pes de funionr en el peor de los esenrios posilesD es deirD undo
el promedio de soliitudes es el que se d en l hor rgdF
xito,
ediionlmenteD supongmos que el experimento se repite un grn nmero de veesD es deirD n es grnde y
que el xito es un sueso rroD es deirD p es pequeoD siendo el promedio de ourrenisD = npF in ese soD
l vrile letori X que mide el nmero de xitos sigue @proximdmenteA un P ()F
in est segund rterizin se suele onsiderr eptle l proximin si n > 20 y p < 0.05. i
n > 100D l proximin es generlmente exelente siempre y undo np < 10F ry que tener en uent que
pr esos vlores de los prmetrosD l distriuin inomil tendr stntes prolems pr ser omputdD
y que se exigirD entre otros lulosD el lulo de n! pr un vlor de n ltoD por lo que l proximin
es muy tilF
Ejemplo.
generdores de grn tmoF i l proilidd de que ulquier de ellos flle durnte el o en urso
es de
1
1200 D
a.
b.
0, 1, 2, 3, ...., 3840F
in prinipioD X B (3840, 1/1200) , pero ddo que n es muy grnde y p muy pequeoD podemos
onsiderr que X P (3.2)F or tntoD
P [X = 4] =
e3.2 3.24
= 0.178 09
4!
or su prteD
P [X > 1] = 1 P [X = 0, 1] = 1
e3.2 3.20
e3.2 3.21
= 0.828 80
0!
1!
69
0.4
P(1)
0.3
0.2
0.1
0
5
10
15
20
25
0.2
P(5)
0.15
0.1
0.05
0
5
10
15
20
25
0.2
P(10)
0.15
0.1
0.05
0
5
10
15
20
25
distribucin
f (x) = p (1 p) , pr x = 0, 1, 2, ...
e X Geo (p)F intonesD
1p
p
1p
V arX =
.
p2
EX =
que ourre on proilidd onstnte pF in ese soD l vrile letori X que uent el nmero de
70
0.4
Geo(0.25)
0.3
0.2
0.1
0
5
10
15
20
25
0.8
Geo(0.5)
0.6
0.4
0.2
0
5
10
15
20
25
0.8
Geo(0.75)
0.6
0.4
0.2
0
5
10
15
20
25
Ejemplo. iguiendo on un ejemplo nteriorD sore el ingeniero que env dgitos trvs de un nl
imperfetoD hor se plnte untos dgitos se reiirn orretmente hst que uno se rueD siendo
que l proilidd de que uno ulquier lo hg es de HFPF
v vrile de inters hor es Y X n
ist
vrile tiene omo modelo de proilidd un distriuin Geo(0.2)F qris este modeloD podemos
deirleD por ejemploD que l proilidd de que enve ien dos y que flle el terero es de
f (x) =
donde (x) =
distribucin
(a + x)
x
pa (1 p) pr x = 0, 1, 2, ...
(a) (x + 1)
71
1p
p
1p
V arX = a 2
p
EX = a
xito,
que ourre
on proilidd onstnte pF in ese soD l vrile letori X que uent el nmero de frsos hst
que ourre el
k-simo
xito sigue un BN (k, p)F in este soD demsD y ddo que (r) = (r 1)! si r es un
enteroD
f (x) =
(k + x 1)! k
x
p (1 p) pr x = 0, 1, 2, ...
(k 1)!x!
k+x1
k1
pk (1 p)
pr x = 0, 1, 2, ...
n
i=1
es un enteroF
a Podemos quedarnos por ahora con la idea de que v.a. independientes son aquellas tales que el resultado de cualquiera de
ellas no afecta al resto.
Ejemplo.
toD untos dgitos se trnsmitirn orretmente hst que dos lo hgn inorretmentec he nuevo
tenemos que sumir que no hy un respuest pr estoD pero s podemos onsiderr un modelo de
proilidd pr ello que nos yude tomr deisionesF
e Z X
BN (2, 0.2)F qris este modeloD podemos deirle l ingenieroD por ejemploD que l proilidd de
que se le ruen P dgitos on IH o menos envos es
8
P [Z 8] =
P [Z = z] =
z=0
72
(2 + z 1)! 2 z
0.2 0.8 = 0.62
(2 1)!z!
z=0
0.1
0.06
BN(2.5,0.25)
BN(5,0.25)
0.04
0.05
0.02
0
10
10
20
30
0
10
40
0.4
10
20
30
40
0.2
BN(2.5,0.5)
BN(5,0.5)
0.3
0.15
0.2
0.1
0.1
0.05
0
10
10
20
30
40
0.8
0
10
10
20
30
40
0.4
BN(2.5,0.75)
BN(5,0.75)
0.6
0.3
0.4
0.2
0.2
0.1
0
10
10
20
30
40
0
10
10
20
30
40
continua
4.4.2. Histograma
ry un difereni fundmentl entre ls vriles disrets y ls ontinusX en ls disrets podemosD l
menosD numerr los posiles vlores y ontr el nmero de vees que sle d vlor posile en un muestrF
in emrgoD por el rter que tienen los intervlos de nmeros relesD por muy grnde que fuer l muestr
Prof. Dr. Antonio Jos Sez Castillo
73
0.2
0.4
Densidad
0.4
0.0
0.0
0.2
Densidad
0.6
0.6
0.8
0.8
74
histogrm ms preido l de l dereh de l pigur RFTF in lD de nuevoD si queremosD por ejemploD lulr
P [a < X < b] ,
deermos sumr ls res de ls rrs que formn el intervlo (a, b)D si es que hy intervlos que formnD
extmenteD el intervlo (a, b) .
ero si el tmo de l muestr es lo su(ientemente mplio pr poder
pasar al lmite
y enontrr un
funin rel de vrile rel f (x) que represente l lne que de(ne el histogrmD lulr un proilidd
del tipo P [a < X < b] sumndo ls res de ls rrs de los intervlos in(nitesimles que formn el intervlo
P [a < X < b] =
f (x) dx.
a
que pr ulesquier a, b R o a, b = D
P [a < X < b] =
f (x) dx
a
Nota.
hdo que efetos del lulo de integrles un punto no fet l resultdo de l integrlD si
P [a < X < b] =
f (x) ,
a
P [a X < b] =
f (x) ,
a
P [a < X b] =
f (x) ,
a
P [a X b] =
f (x) .
a
iste heho pone de mni(esto que los vlores onretos de un vrile letori ontinu no tienen
ms de proiliddD y que
x0
P [X = x0 ] =
f (x) dx = 0,
x0
pero s tienen densidd de proiliddD f (x0 )F ist densidd de proilidd represent l proilidd
de los intervlos in(nitesimles de vlores lrededor de x0 F esD unque P [X = x0 ] = 0D si f (x0 ) tom
un vlor ltoD querr deir que los vlores lrededor de x0 son muy prolesF
75
IF f (x) 0 pr todo x R.
PF
f (x) = 1.
P [X B] =
f (x) dx.
B
omo
F (x) = P [X x] =
f (t) dt.
Ejemplo.
1=
f (x) dx =
f (x) dx +
c exp (ax) dx +
f (x) dx
0
c exp (ax) dx =
0
2c
,
a
F (x) =
f (t) dt =
or ltimoD P [X 0] =
1 ax
si x < 0
2e
1
1eax
si x
2 +
2
f (x) dx = 1 .
2
76
0 si x < 0
x si 0 x < 1 .
1 si x 1
f (x) = F (x) =
1 si 0 x 1
0 en otro so
qr(menteD ms funiones preen en l pigur RFVF in est vrileD todos los puntos tienen l
mism densidd de proiliddD indindo que todos los intervlos de l mism longitudD dentro de
versin muestral.
gonretmenteD si tenemos un vrile letori X y un muestr suy de tmo N, (x1 , ..., xN ) , l funcin
SN (x) =
nmero de valores x
u
.
N
ist funin se utiliz pr proximrse l funin de distriuinD y que pr un grn nmero de vloresD
Prof. Dr. Antonio Jos Sez Castillo
77
l SN (x) = F (x) ,
m
pr d xF
F (x) =
0 si x < 0
x si x [0, 1] .
1 si x > 1
in l pigur RFW hemos representdo dos funiones de distriuin empris soids sends muestrs
de tmo N = 10 @izquierdA y N = 100 @derehAF
ysrvese que undo ument el tmo de l muestr @N AD l funin de distriuin empri se
pree d vez ms l funin de distriuinF
x f (x)dxF
EX =
v interpretin de l medi de un vFF ontinu esD de nuevoD l de un vlor entrl lrededor del que se
dn el onjunto de reliziones de l vFF ytr interpretin es l de
78
fX (x) =
si x1 x x2
0 en otro so
glulemos su mediX
x2
EX =
x1
1
dx
x2 x1
x2
1
x2 x1
2
x2
=
x1
1 x2 x2
1
2
2 x2 x1
1 (x2 x1 ) (x2 + x1 )
1
= (x1 + x2 ) ,
=
2
x2 x1
2
es deirD el punto medio del intervlo [x1 , x2 ]F
ex si x 0
0 en otro so
79
glulemos su mediX
x ex dx
EX =
0
u=x
dv = ex dx
=
1
= 0 + ex
x ex
ex dx
+
0
1
= .
mos introduir hor el onepto de vrinz de un vFF ontinuD que de nuevo se interpret omo un
medid de l onentrin de los vlores de l vFF en torno su mediF
e un vFF X F e de(ne su
(X EX)
v rz udrd de l vrinzD =
desviacin tpicaF
V ar [X] = E (X EX)
= E X 2 2X EX + (EX)
2
= E X 2 2 EX EX + (EX) = E X 2 (EX) .
gomo se oment nteriormenteD l interpretin de l vrinz es l de un promedio que mide l distni
de los vlores de l vrile l medi de stF i l vrinz es pequeD indi un lt onentrin de
los vlores de l vrile en torno l mediY y vieversD si l vrinz es grndeD indi lt dispersin de
los vlores de l vrile respeto de l mediF
E X
1
x2 x1
0 en otro so
x2
x2
=
x1
si x1 x x2
1
1 x3 x3
2
1
dx =
x2 x1
3 x2 x1
x2 + x1 x2 + x2
1
= 2
.
3
80
EX =
x1 + x2
,
2
por tntoD
V ar [X] = E X 2 EX 2
2
(x1 + x2 )
(x2 x1 )
x2 + x1 x2 + x2
2
1
=
.
3
4
12
E [aX + b] = aE [X] + b
V ar [aX + b] = a2 V arX
Nota. i tenemos un olein de vriles letoris independientesD es deirD que son oservds sin
que ningun de ells pued in)uir sore ls otrsD es muy til plnterse en osiones por l medi y l
vrinz de l sum de tods ellsF
mos onsiderr ls vriles X1 , ..., Xn D que pueden ser disrets o ontinusF ues ienD se tiene que
l medi de l sum es l sum de ls medis y que l vrinz de l sum es l sum de ls vrinzsY
81
es deirD
uniforme entre x1 y x2
f (x) =
1
x2 x1
si x1 < x < x2
0 en otro so
e X U (x1 , x2 )F intones
x1 + x2
2
2
(x2 x1 )
V arX =
.
12
EX =
82
e X un vFF ontinu que puede tomr vlores x 0F e die que X sigue un distribucin
exponencial
ex si x 0
.
0 en otro so
f (x) =
1 ex si x 0
.
0 en otro so
F (x) = P [X x] =
e X exp ()F intonesD
1
V arX = 2 .
EX =
15e15t dt = e15/6 .
P [T > 10/60] =
1/6
Ejemplo.
2.5e2.5x dx = e5
P [T > 2] =
2
83
o ien
propiedad de no
P [X > t + s X > s]
P [X > t + s]
=
P [X > s]
P [X > s]
e(s+t)
= et = P [X > t]
es
Ejemplo. il tiempo de vidD T D de un iruitoD sigue un distriuin exponenil de medi dos osF
glulemos l proilidd de que un iruito dure ms de tres osX
1
P [T > 3] = e 2 3
upongmos que un iruito llev S os funionndoD y que nos plntemos l proilidd de que n
funione Q os msF egn l propiedd de no memoriD es proilidd es l mism que si el iruito
r de omenzr funionrD es deirD
1
distribucin Gamma de
f (x) =
donde (x) =
(x)
ex
u (x) ,
(a)
84
1
exp(1)
0.5
10
12
14
16
18
20
0.2
exp(5)
0.15
0.1
0.05
0
10
12
14
16
18
20
0.1
exp(10)
0.05
10
12
14
16
18
20
Gamma
r 1
2, 2
F ist distriuin se utilizD por ejemploD pr evlur l ondd del juste de un distriuin
a
V arX = 2 .
EX =
k + rD T D es un vFF que sigue un Gamma (r, )F hdo que r es un enteroD en relidd es un Erlang (r, )F
n
i=1
85
0.00
0.10
0.20
Gamma(2.5,1)
10
15
20
25
30
0.00
0.02
0.04
Gamma(2.5,0.2)
10
15
20
25
10
15
20
25
10
15
10
15
0.020
0.010
0.000
Gamma(2.5,0.1)
20
25
30
Gamma(5,0.2)
30
0.030
0.06
Gamma(5,1)
20
25
30
Gamma(5,0.1)
30
10
15
20
25
30
1
2 2
exp
(x )
2 2
pr todo x R.
ysrvese que es l ni distriuin que hemos visto hst hor que tom todos los vlores entre y
+F
e X N (, )F intones
EX =
V arX = 2 .
il propio nomre de l distriuin normal indi su freuente uso en ulquier mito ient(o y tenolgioF
iste uso tn extendido se justi( por l freueni o normlidd on l que iertos fenmenos tienden
preerse en su omportmiento est distriuinD y que muhs vriles letoris ontinus presentn
un funin de densidd uy gr( tiene form de mpnF istoD su vezD es deido que hy muhs
vriles soids fenmenos nturles uys rterstis son omptiles on el modelo letorio que
supone el modelo de l normlX
grteres morfolgios de individuos @personsD nimlesD plntsD FFFA de un espeie @tllsD pesosD
envergdursD dimetrosD permetrosD FFFAF
86
0.4
0.1
N(0,4)
N(0,1)
0.3
0.2
0.05
0.1
0
10
10
0.4
0
10
10
0.1
N(1,1)
N(1,4)
0.3
0.2
0.05
0.1
0
10
10
0.4
0
10
10
0.1
N(1,1)
N(1,4)
0.3
0.2
0.05
0.1
0
10
10
0
10
10
87
e X N (, )F intonesD
Z=
propiedd que suele onoerse omo
X
N (0, 1) ,
tipicacin de la normal.
ist onoid propiedd tiene un pliin prti muy usulF hds ls rterstis de l densidd
gussinD no es posile lulr proiliddes soids l norml de form extD y que ls integrles
del tipo
1
2 2
exp
(x )
2 2
dx
no pueden ser expresds en trminos de ls funiones usulesD y slo pueden lulrse por mtodos nuE
mriosF xo ostnteD existen tls donde preen multitud de vlores de l funin de distriuin de l
distriuin N (0, 1) y prtir de ellos se pueden lulr otrs tnts proiliddesD utilizndo l propiedd
de tipi(inF or ejemploD si queremos lulr l proilidd de que un vrile X N (, ) est en
el intervlo [a, b]D tenemos
P [a X b] = P
a
X
b
= FZ
FZ
donde FZ () es l funin de distriuin de un vrile Z N (0, 1)D que puede evlurse medinte el uso
de tlsF mos verlo en un ejemploF
P [X > 76.25] = P
76.25 65.6
X 65.6
>
11.7
11.7
P [X < 60] = P
X 65.6
60 65.6
<
11.7
11.7
P [60 < X < 76.25] = P [X < 76.25] P [X < 60] = 0.819 (1 0.684)
88
RF gunto pesr quel vrn tl que un S 7 de vrones de ese oletivo pesn ms que lc is deirD
ul ser el vlor de x tl que P [X > x] = 0.05 oD equivlentementeD P [X < x] = 0.95F hdo que
P [X < x] = P
x 65.6
x 65.6
X 65.6
<
=P Z<
11.7
11.7
11.7
x65.6
11.7
89
pigur RFIRX fsqued de vlores z en l tl de l N (0, 1)F lor de Z que dej l dereh un proilidd
de HFWS
de proiliddD distriuin de medi X y desviin tpi X F in ese soD l sum de ests vriles
sigue proximdmente un distriuin norml undo N es elevdoD es deirD
N
Xi N N X , N X .
i=1
Xi N X
N (0, 1) .
N X
iste teorem es el que proporion un justi(in mtemti del porqu l distriuin gussin es un
modelo deudo pr un grn nmero de fenmenos reles en donde l vFF oservd en un momento ddo
es el resultdo de sumr un grn nmero de suesos letorios elementlesF
N
i=1
Xi N 0.5N,
N
12
el siguiente experimentoX
r N = 1, 2, 5 y 10D se h simuldo un muestr de IHHHH dtos de
90
N
i=1
Xi D diujndo su histogrm
140
250
N=1
N=2
120
200
100
80
150
60
100
40
50
20
0
0.2
0.4
0.6
0.8
300
0.5
1.5
350
N=5
N=10
300
250
250
200
200
150
150
100
100
50
0
50
0
10
en d soF istos histogrms preen en l pigur RFISF in ell se pone de mni(esto omo segn
inunindo el eorem gentrl del vmite en trminos de l mediD X D de ls vriles X1 , ..., XN D podemos
deir que si N es grndeD
X N (, / N )
91
Ejemplo. n ingeniero dise un prto de medid que reliz un proximin ms impreis que
el prto trdiionl pero muho ms rtF r reduir el mrgen de error de l medid relizdD
el ingeniero propondr que se relien un nmero determindo de medids sore el mismo ojeto y que
se onsidere l medi de ests medids omo vlor (nl de l medid del ojetoF
sniilmenteD el ingeniero he un vlorin que le llev onluir que el prto est ien lirdoD
es deirD que l medi de l medid del prto oinide on l medid relD y que l desviin tpi
de ls medids del prto es igul HFUSF
gunts medids dee proponer el ingeniero pr que el error de medid se inferior HFI on un WS 7
de proiliddc
impeemos onsiderndo que d medidD Xi D tiene omo medi el verddero vlor de l medid del
n
X
ojetoD x0 D y desviin tpi HFUSF or su prteD l medid (nl ser X = i=1 i D donde relmente nos
n
interes onoer el vlor de nF r elloD tengmos en uent que se nos pide que
0.1 n
0.1 n
0.1 n
.
=12 1P Z <
0.75
i queremos que P
0.1 n
0.75
0.975D de donde
0.1 n
0.75
1.96 y
entonesD n 216.09F
gomo onlusinD ms le vle l ingeniero disminuir l desviin tpi del prto de medidF
grosso modoD
cuantil
sntesis de ellsF
f (x) p.
xi x
92
xtese queD l ser l vrile disretD puede que no logremos otener un iguldd del tipo
xi x
f (x) =
pF
i l vrile es ontinuD Qp s puede otenerse omo el vlor x tl que
f (t) dt = p,
hesde luegoD lo ms importnte es que interpretemos qu signi( el until p de un vFF gomo en istdsti
hesriptivD se re(ere l vlor de l vrile que dej por dejo de s un proporin p de vlores de l vrileF
intonesD si un vlor onreto orresponde on un until
altoD
alto
duracin media
in segundo lugrD ddo que tenemos que proponer un modelo de distriuin de proilidd pr l duE
rin de l lmprD vmos onsiderr el ms senillo que suele emplerse en este tipo de pliionesX
l distriuin exponenilF ist hiptesis tmin podr ser disutidD pero otros modelos ms omplejosD
omo l distriuin eiullD omplirn stnte nuestros lulos queD por otr prteD tienen slo (nes
ilustrtivosF
or tntoD vmos suponer que l durin de l omill es un vrile letoriD DD on distriuin
exponenil de medi V os yD por tntoD on prmetro = 1/8F ehor que y tenemos un modelo
proilstio podemos plnternos muhs ossX
is muy prole que l lmpr lne su vid medic
P [D > 8] =
8
1 x
e 8 dx = e8/8 = 0.3678794.
8
ysrvese que eso es lgo que ourrir on ulquier exponenilX l proilidd de que se supere l
medi es slo del QTFUW 7F hiho de otr formD l medi es el perentil TQ proximdmenteD lo que
impli que slo el QU 7 proximdmente de ls lmprs supern su vid mediFFF sorprendentec
Prof. Dr. Antonio Jos Sez Castillo
93
1 eM e = 0.5,
que result ser M e =
log0.5
cmo estF
st on que me dig unto pes y mide mi hijo o mi hijD sino que me dig unto pes y unto mide en
relin on los nios o nis de su mism eddF in es uestin es dnde entrn los perentilesF
in este so jugmos on l ventj de que se hn heho multitud de estudios previos que determinn que
tnto el peso omo l ltur son vriles que siguen un distriuin normlF ws nD se hn determindo
ls medis y ls desviiones tpis de nios y nis desde los H meses hst l edd dultF
mos ponernos en un situin onretD entrndonos en el pesoF engo un hijo de tres meses que pes
SFT kilosF v pregunt es
se por estudios
previos2
in ulquier soD
il peditr
posiin se sit el peso de mi hijoD SFT kilosD dentro de es distriuinF i X es el pesoD ddo que
P [X 5.6] = 0.369,
el peditr me dir que mi hijo est en el perentil QUD lo que quiere deir que es un peln jo de pesoD pero
dentro de niveles rzonlesF
2 Fuente:
94
http://www.familia.cl/salud/curvas_de_crecimiento/curvas_de_crecimiento.htm
Prof. Dr. Antonio Jos Sez Castillo
95
96
Captulo 5
Variables aleatorias con distribucin
conjunta
Resumen. in el estudio de ls vriles letoris hemos psdo por lto el heho de que un onjunto de
dos o ms vriles puede verse fetdo por un serie de reliones entre ellsF il nlisis desde el punto
de vist estdstio de ests reliones es el ojetivo de este ptuloF gomo so espeilD desriiremos de
form detlld el modelo que pr ests reliones proporion l distriuin norml multivrinte
Palabras clave: distriuin onjuntD distriuin mrginlD distriuin ondiiondD ovrinzD oe(E
iente de orrelinD norml multivrinteF
5.1. Introduccin
il mundo rel est repleto de reliones todos los nivelesF xosotrosD por rzones ovisD estremos intereE
sdos priniplmente en ls reliones que fetn vriles que desrien fenmenos propios del miente
ient(oEtenolgioF ists reliones pueden tener muy diverss tipologisF or ejemploD podrmos pensr
en reliones usEefetoD omo l queD por ejemploD explir que un pgin e teng un tmo onE
siderle
debido
que llev inrustdo vrios rhivos de vdeo y udioD o l que se estlee entre l edd
en os de un vestigio y su ontenido en rono IR1 F ero no slo tendremos reliones usEefetoX por
ejemploD semos que el peso y l esttur de un ser humno son vriles muy reliondsD hst el punto
que no podemos deir que un person este oes slo on ser su pesoD sino que deemos vlorrlo
relacin a
en
su estturF
or otr prteD undo un fenmeno es determinstio y est ien estudidoD ls reliones entre vriles
son leyes ms o menos senillsD peroD en ulquier soD son inmutlesF or ejemploD
densidad =
1 Relacin
masa
.
vol.
WU
eroD qu ourre undo el fenmeno es letorioc vs vriles en ese so son letoris y ls reliones que
se puedn dr entre ells no siempre tienen por qu oedeer un ley ojetiv e inmovileF or ejemploD
todos somos onsientes de queD omo demosD existe un relin entre el peso y l ltur de un personD
pero no existe un
razn de conversin
evidente que el tiempo de desrg de un pgin we estr reliondo on el tmo de los rhivos que
l on(gurnD pero mo de
evidente c
X1
F
F
F
XN
es un
rlremos de
vectores mixtosD
pero su trtmiento
Ejemplo. gonsideremos el vlor de un sel nlgi que depende del tiempoD x (t)F in est notinD
entendemos que el vlor de l sel podr ser distinto en d instnte de tiempo tF is muy freuente
que l sel se oserve relmente ontmind por un ruido letorio que tmin depender del tiempoD
x (t1 ) + N (t1 )
F
F
x (tn ) + N (tn )
es un vetor letorioF
Ejemplo. e estudi el tiempo que un usurio de snternet dedi ver un pgin if (T ) en relin
on vriles omo l ntidd de texto que ontiene (T x)D el nmero de imgenes (I) y nimiones
plsh (F ) de l pginF intonesD el vetor
Tx
es un vetor letorioF
98
T1
F
F
F
Tn
es un vetor letorioF
se reprte l proilidd entre todos los posiles resultdos del vetorF r desriirl vmos de(nir los
oneptos de funin de densidd o funin ms nlogos los soidos un vrile letoriF
e (X1 , ..., XN ) un vetor letorio disretoF intonesD se de(ne su
es un funin tl que
P (X1 , ..., XN ) A RN =
...
ARN
99
or elloD
x
x y
ce
1=
0
cex 1 ex dx =
dy dx =
c
,
2
de donde c = 2F
in segundo lugrD por ejemploD lulemos
1y
2ex ey dxdy
P [X + Y 1] =
y
2ey ey e(1y) dy
=
0
1 2e + e2
.
e2
si 0 x 3, 0 y 5
0 en otro so
ist densidd onstnte en el retngulo de(nido indi que l distriuin de proilidd es uniforme
en diho retnguloF mos lulr l proilidd de que Y se myor que X @ver pigur SFPA
P [Y > X] =
0
1
dy dx
15
5x
=
dx
15
0
x x2 3 7
=
| =
.
3
30 0 10
100
distribucin marginalF
e (X1 , ..., XN ) un vetor letorio y (Xi1 , ..., Xik ) un suvetor de vriles suyoF in ese soX
i el vetor es ontinuoD
...
xj (xi1 ,...,xik )
/
dxj .
xj (xi1 ,...,xik )
/
i el vetor es disretoD
(x, y) = x ex(y+1)
pr x, y > 0F
v funin de densidd mrginl de X D
fX (x) =
xex(y+1) dy = ex
fX,Y (x, y) dy =
0
pr x > 0F
enlogmenteD l funin de densidd mrginl de Y D
xex(y+1) dx =
fX,Y (x, y) dx =
fY (y) =
1
(1 + y)
pr y > 0F
101
Ejemplo. gonsideremos dos vriles disretsD Q y GD uy funin msD fQ,G (q, g) , viene dd por
fQ,G (q, g)
g=0
g=1
g=2
g=3
q=0
0.06
0.18
0.24
0.12 .
q=1
0.04
0.12
0.16
0.08
fQ (q) =
fQ,G (q, g)
g
=
y
0.06 + 0.04
0.18 + 0.12
fG (g) =
0.24 + 0.16
0.12 + 0.08
si g = 0
si g = 1
si g = 2
si g = 3
fX,Y (x, y) =
si 0 x 3, 0 y 5
0 en otro so
fX (x) =
=
102
fX,Y (x, y) dy
5 1
dy si 0 x
0 15
0 en otro so
1
3
si 0 x 3
0 en otro so
fY (y) =
fX,Y (x, y) dx
3 1
dx si 0 y
0 15
0 en otro so
1
5
si 0 y 5
0 en otro so
e Y es
2x si 0 x 1, |y| < x2
fX,Y (x, y) =
0 en otro so
glulemos ms mrginlesX
fX (x) =
fX,Y (x, y) dy
x2
x2
0 en otro so
4x3 si 0 x 1
0 en otro so
fY (y) =
fX,Y (x, y) dx
2xdy si 0 x 1
|y|
2xdx si 1 y 1
0 en otro so
1 |y| si 1 y 1
0 en otro so
103
condicionadasD segn
fXi1 ,...,Xik ,Xj1 ,...,Xjl (xi1 , ..., xik , xj1 , ..., xjl )
fXj1 ,...,Xjl (xj1 , ..., xjl )
donde fXi1 ,...,Xik ,Xj1 ,...,Xjl (xi1 , ..., xik , xj1 , ..., xjl ) es l funin ms o l funin de densidd onjunt de
ls vriles Xi1 , ..., Xik , Xj1 , ..., Xjl y fXj1 ,...,Xjl (xj1 , ..., xjl ) es l funin ms o l funin de densidd
onjunt de ls vriles Xj1 , ..., Xjl F
in el so ms hitul en el que el vetor teng dimensin dosD tenemos l densidd o l funin ms de
X ondiiond Y = y,
fX|Y =y (x) =
fX,Y (x, y)
fY (y)
fY |X=x (y) =
Ejemplo. en ls vriles X
fX,Y (x, y)
.
fX (x)
QGPV
WGPV
QGPV
QGIR
QGIR
IGPV
vs mrginles son
fX (x) =
3
3
1
28 + 14 + 28 si x = 0
9
3
28 + 14 + 0 si x = 1
3
28 + 0 + 0 si x = 2
fY (y) =
3
9
3
28 + 28 + 28 si y = 0
3
3
14 + 14 + 0 si y = 1
1
28 + 0 + 0 si y = 2
Y = 1 y l de Y ondiiond X = 1.
fX|Y =1 (x) =
fY |X=1 (y) =
104
3
14
6
14
3
14
6
14
si x = 0
si x = 2
6
14
9
28
15
28
3
14
15
28
0
15
28
si x = 1 .
si y = 0
si x = 1 .
si x = 2
Prof. Dr. Antonio Jos Sez Castillo
gomo es evidenteD un vez que tenemos rterizd l distriuin ondiiond de un vrile letori
l vlor de otrD ulquier rtersti de dih distriuinD omo l medi o l vrinzD puede lulrse
prtir de su funin ms o su funin de densiddF
EjemploF l y omo plntemos l omienzo del ptuloD supongmos que l posiin (X, Y ) de un
telfono mvil que reie oertur de un nten de telefon se enuentr dentro de un rulo de rdio
r lrededor de es ntenD que supondremos sin prdid de generlidd que se enuentr en el origen
del plnoF mos suponer que es posiin es
completamente al azar
onsiderr que l densidd onjunt dee ser onstnte en el ruloY pr que su integrl se l uniddD
es evidente que
fX,Y (x, y) =
1
r2
si x2 + y 2 r2 y ero en ulquier punto fuer del ruloF mos ver qu podemos verigur sore ls
oordends X e Y por seprdo @mrginlesA y sore mo fetn l un l otr @ondiiondsAF
in primer lugrD
fX (x) =
r 2 x2
r 2 x2
2 r 2 x2
1
dy =
r2
r2
fY (y) =
r2 y2
r2
si r < y < rF ist lro que pr d oordend por seprdoD los puntos ms
densosD ms probablesD
2
r 2 y0 < x <
r 2 x2 < y <
0
1
r2
2
y0
2
r2 y0 F enlogmenteD
fY |X=x0 (y) =
si
fX,Y (x, y0 )
=
fY (y0 )
2
fX,Y (x0 , y)
=
fX (x0 )
2
1
r 2 x2
0
105
hitul utilizdo en telefonD X e Y son vriles letoris ontinus on densidd onjunt dd por
2 ey si 0 x < y
fX,Y (x, y) =
0 en otro so
2 ey dy = ex si 0 x,
fX (x) =
x
2 ey dx = 2 yey si y 0F
fY (y) =
0
fY /X=x (y) =
fX,Y (x, y)
= e(yx) si y > x.
fX (x)
fX/Y =y (x) =
1
fX,Y (x, y)
= si 0 x < y.
fY (y)
y
is deirD onoido el instnte en que lleg l segund llmd (y)D no se se nd de undo lleg
l primer llmdD y que l distriuin de X ondiiond Y = y es uniforme en (0, y)F
fX (x) =
106
1
2 si x = 1
1
2 si x = 1
fY (y) =
1
2 si y = 1
1
2 si y = 1
fY |X=+1 (y) =
0.95 si y = 1
0.05 si y = 1
fY |X=1 (y) =
0.95 si y = 1
0.05 si y = 1
fX,Y (x, y) = P [Y = y | X = x] P [X = x]
=
0.05 0.5 si x = 1, y = +1
0.95 0.5 si x = 1, y = 1
0
en otro caso
v distriuin de X ondiiond l sueso Y = +1 viene dd por
0.95 si x = 1
.
0.05 si x = 1
fX|Y =1 (x) =
fX,Y (x, 1)
=
fY (1)
0.05 si x = 1
0.95 si x = 1
107
donde fX,Y ()D fX () y fY () son funin de densidd o funin msD dependiendo de si ls vriles son
disrets o ontinusF
v interpretin del heho de que dos vriles letoris sen estdstimente independientes es que el
omportmiento de un no tiene ningn efeto sore l otr y vieversF ge preguntrse en ese soD qu
sentido tiene un distriuin ondiiond de un vrile otr que no gurd ningun relin on ellF
mos omprorlo lulndo ls distriuiones ondiionds de vriles letoris estdstimente
independientesX
fX|Y =y (x) =
fX (x) fY (y)
fX,Y (x, y)
=
= fX (x) ;
fY (y)
fY (y)
es deirD el omportmiento letorio de un vrile letori ondiiond l vlor de otr que es estdsE
timente independiente de ell @desrito medinte l funin fX|Y =y (x)A es ompletmente igul que si no
se ondiion diho vlor @desrito por l funin fX (x)AF
24xy si x, y 0 y x + y 1
0 en otro so
1x
24xy dy = 12x (1 x) si 0 x 1
fX (x) =
0
1y
24xy dx = 12y (1 y) si 0 y 1.
fY (y) =
0
gomo
108
4xy si 0 x, y y x, y 1
0 en otro so
4xy dy = 2x si 0 x 1
fX (x) =
0
4xy dx = 2y si 0 y 1.
fY (y) =
0
gomo
Ejemplo. upongmos que dos omponentes eletrnis tienen un durin uy distriuin de proE
ilidd puede onsiderrse exponenil de prmetro = 2 horas1 F vs omponentes funionn en
prleloD por lo que podemos onsiderr que son independientesF or lo tntoD su funin de densidd
onjunt ser
2x
4e2(x+y) dydx
P [X + Y < 2] =
0
0
2
2e2x 1 e2(2x)
dx
2e2x 2e4 dx
=
0
= 1 e4 2e4 2
= 1 5e4
he l interpretin que hemos ddo de vriles independientes se sigue de mner inmedit que si dos
vriles letoris son independientesD esto esD no mntienen ningun relinD tmpoo lo hrn funiones
Prof. Dr. Antonio Jos Sez Castillo
109
suysF iste heho se reoge en el siguiente resultdoF vo podemos enunir ms formlmente diiendo que si
de convolucinF
fY (y) fX (w y) dy
fW (w) =
= fX fY (w)
donde fX y fY son ls funiones de densidd de X e Y D respetivmenteF
i X e Y son disretsD
fY (y) fX (w y)
fW (w) =
y
= fX fY (w)
donde fX y fY son ls funiones ms de X e Y D respetivmenteF
Ejemplo.
fTi (x) = ex , i = 1, 2,
pr x > 0F or tntoD
ex e(zx) dx = 2 zez
fT (z) =
0
in el so de que en vez de dos vriles letoris se teng un vetor X = (X1 , ..., XN ) D l mner nturl
de extender el onepto de independeni es inmeditF
110
componentes independientes si
independientes si
E [g (X1 , ..., XN )] =
...
donde fX1 ,...,XN (x1 , ..., xN ) es l funin de densidd o l funin ms del vetor letorio @entendiendo en
este ltimo so l integrl omo un sumAF
gomo onseueni inmedit de est de(niinD tenemos un primer e importnte propieddX este operdor
espernz multivrinte tmin es linelD en el sentido que se reoge en el siguiente resultdoF
gonretmenteD podemos formlizrlo diiendo que si tenemos un vetor letorio (X1 , ..., XN ) y 1 , ..., N
eslres ulesquierD entones
parte
111
correlacin entre X
e Y omo
covarianza entre
X e Y omo
Cov [X, Y ]
V ar [X] V ar [Y ]
i dos vriles letoris tienen ovrinz ero o equivlentementeD si RXY = EX EY, se dien que son
ortogonalesF
hos vriles letoris son inorrelds si reen de ulquier tipo de relin linelF or otr prteD de(niE
mos nteriormente el onepto de independeni entre vrile letoriD que impli l useni de relin
entre ellsF enemosD sD dos oneptosD independeni e inorrelinD que estn stnte reliondosF
in onretoD dos vrile letori independientesD X e Y D son siempre inorreldsD es deirD X,Y = 0. v
rzn es queD por ser independientesD
112
luego
RXY =
xy fX (x) fY (y) dy dx
yfY (y) dy = EX EY,
xfX (x) dx
cos
1
d = 0
2
sin
EX =
1
d = 0
2
EY =
0
E [XY ] =
sin cos
0
1
=
2
1
d
2
sin 2d = 0,
0
por lo que X e Y son vriles inorreldsF in emrgoD puede demostrrse filmente que no son
independientesF
Nota.
v relin ms fuerte de tipo linel que puede drse orresponde l so en que un vrile
XY = 1 signo (a) .
v demostrin es muy senillF engmos en uent que
113
luego
= E a2 (X EX)
= a2 V arX,
= E (aX aEX)
= a2 E (X EX)
XY =
aV arX
Cov (X, Y )
=
= 1 signo (a) .
V arX V arY
V arXa2 V arX
114
ddo de l muestr del pr (X, Y )F epreen R (gursD orrespondientes R simuliones de pres de vriles
ro=1
ro=1
5
4
3
2
2
0
2
4
4
0
2
1
4
ro=0
ro=0.7075
2
1
1
2
2
3
4
4
4
pigur SFRX xues de puntos orrespondientes distintos posiles oe(ientes de orrelin linelF
Ejemplo. en X
115
gomo X,Y =
Cov(X,Y )
V arXV arY
y
xyey dxdy =
=
0
3
yey
x2
2
dy
0
y y
e dy = 3.
2
=
0
fX (x) =
ey dy = ex D pr x > 0,
fX,Y (x, y) dy =
x
luego
EX =
xex dx = 1.
xfX (x) dx =
0
fY (y) =
ey dx = yey D pr y > 0,
fX,Y (x, y) dx =
0
luego
EY =
y 2 ey dy = 2.
yfY (y) dy =
0
or tntoD
Cov (X, Y ) = 3 1 2 = 1.
or su prteD
E X
x2 ex dx = 2
x fX (x) dx =
0
V arX = 2 12 = 1
y
E Y2 =
y 3 ey dy = 6
y 2 fY (y) dy =
0
V arY = 6 22 = 2,
s queD (nlmenteD
X,Y =
1
= 0.707.
12
vs propieddes del operdor espernz son muy tiles en l prtiD por ejemploD undo se trt de onoer
l vrinz de ominiones lineles de vris vrilesF emos lgn ejemplo l respeto y despus un
resultdo generl que los engloe todosF
116
E (X1 + X2 )
2
2
2
2
= E X1 + X2 + 2X1 X2 = E X1 + E X2 + 2E [X1 X2 ]
V ar (X1 + X2 ) = E (X1 + X2 )
E [X1 + X2 ]
2
2
= E X1 + E X2 + 2E [X1 X2 ] (EX1 + EX2 )
2
2
2
2
= E X1 + E X2 + 2E [X1 X2 ] EX1 EX2 2EX1 EX2
2
2
2
2
= E X1 EX1 + E X2 EX2 + 2 (E [X1 X2 EX1 EX2 ])
E (X1 X2 )
2
2
2
2
= E X1 + X2 2X1 X2 = E X1 + E X2 2E [X1 X2 ]
V ar (X1 X2 ) = E (X1 X2 )
E [X1 X2 ]
2
2
= E X1 + E X2 2E [X1 X2 ] (EX1 EX2 )
2
2
2
2
= E X1 + E X2 2E [X1 X2 ] EX1 EX2 + 2EX1 EX2
2
2
2
2
= E X1 EX1 + E X2 EX2 2 (E [X1 X2 EX1 EX2 ])
N
i=1
i Xi .
intonesD
N
i j Cov (Xi , Xj ) ,
V ar [X] =
i=1 j=1
117
X X
V ar [X] = E
i EXi ,
i Xi Xi
=E
i=1
N
i Xi Xi
i=1
i j E
Xi Xi
Xj Xj
i=1 j=1
N
i j Cov (Xi , Xj )
=
i=1 j=1
N
2
i V ar [Xi ] ,
i j Cov (Xi , Xj ) =
V ar [X] =
i=1 j=1
i=1
y que
0 si i = j
Cov [X, Y ] =
V ar [Xi ] si i = j
E [X1 ]
F
,
F
=
F
E [XN ]
y su
donde
Ci,j =
V ar (Xi ) si i = j
Cov (Xi , Xj ) si i = j
ist mtriz ontiene ls vrinzs de d vrile del vetor en l digonl y en el elemento (i, j) l ovrinz
entre l isim y l jsim vrileF
in form mtriilD l mtriz de ovrinzs puede de(nirse omo
CX N N = E (X X )N 1 (X X )1N .
or otr prteD
CX = E (X X ) (X X ) = E [XX ] X X ,
118
le not RX F
ems mtriesD CX y RX D son mtries simtrisF
v linelidd del operdor medi filit rpidmente l expresin del vetor de medis y l mtriz de
vrinzsEovrinzs de ominiones lineles de vetoresD omo se reoge en el siguiente resultdoF gonreE
tmenteD si tenemos el vetor letorio XN 1 on vetor de medis X y mtriz de vrinzs ovrinzs CX
y el vetor YM 1 = AM N XN 1 + bM 1 D entonesD el vetor de medis y l mtriz de vrinzs ovrinzs
de Y vienen dds por
Y = AX + b
CY = ACX A .
Ejemplo.
mos ver que l pliin de este resultdo filit stnte determindos lulosF or
X1 + X2 =
X1
X2
de mner que
V ar (X1 + X2 ) =
V arX1
Cov (X1 , X2 )
Cov (X1 , X2 )
V arX2
5X1 3X2 =
X1
X2
se tiene que
V ar (5X1 3X2 ) =
V arX1
Cov (X1 , X2 )
Cov (X1 , X2 )
V arX2
119
estr seguros de que se trt del so ms interesnte por dos motivosX porque pree omo modelo deudo
en un grn nmero de fenmenos de l nturlez y porque sus propieddes mtemtis on inmejorlesF
n vetor formdo por N vriles letoris X = (X1 , ..., XN ) se die que sigue un distribucin
normal
on vetor de
fX (x) =
1
N
1
1
exp (x X ) CX (x x ) ,
2
donde
CX = (Ci,j )i,j=1,...,N
Cij =
V ar [Xi ] si i = j
Cov [Xi , Xj ] si i = j
x = (x1 , ..., xN )
X = (EX1 , ..., EXN )
y se not X NN (X ; CX ) .
mos destr lguns de ls exelentes propieddes de l distriuin norml multivrinteF gonretE
menteD nos entrremos en los siguientes resultdosX
gulquier mrginl sigue tmin un distriuin normlF
gulquier distriuin ondiiond sigue tmin un distriuin normlF
gulquier ominin linel de un vetor norml es tmin normlF
mos onretrlosF in primer lugrD si tenemos un vetor XN 1 = (X1 , ..., XN ) on distriuin onjunE
tmente gussin de vetor de medis y mtriz de ovrinzs CX D en ese soD el suonjunto de vriles
del vetorD (Xi1 , ..., XiM )D on M < N tmin sigue distriuin onjuntmente gussinD de prmetros
1
0
1 .
1
120
(X1 , X2 ) N2
(X1 , X3 ) N2
(X2 , X3 ) N2
M M
yM 1 Y 1
M
y mtriz de vrinzsEovrinzs
1
V ar X |Y=y = CX CXY CY CXY ,
ondiiond
X3 =0.25 ]
=0+
3
1
1
1
0.5 0
0.25 0
= 0.125
X3 =0.25 )
=2
1
0
= 1.5
121
(X , Y ) y mtriz de ovrinzs
C(X,Y ) =
donde =
Cov(X,Y )
X Y
2
X
X Y
X Y
2
Y
2 2
es el oe(iente de orrelin linelF intonesD det C(X,Y ) = X Y 1 2 y
1
C(X,Y ) =
1
2
X
XY
1
1 2
XY
1
2
Y
fX,Y (x, y) =
1
2X Y
1 2
2
exp
2 (x x ) (y Y ) (y Y )
(x X )
1
+
2
2
2 (1 2 )
X
X Y
Y
1
,
2X Y 12
en el punto (X , Y )F
2
2
ividentementeD ls distriuiones mrginles son N X , X y N Y , Y F
X | Y = y0 N
Y | X = x0 N
X
2
(y0 Y ) ; X 1 2
Y
Y
2
(x0 X ) ; Y 1 2
Y +
X
X +
ysrvese queD uriosmenteD l vrinz ondiiond no depende del vlor que ondiionF isto tendr
importntes reperusiones ms delnteF
YM 1 = AM N XN 1 + bM 1
tiene distriuin gussin de vetor de medis Y = A X + b y mtriz de ovrinzs CY = A CX A F
Ejemplo.
2
2
eroD vrinzs X1 = 4 y X2 = 9 y ovrinzD cX1 ,X2 = 3F i ests vriles se trnsformn linelmente
122
123
en ls vriles
Y1 = X1 2X2
Y2 = 3X1 + 4X2
ls nuevs vriles tienen distriuin onjuntmente gussinD on medis
(Y1 , Y2 ) =
y mtriz de ovrinzs
2
Y1
cY1 ,Y2
cY1 ,Y2
2
Y2
28
66
66
252
ytr de ls ms importntes propieddes es que se trt del nio so en el que independeni e inorrelin
son equivlentesF is deirD si XN 1 es un vetor on distriuin onjuntmente gussinD entones sus
omponentes son inorrelds si y slo si son independientesF
v demostrin es senillF semos que si son independientes son inorrelds @inluso si l distriuin
no es onjuntmente gussinAF or su prteD pr pror que si son inorrelds entones son independientes
slo hy que tener en uent que si son inorreldsD l mtriz de ovrinzs es digonl y l densidd
onjunt puede expresrse omo produto de ls mrginlesD y que
fX (x1 , ..., xN ) =
2
2
(2) 1 ...N
1
1
exp (x X ) CX (x X )
2
1
exp
2
i=1
xi i
i
fXi (xi ) .
i=1
CX
124
2
1
F
= F
F
0
...
FF
F
...
0
F
F .
F
2
N
Parte III
Inferencia estadstica
IPS
Captulo 6
Distribuciones en el muestreo
Resumen.
in este ptulo se pretende llmr l tenin er de que los prmetros muestrles son
6.1. Introduccin
el estudir el onepto de vrile letoriD dijimos que viene motivdo porque muhs de ls vriles que
se oservn en l vid relD en el miente de ls sngeniers en prtiulrD estn sujets inertidumreF
iso quiere deir que si nosotros otenemos lguns oserviones de ess vriles @muestrsAD los dtos
no son igulesF is msD si otenemos otrs oservionesD ls dos muestrs tmpoo sern ni muho menos
idntisF
or tntoD l hlr de distriuiones teris de proiliddD lo que pretendmos er proponer un modelo
que permitier lulr proiliddes soidsD no un muestr en prtiulr de dtosD sino tods ls
posiles muestrsD on todos los posiles dtos de l vrileF
eordemos el ejemplo que pusimosX ls distriuiones de proilidd son omo un trje que elegimos pr
ponernos ulquier d durnte un periodo de tiempo mplioF in l medid que el trje de un vrileD
su distriuinD
le quede bienD
plirse ulquier dto o onjunto de dtos de l vrileF ero igulmenteD si un trje @un distriuin
de proilidd teriA
no le queda bien
funin ms o un funin de densidd terisD pueden no ser relists respeto los resultdos emprios
que se otengn medinte muestrs de l vrileF
u nos qued por her lo lrgo del ursoc hdo queD en generlD ls distriuiones teris de proilidd
dependen de uno o ms prmetrosD lo que nos oupr grn prte del resto del urso es trtr de elegir
IPU
deudmente esos prmetrosF in el ejemplo de los trjes podmos pensr que esto es omo prender
esoger l tll del trjeF
in este ptulo vmos omenzr on lguns uestiones teris er de lo que impli el proeso de
muestreoD previo l elein de los prmetros yD posteriormenteD nos vmos entrr en resultdos que
impli el muestreo de dtos de vriles que siguen un distriuin normlF
vndo un vrile letoriD X D en un polin determindF dijimos que un muestr letori simple
de X onsiste en l reopilin de dtos de l vrileD medinte l repetiin del experimento l que est
soidD on dos ondiiones sisX
IF ue todos los elementos de l polin tengn ls misms posiiliddes de slir en l muestrF
PF ue ls distints oserviones de l muestr sen independientes entre sF
in ese soD los vlores que tom l vrile en d un de ls oserviones de un muestr de tmo
nD X1 , ..., Xn D son en s mismosD vriles letoris independientes que siguen l mism distriuin de
proiliddD llmd
distribucin poblacionalF
que se intentr utilizr l muestr pr her infereni sore ell yD l menosD proximr l form de est
distriuinF
simple suyD x1 , ..., x1 F gon esos dtos podemos lulr l medi de l muestrD x1 D y l desviin tpi de
n
1
l muestrD s1 D por ejemploF
ero deemos ser onsientes de lo que signi( muestr
x1 , ..., x1
n
1
aleatoriaF
es fruto del zrF he hehoD si otenemos otr muestrD x2 , ..., x2 D otendremos otr mediD x2 y
n
1
128
siD suesivmenteD otenemos un y otr muestrD otendremos un y otr medi muestrlD y un y otr
desviin tpi muestrlF or lo tntoD en reliddD lo que estmos viendo es que l medi y l vrinz
muestrles @y en generlD ulquier prmetro de un muestr letori simpleA sonD en reliddD vriles
letoris queD omo tlesD deen tener su distriuinD su mediD su vrinzFFF
mos reordr dos de(niiones que y introdujimos l omienzo del ursoF
n
parmetro muestral
letoriF
n
un vrile letoriF
ues ienD soidos estos dos oneptos tenemos hor ls siguientes de(niionesF
v
il
il prolem es queD en generlD es stnte difil onoer l distriuin en el muestreo de los prmetros
muestrlesF
in emrgoD el so en el que result ms senillo herlo es prolemente el ms importnteF gomo vmos
verD si l vrile que oservmos sigue un distriuin normlD podremos onoer de form ext ls
distriuiones en el muestreo de los dos prmetros ms importntesD l medi y l vrinzF
si l vrile no es normlc i lo que pretendemos es estudir l medi y l vrinz muestrlesD reordemos
que el eorem gentrl del vmite nos die que si un vrile es sum de otrs vrilesD su distriuin es
proximdmente normlD y l medi es sum de ls vriles de l muestrF is deirD si l vrile no es
normlD todv podemos tener on(nz de que lo que hgmos pr vriles normles puede ser vlidoF
n
2
y 1F
2
129
t=
sigue un distriuin llmd t
S/n
F =
sigue un distriuin que se denomin F
S1 /n1
S2 /n2
t=
Sn1 / n
2 =
2
(n 1) Sn1
2
X Y (1 2 )
Sp
donde
1
n1
2
Sp =
1
n2
1
2
(n1 1) Sn1 + (n2 1) Sn1
n1 + n2 2
2
(n1 + n2 2) Sp
,
2
130
1
Sn1
2
/1
2
Sn1
2
/2
131
132
Captulo 7
Estimacin de parmetros de una
distribucin
htosD dtosD dtos3 Egrit impientementeEF xo puedo her ldrillos sin rillF
herlok rolmes @eF gF hoyleAD en
Resumen.
Palabras clave: estimdor puntulD mtodo de los momentosD mtodo de mxim verosimilitudD intervlo
de on(nzD nivel de on(nzF
7.1. Introduccin
in istdsti hy tres forms de inferir un vlor un prmetro de un polinX
istimndo el vlor onreto de ese prmetroF
istimndo un regin de on(nz pr el vlor del prmetroF
omndo un deisin sore un vlor hipottio del prmetroF
odr omprr el vlor promedio de su equipo on un vlor hipottio prD por ejemploD demosE
trr l empres que tiene un mejor rendimiento que el promedio generl de l empresF
in este ptulo nos entrremos en l primer y l segund formD que onsisten en proporionr un vlor
que reemos que est er del prmetro @estimin puntulA o en proporionr un intervlo en el que
on(mos que se enuentr el prmetro desonoido @estimin por intervlos de on(nzAF v terer
posiilidd se estudir en el ptulo de ontrstes de hiptesisF
n estimador puntual, D es un regl que nos die mo lulr un estimin numri de un prmetro
polionl desonoidoD D prtir de los dtos de un muestrF il nmero onreto que result de un luloD
pr un muestr ddD se denomin
estimacin puntualF
Ejemplo. i desemos otener estimiones de l medi de un vrile letoriD lo que pree ms lgio
ser utilizr omo estimdor l medi muestrlF gd medi muestrl de d muestr ser un estimin
puntul de l medi polionlF
u ser desele que le psr ulquier estimdorc u uens propieddes deer tener un uen
estimdorc mos ver dos de ellsF
in primer lugrD pree lgio pensr que si ien el estimdor no proporionr siempre el vlor exto del
prmetroD l menos deer estleer estimiones que
defetoF iste tipo de estimdores se denominn
se equivoquen
insesgados F
insesgado si
E = .
e denomin
sesgo de un estimador
E .
134
s.e.
il
X1 + ... + XN
X=
N
es un estimdor insesgdo de E [X] y su error estndr es
s.e.(X) = .
N
il resultdo estlee lgo que pod herse intuido desde l de(niin de l medi o espernz mtemti
de un distriuin de proiliddX si tenemos unos dtos @mas A de un vFFD un estimin deud de
l medi de l vFF es l medi de los dtosF
ry que tener muho uiddo on no onfundir l medi de l vFFD es deirD l medi polionlD on l
medi de los dtos de l muestrD es deirD on l medi muestrlF
or otr prteD el error estndr he refereni X D que es un prmetro polionl yD por lo tntoD
desonoidoF vo que se suele her es onsiderr l desviin tpi muestrl omo un proximin de l
polionl pr evlur este error estndrF
N
i=1
Xi X
N 1
Nota. el hilo del omentrio previo que hiimos sore l medi muestrl omo estimdor natural
de l
N
i=1
Xi X
N
135
cuasivarianza muestral. yjoD hy que dvertir que en lgunos liros l mner de nomrr l
Nota.
2
il que l vrinz muestrlD SN 1 D se un estimdor insesgdo de l vrinzD 2 D no impli que l
2
SN 1 D se un estimdor insesgdo de D pero en este so s ourre sF
Ejemplo. wedinte hemos generdo un muestr letori simple de IHHH vlores de un distriuin
N (0, 1)F emosD por tntoD que l medi @polionlA de los dtos es H y que l vrinz @polionlA
es IF xo ostnteD vmos suponer que desonoemos de qu distriuin proeden los dtos y vmos
trtr de
ajustar
x = 0.0133
s999 = 0.9813,
por lo que justrmos los dtos de l muestr x medinte un distriuin
N (0.0133, 0.9813) .
v densidd de est distriuin pree tmin en l pigur UFID en trzo ontinuoD y se oserv que
just muy ien l form del histogrmF
136
0.0
0.1
0.2
Densidad
0.3
0.4
0.5
Histograma de la muestra
p=
k
,
N
s.e.() =
p
p(1 p)
N
ore el error estndrD osrvese de nuevo queD ddo que p es desonoidoD en relidd l expresin de s.e.()
p
no puede evlurseF in emrgoD es stnte omn que si el tmo de l muestrD N D es grndeD se utilie
el vlor de l estiminD pD en lugr de p en es expresinF
he tods formsD osrvese tmin que l funin f (p) = p(1 p) es menor que
s.e.()
p
is por ello que siempre podemos dr est ntiddD
1
4
si 0 p 1D luego
1
1
= .
4N
2 N
1
D
2 N
p=
1
2 1000
507
= 0.507,
1000
= 0.01581139F v estimin del error estndr de l
137
estimin ser
x = f 1 , 2
s2 = g 1 , 2 .
n1
EX
n F
or tntoD dd un
p=
.
n
or iertoD este estimdor oinide on el que hmos onsiderdo en un prinipioD que er l proporin
muestrlD es deirD p = k/N D pero puede her lgun onfusin en l notinF emos porquF
xi xitosF vuegoD en
efetoD
p=
i xi
=
,
n
nN
es deirD l proporin muestrlD oiente del n de xitos entre el n totl de experimentosF xo deemos
onfundirnos on l expresin k/N que pusimos ntes porque N no signi( lo mismo en mos sosF
138
1
p
1D de donde p =
1
1+EX D
luego el mtodo
p=
1
.
1+x
EX
= p,
V arX
se tiene que
a = EX
EX
p
EX 2
= EX V arX =
1p
V arX EX
1 VEX
arX
p=
a=
s2 1
X,N
x2
s2 1 x
X,N
ms creibles, ms verosmilesD
r desrrollr el mtodo deemos tener en uent que si tenemos un muestr letori simple de un
vrile X D x1 , ..., xn D y l funin ms o densidd de l vrile es p (x)D entones l funin ms o
densidd de l muestr es
credibilidad
139
hd l verosimilitud de un muestrD LD
si L depende de un slo prmetroD D entones el estimador mximo-verosmil de se otiene
resolviendo el prolem de mximo siguienteX
= arg mx L .
a
Nota.
hdo que el mximo de un funin oinide on el mximo de su logritmoD suele ser muy til
Ejemplo. mos lulr el estimdor mximo verosmil del prmetro p de un distriuin B (n, p)
sdo en un muestr x1 , ..., xN F
in primer lugrD l funin de verosimilitud es
N
n xi
nxi
p (1 p)
xi
=
i=1
n
xi
N
i=1
xi
N
i=1
nN
(1 p)
xi
u logritmo result
N
n
xi
xi
ln p +
nN
i=1
xi
ln (1 p) .
i=1
p
de donde
xi
nN i=1 xi
= 0,
1p
p
x
i=1 xi
=
=
= n
N
1p
nx
1
nN i=1 xi
vuego el estimdor es
p=
.
n
ysrvese que oinide on el estimdor que otuvimos por el mtodo de los momentosF
Ejemplo. mos lulr el estimdor mximo verosmil del prmetro de un distriuin exp ()
sdo en un muestr x1 , ..., xN F
140
punin de verosimilitudX
N
N
i=1
exi = N e
Lx1 ,...,xN () =
xi
i=1
ln Lx1 ,...,xN () = N ln
xi .
i=1
xi = 0,
i=1
de donde
N
i=1
xi
1
.
x
he nuevo el estimdor mximo verosmil oinide on el proporiondo por el mtodo de los momentosF
Lx1 ,...,xN , 2 =
i=1
1
2 2
(xi )2
2 2
2 2
u logritmoX
ln Lx1 ,...,xN , 2 =
N
i=1
N
N
ln (2)
ln 2
2
2
2
n
i=1 (xi )
2 2
(xi )
.
2 2
d
ln Lx1 ,...,xN , 2 =
d
(xi )
=0
2
d
N
1
ln Lx1 ,...,xN , 2 = 2 +
2
d
2
2
N
i=1
(xi )
2
( 2 )
=0
(xi ) =
i=1
de donde
xi N = 0,
i=1
N
i=1
xi
= x.
141
Modelo
Estimadores por el
mtodo de los momentos
exp ()
Gamma (a, )
p= n
x
=x
1
p = 1+
x
2
a = s2 x , p = s2 x
X,N 1 x
X,N 1
1
= x
x2
a = 2 , = 2x
N (, )
= x, = sn1
B (n, p)
P ()
Geo (p)
BN (a, p)
sn1
p= n
x
=x
1
p = 1+
x
lo por mtodos numrios
= 1
x
sn1
= x, = sn
gudro UFIX istimdores por el mtodo de los momentos y de mxim verosimilitud de los prmetros de ls
distriuiones ms usulesF
N
i=1
(xi x)
2
( 2 )
de donde
2 =
Nota.
N
i=1
N
,
2
(xi x)
= s2 .
n
N
he nuevo hy que llmr l tenin sore el heho de que hemos usdo un estimdorD de
F n
P [ I (x1 , ..., xN )] = 1 .
el vlor 1 tmin se le llm
142
nivel de conanzaF
Prof. Dr. Antonio Jos Sez Castillo
|
|
|
|
|
|
|
|
|
|
40
|
40
40
|
|
|
|
|
|
|
|
|
|
|
|
|
30
30
30
|
|
|
|
|
|
|
|
|
Index
Index
Index
|
|
|
|
|
|
|
20
20
20
|
|
|
|
|
|
|
10
10
10
|
|
|
|
|
|
|
|
|
|
|
|
|
0.0
0.2
0.4
0.6
Confidence Interval
0.2
|
|
|
0.4
50
50
50
0.6
0.4
0.2
0.0
0.2
0.4
0.6
1.0
Confidence Interval
0.5
0.0
0.5
1.0
Confidence Interval
ysrvese que l (losof de ulquier intervlo de on(nz es proporionrD sndonos en los dtosD un
regin donde tengmos un determindo nivel de on(nz en que el prmetro se enuentrF gomo en el
so de los estimdores puntulesD el intervlo de on(nz es letorioD y que depende de los dtos de
un muestrF edemsD se d por heho que existe l posiilidd de que el
verdadero
prmetro no quede
Nota. el respeto de l interpretin del nivel de on(nzD tenemos que deir queD ddo que desde el
omienzo del urso hemos doptdo un interpretin freuentist de l proiliddD un intervlo de
on(nz l WS 7D por ejemploD grntiz que si tommos IHH muestrs el prmetro polionl estr
dentro del intervlo en proximdmente WS intervlos onstruidosF
in emrgoD est interpretin es surd en l prtiD porque nosotros no tenemos IHH muestrsD
sino slo unF
xosotros tenemos los dtos de un muestrF gon ellos onstruimos un intervlo de on(nzF hor slo
en dos posiiliddesX o el prmetro est dentro del intervlo o no lo estF il prmetro es onstnteD
y el intervlo tminF xo podemos repetir el experimento3 is por ello que se hl de intervlos
conanza D
conanza
de
143
P x z1 , x + z1
2
2
N
N
= 1 ,
x z1 , x + z1
2
2
N
N
on un (1 ) 7 de on(nzF
xo ostnteD hy que reonoer que en l prti es poo prole que se desonoz el vlor de l medi
y s se onoz el de l vrinzD de mner que l pliin de este teorem es muy limitdF il siguiente
resultdo responde preismente l neesidd de extender el nterior undo se desonoe el vlor de l
vrinzF
e X un vFF on distriuin norml de medi y vrinz 2 , ms desonoidsF e un muestr
X,N
P x t1 ;N 1
s2 1
X,N
N
, x + t1 ;N 1
s2 1
X,N
N
= 1 ,
donde t;N a es el vlor tl que FTN (t;N ) = D siendo TN un vFF on distriuin de tudent on N
grdos de liertd.
x t1 ;N 1
s2 1
X,N
N
, x + t1 ;N 1
s2 1
X,N
Ejemplo.
desviin tpi muestrles de esos IHHH vlores resultron ser x = 0.0133 y s999 = 0.9813F or tntoD
0.0133
144
0.9813
1.96
1000
= (0.074, 0.0475)
vos dos resultdos que mos de enunir se sn en que se onoe l distriuin ext de l muestrD
normlD lo que permite deduir que l medi muestrl sigue tminD y de form extD un distriuin
norml de medi y vrinz
2
N F
2
N D
aproximado
pr ulquier
P x z1/2 , x + z1/2
N
N
1 .
in est expresinD si es desonoidD puede sustituirse por l desviin tpi muestrlD sn1 F
Ejemplo. r dimensionr el tmo del u'er de un modem ehv es neesrio estimr el promedio
de pquetes de dtos por milisegundo que reie el modemF
e onsider que el tiempo @en milisegundosA que trnsurre entre pquete y pquete sigue un distriuE
in exponenil de prmetro F ysrvese que l medi de est distriuin es =
1
D
tiempo medio
entre pquetesD por lo que es preismente el promedio de pquetes por milisegundo que reie el
modemF or lo tntoD el ojetivo es estimr el prmetro D que es el que se utilizr pr dimensionr
el modemF
wedinte un sni'er opldo l modem pr pturr dtos del tr(oD se tomn dtos de los tiempos
entre pquetes de IHHI pquetesD por lo que se tienen IHHH dtos de tiempos entre pquetesF v medi
de estos tiempos result ser x = 2.025D siendo l desviin tpi muestrl de 1.921F
X
sn1
sn1
x z0.975 , x + z0.975
n
n
pinlmenteD ddo que =
1
,
= 2.025
1.921
1.96
= (1.906, 2.144).
1000
el intervlo de on(nz l WS 7 de es
1
1
2.144 , 1.906
= (0.466, 0.525) .
e ttulo informtivoD el vlor que se onsider en el dimensionmiento del modem es un mltiplo @el
doleD por ejemploA del extremo superior del intervloD en este so HFSPSF
145
k
N
P p
p z1/2
p (1 p)
, p + z1/2
p (1 p)
1 .
0.06
1.96
0.06(1 0.06)
= (0.027, 0.093).
200
N
2
i=1 (Xi x)
2 ;N 1
1 2
< 2 <
N
i=1 (Xi
2 ;N 1
x)
= 1 .
a El valor de 2
2
y debe buscarse en las tablas de la distribucin 2 u obtenerse mediante el ordenador.
/2;N 1 1/2;N 1
146
Ejemplo. in el ejemplo donde onsidermos IHHH vlores simuldos de un N (0, 1) tenmos que x =
(Xi x) = 999 s2 ,
999
i=1
961.9867
961.9867
,
1.0885 103 913.3010
= (0.8838, 1.0533) .
control de calidadF
vos jponeses sonD en estoD los pioneros y quiz los mejores expertosF e
ellos se les triuye un prinipio sio del ontrol de lidd en ulquier proeso sio de produinX
la
ensemos en ulquier proeso de friin genrioF in l se trtr de otener un produto sujeto uns
espei(iones onretsF in emrgoD el error inherente ulquier proeso experimentl provorX
IF n umento o un disminuin estruturles del produto on respeto un vlor ojetivoF isto podr
detetrse omo un sesgo en l medi de lo produido on respeto l vlor ojetivoF
PF ns diferenis ms o menos importntes en los produtos resultntesD que podrn ser evluds
medinte l vrinzF
he ess dos posiles prolemtisD l ms omplejD sin dud es l segundF rolemente no es un grve
prolem
calibrar
l mquin que produe pr que l medi se site en el vlor ojetivoD pero ser sin dud
bilaterales
quF
Prof. Dr. Antonio Jos Sez Castillo
147
xo ostnteD no vmos detllrlos quD unque su interpretin es nlog l de los intervlos de on(nz
que hemos vistoF gulquier pquete de softwre estdstio puede filitr estos intervlos sin di(ultdF
trution steD en el que se present un estudio de l ontminin en sureros que ontienen desehos de
onstruin y desperdiios de demoliionesF hemos ll que De
de lixiado, de las cuales 26 contienen niveles detectables de plomo. Una ingeniera desea obtener a partir de
esos datos una estimacin de la probabilidad de que una muestra de un basurero contenga niveles detectables
de plomo. No obstante, es consciente de que esa estimacin estar basada en esa muestra, que es de slo 42
datos, luego querr tambin obtener una estimacin del error que est cometiendo al hacer la estimacin.
Finalmente, se plantea si con la estimacin y el error de sta, podr obtener un rango donde la verdadera probabilidad se encuentre con un alto nivel de conanza.
prolemF
in primer lugrD tenemos que otener un estimin de l proporin de muestrs @o proiliddA que
ontienen niveles detetles de plomoF remos visto que un estimdor insesgdo de mnim vrinzD que
dems oinide on el estimdor de mxim verosimilitudD de l proporin es l proporin muestrlF in
nuestro soD por tntoD podemos estimr l proporin en p =
2 42
0.6190(10.6190)
42
26
42
0.6190
ontendr l verdder proporin de muestrs on niveles detetles de plomoF ist ltim (rmin
pone de mni(esto que dr un intervlo de on(nz on un nivel de signi(in eptlemente jo @S 7A
ondue un intervlo muy mplioD lo que equivle deir que n hy stnte inertidumre on respeto
l proporin que estmos estimndoF or elloD deermos reomendrle l ingenier que umente el
tmo de l muestrF
148
Captulo 8
Contrastes de hiptesis paramtricas
Resumen. in este ptulo explimos qu se entiende por ontrste de hiptesis estdsti y prendemos
relizr ontrstes de este tipo prtir de dtosD referidos lgn prmetro polionl desonoidoF
Palabras clave: ontrste de hiptesisD error tipo sD error tipo ssD estdstio de ontrsteD pEvlorD nivel de
signi(inD nivel de on(nzF
8.1. Introduccin
gomo puntmos en l introduin del ptulo nteriorD ls llmds
tesis se utilizn pr inferir deisiones que se re(eren un prmetro polionl sndose en muestrs de
l vrileF mos omenzr explir el funionmiento de un ontrste de hiptesis on un ejemploF
Ejemplo. vos ient(os reomiendn que pr prever el lentmiento glolD l onentrin de gses
de efeto inverndero no dee exeder ls QSH prtes por millnF n orgnizin de protein del medio
miente quiere determinr si el nivel medioD D de gses de efeto inverndero en un regin umple on
ls puts requeridsD que estleen un lmite mximo de QSH prtes por millnF r ello tomr un
muestr de mediiones diris de ire pr deidir si se super el lmiteD es deirD si > 350 o noF or
tntoD l orgnizin dese enontrr poyo pr l hiptesis > 350D llmd
hiptesis alternativaD
oteniendo prues en l muestr que indiquen que l hiptesis ontrriD = 350 @o 350AD llmd
hiho de otr formD l orgnizin v someter juiio l hiptesis nul 350F rtir de
inocenciaD
su
suponiendo que es iertD es deirD suponiendo queD en prinipioD no se supern los lmites de
IRW
que d l muestrD trvs de lgun medid soid ellD que se denomin estadstico de contrasteF
or ejemploD si se tomn QH leturs de ire y l medi muestrl es muho myor que QSHD lo lgio ser
rehzr l hiptesis nul en fvor de > 350D pero si l medi muestrl es slo ligermente myor que
QSH o menor que QSHD no hr prues su(ientes pr rehzr 350 en fvor de > 350F
v uestin lve es en qu momento se deide rehzr l hiptesis nul en fvor de l lterntivF in
nuestro ejemploD en qu momento podemos deir que l medi muestrl es su(ientemente myor que
QSHF il onjunto de estos vlores del estdstio de ontrsteD que permiten rehzr = 350 en fvor de
regin de rechazoF
e l luz de este ejemploD vmos trtr de de(nir de form generl los oneptos que mos de introduirF
n contraste
contrasteF
estadstico de
e rehzr l hiptesis nul en fvor de l lterntiv undo el vlor del estdstio de ontrste se site
en un determind reginD llmd
regin de rechazoF
no de los spetos ms importntes y que se suele prestr myor onfusin se re(ere qu hiptesis
onsiderr omo H0 y ul omo H1 F n regl prti pr herlo orretmente puede ser l siguienteX
IF i estmos intentndo pror un hiptesisD st dee onsiderrse omo l hiptesis lterntivF
PF or el ontrrioD si desemos desreditr un hiptesisD deemos inluir st omo hiptesis nulF
Ejemplo. r un determind edi(in se exige que los tuos de gu tengn un resisteni medi
l rupturD D por enim de QH kg por entmetroF
150
gomo primer situinD supongmos que un proveedor quiere filitr un nuevo tipo de tuo pr
ser utilizdo en est edi(inF vo que deer her es poner trjr sus ingenierosD que
deen relizr un prue pr deidir si esos tuos umplen on ls espei(iones requeridsF
in ese soD deen proponer un ontrste que inluy omo hiptesis nul H0 : 30 frente l
lterntiv H1 : > 30F i l relizr el ontrste de hiptesis se rehz H0 en fvor de H1 D el
tuo podr ser utilizdoD pero si no se puede rehzr H0 en fvor de H1 D no se tienen su(ientes
grnts sore l lidd del tuo y no ser utilizdoF
gomo segund situinD un proveedor llev suministrndo su tipo de tuo desde he osD sin que
se hyn detetdoD en prinipioD prolems on ellosF in emrgoD un ingeniero que trj pr
el goierno ontrolndo l lidd en ls edi(iones viene teniendo sospehs de que ese tipo de
tuo no umple on ls exigenis requeridsF in ese soD si quiere pror su hiptesisD el ingeniero
deer onsiderr un ontrste de l hiptesis nul H0 : 30 frente H1 : < 30F hiho de
otr formD slo podr ontrstr su hiptesis si enuentr dtos emprios que permitn rehzr
es hiptesis nul en fvor de su lterntivD que demuestren on un lto nivel de (ilidd que el
proveedor que est siendo eptdo hor no umple on los requisitosF
he hehoD es importntsimo que desde el prinipio tengmos lro qu tipo de deisiones puede proporioE
nrnos un ontrste de hiptesisF eunque y ls hemos omentdoD vmos insistir en ellsF on ls dos
siguientesX
IF i el vlor del estdstio de ontrste pr los dtos de l muestr e en l regin de rehzoD podremos
(rmr
con un determinado nivel de conanza que los dtos de l muestr permiten rehzr l
con el nivel de conanza exigido que los dtos de l muestr permiten rehzr
error tipo I o falso negativo rehzr l hiptesis nul undo es iertD y su proilidd se
not por D llmdo nivel de signicacinF
e llm
e llm
151
Estado real
Decisin en
el contraste
H0
H1
H0
heisin orret
irror tipo s
H1
irror tipo ss
heisin orret
e llm
error tipo II o falso positivo eptr l hiptesis nul undo es flsD y su proilidd se
not por .
e llm
gul de los dos errores es ms grvec rolemente eso depende de d ontrsteD pero en generlD lo que
se pretende es otr el error tipo s y trtr de minimizr el error tipo ssD es deirD trtr de elegir ontrstes
lo ms potentes posiles grntizndo que l proilidd del error tipo s es inferior un determindo nivelF
Ejemplo. n frinte de miniomputdors ree que puede vender ierto pquete de softwre ms
del PH 7 de quienes omprn sus omputdorsF e seleionron l zr IH posiles omprdores de l
omputdor y se les pregunt si estn interesdos en el pquete de softwreF he ests personsD R
indiron que pensn omprr el pqueteF roporion est muestr su(ientes prues de que ms
del PH 7 de los omprdores de l omputdor dquirirn el pquete de softwrec
i p es l verdder proporin de omprdores que dquirirn el pquete de softwreD ddo que desemos
demostrr p > 0.2D tenemos que H0 : p = 0.2 y H1 : p > 0.2F
e X : nmero de posiles omprdores de l muestrD en uyo soD X B (10, p)F tilizremos el
vlor de X omo estdstio del ontrsteD rehzndo H0 si X es grndeF
upongmos que estleemos omo regin de rehzo x 4F in ese soD ddo que en l muestr x = 4D
rehzrmos H0 en fvor de H1 D llegndo l onlusin de que el frinte tiene rznF
eroD ul es el nivel de on(nz de este ontrstec glulemos l proilidd de error tipo sF r
elloD en el gudro VFP pree l distriuin de proilidd del estdstio de ontrste que hemos
elegidoD suponiendo que H0 es iertD y que deemos lulr
= P [ehzr H0 |H0
es cierta ]
2
= 0.08808 + 2.6424 10
= P [X 4|p=0.2 ]
a la luz de los datos podemos armar con un 87.913 % de conanza que p > 0.2F
si queremos un nivel de on(nz myorD es deirD un proilidd de error tipo s menorc heemos
reduir l regin de rehzoF i ponemos omo regin de rehzo x 5D y no podremos rehzr H0 en
152
x
H
I
P
Q
R
S
T
U
V
W
IH
P [X = x]
0.20 0.810 = 0.10737
0.21 0.89 = 0.26844
0.22 0.88 = 0.30199
0.23 0.87 = 0.20133
0.24 0.86 = 0.08808
10
5
5
2
5 0.2 0.8 = 2.6424 10
10
6
4
3
6 0.2 0.8 = 5.505 10
10
7
3
4
7 0.2 0.8 = 7.8643 10
10
8
2
5
8 0.2 0.8 = 7.3728 10
10
9
1
6
9 0.2 0.8 = 4.096 10
10
10
0
7
10 0.2 0.8 = 1.024 10
10
0
10
1
10
2
10
3
10
4
egin de
eptin
egin
de
rehzo
gudro VFPX punin ms del estdstio de ontrste suponiendo iert H0 D es deirD suponiendo que p = 0.2F
luz de los datos no podemos armar que p > 0.2 con un 96.721 % de conanza.
a la
p-valorF
153
que el ontrste se reliz medinte un estdstio que notremos S D y que el vlor del estdstio pr l
muestr es sF
il
p-valor soido l ontrste se de(ne omo el mnimo nivel de signi(in on el que l hiptesis nul
Ejemplo. in el ijemplo VFP hemos visto mo podemos rehzr l hiptesis nul on un 87.913 % de
on(nzD pero no on un 96.721 %F hiho de otr formD podemos rehzr l hiptesis nul on un
nivel de signi(in del 12.087 %D pero no on un nivel de signi(in del 3.279 %F isto impli que el
pEvlor estr justo entre estos dos ltimos vloresF
hdo que normlmente se elige omo nivel de signi(in mximo = 0.05D se tiene que l regl de deisin
en un ontrste on ese nivel de signi(inD ddo el pEvlorD ser l siguienteX
i p < 0.05D rehzmos H0 en fvor de H1 on ms de un WS 7 de on(nzF
i p 0.05D no podemos rehzr H0 en fvor de H1 on l menos un WS 7 de on(nzF
in emrgoD est regl de deisinD que es l ms hitulD es demsido reduionist si no se proporion
el vlor exto del pEvlorF v rzn es que no es lo mismo rehzr un hiptesis on
al menos
un WS 7 de
on(nz si el pEvlor es HFHRW que si es HFHHIF ry que proporionr siempre el pEvlor de un ontrsteD y
que eso permite d letor deidir por s mismoF
in resumenD el pEvlor permite utilizr ulquier otro nivel de signi(inD y que si onsidermos un nivel
de signi(in X
i p < D rehzmos H0 en fvor de H1 on ms de un (1 ) % de on(nzF
i p D no podemos rehzr H0 en fvor de H1 on l menos un (1 ) % de on(nzF
gomo onlusinD siempre que hgmos un ontrste de hiptesisD deemos filitr el pEvlor soidoF
gomo not (nl sore el onepto de pEvlorD es importnte selr queD l ontrrio de lo que errnemente
se piens en demsids osionesD el pEvlor no es l proilidd de l hiptesis nulF wuh gente piens
esto porque es ierto que undo el pEvlor es pequeo es undo se rehz l hiptesis nulF in emrgoD
pr empezrD no tiene sentido plnternos l
probabilidad
154
0.4
0.3
0.2
0.2
0.3
0.4
0.1
Regin de aceptacin
0.1
Regin de aceptacin
0.0
0.0
0.2
0.3
0.4
0.1
Regin de aceptacin
0.0
contrastes bilaterales
o de dos colasD y que el rehzo de l hiptesis nul en fvor de l lterntiv puede produirse porque el
estdstio de ontrste tom vlores muy ltos o muy josF or ontrD los ontrstes del tipo H0 : = 0 D
frente H1 : > 0 o H1 : < 0 son
y que el rehzo de l
hiptesis nul en fvor de l lterntiv puede produirse slo si el estdstio de ontrste tom vlores muy
ltos @undo H1 : > 0 , llmdo
contraste a la izquierdaAF
: < 0 D
llamado
155
p = P [S s/H0 ] .
i el ontrste es unilterl l dereh @H1 : > 0 AD
p = P [S > s/H0 ] .
i el ontrste es ilterl @H1 : = 0 AD
manoD
n1 l vrinz muestrlF
156
ipo de prue
riptesis
istdstio
ehzo
pEvlor
upuestos
e l izquierd
H0 : = 0
H1 : < 0
z < z
P [Z < z]
filterl
H0 : = 0
H1 : = 0
x0
z = sn1 /n
|z| > z1/2
2P [Z > |z|]
n 30
e l dereh
H0 : = 0
H1 : > 0
z > z1
P [Z > z]
IHFQV
VFUI
UFVR
VFTQ
IHFHT
WFUT
WFIT
WFIT
UFRV
VFHW
UFSV
IHFVH
WFRH
UFUS
WFIW
WFWW
WFVT
WFHQ
VFWP
IHFUW
WFRT
UFTI
WFHH
IPFVS
WFVP
IHFIV
VFWV
WFPS
IIFHI
WFQU
WFHV
IHFVI
IHFQW
VFIW
WFTT
UFHW
WFHS
VFSH
UFRR
WFUS
WFPS
WFQW
WFSI
IIFTT
WFTT
Bichus localisD
tiene un
rzn medi longitudGnhur de WF vos rquelogos enrgdos del yimiento hn hlldo SH hmeros
fsilesD uyos dtos preen en el gudro VFRF ienen los rquelogos indiios su(ientes pr onluir que
hn desuierto en el yimiento un espeie distint de l
Bichus localis c
in primer lugrD oservemos que no nos hn espei(do ningn nivel de signi(in en el enunidoF in
este soD lo hitul es onsiderr = 0.05F in so de que l deisin se muy relevnteD elegirmos un
nivel ms joF
e ontinuin deemos plnter ls hiptesis del ontrsteF in prinipioD l zon de l exvin indi que
l espeie del yimiento deer ser l espeie
Bichus localisD
l hiptesis nul es H0 : = 9D donde por estmos notndo l medi de l rzn longitudGnhur del
hmero de l espeie del yimientoF gomo hiptesis lterntiv nos plntemos que se trte de otr espeieD
es deir H1 : = 9F e trtD por tntoD de un ontrste de dos olsF
r relizrloD deemos lulr en primer lugr el estdstio de ontrsteF steD su vezD requiere del
lulo de l medi y de l desviin tpi muestrl de los dtosF istos vlores sonD respetivmenteD WFRIR
y IFPQWF or tntoD
z=
9.414 9
= 2.363.
1.239/ 50
ehor tenemos que plnternos si este vlor del estdstio nos permite rehzr l hiptesis nul en fvor
de l lterntiv o noF odemos herlo de dos formsX
IF yteniendo l regin de rehzoF hdo que z10.05/2 = 1.96D l regin de rehzo es |z| > 1.96F emos
queD en efetoD 2.363 > 1.96D por lo que podemos rehzr l hiptesis nul en fvor de l lterntiv
on un WS 7 de on(nzD onluyendo on ese nivel de on(nz que se trt de un nuev espeieF
xos quedD sin emrgoD l dud de ser qu huier psdo de tomr un nivel de signi(in ms
exigenteY por ejemploD = 0.01F
Prof. Dr. Antonio Jos Sez Castillo
157
ipo de prue
riptesis
istdstio
ehzo
pEvlor
upuestos
e l izquierd
H0 : = 0
H1 : < 0
filterl
e l dereh
H0 : = 0
H0 : = 0
H1 : = 0
H1 : > 0
x
0
t = sn1 / n
t < t;n1
|t| > t1/2;n1
t > t1;n1
P [Tn1 < t]
2P [Tn1 > |t|]
P [Tn1 > t]
histriuin de proilidd proximdmente norml
Bichus localisD
signi(inA1 F
encuentra como vapor a temperatura ambiente y es indisoluble en agua, no superan el mximo permitido por
la Directiva Europea de Calidad del Aire, cinco microgramos por metro cbico. sta es la principal conclusin
del estudio elaborado por un equipo de la Escuela Andaluza de Salud Pblica
en el gmpo de qirltrF v
notii slo indi que el estudio se s en un muestrD dndo el vlor medio muestrl en vris zons
del gmpo de qirltrD pero no el tmo ni l desviin tpi muestrlF
r relizr el ejemploD nosotros vmos imginr unos dtos orrespondientes un muestr de PH hogres
donde se midi l onentrin de enenoD rrojndo un medi muestrl de SFI mirogrmos por metro
io y un desviin tpi muestrl de IFUF istoy seguro de queD en ese soD el peridio hr sdo
grndes titulres sore l ontminin por eneno en los hogres del gmpo de qirltr peroD podemos
(rmr queD en efetoD se supern los lmites de l hiretiv iurope de glidd del eirec
in primer lugrD de nuevo no nos indin un nivel de signi(in on el que relizr l prueF isogemosD
en prinipioD = 0.05F
enemos que tener uiddoD porque el plntemiento de l prueD tl y omo se nos h plntedoD ser
ontrstr l hiptesis nul H0 : = 5 frente H1 : > 5D en uyo soD un error tipo s se trdue en
onluir que se viol l normtiv undo en relidd no lo heD lo ul es grve porque gener lrm
injusti(d en l polinD mientrs que el error tipo ssD el que no ontrolmos on el D es onluir que
1 Debe quedar claro que, estadsticamente, lo que hemos demostrado es que la razn media es distinta de 9. Son los arquelogos
los que deciden que eso implica una nueva especie.
158
t=
5.1 5
= 0.263.
1.7/ 20
IF i queremos onluir on l regin de rehzoD st est formd por los vlores t > t0.95;19 = 1.729D
luegoD ddo que 0.263 < 1.729D no podemos (rmr on un WS 7 de on(nz que se est inumpliendo
l normtivF
PF il pEvlor es n ms informtivoF u vlor es p = P [T19 > 0.263] = 0.398D por lo que tendrmos
que llegr hst si un RH 7 de signi(in pr rehzr l hiptesis nul en fvor de l lterntiv
(rmndo que se inumple l normtivF
or lo tntoD tl y omo est plntedo el prolemD no podemos (rmr que se est inumpliendo l normtiv
@on un S 7 de signi(inAD por ms que un vlor muestrl de l mediD SFID prez indir que sF vo
que yo reomendr los responsles del umplimiento l normtiv es que umentrn el tmo de l
muestrD y queD por ejemploD si esos mismos dtos orrespondiern IHHH hogres en vez de PHD s se
podr (rmr on un WS 7 de on(nz que se inumple l normtivF
en xD y D s1
n1
y s2
n1
159
ipo de
prue
riptesis
nilterl
l izquierd
H0 : 1 2 = D0
H1 : 1 2 < D0
istdstio
de ontrste
egin de
rehzo
pEvlor
upuestos
nilterl
l dereh
H0 : 1 2 = D0
H1 : 1 2 > D0
filterl
H0 : 1 2 = D0
H1 : 1 2 = D0
()D0
x y
z=
( s1 )
n1
n1
(s2 )
n1
n2
z < z
z > z1
P [Z < z]
2P [Z > |z|]
P [Z > z]
n1 , n2 30F wuestreo independiente y letorio
s1 = 215
roeso ntiguo
n2 = 30
y2 = 1330
s2 = 238
z=
1255 1330
2152
50
= 1.41.
2382
30
8.5.2. Con muestras pequeas (n1 < 30 o n2 < 30) y varianzas iguales
il resumen pree en el gudro VFVF e propsito de l hiptesis de l iguldd de ls vrinzsD st dee
srse en rzones no estdstisF vo hitul es que se supong que son igules porque el experto que est
relizndo el ontrste tiene rzones experimentles pr herloD rzones jens l estdstiF
mos onsiderr omo ejemplo el de un ingeniero que dese omprr dos equipos de trjo pr nlizr
si se omportn de form homogneF r ello reliz un prue de destrez entre los trjdores de
mos equiposX IQ del equipo I y IS del equipo PD uys puntuiones preen en el gudro VFWF ry
indiios su(ientes de que existn diferenis entre ls puntuiones medis de los dos equiposc ( = 0.05)F
160
ipo
e l izquierd
H0 : 1 2 = D0
H1 : 1 2 < D0
riptesis
istdstio
de ontrste
()D0
x y
t=
1
n1
s2
p
egin de
ehzo
pEvlor
1
+n
filterl
e l dereh
H0 : 1 2 = D0
H0 : 1 2 = D0
H1 : 1 2 = D0
H1 : 1 2 > D0
2
2
1
(n1 1)(sn1 ) +(n2 1)(s2 )
n1
, s2 =
p
n1 +n2 2
upuestos
SW
UI
UQ
TQ
UR
RH
TI
QR
WP
QV
TH
RV
VR
TH
SR
US
UQ
RU
RU
RI
IHP
RR
US
VT
QQ
SQ
TV
QW
s2 =
p
12 18.6 + 14 15.8
= 294.09.
13 + 15 2
t=
68.2 53.8
1
294.09( 13 +
= 2.22.
1
15 )
eunque no hemos diho nd l respetoD vmos suponer que ls vrinzs son igulesF isto no pree
deselldo si dmitimos que ls ondiiones en que trjn mos equipos determinn que no dee her
diferenis en l vriilidd de sus puntuionesF ist hiptesis dee ser dmitid y propuest por el experto
@en este soD el ingenieroA que mnej los dtosF
r otener l onlusinD omo siempreD vmos otener l regin de rehzo y vlorr el pEvlorX
IF v regin de rehzo es |t| > t0.975;26 = 2.055F hdo que t = 2.22 e en es reginD podemos rehzr
l iguldd de ls medis on un WS 7 de on(nzF
PF hdo que el pEvlorD p = 2P [T26 > 2.22] = 0.035 es inferior HFHSD podemos rehzr l iguldd de ls
medis on un WS 7 de on(nzF he hehoD podrmos llegr un WTFS 7F
161
ipo de prue
riptesis
nilterl
l izquierd
H0 : 1 2 = D0
H1 : 1 2 < D0
H0 : 1 2 = D0
H1 : 1 2 = D0
istdstio
de ontrste
egin de
rehzo
pEvlor
upuestos
nilterl
l dereh
H0 : 1 2 = D0
H1 : 1 2 > D0
filterl
()D0
x y
t=
(s1 ) +(s2 )
n1
n1
1
n
t < t;2(n1)
t > t1;2(n1)
P [T;2(n1) < t]
2P [T;2(n1) > |t|]
P [T;2(n1) > t]
vs dos muestrs se reogen de form independiente y letori
ems vriles siguen distriuiones proximdmente normles
vs muestrs tienen el mismo tmoD n1 = n2 = n
gudro VFIHX gontrste pr l iguldd de medis on muestrs peques vrinzs distints y mismo
tmo muestrl
ipo de prue
riptesis
istdstio
de ontrste
nilterl
l izquierd
H0 : 1 2 = D0
H1 : 1 2 < D0
t=
upuestos
n1
()D0
x y
2
(s1 )
n1
n1
egin
de rehzo
pEvlor
nilterl
l dereh
H0 : 1 2 = D0
H0 : 1 2 = D0
H1 : 1 2 = D0
H1 : 1 2 > D0
2
2
2
(s1 ) + (s2 )
n1
n1
filterl
( s2 )
+ n1
n2
,v =
n1 1
t < t;v
n2
2 2
s1
n1
n1
(s2 )
n1
n2
2 2
n2 1
t > t1;v
P [Tv < t]
2P [Tv > |t|]
P [Tv > t]
vs dos muestrs se reogen de form independiente y letori
ems vriles siguen distriuiones proximdmente normles
gudro VFIIX gontrste pr l iguldd de medis on muestrs pequesD vrinzs distints y distinto
tmo muestrl
apareadasD
su vrinz muestrlF
d l medi muestrl de x1 y1 , ..., xn yn y sd
n1
162
ipo
riptesis
e l izquierd
H0 : 1 2 = D0
H1 : 1 2 < D0
filterl
H0 : 1 2 = D0
H1 : 1 2 = D0
0
z = sddDn
/
e l dereh
H0 : 1 2 = D0
H1 : 1 2 > D0
z < z
P [Z < z]
z > z1
P [Z > z]
istdstio
ehzo
pEvlor
upuestos
n1
istdstio
filterl
H0 : 1 2 = D0
H1 : 1 2 = D0
0
t = sddDn
/
ehzo
pEvlor
upuestos
t < t;n1
|t| > t1/2;n1
t > t1;n1
P [Tn1 < t]
2P [Tn1 > |t|]
P [Tn1 > t]
D = X Y D es proximdmente norml
riptesis
e l izquierd
H0 : 1 2 = D0
H1 : 1 2 < D0
e l dereh
H0 : 1 2 = D0
H1 : 1 2 > D0
n1
doble ciego
3.21 2
= 3.375
1.134/ 10
y el pEvlor soido es p = P [T9 > 3.375] = 0.004F emos que l signi(in determin un pEvlor inferiorD
por ejemploD = 0.05D por lo que podemos onluir on ese nivel de signi(in que l mejor es superiorD
en mediD P puntos yD por tntoD el medimento es rentleF
2 Podra
163
rej
I
P
Q
R
S
T
U
V
W
IH
wedimento
QPFIH
QTFIH
QPFQH
PWFSH
QRFQH
QIFWH
QQFRH
QRFTH
QSFPH
QPFUH
leo
PUFIH
QIFSH
QHFRH
PTFWH
PWFWH
PVFUH
QHFPH
QIFVH
QQFTH
PWFWH
hifereni
SFHH
RFTH
IFWH
PFTH
RFRH
QFPH
QFPH
PFVH
IFTH
PFVH
nilterl
l izquierd
H0 : p = p0
H1 : p < p0
filterl
H0 : p = p 0
H1 : p = p 0
z=
nilterl
l dereh
H0 : p = p0
H1 : p > p0
pp0
p0 (1p0 )
n
P [Z < z]
2P [Z > |z|]
P [Z > z]
z < z
z > z1
np0 , n (1 p0 ) 10
xitoD
mos onsiderr un primer ejempo reltivo l relin entre el gnero y los identes de tr(oF e
estim que el TH 7 de los ondutores son vronesF or otr prteD un estudio relizdo sore los dtos de IPH
identes de tr(o muestr que en ellos el UH 7 de los identes fueron provodos por un vrn ondutorF
odemosD on esos dtosD on(rmr que los homres son ms peligrosos l volntec
i notmos por p l proporin de vrones usntes de identes de tr(oD l pregunt se responder
(rmtivmente si logrmos ontrstr l hiptesis H1 : p > 0.6F il vlor del estdstio es
z=
0.7 0.6
= 2.236.
0.60.4
120
or su prteD l regin de rehzo ser |z| > 1.96 pr un = 0.05D luego en efetoD podemos onluir que l
proporin de vrones usntes de identes es superior l proporin de vrones ondutores en generlF
il pEvlorD de hehoD es HFHIQF
mos nlizr on muho detlle otro ejemplo sore iguldd de proporionesF he tods formsD lo que
quiero enftizros on el ejemplo no est reliondo en s on el heho de que se re(er un proporinF
Una marca de nueces arma que, como mximo, el 6 % de las nueces estn vacas. Se eligieron 300 nueces
164
al azar y se detectaron 21 vacas. Con un nivel de signicacin del 5 %, se puede aceptar la armacin de
la marca?
in primer lugrD pedir un nivel de signi(in del S 7 es equivlente pedir un nivel de on(nz del
WS 7 FFF sore quc xos preguntn si se puede eptr l (rmin de l mr
con un nivel de
signicacin del 5 %, es decir, con un nivel de conanza del 95 %F iso impli que queremos
pror on mplis grnts que l mr no mienteD y l ni form de herlo es poner su hiptesis
@p < 0.06A en l hiptesis lterntivF or tntoD tendrmos H0 : p 0.06 frente lo que (rm l
mrD H1 : p < 0.06F
ehor ienD (jmonos que l proporin muestrl de nuees vs es p = 21/300 = 0.07F is deirD nos
piden que vemos si un proporin muestrl de HFHU d su(iente on(nz @WS 7 pr ser extosA de
que p < 0.06FFF xo d ningun3 xi siquier he flt her el ontrste on nmerosF tms podremos
rehzr l hiptesis nul en fvor de l hiptesis de l mrD es deirD en soluto podemos (rmr
lo que die l mrD p < 0.06D on un WS 7 de on(nzF he tods formsD por si hy lgn inrduloD
0.070.06
el estdstio de ontrste ser z = 0.060.94 = 0.729F v regin de rehzoD ddo que es un test l
300
izquierdD ser z < z0.05 = 1.645F gomo vemosD el vlor del estdstio de ontrste est en l ol de
l dereh y l regin de rehzo en l de l izquierdF or eso de ntes que es imposile rehzr l
hiptesis nul en fvor de l lterntivD independientemente del nivel de on(nz requeridoF
rst hor hemos demostrdo que l mr no puede (rmr que l proporin de nuees vs es
inferior l T 7 on un WS 7 de on(nzF he hehoD no lo puede (rmr on ningn nivel de on(nzD
porque los dtos tomdos proporionn un estimin de HFHU que v justo en ontr de su hiptesisF
ero vmos suponer que nos ponemos gllitos y deimosX es
cias empricas que proporcionan un 95 % de conanza en que la compaa miente, siendo en realidad
la proporcin de nueces vacas superior al 6 % F
(rmmos p > 0.06 on un WS 7 de on(nzD lo que equivle deir que hemos plntedo un nuevo
ontrste de hiptesis en el que H0 : p 0.06 frente H1 : p > 0.06F vs uents estn si hehsD y
que el vlor del estdstio de ontrste es el mismoD z = 0.729D mientrs que l regin de rehzo es
z > z0.95 = 1.645F ehor el vlor del estdstioD es deirD l informin que nos dn los dtos @PI de
QHH nuees vsAD s es oherente on l hiptesis lterntivD de h que est en l mism ol que l
regin de rehzoFFF pero no e en ell3F or lo tntoD no tenemos su(ientes evidenis en los dtos
pr rehzr l hiptesis nul en fvor de l lterntiv on un WS 7 de on(nzD s que no podemos
demostrr on ese nivel de on(nz que l mr mienteF
in resumenD unque prez prdjioD no tenemos su(ientes evidenis en los dtos pr (rmr
que l omp die l verddD pero tmpoo pr demostrr que mienteF v difereni entre ms
hiptesis rdi en que no tenemos ningun on(nz en l (rmin de l ompD y s lgun
on(nz en l (rmin ontrriF gunt on(nz tenemos en l (rmin ontrri p > 0.06c
ise vlor viene ddo por el pEvlorD P [Z > 0.729] = 0.233D que determin que el nivel de on(nz en
entonces qu hacemos? F
lo nio que podemos reomendr es umentr el tmo de l muestrD es deirD romper ms de QHH
nuees pr tomr l deisinF eprentementeD l informin reogid on QHH nuees pree indir
Prof. Dr. Antonio Jos Sez Castillo
165
ipo de
prue
riptesis
nilterl
l izquierd
H0 : p1 p2 = D0
H1 : p1 p2 < D0
istdstio
de ontrste
filterl
H0 : p1 p2 = D0
H1 : p1 p2 = D0
p1 p2 D0
z=
p(1p)
egin
de rehzo
pEvlor
upuestos
1
n1
, p=
1
+n
nilterl
l dereh
H0 : p1 p2 = D0
H1 : p1 p2 > D0
n1 p1 +n2 p2
n1 +n2
z < z
z > z1
P [Z < z]
2P [Z > |z|]
el menos IH xitos y IH frsos
P [Z > z]
son grndes pr poder plir el eorem gentrl del vmite l hor de trjr on el estdstio de
ontrsteF il resumen del ontrste pree en el gudro VFITF
mos onsiderr un estudio3 on dtos relesD unque lgo ntiudosD referente l relin entre los
identes de tr(o y el onsumo de loholD relizdo por l hq en l gomunidd eutnom de xvrr
en IWWIF
e relizron prues de loholemi en PUR ondutores implidos en identes de tr(o on heridosD
de los ulesD VV dieron positivoF or su prteD l qurdi givil de r(o reliz en l mism zon IHRR
ontroles de loholemi l zrD de los ules IS dieron positivoF
vo que l hq quiere demostrr es que el lohol es usnte de los identes de tr(oF in emrgoD
desde el punto de vist estdstio slo podemos ontrstr l hiptesis de que l proporin de positivos en
l prue de loholemi es myor en el grupo de ondutores implidos en identes de tr(oF
xotemos por p1 y p2 ls verdders proporiones en el grupo de implidos en identes y en el grupo
de ondutores no implidosF e nos pide ontrstr H0 : p1 = p2 frente H1 : p1 > p2 F il estdstio de
ontrste es
88
274
z=
88+15
274+1044 (1
15
1044
88+15
1
274+1044 )( 274
= 904.29.
+
1
1044 )
ist lro que el vlor del estdstio es estilD sin neesidd de vlorr l regin de rehzoD que ser
z > z0.95 = 1.645D luego podemos rehzr l hiptesis nul en fvor de l lterntiv onD l menosD el WS 7
de on(nzF il pEvlorD p = P [Z > 904.29] = 0 indi que l on(nz esD de hehoD stnte myorF
xo puedo resistirme onluir el ejemplo sin reordr que lo que l hq relmente querr dr entender
es que el lohol es el usnte de los identes de tr(oD pero que eso no puede ser demostrdo on el
ontrsteF
3 http://www.dgt.es/educacionvial/imagenes/educacionvial/recursos/dgt/EduVial/50/40/index.htm
166
ipo de prue
riptesis
istdstio
de ontrste
ehzo
pEvlor
upuestos
nilterl
l izquierd
2
H0 : 2 = 0
2
H1 : 2 < 0
filterl
2
H0 : 2 = 0
2
H1 : 2 = 0
2 =
nilterl
l dereh
2
H0 : 2 = 0
2
H1 : 2 > 0
(n1)s2
n1
2
0
2 < 2
/2;n1 o
2 > 2
1;n1
2 > 2
1/2;n1
2
2
2
2
2
2
2
P [n1 < ]
2min(P [n1 < ], P [n1 > ])
P [n1 > 2 ]
histriuin de proilidd proximdmente norml
2 < 2
;n1
2 =
49 0.6
= 45.938.
0.64
OjoX ntes de que l empres idel se enfde on nosotrosD no olvidemos que los dtos son imginriosX slo
son reles ls espei(iones tnis de < 0.8gr.
4 http://www.sidel.com/es/products/equipment/the-art-of-lling/hema-gw
Prof. Dr. Antonio Jos Sez Castillo
167
ipo
riptesis
nilterl
l izquierd
H0 :
H1 :
2
1
2
2
2
1
2
2
=1
H0 :
<1
H1 :
istdstio
ehzo
pEvlor
upuestos
nilterl
l dereh
filterl
f=
2
1
2 = 1
2
2
1
2 = 1
2
2
(s1 )
n1
H0 :
H1 :
2
1
2
2
2
1
2
2
=1
>1
(s2 )
n1
f=
2
X
2
Y
12.062
= 1.1172.
11.412
mos tomr un nivel de signi(in de = 0.05F v regin rti viene delimitd por el vlor f0.95;19,19 =
2.168F hdo que f = 1.1172 < f0.95;19,19 = 2.168D no podemos onluir l nivel de signi(in = 0.05 que
l durez del metl sio se ms vrile que l durez medid en l solddurF
il pEvlorD por su prteD es p = P [F19,19 > 1.1172] = 0.4058F
factor
168
cara al uso de las tablas hay una propiedad bastante til: fp;v1 ,v2 = 1/f1p;v2 ,v1
es necesario, aunque s deseable, que todas las muestras tengan el mismo tamao.
Prof. Dr. Antonio Jos Sez Castillo
H0 : 1 = ... = m
frente
n
1
i,n
i = 1, ..., mF
iste ontrste se denomin exye omo rnimo de
Analysis of VarianceD
s en nlizr qu se dee l vriilidd totl que presentn los dtosD si l zr o ls diferenis entre
ls poliones de ls que proeden ls muestrsF
upongmos que
juntamos
N=
ni ,
i=1
y lulmos su mediD
m
i=1
x=
ni
j=1
xi
j
IF in primer lugrD los dtos vrn glolmente respeto l medi totlF n medid de est vriin
es l
ni
xi x
SCT =
i=1 j=1
PF or otro ldoD puede her diferenis entre ls medis de d grupo y l medi totlF odemos medir
ests diferenis on l
ni (i x) .
x
SCE =
i=1
SCE
muestrales
entre ls medis de d
SCE
ser grndeF
ni
xi xi
SCD =
i=1 j=1
suma de los
(ni 1) s2 i 1 .
i,n
=
i=1
169
de la varianzaX
teorema de particin
SCDF
SCE
SCT
2
SCE
2
SCD
2
F =
SCE
m1
SCD
N m
x=
y on ell
m
i=1
ni
j=1
m
2
i=1
ni x2 N x2 .
i
ni (i x) =
x
SCE =
PF glulmos
xi
j
i=1
ni
xi xi
SCD =
(ni 1) s2 i 1 .
i,n
i=1 j=1
i=1
F =
SCE
m1
SCD
N m
RF ommos l deisinX
aA
bA
170
gomposiin
e
f
g
h
wedi muestrl
PSQFV
PTQFP
PUIFH
PTPFH
in primer lugrD oservemos que los tmos muestrles son igulesX n1 = ... = n4 = 5F
or otr prteD tenemosX
x=
F =
743.4
41
1023.6
204
= 3.8734.
or su prteD el vlor de F3,16;0.95 es QFPQVWD de mner que podemos (rmr que existen diferenis
signi(tivs entre ls durezs de los R ompuestosD on un WS 7 de on(nzF
Ejemplo. in fiolog woleulr se estudi l relin que puede tener el nivel de expresin de un gen
on l posiilidd de pdeer un tipo de nerF n investigdor onsigue nlizr el nivel de expresin de
IH genes en un muestr de pientes y reliz IH ontrstes de hiptesis donde l hiptesis lterntiv de
d uno de ellos die que un gen est reliondo on l posiilidd de pdeer ese nerF vos pEvlores
otenidos son los siguientesX
(0.1, 0.01, 0.21, 0.06, 0.32, 0.24, 0.45, 0.7, 0.08, 0.0003)
171
10 > 0.05)Y por el ontrrioD ddo que 0.0003 10 < 0.05D el ltimo gen sigue siendo onsiderdo
signi(tivmente reliondo on el nerF
tiene dos mquinas distintas para ello. Le interesa que los cojinetes producidos tengan dimetros similares,
independientemente de la mquina que los produce, pero tiene sospechas de que est produciendo algn problema de falta de calibracin entre ellas. Para analizar esta cuestin, extrae una muestra de 120 cojinetes que
se fabricaron en la mquina A, y encuentra que la media del dimetro es de 5.068 mm y que su desviacin
estndar es de 0.011 mm. Realiza el mismo experimento con la mquina B sobre 65 cojinetes y encuentra que
la media y la desviacin estndar son, respectivamente, 5.072 mm y 0.007 mm. Puede el ingeniero concluir
que los cojinetes producidos por las mquinas tienen dimetros medios signicativamente diferentes?
in este soD fortundmente tenemos un tmo muestrl que v permitir ovir l hiptesis de normliE
ddF emos que se plnte un supuesto que puede ser nlizdo trvs de l mediD en onretoD omprndo
l medi de ms mquinsF i llmmos X l dimetro de l mquin e e Y l dimetro de l mquin
fD tenemos que ontrstr H0 : X = Y frente H1 : X = Y F
il estdstio de ontrste es
z=
5.068 5.072
0.0112
120
= 3.013.
0.0072
65
il pEvlor soido es 2 P [Z < 3.361] = 0.002D luego tenemos evidenis de queD en efetoD el dimetro
medio de ms mquins es distintoF
172
Captulo 9
Contrastes de hiptesis no paramtricas
odos prendemos de l experieniD y l lein en est osin es que nun se dee perder
de vist l lterntivF
herlok rolmes @eF gF hoyleAD en vs eventurs de flk eter
Resumen. gontinundo on los ontrste de hiptesisD presentmos en este ptulo nuevos ontrstes que
permitirn deidir si un juste medinte un distriuin teri es vlido y vlorr si existe relin entre
vriles ulittivsF
9.1. Introduccin
odos los ontrstes que hemos desrito en el ptulo nterior se snD diret o indiretmente @ trvs
del teorem entrl del lmiteA en que los dtos se justn l distriuin normlD hiendo infereni de
un u otr form sore sus prmetrosF in este ptulo vmos onsiderr ontrstes que no neesitn
de tl hiptesisD por lo que no se enunin omo ontrstes sore lgn prmetro desonoidoX de h que
formen prte de los llmdos contrastes
juzgar
si ese
juste es ueno o mloD o mo de ueno esF he hehoD en l relin de prolems orrespondiente dejmos
iert est uestinD y que slo pudimos vlorr est
lo que slo nos dio un visin pril del prolemD que puede ser muy sujetivF
vos dos ontrstes de hiptesis que vmos desriir hor vn permitir ontrstr omo hiptesis nul
esultdo
I
P
Q
R
S
T
otl
yservdos
IHS
IHU
VW
IHQ
III
VS
THH
isperdos
IHH
IHH
IHH
IHH
IHH
IHH
THH
H0 : p1 = ... = p6 =
1
6
frecuencias observadasF
or otr prteD si el ddo fuer justo @hiptesis H0 AD en THH lnzmientos deern drse proximdmente
IHH de d resultdo posileF sts freuenis se denominn
frecuencias esperadasF
e ontinuinD vmos desriir el test 2 D que permite relizr prues de este tipoF gomo hemos omentdo
en l introduinD on ell podremos
juzgar
puntulD pero tmin podremos utilizrl en ejemplos omo el que mos de verD en el que el experto
est interesdo en ontrstr dtos experimentles on respeto un distriuin teri que le result de
intersF
in primer lugr y de form ms generlD supongmos que tenemos un muestr de tmo N de un vFF
disret o ulittivD X D justd un modelo ddo por un distriuinF
174
gonsideremos un prtiin del onjunto de vlores que puede tomr l vrileX S1 , ..., Sr F in prinipioD
est prtiin podrn ser simplemente todos y d uno de los vlores que tom l vrile X D peroD omo
veremosD es posile que tengmos que grupr lgunos de ellosF
eguidmenteD onsideremos l proiliddD segn l distriuin dd por el juste que queremos evlurD
de d un de ests prtesD
pi = P [X Si /H0 ] > 0.
he igul formD lulemos Oi D el nmero de oserviones de l muestr que en en d onjunto Si .
v ide del test es omprr el nmero de oserviones Oi que en relmente en d onjunto Si on el
nmero esperdo de oserviones que deern er en Si si el juste es el ddo por nuestro modeloD que
ser N pi F r elloD un medid que ompr ests dos ntiddes viene dd por
r
D=
i=1
(Oi N pi )
.
N pi
iD pr un muestr ddD est vFF tom un vlor d muy ltoD indi que los vlores oservdos
no cuadran
on el juste que hemos propuesto @on lo ul se rehzr l hiptesis nul en fvor de l lterntivAY
siD por el ontrrioD tom un vlor d joD indi que nuestro juste orresponde ien on los dtos de l
muestrD por lo que es
aceptable
l hiptesis nulF
il prolem (nl es deidir undo el vlor de l vFF D, dD es lo su(ientemente lto omo pr que nos
resulte ineptle el justeF r deidirlo hy que tener en uent que undo N es rzonlemente lto y
l hiptesis H 0 es iertD l distriuin de proilidd de D es 2 on r k 1 grdos de liertdD es deirD
N >>
D/H0 2
rk1 ,
donde k es el nmero de prmetros que hn sido estimdos en el justeF eniendo en uent este resultdoD
se lul jo est distriuin l proilidd de que se de un vlor todv ms lto que d @el pEvlorD por
tntoAD
p = P [D > d/H0 ] .
i est proilidd es inferior l S 7D se rehz l hiptesis nul en fvor de l lterntiv on un WS 7 de
on(nzF hiho de otr formD se ept l hiptesis nul slo si el vlor de D entr dentro del WS 7 de
resultdos ms fvorles ellF
isquemtimenteD el proeso es el siguienteX
IF e enuni el testX
175
xi
preF osF
H
RP
I
PV
P
IQ
Q
S
R
U
S
Q
T
P
d=
i=1
(Oi N pi )
.
N pi
p = P [D > d/H0 ] ,
segn un distriuin 2 on r k 1 grdos de liertdF
TF e tom l deisin @pr un nivel de on(nz del 95 %AX
aA
bA
i p 0.05D se onluye que no hy evidenis en ontr de (rmr que los dtos se justn l
distriuin ddF
Ejemplo.
vos dtos que se presentn en el gudro WFP onstituyen un muestr letori simple del
tiempo en msF que trnsurre entre l llegd de pquetes trnsmitidos por un determindo protooloF
in l tl preen los vlores junto l nmero de vees que hn sido oservdos en l muestrF
e sospeh que un distriuin geomtri puede justr ien esos dtosF mos relizr ese juste
y ontrstr si es eptle medinte el test de l hiEudrdoF
in primer lugrD pr justr un distriuin geomtri deemos estimr el prmetro de l mismF
mos herlo de form senill por el mtodo de los momentosF il vlor de l medi de l distriuin
es 6ia de donde p =
1
1+EX .
p=
1
.
1+x
or su prteD
x=
0 42 + 1 28 + 2 13 + 3 5 + 4 7 + 5 3 + 6 2
= 1.24,
100
luego 6
176
es puesD desemos ontrstr en qu medid el juste de un Geo (0.4464) es vlido pr los dtos de
l muestrF is deirD desemos ontrstr H0 : X Geo (0.4464) frente l lterntiv H1 : X
Geo (0.4464) .
mos lulr ules son ls proiliddes teris segn es distriuin de los vlores oservdos
en l muestrX
0
d=
p valor =
1.7973
1
2
1
2x
3
2 1
3
2
e 2 x
dx = 0.61552.
el ser superior @muy superiorD de hehoA HFHSD podemos (rmr que no hy evidenis en los dtos de
l muestr en ontr de que stos sign un distriuin Geo (0.4464)F
177
xi
Oi
N pi
(Oi N pi )
0
1
2
3
4
42
28
13
5
12
44.64
27.71
13.68
7.57
9.38
e l hor de lulr este mximo deemos tener en uent que l vrile x es de tipo ontinuoF
v hiptesis nul ontrstr es
SN x(i) =
i
NF
dN = mx
a
1iN
mx
a
F x(i) SN x(i)
, F x(i) SN x(i1)
100 % de on(nzF
v distriuin de proilidd de DN D neesri pr lulr el pEvlorD no es muy onoidF edemsD
pr evlur est proilidd hy que tener en uent el nmero de prmetros de l distriuin en el
178
justeF n metodolog deud pr ello es onoid omo wtodos de wonte grloD unque exede los
ontenidos de estos puntesF heo dvertir que muhos de los pquetes estdstios ms hitules pueden
induir error en el lulo de este pEvlorD y que proporionn por defeto qul orrespondiente un
juste en el que no se estime ningn prmetro en l distriuin jo l hiptesis nulD dndo lugr un
soreestimin de diho pEvlorF
IFRTRU
HFPQQQ
HFRWWS
HFHVIR
HFUPIT
HFQHQS
HFIISI
IFUQSV
HFPUIU
HFWHPI
HFUVRP
HFHTTU
QFWVWV
HFHVTV
HFIWTU
HFVWHW
HFVIHQ
HFIIPR
HFRVSR
HFHSIP
Ejemplo. vos dtos que preen en el gudro WFR orresponden l tiempo en seF entre onexiones
un servidorF xos plntemos si un distriuin exponenil es deud pr su justeF
in primer lugr hemos de deidir ul es el juste propuestoF il estimdor mximo verosmil del prE
exp (1.4489)D
F (x) = 1 e1.4489x , x 0
on l funin de distriuin empriF il gudro WFS muestr ms funiones de distriuinF he ell
se dedue que el vlor del estdstio de ontrste es 0.172 72F il pEvlor soido @luldo por wtodos
de wonte grlo on A tom el vlor
x(i)
0.0512
0.0667
0.0814
0.0868
0.1124
0.1151
0.1967
0.2333
0.2717
0.3035
F x(i)
7.1499 102
9.2119 102
0.11125
0.11818
0.15029
0.1536
0.24798
0.28682
0.32542
0.3558
i
20
i1
20
0.05
0.1
0.15
0.2
0.25
0.3
0.25
0.4
0.45
0.5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
x(i)
0.4854
0.4995
0.7216
0.7842
0.8103
0.8909
0.9021
1.4647
1.7358
3.9898
F x(i)
0.50505
0.51506
0.64849
0.67897
0.69089
0.72496
0.72938
0.88023
0.91914
0.99691
i
20
i1
20
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
1
0.5
0.55
0.6
0.65
0.7
0.75
0.8
0.85
0.9
0.95
179
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.5
1.5
2.5
3.5
pigur WFIX puniones de distriuin teri y empriF lor donde se d el estdstio de uolmogorovE
mirnofF
Ejemplo.
ist reliond l ideolog polti on el gnero del votntec is deirD nos plntemos si
el que un person se delre de izquierds o de derehs depende de si es vrn o mujerF ixisten dos
vriles ulittivs o rterstis que dividen l polinF vo que nos interes es si es divisin
est o no reliondF ern ms onservdors ls mujeresc
P [X = xi , Y = yj ] = pij
s
P [X = xi ] = pi. =
pij
j=1
180
P [Y = yj ] = p.j =
pij .
i=1
P [X = xi , Y = yj ] = P [X = xi ] P [Y = yj ] ,
es deirD si
ni. =
s
j=1
r
i=1
observadasA,
yj .
he est formD
pij =
nij
n
pi. =
ni.
n
p.j =
n.j
n
eij = n pi . p.j .
fsdo en l muestrD los vlores
ni. n.j
=
n
@frecuencias
pinlmenteD el estdstio del ontrste se s en omprr los vlores reles en l muestr de nij on
los vlores eij que se drn si l hiptesis nul fuer iertD es deirD si ls rterstis X e Y fuern
181
d=
i=1 j=1
(nij eij )
.
eij
uponiendo que l hiptesis nul es iertD l distriuin del estdstio del ontrste es 2 on (r 1) (s 1)
grdos de liertdD por lo que deidiremos en funin del pEvlor soidoD
p = P [D > d/H0 ] ,
donde D 2
(r1)(s1) o ienX
ehzremos H0 on nivel de signi(in si d > 2
(r1)(s1);1 .
xo rehzremos H0 on nivel de signi(in si d < 2
(r1)(s1);1 .
ry que her un ltim oservinX pr que en efeto D 2 on (r 1) (s 1) es neesrio que tods
@o si todsA ls freuenis esperds eij sen myores o igules SF i lgun o lguns de ells no lo
sonD l distriuin 2 podr no ser deud y el resultdo del test inorretoF r que esto no ourr es
reomendle que el tmo de l muestr se grndeF
hereh
gentro
otl
wujeres
TV
ST
QP
IST
romres
SP
UP
PH
IRR
otl
IPH
IPV
SP
QHH
nij yD en los mrgenes inferior y lterl derehoD los vlores ni. y n.j .
mos ver si el gnero est reliondo on l ideologF i no fuer sD si l ideolog fuer independiente
del gneroD se tendr en un muestr de QHH individuos ls freuenis esperds sern
szquierd
wujeres
romres
otl
156
300 300
144
300 300
120
300
120
300
IPH
hereh
156
300 300
144
300 300
128
300
128
300
IPV
gentro
156
300 300
144
300 300
SP
otl
52
300
52
300
IST
IRR
QHH
szquierd
hereh
gentro
otl
wujeres
TTFST
PUFHR
IST
SUFTH
TIFRR
PRFWT
IRR
otl
182
TPFRH
romres
IPH
IPV
SP
QHH
(68 62.40)
(56 66.56)
(32 27.04)
+
+
+
62.40
66.56
27.04
2
2
2
(52 57.60)
(72 61.44)
(20 24.96)
+
+
+
= 6.433.
57.60
61.44
24.96
D=
or su prteD 2
(21)(31);0.95 = 5.991D de mner que podemos rehzr l hiptesis nul en fvor de l
lterntivD (rmndo on un WS 7 de on(nz que el genero est reliondo on l ideologF in qu
sentido lo estrc
i nos entrmos slo en los de izquierdsD tenemos que el porentje de homres y mujeres es de
68
120
100 % = 56.667 % y de
52
120
i nos entrmos slo en los de derehsD tenemos que el porentje de homres y mujeres es de
56
128
100 % = 43.75 % y de
72
128
pinlmenteD si nos entrmos slo en los de entroD tenemos que el porentje de homres y mujeres
es de
32
52
100 = 61.538 % y de
20
52
vo que pree que ourre es que ls mujeres tienen myor prefereni por l derehF in emrgoD est
(rmin no se h ontrstdoD sino que se s simplemente en dtos desriptivos1 F
En una empresa se sospecha que hay franjas horarias donde los accidentes
laborales son ms frecuentes. Para estudiar este fenmeno, contabilizan los accidentes laborales que sufren
los trabajadores segn franjas horarias, durante un ao. Los resultados aparecen en la tabla.
rors del d
VEIH hF
IHEIP hF
IQEIS hF
ISEIU hF
xmero de identes
RU
SP
SU
TQ
Con esa informacin, los responsables de seguridad de la empresa deben decidir si hay franjas horarias donde
los accidentes son ms probables o si, por el contrario, stos ocurren absolutamente al azar.
in primer lugr deemos plnternos l hiptesis que queremos ontrstrF il heho de que ourrn los
identes solutmente l zr vendr deir que l proilidd de ourreni es l mism en d frnj
horri @puesto que tods ells tienen l mism mplitudAF or elloD si notmos pi l proilidd de que
ourr un idente en l iEsim frnj horriD nos plntemos omo hiptesis nul H0 : p1 = ... = p4 =
1
4
183
2 =
or su prteD el pEvlor es p = P [2
401 > 2.571] = 0.462D por lo que no tenemos evidenis en estos dtos
que hgn pensr en que hy frnjs horris ms propiis los identesF
184
Captulo 10
Regresin lineal simple
Resumen. in este ptulo se desrie el modelo de regresin linel simpleD que sume que entre dos vriles
dds existe un relin de tipo linel ontmind por un error letorioF eprenderemos estimr diho
modelo yD prtir de ests estimiones y jo determinds hiptesisD podremos extrer prediiones del
modelo e inferir l fortlez de dih relin linelF
Palabras clave: regresin linel simpleD vrile dependienteD vrile independienteD error letorioD nue
de puntosD prinipio de mnimos udrdosD oe(iente de orrelin linelD oe(iente de determinin
linelD ondd del justeD prediinD estiminF
10.1. Introduccin
no de los spetos ms relevntes que ord l istdsti se re(ere l nlisis de ls reliones que se dn
entre dos vriles letorisF il nlisis de ests reliones est muy freuentemente ligdo l nlisis de
un vrileD llmd variable
dependiente (Y ) , y del efeto que sore ell tiene otr @u otrsA vrile@sAD
llmd@sA variable(s) independiente(s) (X)D y permite responder dos uestiones sisX
is signi(tiv l in)ueni que tiene l vrile independiente sore l vrile dependientec
Ejemplo. n equipo de investigdores que trjn en seguridd en el trjo est trtndo de nlizr
mo l piel sore un ierto omponente qumio peligrosoF r elloD olo diferentes volmenes del
ompuesto qumio sore diferentes segmentos de piel durnte distintos intervlos de tiempoD midiendo
l o de ese tiempo el porentje de volumen sorido del ompuestoF il diseo del experimento se h
IVS
relizdo pr que l interin esperle entre el tiempo y el volumen no in)uy sore los resultdosF
vos dtos preen en el gudro IHFI
vo que los investigdores se uestionn es si l ntidd de ompuesto por un ldo y el tiempo de
exposiin l que se somete por otroD in)uyen en el porentje que se soreF he ser sD ser interesnte
estimr el porentje de sorin de persons que se sometn un exposiin de un determind
ntiddD por ejemploD durnte V horsF
in un primer proximin l prolemD podemos oservr un representin gr( de los dtos en
los digrms de dispersin o nues de puntos de l pigur IHFIF u (rmrmosc ree que s hy
un relin linel ms o menos lr @pero no de(nitivA entre el tiempo de exposiin y el porentje
de sorinD pero l hy entre el volumen y el porentje de sorinc
ixperimento
I
P
Q
R
S
T
U
V
W
olumen
HFHS
HFHS
HFHS
PFHH
PFHH
PFHH
SFHH
SFHH
SFHH
iempo
P
IH
PR
P
IH
PR
P
IH
PR
orentje esorido
SHFVV
RWFWT
VQFTT
SRFHW
TVFPU
VSFTS
RVFQW
TRFVV
VVFHI
@variable
Y represent l vrile dependienteD es deirD quell vrile que desemos estudir en relin
on otrsF
X represent l vrile independienteD es deirD quells que reemos que puede fetr en lgun
medid l vrile dependienteF v estmos notndo en mysulD indindo que podr ser un
vrile letoriD pero hitulmente se onsider que es un onstnte que el investigdor puede (jr
su ntojo en distintos vloresF
represent el error
aleatorioD es deirD quell ntidd @letoriA que provo que l relin entre
l vrile dependiente y l vrile independiente no se perfetD sino que est sujet inertidumreF
186
80
70
60
50
Porcentaje.Absorbido
80
70
60
50
Porcentaje.Absorbido
15
Tiempo
Volumen
Y = 0 + 1 X.
vo que en primer lugr resultr desele de un modelo de regresin es que estos errores letorios ourrn en
l mism medid por exeso que por defetoD se ul se el vlor de X D de mner que E [/X=x ] = E [] = 0
yD por tntoD
E [Y /X=x ] = 0 + 1 x + E [/X=x ]
= 0 + 1 x.
is deirD ls medis de los vlores de Y pr un vlor de X ddo son un retF
v pigur IHFP represent un nue de puntos y l ret de regresin que los just de unos dtos genriosF
odemos ver el vlor onreto de = y E [Y /X=x ] pr un dtoD supuesto que hemos otenido un modelo
de regresinF in ell se puede ver tmin l interpretin de los oe(ientes del modeloX
0 es
la ordenada al origen del modeloD es deirD el punto donde l ret interept o ort l eje yF
1 represent
la pendiente
187
100
105
0 + 1xi
85
90
95
yi
xi
50
60
70
80
90
100
Nota. is evidente que l utilidd de un modelo de regresin linel tiene sentido siempre que l relin
hipotti entre X e Y se de tipo linelD pero qu ourre si en vez de ser de este tipo es de otro tipo
@exponenilD logrtmioD hiperlioFFFAc
in primer lugrD es solutmente onveniente diujr el digrm de dispersin ntes de omenzr
trtr de otener un modelo de regresin linelD y que si l form de este digrm sugiere un per(l
distinto l de un ret quiz deermos plnternos otro tipo de modeloF
D por otr prteD si se oserv que el digrm de dispersin es de otro tipo onoidoD puede optrse
por relizr un mio de vrile pr onsiderr un modelo linelF ixisten tnis muy senills pr
est uestinD pero no ls veremos quF
deeremos
estimr los oe(ientes 0 y 1 del modeloF r otener estimdores de estos oe(ientes vmos onsiderr
un nuevo mtodo de estiminD onoido omo
jo determindos supuestos que veremos en reveD los estimdores de mnimos udrdos oiniden on los
estimdores mximoEverosmiles de 0 y 1 .
il rzonmiento que motiv el mtodo de mnimos udrdos es el siguienteX si tenemos un muestr de
188
usremos vlores estimdos de 0 y 1 , que notremos por 0 y 1 , de mner que en el modelo justdoD
y x = 0 + 1 x
E [Y /X=x ] = 0 + 1 x,
luego yx puede interpretrse de dos formsX
yi (0 + 1 xi )
SSE =
i=1
es deir usmos
0 , 1 = arg m SSE .
n
0 ,1
e llm
dada X
l lne que tiene l SSE ms peque de entre todos los modelos linelesF
v soluin de ese prolem de mnimo se otiene por el menismo hitulX se deriv SSE respeto de 0
SSxy
y 1 , se igul ero y se despejn estosF v soluin es 1 = SSxx y 0 = y 1 x, donde
n
(xi x) (yi y ) =
SSxy =
i=1
n
n
2
x2 n2 .
x
i
(xi x) =
SSxx =
xi yi ny
x
i=1
i=1
i=1
y i ( 0 + 1 x i )
SSE =
i=1
=SSyy
2
SSxx SSyy SSxy
SSxx
SSxy 2
= SSyy SSxy 1 .
SSxx
189
in este sentidoD se de(ne omo medid de l lidd del juste de l ret de regresin el
juste omo
SSE
=
n2
se =
yi 0 + 1 x
n2
SSyy 1 SSxy
.
n2
Ejemplo. r los dtos sore el ejemplo de l sorin del ompuestoD vmos lulr e interpretr
ls dos rets de regresin posilesF
in primer lugrD vmos onsiderr l ret de regresin pr explir el porentje de sorin @y)
onoido el volumen de sustni @xAX
SSxy
= 0.97
1 =
SSxx
0 = y 1 x = 63.69,
s que l ret de regresin justd es
yx = 63.69 + 0.97 x.
SSxy
1 =
= 1.60
SSxx
0 = y 1 x = 46.82,
190
yx = 46.82 + 1.60 x.
Nota. ry que her un oservin importnte que suele onduir freuentes erroresF v ret de
regresin pr l vrile dependiente Y D dd l vrile independiente X no es l mism que l ret
de regresin de X dd Y F v rzn es muy senillX pr otener l ret de regresin de Y ddo X
deemos minimizr
yi 0 + 1 xi
i=1
191
xi 0 + 1 yi
i=1
SSxy
1 =
SSyy
0 = x 1 y ,
despejandoF
is importnte queD pr terminr este prtdoD reordemos que 0 y 1 son slo estimiones de 0 y 1 D
estimiones sds en los dtos que se hn otenido en l muestrF
n form de hernos onsientes de que se trt de estimiones y no de vlores extos @es imposile
onoer el vlor exto de ningn prmetro polionlA es proporionr ls estimiones de los errores
estndr de ls estimiones de 0 y 1 F e onoe que dihs estimiones sonX
s.e. 1 =
s.e. 0 =
Ejemplo.
s2
e
SSxx
s2
e
x2
1
+
n SSxx
in el ejemplo de los dtos de sorin hemos estimdo los oe(ientes de ls dos rets
de regresin del porentje de sorin en funin del volumen y del tiempo de sorinF mos
ompletr ese nlisis on el lulo de los errores estndres de ess estimionesF vos resultdos
preen resumidos en l siguiente tlX
wodelo
s.e. 0
s.e. 1
% absorcin = 0 + 1 V olumen
o
TQFTW
VFVH
HFWU
PFVQ
% absorcin = 0 + 1 T iempo
o
RTFVP
QFIT
IFTH
HFPI
ysrvese que los errores estndr en el modelo en funin del volumen son myores proporionlmente
que en el modelo en funin del tiempo de sorinF
192
ms o menos
omprole on un nue de puntosF i el speto de est nue no reuerd un lne ret sino
otro tipo de funinD lgimente no hremos regresin linelF
PF ue los errores tengn medi eroD independientemente del vlor de xD lo queD por otr prteD no es un
hiptesis sino ms ien un requerimiento lgio l modeloF
vo que hor vmos her es dir lgunos supuestos l modelo de mner que undo stos se umplnD
ls propieddes de los estimdores de los oe(ientes del modelo sen muy uensF isto nos v permitir
her infereni sore estos oe(ientes y sore ls estimiones que pueden drse de los vlores de l vrile
dependienteF
vos supuestos que podemos dir se re(eren l error del modeloD l vrile F
pr todo xF
es normlF
buena
193
derehD pesr de que prentemente el juste es peorD l ret justd s tiene pendiente distint de eroD
luego el heho de que y vre viene ddo en uen prte por el heho de que x vrD y ello ourre porque l
pendiente de es ret es distint de eroF es puesD no lo olvidemosX deir que dos vriles estn relionds
linelmente equivle deir que l pendiente de l ret de regresin que just un en funin de l otr es
distint de eroF
ues ienD ddos los supuestos desritos en l sein nteriorD es posile otener un ontrste de este tipoD
tl y omo se resumen en el gudro IHFPF in ellD siD en efetoD lo que desemos es ontrstr si el efeto de
l vrile independiente es o no signi(tivo pr l vrile dependienteD el vlor de b1 ser eroF
Ejemplo. r los dtos del ejemplo sore l sorinD prtmos del deseo de ompror si l volumen
yGo el tiempo de exposiin in)un sore el porentje de sorinF vs nues de puntos y el juste de
l ret y nos dieron pistsX d l impresin de que el tiempo de sorin s in)u en el porentje
de sorinD pero no qued tn lro si el volumen lo hF is el momento de omprorloF
xos plntemos en primer lugr si el tiempo de exposiin in)uye o no sore el porentje de sorinD
es deirD nos plntemos si en el modelo linel
194
ipo de prue
riptesis
istdstio
de ontrste
egin
de rehzo
pEvlor
upuestos
nilterl
l izquierd
H 0 : 1 = b1
H1 : 1 < b1
filterl
H0 : 1 = b1
H1 : 1 = b1
1
t = 2 b1
se /SSxx
t < t;n2
, s2 =
e
nilterl
l dereh
H0 : 1 = b1
H1 : 1 > b1
SSyy 1 SSxy
n2
SSE
n2
t > t1;n2
P [Tn2 < t]
2P [Tn2 > |t|]
P [T > t]
vos ddos en l ein IHFQ
gudro IHFPX gontrste sore 1
1 = 1.6
s2 =
e
SSyy 1 SSxy
= 32.82
n2
1 = 0.97
s2 =
e
SSyy 1 SSxy
= 298.77
n2
0.34] = 0.741F
in vist de los resultdosD prtir de hor dejremos de onsiderr el efeto del volumen sore el
porentje de sorinD y slo tendremos en uent el efeto del tiempo de exposiinF
195
signicativas
IH
PH
QH
RH
SH
TH
UH
VH
WH
IHH
IP
PH
PW
QV
RV
TI
TV
UW
WI
WU
vo idelD lo desedoD ser que y = xD es deirD que el modelo linel que expli y en funin de x tuvier
oe(ientes 0 = 0 y 1 = 1F or hor vmos entrrnos en el primer pso en l omproin de que
el espetrmetro est ien lirdoD que impli ontrstr que 1 = 1F r elloD
1 =
= 0.976
11000
SSyy 1 SSxy
s2 =
= 2.286
e
n2
por lo tntoD
t=
0.976 1
1.964/11000
= 1.639.
hdo que t1 0.05 ;112 = t0.975;9 = 2.262 y |1.639| < 2.262, no hy rzones pr onluir que 1 = 1F
2
es puesD el modelo podr ser
y = 0 + x,
unque lo desedoD insistmosD ser que fuer
y = x,
es deirD que lo que mid el espetrmetro oinid on l ntidd rel de gy en el ireF gomo hemos
dihoD eso ourrir si 0 = 0D lo que equivle deir que en useni de gyD el espetrmetro est
eroF
edems del ontrste de hiptesisD es trivil proporionr un intervlo de on(nz pr l pendienteD y que
onoemos su estiminD su error estndr y l distriuin en el muestreo @tEstudentD omo pree en el
ontrsteAF gonretmenteD
Ejemplo.
= 1 .
on(nz pr 1 es (0.94, 1.01)F gomo podemos verD el vlor 1 = 1 es un vlor on(le del intervloD
luego rti(mos que no podemos (rmr que el espetrmetro est ml lirdoF
196
ipo de prue
riptesis
nilterl
l izquierd
H 0 : 0 = b0
H1 : 0 < b0
istdstio
de ontrste
egin
de rehzo
pEvlor
upuestos
filterl
H0 : 0 = b0
H1 : 0 = b0
0 b0
t=
s2
e
1
x2
n + SSxx
, s2 =
e
SSyy 1 SSxy
n2
t < t;n2
nilterl
l dereh
H0 : 0 = b0
H1 : 0 > b0
SSE
n2
t > t1;n2
P [Tn2 < t]
2P [Tn2 > |t|]
P [T > t]
vos ddos en l ein IHFQ
gudro IHFQX gontrste sore 0
Ejemplo. in el ejemplo nteriorD vmos ontrstr siD en efetoD 0 = 0D lo que equivldr onluir
que no hy rzones pr pensr que el espetrmetro est ml lirdoF r elloD
0 = y 1 x = 0.636
por lo tntoD
t=
0.636 0
2.286
1
11
= 0.746.
502
11000
gomoquier que 0.746 < t0.975;9 = 2.261D tmpoo tenemos rzones pr pensr que 0 = 0 on un WS 7
de on(nzD luegoD en resumenD no existen rzones pr pensr que el espetrmetro est ml lirdoF
Ejemplo.
yhmD l tensin @V A entre los extremos de un resisteni y l intensidd de orriente @I A que irul
por ell se relionn siguiendo l ley
V = R I,
donde R es el vlor de l resisteniF xosotros vmos relizr l omproin on un mism resisteniD
vrindo los vlores de l intensiddD por lo que l euin equivle
V = 0 + 1 I,
siendo 0 = 0 y 1 = RF vos dtos son los que preen en el gudro IHFRF
enemos que relizr un ontrsteD H0 : 0 = 0 frente H1 : 0 = 0 que equivle ontrstr en relidd
197
yservin
I
P
Q
R
S
T
U
V
W
IH
II
s @meA
HFIT
TFSR
IPFUT
IWFPT
PSFTQ
QIFVI
QVFPI
RUFRH
SRFHH
THFVH
TVFHH
@A
HFPT
IFHR
PFHP
QFHS
RFHT
SFHQ
TFHQ
UFHQ
VFHT
VFWW
IHFHI
que nuestros prtos de medid estn ien lirdosD puesto que l ley de yhm olig que 0 = 0F
mos llX
SSxx = 5105.90
SSyy = 107.25
SSxy = 739.49
1 = 0.14
0 = 0.25
s2 = 0.022
e
es puesD
t=
0.25 0
0.022
1
11
= 3.531.
33.142
5105.90
contradice la ley de
Ohm! vo que este nlisis pone de mni(esto es que tenemos lgn prolem en nuestrs mediionesF
hejemos un poo de ldo este ltimo resultdoF i queremos estimr el vlor de l resisteniD un
estimin puntul esD omo hemos vistoD R = 1 = 0.14D y un intervlo de on(nz l WS 7 de on(nz
@omitimos los detlles de los lulosA result ser (0.141, 0.149)F
pinlmenteD podemos tmin proporionr un intervlo de on(nz pr l ordend en el origenD ddo
por
Ejemplo.
= 1 .
(1.29, 2.57)D luego es on(le pensr que 0 = 0F in sumD hemos omprodo que es posile 1 = 1 y
0 = 0D luego hemos omprodo que l euin y = x no puede ser rehzd on los dtos disponilesD
es deirD que no hy rzones pr pensr que el espetrmetro est ml lirdoF
198
1 mide en ierto modo l relin que existe entre l vrile dependiente y l vrile independienteD y
que se interpret omo el inremento que sufre Y por d inremento unitrio de X F in emrgoD es un
medid sujet l esl de ls vriles X e Y D de mner que se he difil poder omprr distintos s
1
entre sF
dimensionlD y que sus vlores siempre estn entre 1 y 1D sen ules sen ls uniddes de medid de ls
vrilesF
hd un muestr de vlores de dos vriles (x1 , y1 ) , ..., (xn , yn )D el
r=
SSxy
=
SSxx SSyy
SSxx
1 .
SSyy
Nota.
in l pigur IHFS preen lgunos de los supuestos que mos de enunir respeto los
distintos vlores de rF ry que her hinpi en que r slo es pz de desurir l preseni de relin
de tipo linelF iD omo en el ltimo gr(o l dereh de est (gurD l relin entre X e Y no es de
tipo linelD r no es deudo omo indidor de l fuerz de es relinF
Nota. in l pigur IHFT pree un vlor tpio entre un onjunto de dtos on un relin linel ms
que evidenteF or ulp de este dtoD el oe(iente de orrelin linel ser joF u dee herse en
199
20
60
100
10000
20
6000
10
0
2000
10
20
0
20
60
100
30
100
20
40
60
80
60 40 20
100
20
60
100
20
60
100
Correlacin parablica
este soc in generlD no se deen eliminr dtos de un muestrD pero podr ourrir que dtos tpios
orrespondn errores en l tom de ls muestrsD en el registro de los dtos oD inlusoD que relmente no
proedn de l mism polin que el resto de los dtosX en ese soD eliminrlos podr estr justi(do
de r nlizr de un form ms preis l relin linel entre los dtosF
Nota.
pretiones del oe(iente de orrelin linelF is muy freuente que se utilie pr justi(r reliones
usEefetoD y eso es un grve errorF r slo indi preseni de relin entre ls vrilesD pero eso no
permite inferirD por ejemploD que un inremento de X se l us de un inremento o un disminuin
de Y F
r=
36.24
= 0.129;
37.30 2126.61
vemos que l relin es muy pequeY de hehoD ompromos medinte un ontrste de hiptesis sore
1 que er no signi(tivF
in el so del porentje de sorin en funin del tiempo de sorinD
r=
36.24
= 0.944.
744 2126.61
ist relin s result ser muy fuerte y en sentido diretoF or eso l relizr el test sore 1 D ste s
result ser signi(tivoF
xo podemos olvidr que el oe(iente de orrelin linel muestrlD rD mide l orrelin entre los vlores
200
End
LS Line
Add Point
Delete Point
10
Move Point
de X y de Y en l muestrF ixiste un oe(iente de orrelin linel similr pero que se re(ere todos los
posiles vlores de l vrileF ividentementeD r es un estimdor de este oe(iente polionlF
E [(X EX) (Y EY )]
V arX
=
=
1 .
V arXV arY
V arY
r n2
t=
.
1 r2
0.944 92
10.9442
201
n
2
(yi y ) ,
SSyy =
i=1
de tl mner que unto ms vren los dtos de Y myor ser SSyy F or otr prteD undo justmos por
n
2
(yi yx ) .
SSE =
i=1
mos ponernos en ls dos situiones lmite que pueden drse en unto l preisin de un ret de
regresinX
i X no tiene ningn tipo de relin linel on Y D entones = 0D en uyo so 1 =
l ret es simplemente
V arY
V arX
=0y
yi = 0 + 1 xi
= y.
is deirD si X no tiene ningn tipo de relin linel on Y D entones l mejor prediin que podemos
dr por el mtodo de mnimos udrdos es l mediF edemsD en ese so
n
(yi yi )
SSE =
i=1
n
2
(yi y ) = SSyy ,
=
i=1
es deirD SSE es el totl de l vriin de los vlores de Y F ist lro que est es l peor de ls
situiones posiles de r l preisinF
i l relin linel entre X e Y es totlD entones = 1, en uyo so 1 =
202
V arY F
V arX
edemsD si l
n
2
(yi yi ) = 0.
SSE =
i=1
SSE
.
SSyy
xtese que l notin es r l udrdoD y queD en efetoD en un regresin linel simple oinide on el
oe(iente de orrelin linel l udrdoF
or lo tntoD l interpretin de r2 es l medid en que X ontriuye l expliin de Y en un esl de
H ID donde el H indi que el error es el totl de l vriin de los vlores de Y y el I es l preisin totlD
el error HF v medid suele drse en porentjeF hiho de otr formX
respecto de su media
y x = 0 + 1 x
E [Y /X=x ] = 0 + 1 x,
luego yx puede interpretrse de dos formsX
IF gomo
undo X = xF
203
PF gomo
ems ntiddes estn sujets inertidumreD que ser tnto myor unto ms vriilidd teng Y, yGo
peor se el juste medinte l ret de regresinF
vo que vmos ver en est sein pr onluir el tem es mo estleer
regiones de conanza
pr ests
prediiones de los vlores de Y y pr ls estimiones de los vlores medios de Y ddos vlores de X F istos
resultdos requieren que se veri(quen los supuestos diionles sore los errores ddos en l sein IHFQF
odemos grntizr on un (1 ) 100 % de on(nz que undo X = xD el vlor medio de Y se enuentr
en el intervlo
yx t1/2;n2 se
1
(x x)
+
, yx + t1/2;n2 se
n
SSxx
1
(x x)
+
,
n
SSxx
P E[Y /X=x ] yx
t1/2;n2 se
(x x)2
1
+
|X=x = 1 .
n
SSxx
yx t1/2;n2 se
1
(x x)
1+ +
, yx + t1/2;n2 se
n
SSxx
2
1
(x x)
1+ +
,
n
SSxx
P Y yx
t1/2;n2 se
1
(x x)2
1+ +
|X=x = 1
n
SSxx
Nota. xo deemos olvidr que los modelos de regresin que podemos estimr lo son prtir de los dtos
de un muestr de vlores de X e Y F e prtir de estos modelos podemos otenerD omo mos de
reordrD prediiones y estimiones pr vlores ddos de X. hdo que el modelo se s preismente
en
Ejemplo. in l pigur IHFU pree l ret de regresin pr los dtos del ejemplo sore l sorin
del ompuesto junto on lnes que ontienen los intervlos de on(nz l WS 7 pr ls prediiones y
ls estimiones soids los distintos vlores de X F
204
110
105
Resistencia
100
observed
fit
conf int
pred int
95
90
85
80
50
60
70
80
90
100
Velocidad
ysrvese que l mplitud de los intervlos se he myor en los vlores ms extremos de X F is deirD
los errores en ls estimiones y en ls prediiones son myores en estos vlores ms extremosF isto
dee ser un motivo dir l omentrio nterior pr no her estimiones ni prediiones fuer del
rngo de vlores de X en l muestrF
or otr prteD nos plntemos l omienzo de ptulo que ser de inters estimr el porentje de
sorin que tendr lguien que se somet un tiempo de exposiin l ompuesto de V horsF iso es
un prediinD s que omo estimin puntul dremos
yx
t1/2;n2 se
1
(x x)2
1+ +
= 59.59
n
SSxx
2.36 5.73
2
1 (8 12)
1+ +
= (45.17, 74.00) .
9
744
or el ontrrioD imginemos que los trjdores de un empres vn estr sometidos todos ellos
un tiempo de exposiin de V horsF in ese soD no tiene sentido que nos plnteemos un prediin
pr ser ul v ser su porentje de sorinD y que d uno de ellos tendr un porentje
distintoY lo que s tiene sentido es que nos plnteemos ul v ser el porentje medio de sorin de
los trjdores sometidos V hors de exposiin l ompuestoF isto es un ejemplo de l estimin
de un vlor promedioF v estimin puntul es l mism que en l prediinD es deirD SWFSWD pero el
intervlo de on(nz l WS 7 es
yx
t1/2;n2 se
x)2
1
(x
= 59.59
+
n
SSxx
2.36 5.73
1 (8 12)
= (54.66, 64.52) .
+
9
744
205
= yi yi
de residuos frente
= yi yi F
es eroF
PF i los errores son independientesD no dee oservrse ningn patrn en l gr(D es deirD ningn efeto
en ell que hg pensr en lgn tipo de relin entre yi y
iF
homocedasticidadAD l dispersin
vertil de los puntos de l gr( no dee vrir segn vre el eje F in so ontrrioD se hl de
heterocedasticidadF
probableD
206
15 10
Residuals
Residuals vs Fitted
50
55
60
65
70
75
80
85
Fitted values
lm(Porcentaje.Absorbido ~ Tiempo)
pigur IHFVX qr( de vlores justdos vs residuos en el ejemplo de l sorin
Ejemplo.
gr(o de residuos vs vlores justdos y podemos ver que primer vist pree que se dn ls ondiiones
requeridsX
IF vos puntos se sitn en torno l eje Y = 0D indindo que l medi de los residuos pree ser eroF
PF xo se oservn ptrones en los residuosF
QF xo se oserv myor vriilidd en lguns prtes del gr(oF ry que tener en uent que son
muy poos dtos pr sr onlusionesF
207
208
Parte IV
Procesos aleatorios
PHW
Captulo 11
Procesos aleatorios
Resumen.
Philosophy of Science
desriir fenmenos reles no determinstiosX onretmenteD se trt de fenmenos letorios que dependen
del tiempoF e desrien priniplmente en trminos de sus medis y sus ovrinzsF in este ptulo se
inluyen dems lgunos de los ejemplos ms omunes de tipos de proesos y su omportmiento undo se
trnsmiten trvs de sistems lineles invrintes en el tiempoF
Palabras clave.
zD proesos estionriosD proesos gussinosD proeso de oissonD sistems linelesD densidd espetrl de
poteniF
11.1. Introduccin
in muhos experimentos de tipo letorio el resultdo es un funin del tiempo @o del espioAF
or ejemploD
en sistems de reonoimiento de voz ls deisiones se tomn sore l se de un ond que reprodue
ls rterstis de l voz del interloutorD pero l form en que el mismo interloutor die un mism
plr sufre ligers vriiones d vez que lo heY
en un sistem de olD por ejemploD en un servidor de teleomuniionesD el nmero de lientes en el
sistem l esper de ser tendidos evoluion on el tiempo y est sujeto ondiiones tles que su
omportmiento es
impredecible Y
certezaF
hesde un punto de vist mtemtioD todos estos ejemplos tienen en omn que el fenmeno puede ser visto
omo uns funiones que dependen del tiempoD pero que son desonoids prioriD porque dependen del
azarF
in este ontexto vmos de(nir el onepto de proeso letorioF xuestro ojetivoD omo en ptulos
nteriores dedidos vriles y vetores letoriosD es desriir desde un punto de vist estdstio el
fenmenoD proporionndo medids de posiinD medids sore l vriiliddD etF
11.1.1. Denicin
gonsideremos un experimento letorio sore un espio muestrl . upongmos que pr d resultdo
posileD A, tenemos un oservin del fenmeno dd por un funin rel de vrile relD x (t, A)D on
t I RF ritulmenteD t represent l tiempoD pero tmin puede referirse otrs mgnitudes fsisF
r d A vmos denominr x (t, A)
{X (t, A) : t I, A }
lo denominmos
i reordmos ls de(niiones de vrile letori y vetor letorioD podemos ver en qu sentido estn
reliondos los oneptos de vrileD vetor y proeso letorioF gonretmenteD si es un espio muestrlD
un vrile letori es un funin
X:R
que d sueso posile le sign
funin
X : RN
que d sueso posile le sign
un vector realF
funin
he r esriir de hor en delnte un pFFD lo notremos normlmenteD por ejemploD omo X (t)D ovindo
s l vrile que he refereni l elemento del espio muestrl l que v soid l funin muestrlF
iste onvenio es el mismo que nos llev esriir X re(rindonos un vFF o un vetorF
or esoD
en el mito de los proesos @no slo estostiosA es importnte preguntrse si el fenmeno que represent
el proeso es oservdo
212
en cada instante
o slo
{X (t, A) : t I, A } ,
se die que el proeso es un
es un onjunto numerleF
X (n)F or otr prteD el onjunto I normlmente es el onjunto de los enteros o de los enteros positivosD
unque tmin puede ser un suonjunto de stosF
in lgunos liros los proesos en tiempo disreto tmin son denomindos
secuencias aleatoriasF
{X (t, A) : t I, A } ,
se die que el proeso es un
es un intervloF
213
Ejemplo.
X (t, ) omo
X (t, ) = cos (2t) .
us funiones muestrles son onds sinusoidles de mplitud letori en (1, 1) @pigur IIFPA.
Ejemplo.
X (t, ) omo
X (t, ) = cos (2t + ) .
us funiones muestrles son versiones desplzds letorimente de cos (2t) @pigur IIFQAF
214
pr d t I.
xtese queD omo su nomre indiD se trt de un funin determinstiF xo tiene ningun omponente
letoriF xtese tmin que unque se est esriiendo el smolo integrlD podrmos estr re(rindonos
un vrile disretD en uyo so se trtr de un sumF
e de(ne l
funcin de autocovarianza
o simplemente l
215
e de(ne l
funcin de autocorrelacin
o simplemente l
centrado en mediaD
funiones oinidenF
or otr prteD l vrinz de ls vriles del proeso puede otenerse omo
V ar (X (t)) = CX (t, t) F
v interpretin de l funin de utoovrinz CX (t, s) es l de un funin que proporion un medid
de l interdependeni linel entre dos vFF del proesoD X (t) y X (s)D que distn = s t uniddes de
tiempoF he hehoD y semos que podrmos nlizr est relin medinte el oe(iente de orrelin
linel
X (t, s) =
CX (t, s)
CX (t, t) CX (s, s)
Ejemplo. v sel reiid por un reeptor ew de rdio es un sel sinusoidl on fse letoriD dd
por X (t) = A cos (2fc t + ) , donde A y fc son onstntes y es un vFF uniforme en (, ) .
1 Esta
frmula es la misma que cuando veamos la covarianza entre dos variables, calculable como la media del producto menos
216
in ese soD
A cos (2fc t + )
E [X (t)] =
1
A
=
d =
[sin (2fc t + )]=
2
2
A
(sin (2fc t) cos () + cos (2fc t) sin () sin (2fc t) cos () cos (2fc t) sin ())
2
A
=
[0 + 0] = 0.
2
A2
A2
E [cos (4fc t + 2fc + 2)] +
E [cos (2fc )]
2
2
A2
=
2
1
A2
cos (4fc t + 2fc + 2) d +
cos (2fc )
2
2
A2
A2
A2
=
0+
cos (2fc ) =
cos (2fc ) .
2
2
2
or tntoD
A2
cos (2fc ) .
2
independiente.
v interpretin de este tipo de proesos es l de quellos en donde el vlor de l vFF que es el proeso en
un momento ddo no tiene nd que ver on el vlor del proeso en ulquier otro instnteF hesde un punto
de vist fsio estos proesos son muy
caticos
217
10
pigur IIFRX punin muestrl de un proeso independiente formdo por vF gussins de medi ero y
vrinz unoF
X (t1 ) , X (t2 ) , ..., X (tN )D on t1 < t2 < ... < tN son tles que los inrementos
X (t1 ) , X (t2 ) X (t1 ) , ..., X (tN ) X (tN 1 )
son independientes entre sF
X (t + ) | {X (s) = xs pr todo s t} .
istoD en generlD es stnte omplejoF
edemsD tiene sentido pensr que l evoluin del proeso en el instnte t + se ve fetd por tod
l histori del proesoD desde el instnte iniil s = 0 hst el ltimo instnte de es histori s = tc ree
lgio pensr que l evoluin del proeso teng en uent l histori ms reiente de steD pero no tod
l historiF ist hipotesis se ve vld por los per(les ms hitules de ls funiones de utoorrelinD
donde oservmos que l relin entre vriles del proeso suele dereer en l myor de ls osiones
onforme ument l distni en el tiempo entre ls mismsF
vos proesos de wrkov son un so donde esto ourreF e trt de proesos que evoluionn de mner que
en d instnte
218
olvidan
markoviano o de Markov
fX(tn+1 )|X(t1 )=x1 ,...,X(tn )=xn (xn+1 ) = fX(tn+1 )|X(tn )=xn (xn+1 ) .
ist de(niin se suele enunir oloquilmente diiendo que un proeso de wrkov es
X (t) es un proeso
dbilmente estacionario si
mX (t) es independiente de t y
C (t, s) @o R (t, s)A depende tn slo de s tD en uyo so se not C (s t) @ R (s t)AF
is importnte destr que l primer de ls ondiiones es irrelevnteD y que siempre se puede entrr en
medi un proeso pr que st se eroD onstnteF is deirD en l prti es indiferente estudir un proeso
X (t) on funin medi X (t) que estudir el proeso Y (t) = X (t) X (t)D on medi eroF
v propiedd ms exigente y relmente importnte es l segundF iene deir que l relin entre vriles
letoris del proeso slo depende de l distni en el tiempo que ls seprF
Nota.
delnteF emos de ver que si un proeso es dilmente estionrioD sus funiones de utoovrinz
y de utoorrelinD C (s, t) y R (s, t) no dependen en relidd de s y de tD sino tn slo de t sF or
eso introduimos l notin
C (t, s) C (s t)
R (t, s) = R (s t) .
or lo tntoD qu queremos deir si esriimos diretmente C ( ) o R ( )c ue tenemos un pFF dilE
mente estionrio y que hlmos de
C ( ) = C (t, t + )
R ( ) = R (t, t + ) .
potencia promedioD
de(niE
. ws delnte
219
or otr prteD l peuliridd que de(ne los proesos dilmente estionrios le on(ere su funin
de utoorrelin y utoovrinz dos propieddes interesntesX se X (t) un proeso estionrio @dilAF
intonesD si notmos RX ( ) = E [X (t) X (t + )] pr todo t, su funin de utoorrelin y por CX ( )
su funin de utoovrinzX
Ejemplo. in el ejemplo del osildor vimos que l sel reiid por un reeptor ew de rdio es un
sel sinusoidl on fse letoriD dd por X (t) = A cos (2fc t + ) , donde A y fc son onstntes y
RX (t, t + ) =
A2
cos (2fc ) .
2
Ejemplo.
vrinz onstnte e igul 2 F mos onsiderr tmin otro proeso que en d instnte de
tiempo onsider l medi de X en ese instnte y el nteriorD es deirD
Yn =
Xn + Xn1
.
2
E [Yn ] = E
220
Xn + Xn1
= 0.
2
or otr prteD
1
E [(Xn + Xn1 ) (Xn+m + Xn+m1 )]
4
1
= (E [Xn Xn+m ] + E [Xn Xn+m1 ] + E [Xn1 Xn+m ] + E [Xn1 Xn+m1 ])
4
=
CX (n, m) = RX (n, m) =
si n = m
si n = m
1 2 + 0 + 0 + 2
4
1
0 + 2 + 0 + 0
CY (n, n + m) = 4
1 0 + 0 + 2 + 0
4
1 2 si m = 0
2
= 1 2 si m = 1
4
0
en otro so
si m = 0
si m = 1
si m = 1
en otro so
odemos deirD por tntoD que el proeso Yn tmin es dilmente estionrioD porque su medi es
onstnte @eroA y CY (n, n + m) no depende de n sino tn slo de mF
E [X (t)] = mX (t) = mX =
xfX(t) (x) dx
RX ( ) = E [X (t) X (t + )] =
rst hor quiz no lo hmos pensdoD pero ms ll de los tpios ejemplosD mo podrmos trtr de
lulr o estimr l menos ests ntiddesc i plimos lo que hemos prendido hst horD estimrmosD
por ejemploD l medi on l medi muestrlD pero pr ello neesitrmos un muestr muy grnde de
Prof. Dr. Antonio Jos Sez Castillo
221
funiones muestrles del proesoD y eso no siempre ourreF he hehoD no es nd rr l situin en l queD
en reliddD slo es posile oservr un ni funin muestrl del proesoF
ehor ienD dd un ni funin muestrl de un proesoD x (t)D en es funin hy muhos dtosD tntos
omo instntes de tiempo t hymos sido pes de oservrF xo podr ourrir que utilizrmos todos esos
dtos que hy en x (t)pr estimr ls medis y ls utoorrelionesc or ejemploD si tenemos oservd l
sel x (t) en un montn de vlores t1 , ...tn D qu tendr que ver
1
2T
x (t) dt.
T
estadstica A
1
2T
x (t) x (t + ) dt
T
vo que no semosD en generlD es si es integrl tiene lgo que ver on RX ( )D que es un integrl estadsticaF
ues ienD se die que un proeso estionrio es
estadsticos A
de un sol funin muestrl x (t)F is deirD que un sol relizin es representtiv de todo el proesoF
ws onretmenteD un proeso ser ergdio en medi y en utoorrelin si
limT
y
1
limT
2T
1
2T
x (t) dt = mX
T
x (t) x (t + ) dt = RX ( ) .
T
ltrar
in este prtdo nos referimos revemente un modelo gstnte omn pr los fenmenos de ruidoD llmdo
ruido lnoF
222
N0
2 F
or
CN (t, t + ) =
N0
en otro so
1 si t = 0
(t) =
,
0 en otro so
est funin de utoovrinz puede esriirse omo
CN ( ) =
N0
( ) .
2
v justi(in de que este se un modelo hitul pr los ruidosD onsiderndo que los vlores del ruido
estn inorreldos unos on otrosD es que suelen ser deidos fenmenos ompletmente letorios y tiosD
por lo que no es esperle que exist relin entre vlores del ruidoD ni siquier undo stos son muy ernos
en el tiempoF
onjuntmente gussinF is deirD si ulquier olein X (t1 ) , ..., X (tn ) tiene funin de densidd onjunt
1
exp (x ) C 1 (x ) ,
2
(2) det (C)
n
donde
x = (x1 , ..., xn ) ,
= (E [X (t1 )] , ..., E [X (tn )]) ,
C = (Ci,j )i,j=1,..,n ,
Cij = Cov [X (ti ) , X (tj )] .
xtese que un proeso gussino est ompletmente desrito un vez que se onoen su funin medi y su
utoovrinz o su utoorrelinF
Prof. Dr. Antonio Jos Sez Castillo
223
ixisten dos rzones fundmentles por ls queD omo hemos omentdoD los proesos gussinos son l fmili
de proesos ms relevnteX
or un prteD ls propieddes nltis que veri(n los hen filmente mnejlesD omo veremos
ontinuinF
or otr prteD estos proesos hn demostrdo ser un exelente modelo mtemtio pr grn nmero
de experimentos o fenmenos reles @resultdo mprdo en el eorem gentrl del vmiteAF
Ejemplo. is muy hitul onsiderr que los ruidos lnos son gussinosF in ese soD si onsidermos
ruidos lnos gussinosD sus vriles no slo son inorreldsD sino que tmin son independientesF
Ejemplo.
1
2
y t2 = t1 +
1
2
25
25e3/2
25
25e3/2
25e6/2
25e3/2 .
25
CX (t1 , t3 ) =
CX (t1 , t2 ) CX (t2 , t3 )
,
CX (t2 , t2 )
procesos de recuentoF
elgunos de los ejemplos ms omunes en el mpo de ls eleomuniiones son el proeso que uent el
nmero de llmds reiids en un entrlit telefni o el que uent el nmero de visits un pgin
ifF in otros mitosD omo l psiD estos proesos pueden servirD por ejemploD pr ontilizr el
nmero de prtuls emitids por un uerpoF
224
u (t T [n]) ,
N (t) =
n=1
donde T [n] es un proeso en tiempo disreto que represent el momento de l nsim llegd que uent
el proeso y
0 si t < t
0
u (t t0 ) =
1 si t t
0
es l funin umrlF
il
n=1
fT [n] (t) =
elterntivmenteD puede deirse que
llegadas,
(t)
et u (t) .
(n 1)!
Ejemplo.
= 1F mos interpretr l funin muestrl de l izquierd pensndoD por ejemploD que represent
el nmero de visits un pgin ifX se oserv que poo depus de los tres minutos se hn ddo Q
visitsY despus psn si S minutos sin ningun visitY ontinuin se produen un uen nmero de
visits en poo tiempoY FFF
i oservmos tn slo el eje del tiempoD podrmos selr los instntes en que se produen ls llegdsF
emos que esos inrementos en el tiempo desde que se produe un llegd hst l siguiente siguen
un distriuin exponenilD en este so de prmetro IF
mos desriir lguns de ls propieddes ms interesntes de los proesos de oissonX
e N (t) un proeso de oisson de prmetro F intonesD pr todo t se tiene que N (t) P (t)F
v medi de un proeso de oisson de prmetro es N (t) = t. or tntoD el proeso de oisson no
es estionrioF
e N (t) un proeso de oisson de prmetro F intonesD el proeso tiene inrementos independientes
Prof. Dr. Antonio Jos Sez Castillo
225
(t2 t1 )F
e N (t) un proeso de oisson de prmetro . intones
CN (t1 , t2 ) = m (t1 , t2 ) .
n
e N (t) un proeso de oisson de prmetro F intonesD pr ulesquier t1 < ... < tk D
n n
n
1 n1 2 2 2 n1
k k1
1
e
e
... ek (n2 nk1 )! si n1 ... nk
n1 !
(n2 n1 )!
k
=
,
0 en otro so
donde i = (ti ti1 ) .
il proeso de oisson es de wrkovF
en N1 (t) pFF de oisson de prmetro 1 , N2 (t) pFF de oisson de prmetro 2 , mos indepenE
dientesF intonesD N1 (t) + N2 (t) es un pFF de oisson de prmetro 1 + 2 F ist propiedd se onoe
omo
propiedad aditivaF
e N (t) un pFF de oisson de prmetro F upongmos que de todos los eventos que uent el
proesoD slo onsidermos un prte de ellosY onretmente los que presentn un rtersti que
tiene proilidd p entre todos los eventosF in ese soD si notmos por Np (t) l proeso que uent
226
propiedad de descomposicinF
propiedad de no memoria del proeso de oissonF ysrvese queD en reliddD est propiedd de no
memori lo es de l distriuin exponenilF
Ejemplo.
is freuente onsiderr que el proeso que uent el nmero de prtuls emitids por un
mteril rditivo es un proeso de oissonF mos suponer por tntoD que estmos oservndo el
omportmiento de un determindo mteril del que se onoe que emite rzn de prtuls por
segundoF
upongmos que se oserv el proeso que uent el nmero de prtuls emitids desde un instnte
eT0
P [N (t + T0 ) N (t) > N0 ] =
k=N0 +1
(T0 )
=1
k!
N0
eT0
k=0
(T0 )
,
k!
Ejemplo.
trvs de sxixi es deudmente desrito medinte un proeso de oissonF iendo que durnte
un hor se reien un promedio de S visitsD
227
P [N (0.5) = 0] = e50.5
(5 0.5)
= 8.2085 102 ,
0!
pens un V 7 de proiliddF
PF gul es el promedio de visits en S hors l ifc E [N (5)] = 5 5 = 25 visitas.
QF v empres sore otr empres del setor y opt por estleer un enle diretmente desde l
pgin de su (lil l propiD grntizndose que todos los lientes de l (lil visitn su pginF
i el promedio de lientes que visitn l pgin de l (lil er de P lientes l horD ul es l
proilidd de que trs l fusin no se rei ningun visit en IH minutosc
el herse on los lientes de l otr empres @notemos por M (t) l proeso de oisson que ont
sus visitsD de prmetro = 2 visitas/horaAD lo que h ourrido es que hor el nmero de visits
l if de l empres es l sum de mos proesosX T (t) = N (t) + M (t) .
uponiendo que los proesos de oisson que ontn ls visits ms empress fuern indeE
pendientesD se tiene que T (t)D en virtud de l propiedd ditiv del proeso de oissonD es tmin
un proeso de oissonD de prmetro = 5 + 2 = 7 visitas/horaF or tntoD
P T
1
6
=0 =e
7 1
6
1
7 6
0!
= 0.3114,
un proilidd del QI 7F
228
Bibliografa
et al
PPW
ndice alfabtico
exyeD ITV!IUH
histriuin normlD VT
histriuin norml multivrinteD IPHD PIW
goe(iente de simetrD QI
histriuin uniformeD VP
govrinzD IIP
htos ulittivosD PH
de ol pesdD QP
hesviin tpi o estndrD PW!QID QUD TRD VHD VVD punin ms onjuntD WW
IPVD IPWD IRSD ISU
punin ms de proiliddD TPD TQD TVD UHD UID URD
higrm de rrsD PPD PQD PSD QI
VID WPD IPUD IQW
higrm de js y igotesD QSD QTD QV
snorrelinD IIP
sndependeni de suesosD RV!SHD SPD SQD TVD IVI
sndependeni estdstiD PIQD PIR
snsesgdezD IQR!IQUD IRV
sntervlos de on(nzD IQRD IRP!IRVD PHH
wedi muestrlD PSD PTD PV!QID QRD TRD VID VUD IPVD rile letori disretD TP!TR
rinz muestrlD PVD PWD TRD VID IPWD IQSD IQTD IRRD
IPWD IQSD IRR!IRTD ISHD ISTD ITWD PIU
wedi polionlD QRD TQD TRD UVD VHD VID WHD WID IPWD
IQSD IRR!IRUD ISHD ISTD IWPD IWWD PHP
wedinD PTD PVD QID QS
wodD PTD QI
muestraD IS
wuestr letori simpleD PHD PWD QQD QTD QUD TQD TSD
URD IVQD IWTD IWU
xivel de on(nzD IRP!IRRD IRVD ISI!ISRD ISUD ISVD
ITHD ITID IUID IUUD IUVD IVHD IVRD IWRD PHH
yrtogonliddD IIP
pEvlorD ISQD ISRD ISTD ISV!ITID ITRD ITT!ITVD IUI!
IUQD IUT!IVID IVQD IVSD IWR
erentilD PUD QRD QSD QUD QVD WP!WR
roiliddD RID RPD RSD RUD RV
roilidd ondiiondD RV!SH
roeso letorioD PHV
roeso letorio en tiempo ontinuoD PHW
roeso letorio en tiempo disretoD PHW
roeso dilmente estionrioD PIS
roeso de wrkovD PISD PPH
roeso de oissonD PPI
roeso ergdioD PIV
roeso gussinoD PIW
roesos independientesD PIQ
et de regresinD IWI
uido lnoD PIW
l de freuenisD PI
eorem de fyesD SQ!SS
eorem de l proilidd totlD SQ!SS
est chi2 de ondd de justeD IUTD IUV
est chi2 de independeniD IVI
est de uolmogorovEmirno'D IUWD IWID IWPD IWTD IWV!
PHP
lores z D QRD WH
Prof. Dr. Antonio Jos Sez Castillo
231