Está en la página 1de 49

Estads2ca

Tema 5. Inferencia estads2ca

Mara Dolores Fras Domnguez


Jess Fernndez Fernndez
Carmen Mara Sordo
Departamento de Matem.ca Aplicada y
Ciencias de la Computacin
Este tema se publica bajo Licencia:
Crea.ve Commons BY-NC-SA 3.0

TEMA5:InferenciaEstadstica
Muestreo:
Tamaoycalidaddelamuestra
Muestreoaleatorio

Inferenciaestadstica:
Estimacindeunaproporcin
Estimacindeunamedia
Estimacindeunavarianza

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Muestreo
muestra

poblacin

POBLACIN: todos los


UniversidaddeCantabria

estudiantes

de

la

MUESTRA: alumnos de 1 de Grado de Ingeniera


QumicadelaUniversidaddeCantabria.
Necesidaddelmuestreo:

1. Coste reducido: la recogida y tratamiento de datos resulta


msbaratoaltrabajarconunapequeapartedelapoblacin
2. Mayor rapidez en la evaluacin del resultado final (ej.
escrutiniodevotosdelasprimerasmesaselectorales).
3. Imposibilidad material por destruccin del objeto a estudio
(ej. duracin de bombillas, si se estudia toda la poblacin no
quedaranbombillasparavender).
Esimportanteelegirunamuestraquerepresentebienalapoblacin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

MuestreoAleatorio
Todosloselementostienenlamismaprobabilidaddeser
incluidosenlamuestra.
Sinreposicindeloselementos:nosepermitequeunmismo
individuoseaseleccionadomsdeunavez.
Conreposicin:unelementopuedeserextradovariasveces.
Cuandolapoblacinesgrandeladiferenciaentreamboscasos
esmnima.
11
12
13
.
31
.
MaraDoloresFras,JessFernndezyCarmenMaraSordo
65

InferenciaEstadstica
Elproblemaqueaparececonmsfrecuenciaenlaprcticaes
el de la estimacin de parmetros de la poblacin, que son
desconocidos.
Existeuna
utilizadosparadescribirla
p a r m e tro s
p o b la c i n

P O B L A C I N

utilizados
paraestimar

dedondese
extraeuna
m u e s tra
a le a to r ia

lamuestra
genera

d a to s
n u m r ic o s

utilizados
paraevaluar

e s ta d s tic o s

El objetivo es deducir (inferir) caractersticas de una poblacin


medianteelestudiodeunamuestra
MaraDoloresFras,JessFernndezyCarmenMaraSordo

InferenciaEstadstica
SedeseaconocerlaalturadelosalumnosdelaUniversidadde
Cantabria.
utilizadosparadescribirla

POBLACIN:
alumnos de la
U.C

parmetro
poblacin

utilizados
paraestimar

dedondese
extraeuna
muestra aleatoria:
Alumnos
de 1 de
Grupoalumnos
Ingenieria Civil

lamuestra
genera
V.A.Altura

utilizados
paraevaluar
1.72,1.69,1.57...1.90
23,18,20,

x = 21.71m
0.5
S n = 0.53m
1 .7

Conjunto de mtodos estadsticos que permiten deducir (inferir)


comosedistribuyelapoblacinenestudioapartirdelainformacin
queproporcionaunamuestra.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

InferenciaEstadstica
Estimacin puntual: Obtener un pronstico numrico
nicosobreunparmetrodeladistribucin.

Estimacin por intervalos: Obtener un margen de


variacinparaunparmetrodeladistribucin.
Poblacin,parmetro

Muestra,estimadorparmetro

proporcinP

proporcinp

media

media x

varianza2

VarianzaSn2

Objetivo :min

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Estimacindeunaproporcin
Dada una poblacin con N individuos de los cuales M poseen
cierta propiedad (e.g. mujeres) que no poseen los dems, la
proporcinpoblacionalsedefinecomoP=M/N
Si se elige una muestra de esa poblacin de tamao n, en la
que aparecen m individuos con esa propiedad, entonces la
proporcinmuestralsedefinecomop=m/n

p 1p1

p
Laproporcinpoblacional(P)es
constantemientrasquecada
muestrapuedeteneruna
proporcinmuestral(p)distinta.

pp2 2

pp3 3

pp4

Laproporcinmuestralesunavariablealeatoriaporloque
esimportantedeterminarsudistribucin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Distribucindelaproporcinmuestral
Ladistribucindelaproporcinmuestralesladistribucinde
probabilidad de todos los valores posibles de la proporcin
muestral(p)
Muestreoconreemplazamientoopoblacininfinita:
El nmero de individuos (m) que poseen la propiedad en la
muestraesunavariablealeatoriabinomial.
Lamediayvarianzadelaproporcinmuestralsern:

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Distribucindelaproporcinmuestral
Ladistribucindelaproporcinmuestralesladistribucinde
probabilidad de todos los valores posibles de la proporcin
muestral(p)
Muestreosinreemplazamientoypoblacinfinita:
El nmero de individuos (m) que poseen la propiedad en la
muestraesunavariablealeatoriahipergeomtrica.
Lamediayvarianzadelaproporcinmuestralsern:

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Distribucindelaproporcinmuestral

Elvalormediodelafuncindeprobabilidadcoincidecon
laproporcinpoblacionalP.

La varianza disminuye a medida que aumenta el tamao


delamuestra(n).

Ladistribucindelaproporcinmuestralpseaproximaa
la distribucin normal (=E[p] y 2=Var[p]) para n
tendiendoainfinito.

si conocisemos P, podramos calcular la probabilidad de que la


proporcinmuestralseamenorqueunciertovaloroqueestentre
ciertosvalores.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunaproporcin
Conocidalaproporcinpoblacional,P,yladistribucindela
proporcinmuestral,podemosobtenerunintervalodondela
v.a.ptieneunaprobabilidaddada(1)deestar.
El 100(1)% de las muestras aleatorias dan un valor de la
proporcinmuestraldentrodeesteintervalo.
Eseintervalosedenomina
intervalodeprobabilidad
deunaproporcincon
confianza1.

E.CastilloyR.E.Pruneda
EstadsticaAplicada.
Ed.Moralea(2001)

Los intervalos de probabilidad


permanecen constantes para
diferentesmuestras.
Pe
MaraDoloresFras,JessFernndezyCarmenMaraSordo

P+e

Intervalosdeprobabilidaddeunaproporcin
1(niveldeconfianza,valores
tpicos:90%95%99%)
eselniveldesignificacin
Existeninfinitosintervalos1.
Nosquedaremosconun
intervalosimtricorespecto
alvalorcentralPque,enel
casoladistribucinnormal,es
eldemenortamaoparauna
confianzadada.
[

Pe

P+e

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunaproporcin
Si el tamao de la muestra es suficientemente grande, la
variable aleatoria p tiende a la ley normal y los intervalos de
probabilidad pueden obtenerse con las tablas de la ley normal.

Donde

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunaproporcin

Pe

Muestreosinreemplazamientoy
poblacinfinita

Muestreoconreemplazamientoo
poblacininfinita

Condiciones
devalidez

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunaproporcin

Pe

Muestreosinreemplazamientoy
poblacinfinita

Muestreoconreemplazamientoo
poblacininfinita

Condiciones
devalidez

Ejemplo
Lapoblacindeinternadosenuncentromdicoesde1000enfermos,delos
cuales el 20% padecen afecciones cardiacas. Se elige una muestra de 50
enfermos del fichero de registro. Calcular el intervalo de probabilidad al 0.95
depparaelcasodemuestreosinyconreemplazamiento.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunaproporcin
Ejemplo

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Estimadoresdeunaproporcin
Enlarealidad,elproblemamsfrecuenteeseldelaestimacinde
los parmetros de la poblacin. Para ello se extrae de la poblacin
unamuestradetamaonyconocidastasetratadeestimarP.

Estimacin puntual: Se estima el valor de la proporcin de la


poblacin(P)conelvalordelparmetrodelamuestra.

Nodainformacinalgunadelaprecisindelaestimacin.

Intervalo de confianza: Determina entre que valores (a, b] se


encuentralaproporcindelapoblacinPconciertaprobabilidad
ocerteza(1).

P(a P b) = 1

Complementalaestimacinpuntualprecisandolaexactituddelaestimacin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

IntervalosdeConfianzadeunaProporcin
Se dice que el intervalo (a,b] es un intervalo de confianza
paraPalnivel(1)siseverifica:

P(a P b) = 1
Partiendodelintervalodeprobabilidad(1):

P(P e p P + e) = 1
Estaexpresinsepuedeescribircomo:

P(p e P p + e) = 1
Por lo que el intervalo [pe, p+e] tiene una probabilidad
asociadade(1)deconteneralparmetroP.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeconfianzadeunaproporcin

pe
Muestreosinreemplazamientoy
poblacinfinita

Muestreoconreemplazamientoo
poblacininfinita

n( p e) > 5
n(1 p e) > 5
n / N < 0.9
Ejemplo

Condiciones
devalidez

n( p e) > 5
n(1 p e) > 5

Enunamuestraaleatoriade50rocastomadasdeunaminaseobservaque20deellas
son ricas en contenido mineral. Estimar puntualmente la proporcin de rocas con alto
contenido mineral en la mina. Calcular un intervalo de confianza 0.95 de esta
proporcin.

MaraDoloresFras,JessFernndezyCarmenMaraSordo

IntervalosdeConfianzadeunaProporcin
E.CastilloyR.E.Pruneda
EstadsticaAplicada.
Ed.Moralea(2001)

Losintervalosdeconfianzascambianconlasmuestras.

El100(1)%delasmuestrasdanintervalosdeconfianza
quecontienenalaproporcinpoblacional.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Tamaodemuestraparaestimarproporcin
Enlaprcticaelexperimentadorseplanteaconquerrorynivel
deconfianzadeseaestimarlaproporcinysecalculaeltamao
delamuestranecesario.
Esdecir,seconoceney1ysebuscacalcularn.
Muestreosinreemplazamientoy
poblacinfinita

Muestreoconreemplazamiento
opoblacininfinita

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Tamaodemuestraparaestimarproporcin
El clculo de n implica elconocimiento
previo de la proporcin poblacional
(que, como mucho, se podr estimar
DESPUSdetomarlamuestra)
Sinosetieneideadelrangodevalores
de P(1P), se puede usar el valor
queeslacotasuperiordeP(1P).
Muestreosinreemplazamientoy
poblacinfinita

Muestreoconreemplazamientoo
poblacininfinita

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Ejercicio
Se quiere estimar la proporcin de zurdos en una poblacin con una confianza del
95%yunaprecisinde0.01.
1.Culdebesereltamaodelamuestraescogida?
2. Mediante un muestreo previo se estima que p0.1, qu tamao debe tener la
muestrasiparacalcularloseutilizalaestimacindepobtenida?

Estimacindeunamedia

DadaunapoblacinconNindividuosqueposeen
cierta propiedad (altura), esa propiedad o
variable tendr su media poblacional , an
cuandosuvalornumricosedesconozca.

Siseeligeunamuestraaleatoriadeesapoblacindetamaon,
sepuedeobservardichavariableyobtenerlamediamuestral
Lamediamuestralesunavariablealeatoriayaquecadamuestra
tieneunvalordistinto,porloquetieneintersestudiarsufuncin
deprobabilidadyenespecialsumediaysuvarianza.
La distribucin de la media muestral es la distribucin de
probabilidaddetodoslosvaloresposiblesdelamediamuestral.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Distribucindelamediamuestral
Muestreosinreemplazamientoy
poblacinfinita

Muestreoconreemplazamientoo
poblacininfinita

El valor esperado de la media muestral coincide con la media


poblacional.
Lavarianzadelamediamuestraldisminuyeamedidaqueaumentael
tamaodelamuestra(n).
La funcin de distribucin converge a la normal para n tendiendo a
infinito(teoremadellmitecentral).

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunamedia
Sedenominaintervalodeprobabilidaddeunamediaaaquel
intervalo para el cual se sabe con una confianza 1 que la
mediamuestralseencuentraendichointervalo.
El intervalo (a,b] es un intervalo para la media muestral con
probabilidad1siseverifica:

P(a x b) = 1
Al igual que para proporciones, para la media el intervalo de
especial inters es el simtrico respecto de la media de la
poblacin.

P( e x + e) = 1

[ e, + e]

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunamedia

Varianzadelapoblacinconocidayngrande(n30):
Ladistribucinmuestralsepuedeaproximarporunanormal,(Teor.centraldellmite)
Muestreosinreemplazamientoy
poblacinfinita

Muestreoconreemplazamientoo
poblacininfinita

Varianzadelapoblacindesconocidaynespequea.
Nosepuedeemplear 2/n,ensulugarsetomaS2/n.NtesequeS2 esuna
variableaaleatoria(dependedelamuestra)porloqueyanosigue
unadistribucinnormaltipificada.
En este caso, si la distribucin de partida es normal, se considera el
estadstico t que se distribuye segn una t de Student con n1 grados de
libertad.

MaraDoloresFras,JessFernndezyCarmenMaraSordo

tdeStudent,t(n)
Distribucin contnua con forma de campana, simtrica y
unimodal.Elparmetronsedenominagradosdelibertad.
EjedesimetraenlarectaX=0,porloquesumediana=0

n=1,4,16,

Cuandontiendeainfinitoladistribucint(n)tiendealaN(0,1)
MaraDoloresFras,JessFernndezyCarmenMaraSordo

tdeStudent,t(n)
Loscuantilesdela
distribucint(n)
aparecenenmuchas
frmulasdeinferencia
estadsticayse
aproximanmediante
tablasomediante
programasde
ordenador.
n=10
1=0.95

Rtip
>#tn1,/2
>qt(0.975,9)
[1]2.2622
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Ejercicio
En un instituto se sabe que la estatura de los alumnos se ajusta a una
N(165,82) en cm. Calcular la probabilidad de que la altura media de 64
alumnos,elegidosalazar,estentre163y167cm.

Estimadoresdeunamedia
Como ya se ha mencionado antes, en la realidad, el problema ms
frecuente es el de la estimacin de los parmetros de la poblacin.
Para ello se extrae de la poblacin una muestra de tamao n y
conocidastasetratadeestimar.

Estimacinpuntual:Lamediamuestralesunbuenestimadordela
mediadelapoblacin.
Nodainformacinalgunadelaprecisindelaestimacin.

Intervalo de confianza: Determina entre que valores (a, b] se


encuentra la media de la poblacin con cierta probabilidad o
certeza(1).

P(a b) = 1

Complementalaestimacinpuntualprecisandolaexactituddelaestimacin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeconfianzadeunamedia
Sedicequeelintervalo(a,b]esunintervalodeconfianzapara
alnivel(1)siseverifica:

P(a b) = 1
Usando la hiptesis de normalidad y de la misma manera que se
hizoparalasproporciones:

Si la aproximacin normal no es vlida (n pequea y


desconocida),aligualquesehizoconelintervalodeprobabilidad,
esnecesarioconsiderarelvalordelacuasivarianzamuestralS2 y
calcularlavariablet,quesedistribuyesegnunatdeStudent.

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeconfianzadeunamedia

xe

Varianzadelapoblacinconocidayngrande(n30):
Muestreosinreemplazamientoy
poblacinfinita

Nn
e = z / 2
n(N 1 )

Muestreoconreemplazamientoo
poblacininfinita

e = z / 2

Varianzadelapoblacindesconocidaynespequea.

e = tn 1, / 2

S
n

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Tamaodemuestraparaestimarmedia
Aligualqueconlaproporcin,enlarealidadelproblemaquese
plantea se centra en estimar el tamao de muestra necesario
paraestimarunamediaconunerroryniveldeconfianzadados.
Esdecir,seconoceney1ysebuscacalcularn.

e = z / 2

SilaaproximacinNormalnoesvlida,esteclculosecomplica
yaquenapareceimplcitamenteentn1,/2.Adems,S2tambines
desconocidohastatomarlamuestra.

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Ejercicio
Silavidaenhorasdeunabombillaelctricade75watiossedistribuye
deformanormalconunadesviacintpicade5horasyelegimosuna
m.a.s.de30bombillascuyavidamediaesde1014horas,sepide:
1. Construir un intervalo de confianza para la vida media de las
bombillasconunniveldesignificacindel0.05.
2.Siqueremostenerunniveldeconfianzadel95%dequeelerroren
laestimacindelavidamediafueramenordeunahora,Qutamao
delamuestraelegiramos?

Estimacindeunavarianza
Sx
Sx

2
24

2
14

2
1

2
3

S 2 , S n2

La varianza poblacional (2) es constante mientras que cada


muestra puede tener una varianza o cuasivarianza muestral
(Sn2,S2)distinta.
Sn2 y S2 son variables aleatorias por lo que es importante
determinarsudistribucin
La distribucin de la varianza (cuasivarianza) muestral es la
distribucindeprobabilidaddetodoslosvaloresposiblesdela
varianza(cuasivarianza)muestral.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Distribucindelavarianzamuestral

4eselmomentodeordencuatrorespectodelamedia:

El valor esperado de la varianza muestral no coincide con la


varianzapoblacional(sedicequeesunestimadorsesgado)

El valor medio de las cuasivarianzas muestrales si coincide


coneldelavarianzadelapoblacin(estimadorcentrado).

[Estaeslarazndehaberintroducidoesteestadsticoenestadsticadescriptiva!]

Las varianzas de la varianza y la cuasivarianza muestral


tiendenacerocuandontiendeainfinito.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunavarianza
Se denomina intervalo de probabilidad de una varianza a
aquelintervaloparaelcualsesabeconunaconfianza1que
lavarianzamuestralseencuentraendichointervalo.

P(a S b) = 1
2
n

Para el caso de la varianza y cuasivarianza muestrales, no


existe una distribucin a la que converjan todos los casos
posiblesdedistribucinpoblacional.
La distribucin de la varianza o cuasivarianza muestral
depende en alto grado de cual sea la distribucin poblacional
departida.
Para simplificar vamos a considerar en lo que sigue slo el
casodepoblacinnormal.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunavarianza
Si asumimos que la poblacin sigue una distribucin N(, 2),
entonceslavariablealeatoria

MaraDoloresFras,JessFernndezyCarmenMaraSordo

DistribucinChicuadrado, (n)
Esunadistribucincontnua,queslotomavalorespositivos.
Porlotanto,NOessimtrica.
Esladistribucinquesiguelasumadenvariablesaleatorias
independientesN(0,1)elevadasalcuadrado.Elparmetron
sedenominagradosdelibertad.

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunavarianza
Si asumimos que la poblacin sigue una distribucin N(, 2),
entonceslavariablealeatoria

Portanto:

Pero hay infinitos valores de a y b que cumplen esta relacin


paraunaconfianzadada.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunavarianza

Al no ser simtrica la distribucin,


esteNOeselintervalomspequeo
paraunaconfianza dada.Slamente
eselmssencillodecalcular.

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunavarianza

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeprobabilidaddeunavarianza
n=30

n1,/2

Rtip
># 2n1,/2
>qchisq(0.05,29)
># 2n1,1/2
>qchisq(0.95,29)
MaraDoloresFras,JessFernndezyCarmenMaraSordo

n1,1/2

Intervalosdeprobabilidaddeunacuasivarianza

Paralacuasivarianzaelintervalodeprobabilidadsecalcularadela
mismamanera:

n1 S

sigue una distribucin Chicuadrado con n1


gradosdelibertad,

Elintervalodeprobabilidadvendradadodelaforma:

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Estimadoresdeunavarianza
En la realidad, el problema ms frecuente es el de la estimacin de
los parmetros de la poblacin. Para ello se extrae de la poblacin
unamuestradetamaonyconocidastasetratadeestimar2.

Estimacin puntual: La varianza y cuasivarianza muestral son


buenosestimadoresdelavarianzadelapoblacin.Lacuasivarianza
tienelaventajadeseunestimadorcentradode2.

Nodainformacinalgunadelaprecisindelaestimacin.

Intervalo de confianza: Determina entre que valores (a, b] se


encuentra la varianza de la poblacin con cierta probabilidad o
certeza(1).

P(a 2 b) = 1

Complementalaestimacinpuntualprecisandolaexactituddelaestimacin.
MaraDoloresFras,JessFernndezyCarmenMaraSordo

Intervalosdeconfianzadeunavarianza
Delamismamaneraquesehizoparaelintervalodeprobabilidad(1):

esunintervalodeconfianzaparalavarianzapoblacionalsilapoblacin
departidaesnormal.Porladefinicindelacuasivarianzamuestral,este
intervalotambinsepuedeescribircomo:

MaraDoloresFras,JessFernndezyCarmenMaraSordo

Ejercicio
Se sabe que elpeso por bloque deun ciertopreparado de hormign
sedistribuyedeformanormal.Conelobjetodeestudiarlavarianzade
la distribucin, se extrae una m.a.s de 6 bloques. Sabiendo que la
varianza muestral es igual a 40, estimar la varianza poblacional
medianteunintervalodeconfianzaal90%.