Está en la página 1de 40

Tema 1.

Inferencia estadstica para una poblacion


Contenidos
I
I

Inferencia estadstica
Estimadores puntuales
I

Estimaci
on de la media y la varianza de una poblaci
on

Estimaci
on de la media de la poblaci
on mediante intervalos de
confianza
I

Intervalos de confianza para la media de una poblaci


on normal con
varianza conocida
Intervalos de confianza para la media en muestras grandes
I

Intervalos de confianza para la proporci


on en una poblaci
on

Intervalos de confianza para la media de una poblaci


on normal con
varianza desconocida

Estimaci
on de la varianza de la poblaci
on mediante intervalos de
confianza
I

Intervalos de confianza para la varianza de una poblaci


on normal

Tema 1. Inferencia estadstica para una poblacion


Objetivos de aprendizaje
Al final de este tema debieras ser capaz de:
I

Estimar parametros de la poblaci


on desconocidos a partir de datos
muestrales
Construir intervalos de confianza para los parametros de la poblacion
desconocidos a partir de datos muestrales:
I

En el caso de una distribuci


on normal: intervalos de confianza para la
media y la varianza de la poblaci
on
En muestras grandes: intervalos de confianza para la media de la
poblaci
on y la proporci
on

Interpretar el significado de un intervalo de confianza

Entender el efecto del tama


no muestral, el nivel de confianza, etc
sobre la longitud del intervalo de confianza

Calcular un tama
no muestral necesario para controlar la longitud de
un intervalo de confianza

Tema 1. Inferencia estadstica para una poblacion

Referencias
I

Newbold, P. Estadstica para Administraci


on y Economa
I

Captulos 7 y 8 (8.1-8.6)

Ross, S. Introducci
on a la Estadstica
I

Captulo 8

Inferencia Estadstica: palabras clave (i)

Poblaci
on: el conjunto de toda la informaci
on numerica relativa a
una cantidad de interes.
I

Muestra: un subconjunto observado (por ejemplo, de tama


no n) de
valores de la poblaci
on.
I

Identificaremos el concepto de poblaci


on con el de una variable
aleatoria X .
La ley o distribuci
on de la poblaci
on es la distribuci
on de X , FX .

Representada como una colecci


on de n variables aleatorias
X1 , X2 , . . . , Xn , tpicamente
iid (independientes e identicamente distribuidas) .

Parametro: una constante que caracteriza a X o FX .

Inferencia Estadstica: palabras clave (ii)

Inferencia estadstica: el proceso mediante el que se llega a


conclusiones sobre una poblaci
on a partir de las medidas o las
observaciones realizadas sobre una muestra de individuos de la
poblaci
on.

Estadstico: una variable aleatoria definida como una funcion de una


muestra aleatoria, Y = f (X1 , X2 , . . . , Xn )

Estimador de un parametro: una variable aleatoria, por ejemplo T ,


funci
on de una muestra aleatoria, T = T (X1 , X2 , . . . , Xn ), que se
emplea para aproximar (estimar) el valor de un parametro de la
poblaci
on desconocido.

Estimaci
on: una realizaci
on concreta del estimador, por ejemplo T ,
correspondiente a una muestra observada, x1 , x2 , . . . , xn , y que
proporciona una aproximaci
on al valor del parametro de interes.

Inferencia estadstica: ejemplo

Queremos conocer
X = E[X ]

X F

Tenemos n copias
de X

X = E[X ]
Valor esperado de X

X1 , X2 , . . . , Xn F
Muestra

Tenemos n
valores observados de
X1 , X2 , . . . , Xn

Estimador de X (variable aleatoria)

X
Media muestral

x1 , x2 , . . . , xn
Muestra observada

Estimaci
on de X (un n
umero)
x
Media muestral

Estimadores puntuales: introduccion

Un estimador puntual de un parametro de una poblacion es una


funci
on, por ejemplo T , de la informaci
on muestral
X n = (X1 , . . . , Xn ) que toma un valor numerico.
Ejemplos de parametros de poblaciones, estimadores y estimaciones:
Par
ametro
poblaci
on
Media pobl. X
Prop. pobl. pX
Var. pobl. X2
X2

Var. pobl.
...
En general, X

media muestral
prop. muestral

T (X n )
X1 +...+Xn
n

2
2
i Xi n(X )
nP
)2
Xi2 n(X
muestral i n1
P

var. muestral
quasi var.
...
...

n
X2
n1

Estimador:
notaci
on
=
X
X
p
X

Estimaci
on:
notaci
on
x
p
x

X2

x2

sX2

sx2
...
x

...
X

Estimadores puntuales: propiedades (i)

Que caractersticas querramos que tuviese un estimador?


I

Ausencia de sesgo. Esta propiedad se da cuando un estimador tiene


sesgo igual a cero. Que es el sesgo? El sesgo es la diferencia entre
el valor esperado del estimador y el valor del parametro de interes.
Sesgo[X ] = E[X ] X
Poblaci
on
par
ametro
Media pobl. X
Prop. pobl. pX
Var. pobl. X2
Var. pobl. X2
En general, X

Estimador
T (X n )
X
p
X

X2
sX2
X

Sesgo
] X = 0
E[X
E[
pX ] pX = 0
E[
X2 ] X2 6= 0
E[sX2 ] X2 = 0
E[X ] X

Insesgado?
S
S
No
S
A menudo

Estimador insesgado
de mnima varianza?
S, si X normal
S
No
S, si X normal
Rara vez

Estimadores puntuales: propiedades (ii)

Eficiencia. Se mide por la varianza del estimador. Un estimador con


menos varianza es mas eficiente.
La eficiencia relativa de dos estimadores insesgados X ,1 y X ,2 para
un parametro X se define como
Var[X ,1 ]
Eficiencia relativa(X ,1 , X ,2 ) =
Var[X ,2 ]
Nota:
I
I

En algunos casos se emplea la definici


on inversa.
En todo caso, un estimador con menor varianza es m
as eficiente.

Estimadores puntuales: propiedades (iii)


I

Un criterio mas general para seleccionar estimadores (incluyendo


estimadores insesgados y sesgados) es el error cuadratico medio,
definido como
ECM[X ] = E[(X X )2 ] = Var[X ] + (Sesgo[X ])2
Nota:
I

I
I

El error cuadr
atico medio de un estimador insesgado es igual a su
varianza.
Un estimador con menor ECM es mejor.
El estimador insesgado de mnima varianza tiene la menor
varianza/ECM entre todos los estimadores.

Como encontrar una buena definici


on para un estimador T ?
I

En algunos casos se conoce un estimador o


ptimo: estimador
insesgado de mnima varianza
Si no es as, existen distintos metodos de construcci
on de
estimadores que proporcionan resultados razonables, por ejemplo:
I
I

Estimaci
on m
aximo verosmil
M
etodo de momentos

Estimacion puntual: ejemplo


Ejemplo: 7.1 (Newbold) Las ratios precio-beneficio para una muestra
aleatoria de diez acciones negociadas en la bolsa de NY en un da
concreto fueron
10

16

10

12

Emplee un procedimiento de estimaci


on insesgado para obtener
estimaciones puntuales para los siguientes parametros de la poblacion:
media, varianza, proporci
on de valores que exceden 8.5.

sx2

px

=
=

80
=8
10
782 10(8)2
= 15,78
10 1
1+1+0+1+1+0+0+0+0+0
10
0,4

Estimacion puntual: ejemplo


2
(X1 + 2X2 + . . . + nXn ) un estimador de la media de
Ejemplo: Sea
X = n(n+1)
la poblaci
on basado en una MAS X n . Compare este estimador con la media
.
muestral, X
2
es un estimador insesgado de X , con varianza X .
Sabemos que X
n

X tambi
en es insesgado:
"
E[
X ]

Y su varianza/ECM es:
"

E
n(n + 1)

V[
X ]

(X1 + 2X2 + . . . + nXn )

2
=
n(n + 1)

(E[X1 ] + 2E[X2 ] + . . . + nE[Xn ])

=indep.

#
2
(X1 + 2X2 + . . . + nXn )
n(n + 1)
!2
2
2
2
(V[X1 ] + 2 V[X2 ] + . . . + n V[Xn ])
n(n + 1)

2
=id

n(n + 1)

2X
n(n + 1)

(X + 2X + . . . + nX )
4
=id

n(n+1)/2
z
}|
{
(1 + 2 + . . . + n) = X

n2 (n + 1)2
2(2n + 1)

=
3n(n + 1)

2
X

Sesgo[
X ] = 0
ECM[
X ]

,
Eficiencia relativa(X
X ) =

X2 /n
2(2n+1) 2

3n(n+1) X

V[
X ] + 0

n(n+1)(2n+1)/6
}|
{
z
2
2
2
2
X (1 + 2 + . . . + n )

2(2n + 1)
=
3n(n + 1)

2
X

3(n + 1)
2(2n + 1)

es un
Puede verse que para n 2 este cociente es menor que 1, y por tanto X
estimador m
as eficiente para X .

De estimaciones puntuales a estimacion por intervalos de


confianza
I

Hasta ahora hemos considerado la estimaci


on puntual de un
parametro desconocido de una poblaci
on que, partiendo de una
MAS de n observaciones de X , proporciona una aproximacion
razonable para ese parametro desconocido.
Una estimaci
on puntual no tiene en cuenta la variabilidad del
proceso de estimaci
on, debida entre otras causas a:
I

I
I

El tama
no muestral - una muestra mayor debiera proporcionar una
informaci
on m
as precisa sobre el par
ametro de la poblaci
on.
Variabilidad en la poblaci
on - una muestra de una poblaci
on con
menos varianza debiera proporcionar estimaciones m
as precisas
Que se conozcan otros par
ametros de la poblaci
on.
etc

Estas limitaciones pueden tratarse mediante el uso de estimaciones por


intervalos de confianza, esto es, un metodo que proporciona un intervalo
de valores al que es probable que pertenezca el valor del parametro.

Estimadores por intervalos de confianza e intervalos de


confianza
on X con funcion de
Sea X n = (X1 , X2 , . . . , Xn ) una MAS de una poblaci
distribuci
on FX que depende de un parametro desconocido .
Un estimador por intervalos de confianza de con un nivel de confianza
(1 ) = 100(1 ) % es un intervalo (T1 (X n ), T2 (X n )) que satisface
P ( (T1 (X n ), T2 (X n )) = 1
Interpretaci
on: tenemos una probabilidad (1 ) de que el parametro
desconocido de la poblaci
on pertenecera a (T1 (X n ), T2 (X n )).
Un intervalo de confianza para con un nivel de confianza 1 es el
valor observado del estimador por intervalos de confianza,
(T1 (x n ), T2 (x n ))
Interpretaci
on: podemos tener una confianza de (1 ) de que el valor
del parametro desconocido de la poblaci
on estara en (T1 (x n ), T2 (x n )).
Niveles de confianza habituales

100(1 ) %

0.01
99 %

0.05
95 %

0.10
90 %

Obteniendo un estimador por intervalos de confianza:


procedimiento
1. Se busca una cantidad (aleatoria) relacionada con el parametro
desconocido y con la muestra X n , C (X n , ), cuya distribucion sea
conocida y no dependa del valor del parametro - esta cantidad se
conoce como la cantidad pivotal o el pivote para
2. Se pueden usar los cuantiles 1 /2 y /2 de esa distribucion, y la
definici
on del estimador por intervalos de confianza, para plantear la
ecuaci
on
doble desigualdad
}|
{
z
P(1 /2 cuantil<C (X n , )</2 cuantil) = 1 .
3. Para obtener los extremos del estimador por intervalo de confianza,
T1 (X n ) y T2 (X n ), se resuelve la doble desigualdad en .
4. El intervalo de confianza al 100(1 ) % para es (T1 (x n ), T2 (x n )).

Intervalo de confianza para la media de la poblacion,


poblacion normal con varianza conocida

no n obtenida de X . Bajo los supuestos:


1. Sea X n una MAS de tama
I
I

X sigue una distribuci


on normal con par
ametros X y X2
2
X es conocida (muy poco realista)

2. La cantidad pivotal para X es:


X
X
N(0, 1)
/ n
, X /n, (o de cualquier otro
Nota: la desviaci
on tpica de X
estadstico) se conoce como su error estandar

Intervalo de confianza para la media de la poblacion,


poblacion normal con varianza conocida
3. Si z1/2 y z/2 son los cuantiles
superiores (1 /2) y (/2) de
la distribuci
on N(0, 1), tenemos
P(z1/2 < Z < z/2 ) = 1

Densidad normal estandar


Si Z N(0, 1) entonces
E[Z ] = 0, V[Z ] = 1

z12 = z2

z2

Z
z/2 z }| {
X
z }| { X
< z/2 ) = 1
4. Se tiene que P(z1/2 <
X / n

Intervalo de confianza para la media de la poblacion,


poblacion normal con varianza conocida
5. Resolvemos la doble desigualdad para X :
z/2
X
z/2
n
X

z/2 X
n
X

z/2 + X
n

<

X
X

X / n

<

X <
<X
< X <
> X >

z/2
X
z/2
n
X
+ z/2
X
n
X
z/2
X
n

para obtener el estimador por intervalos de confianza


T1 (X n )
T2 (X n )
z
}|
{ z
}|
{
X
X
z/2
(X
, X + z/2 )
n
n
6. El intervalo de confianza es:

X
X
X
IC1 (X ) = x z/2 , x z/2
= x z/2
n
n
n

Ejemplo: calculo de un intervalo de confianza para X


Ejemplo: 8.2 (Newbold) Un proceso industrial produce bolsas de azucar
refinado. Los pesos de las bolsas siguen una distribuci
on normal con desviaci
on
tpica igual a 12 g. Una muestra aleatoria de venticinco bolsas tiene un peso
promedio de 198 g. Encuentre un intervalo de confianza al 95 % para el peso
promedio en la poblaci
on de las bolsas de azucar fabricadas con este proceso.

X
Poblaci
on:
Objetivo: IC0,95 (X ) = x z/2
n
X = peso de una bolsa (en g)
2
2
X N(X , X = 12 )
X = 12

'

MAS: n = 25

Muestra: x = 198

Area=
0.025

z0.025 = 1.96

n = 25

x = 198

1 = 0,95

/2 = 0,025

z/2

IC0,95 (X )

=
=

z0,025 = 1,96

12

198 1,96
25
(198 4,7)

(193,3, 202,7)

Interpretaci
on: Podemos tener una
confianza del 95 % de que X
est
a en (193,3, 202,7)

Interpretacion frecuentista del IC: nivel de confianza


En este ejemplo simulado se han generado 150 muestras de tama
no n = 50, de
una distribuci
on X N(X = 5, X2 = 12 ) y se construyeron 150 IC1 (X )
con = 0,1 y otros 150 intervalos con = 0,01.

(1 ) = 0,9, n = 50

(1 ) = 0,99, n = 50
150

X est
a en aprox. 150(0,99) = 148,5 interv.
(pero no en 150(0,01) = 1,5)

150

X est
a en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15)

|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
||
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|

6.0

5.5

5.0

Indice

100

50

100

Indice
0

50

|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
||
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|

4.5

4.0

6.0

Intervalo de confianza

La longitud del intervalo, L = x +

5.5

5.0

4.5

4.0

Intervalo de confianza

z/2

z/2 X

=2

z/2 X

, aumenta

al aumentar el nivel de confianza (a igualdad de otros valores). Por que?

Interpretacion frecuentista del IC: tamano muestral


Construimos ahora 150 muestras de tama
no n = 50 y otras 150 de tama
no
n = 200, de una distribuci
on X N(X = 5, X2 = 12 ) .

(1 ) = 0,9, n = 50

(1 ) = 0,9, n = 200
150

X en aprox. 150(0,9) = 135 interv.


(pero no en 150(0,1) = 15)

150

X en aprox. 150(0,9) = 135 interv.


(pero no en 150(0,1) = 15)

|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
|
|
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|

|| |
|
|
|
|
|
|
|| |
| |
|
|| |
| | |
|
|| |
||
| |
||
|| |
|
|
|
|
|
| | |
|
| |
||
| | |
| ||
||
|
|| |
|
| |
| ||
|
|
| |
|
|
|
| ||
|
||
|| |
|| |
||
|||
||
| |
|
|
|
|
||
|
|
||
|
| |
| | |
| | |
||
|
|
| | |
| | |
| |
|
|||
|
|| |
|
| ||
|
|
|| |
|
||
| ||
| |
|

6.0

5.5

5.0

Indice
50
0

100

Indice
0

50

100

4.5

Intervalo de confianza

4.0

6.0

5.5

5.0

4.5

Intervalo de confianza

La longitud de los intervalos decrece cuando el tama


no muestral aumenta
(suponiendo que los dem
as valores no cambien). Por que?
Pregunta: Cu
al es el efecto del valor de sobre la longitud?

4.0

Ejemplo: estimacion del tamano muestral


Ejemplo: 8.14 (Newbold) La longitud de las barras de acero fabricadas en un
proceso industrial siguen una distribuci
on normal con desviaci
on tpica 1.8 mm.
El encargado del proceso desea obtener un intervalo de confianza al 99 % para
dicha longitud, con un tama
no menor o igual a 0.5 mm a cada lado de la media
muestral. Que tama
no muestral sera necesario para tener esta propiedad?
Poblaci
on:
X = longitud de la barra (en mm)
X N(X , X2 = 1,82 )

'

MAS: n =?

longitud
z }| {
z/2
IC0,99 (X ): 2
2(0,5) = 1
n

Area=
0.005

z0.005 = 2.575

Objetivo: n tal que longitud IC 1


z/2
2
n

2z/2

2
22 z/2
2

(22 )(2,5752 )(1,82 )

85,93

Para satisfacer la petici


on del
encargado se necesitara una
muestra de tama
no al menos
igual a 86 observaciones.

Intervalo de confianza para la media de la poblacion en


muestras grandes

1. Sea X n una MAS de tama


no n de X . Bajo las hipotesis:
I

X sigue una distribuci


on (no necesariamente normal) con par
ametros
X y X2
el tama
no muestral n es grande (n 30)

2. La cantidad pivotal para X basada en el Teorema Central del


Lmite es
X
X
approx. N(0, 1)

X / n

Intervalo de confianza para la media de la poblacion en


muestras grandes
3. Por tanto, si z1/2 y z/2 son
los cuantiles superiores (1 /2)
y (/2) de N(0, 1), tenemos
P(z1/2 < Z < z/2 ) = 1

Densidad normal estandar

z12 = z2

z2

Z
z/2 z }| {
X
z }| { X
< z/2 ) = 1
4. Imponemos la condici
on P(z1/2 <

X / n

Intervalo de confianza para la media de la poblacion en


muestras grandes
5. Resolvemos la doble desigualdad para X :
z/2 <

X
X
< z/2

X / n

para obtener el estimador por intervalos de confianza


T2 (X n )
T1 (X n )
z
}|
{ z
}|
{

(X z/2 , X + z/2 )
n
n
6. El intervalo de confianza es:

x
IC1 (X ) = (
x z/2 , x + z/2 )
n
n

Intervalo de confianza para la proporcion en la poblacion


en muestras grandes
Aplicacion de ICs para la media en muestras grandes
de una distr. Bernoulli con parametro pX
Sea X n , n 30, una MASp
(X = E[X ] = pX y X = pX (1 pX )). La proporci
on muestral pX es
.
un caso especial de media muestral con observaciones cero-uno, pX = X
Por tanto, del TCL,
p pX
p X
approx. N(0, 1)
p(1 p)/n
|
{z
}

X / n

Este resultado sigue siendo

v
alido si la desviaci
on tpica de la
poblaci
on se estima (no se conoce)
p
X pX
p
approx. N(0, 1)
p
(1 p
)/ n
|
{z
}

X / n

En muestras grandes, el intervalo de confianza para pX es:


!
r
r
px (1 px )
px (1 px )
IC1 (pX ) = px z/2
, px + z/2
n
n

Ejemplo: calculo de un intervalo de confianza para pX


Ejemplo: 8.6 (Newbold) A una muestra aleatoria de 344 ejecutivos de compras se les realiz
o la
pregunta Cu
al es la poltica de su empresa en relaci
on con los regalos que su personal de
compras pueda recibir de sus proveedores? 83 de estos ejecutivos respondieron que cada
empleado poda tomar su propia decisi
on. Calcule un intervalo de confianza al 90 % para la
proporci
on en la poblaci
on de los ejecutivos que dan libertad sobre estos regalos a sus empleados.
r

Poblaci
on:
X = 1 si un ejecutivo permite tomar
decisiones a su personal y 0 en otro caso
X Bernoulli(pX )

'
Muestra: p
x =

MAS: n = 344 grande

83
344

Objetivo: IC0,9 (pX ) =

p
x = 0,241

p
x z/2

z0.05 = 1.645

n = 344

1 = 0,9

/2 = 0,05

z/2

z0,05 = 1,645
0

IC0,9 (pX )

@0,241 1,645

= 0,241

Area=
0.05

p
x (1
px )
n

(0,241 0,038)

(0,203, 0,279)

0,241(1 0,241)
344

Interpretaci
on: Podemos tener una confianza
del 90 % de que la proporci
on de ejecutivos
que permiten tomar sus propias decisiones a
sus empleados, pX , est
a en (0,203, 0,279)

1
A

Intervalo de confianza para la media de la poblacion:


poblacion normal con varianza desconocida

1. Sea X n una MAS de tama


no n de X . Bajo las hipotesis:
I
I

X sigue una distribuci


on normal con par
ametros X y X2
X2 es desconocida (muy realista)

2. La cantidad pivotal para X es


X
X
tn1
sX / n

Intervalo de confianza para la media de la poblacion:


poblacion normal con varianza desconocida
3. Si tn1;1/2 y tn1;/2 son los cuantiles
superiores (1 /2) y (/2) de una
distribuci
on t de Student con n 1 grados
de libertad (gl), tenemos

P(tn1;1/2

tn1
z}|{
< T < tn1;/2 ) = 1

Densidad t de Student

Recuerda: si T tn , E[T ] = 0, V[T ] =

tn1 ; 12 = tn1 ; 2

tn1 ; 2

n
n2

4. Imponemos la condici
on
T tn1
z }| {
tn1;/2
X
z }| {
X
< tn1;/2 ) = 1
P(tn1;1/2 <
sX / n

Intervalo de confianza para la media de la poblacion:


poblacion normal con varianza desconocida
5. Resolvemos la doble desigualdad para X :
tn1;/2

<

X
X

sX / n

<

tn1;/2

y obtenemos el estimador por intervalos de confianza


T1 (X n )
T2 (X n )
z
}|
{ z
}|
{
sX
sX

(X tn1;/2 , X + tn1;/2 )
n
n
6. El intervalo de confianza es:
sx
sx
IC1 () = (
x tn1;/2 , x tn1;/2 )
n
n

Ejemplo: calcular un intervalo de confianza para X


Ejemplo: 8.4 (Newbold) Se ha medido el consumo de combustible en una
muestra aleatoria de seis coches del mismo modelo, obteniendo en mpg: 18.6,
18.4, 19.2, 20.8, 19.4, 20.5. Calcule un intervalo de confianza al 90 % para el
consumo medio, suponiendo que la poblaci
on sigue una distribuci
on normal.

Poblaci
on: X = mpg de un coche
Objetivo: IC0,9 (X ) = x tn1;/2 sxn
de este modeloX N(X , X2 )
p
X2 desconocida
sx =
0,96 = 0,98

'

n=6
MAS: n = 6 peque
na

Muestra: x =
sx2

116,9
6

= 19,4833

2282,41 6(19,4833)2
=
= 0,96
61

Area=
0.05

t5 ; 0.05 = 2.015

x = 19,48

1 = 0,9

/2 = 0,05

tn1;/2

IC0,9 (X )

=
=

t5;0,05 = 2,015

0,98
19,48 2,105
6
(19,48 0,81)

(18,67, 20,29)

Interpretaci
on: Tenemos una
confianza del 90 % de que el
consumo promedio de este modelo,
X , estar
a entre 18.67 y 20.29 mpg

Ejemplo: calcular un intervalo de confianza para X


Ejemplo: 8.4 (cont.) en Excel: Ir al men
u: Datos, submen
u: Analisis de
Datos, escoger la funci
on: Estadstica Descriptiva.
Columna A datos en amarillo (media muestral, semilongitud tn1;/2 sxn ,
extremo inferior (celda: D3-D16), extremo superior (celda: D3+D16)).

Media muestral

Semilongitud IC
Datos

Distribuciones t de Student y 2 (chi-cuadrado)


, donde Z N(0, 1) y 2n sigue una

Sabemos que T tn si T = Z2

Tambien, 2n es la distribuci
on de la suma de los cuadrados de n variables
aleatorias N(0, 1) independientes.

Por ejemplo, la cuasi varianza muestral reescalada sigue una distribuci


on
chi cuadrado con n 1 grados de libertad.
Pn

n
2
X
2
(n 1)sX2
Xi X
i=1 (Xi X )
=
=
2n1

X2
X2
X
i=1

n /n

distribuci
on chi-cuadrado con gl = n, y ambas son independientes.

Por que n 1 y no n?
Si conociesemos el valor de X , el
n
umero de grados de libertad sera
n, porque tendramos n variables
X
aleatorias iid Xi
X

Si tenemos que estimar X mediante


, los gl son n 1, porque solo
X
tenemos n 1 variables aleatorias iid

Xi X
(si se conocen los valores de
X
n 1 de ellas, se puede deducir
f
acilmente el valor de la restante)

Decimos que empleamos un grado de libertad en el c


alculo de X

Distribuciones t de Student y 2 (chi-cuadrado)

0.15

Densidades de 2

0.0

0.00

0.1

0.05

0.2

N(0,1)
gl=10
gl=5
gl=3

gl=20
gl=15
gl=10
gl=5

0.10

0.3

0.4

Densidades de t y N(0, 1)

10

20

30

40

Intervalo de confianza para la varianza de la poblacion,


poblacion normal

1. Sea X n una MAS de tama


no n de X . Bajo las hipotesis:
I

X sigue una distribuci


on normal con varianza X2

2. La cantidad pivotal para X2 es


(n 1)sX2
2n1
X2

Intervalo de confianza para la varianza de la poblacion,


poblacion normal
3. Por tanto, si 2n1;1/2 y 2n1;/2 son
los cuantiles superiores (1 /2) y
(/2) de una distribuci
on chi-cuadrado
con n 1 grados de libertad, tenemos
P(2n1;1/2 < 2n1 < 2n1;/2 ) = 1

Densidad chi-cuadrado

Recuerda: E[2n ] = n, V[2n ] = 2n

4. Imponemos la condici
on P(2n1;1/2

2n1 ; 1
2

2n1 ;
2

2n1
z }| {
(n 1)sX2
<
< 2n1;/2 ) = 1
2

Intervalo de confianza para la varianza de la poblacion,


poblacion normal
5. Resolvemos la doble desigualdad para X2 :
2n1;1/2
1
2n1;1/2
(n 1)sX2
2n1;1/2

<

(n1)sX2
X2

<

2n1;/2

>

X2
(n1)sX2

>

1
2n1;/2

> X2 >

(n 1)sX2
2n1;/2

y obtenemos el estimador por intervalos de confianza


!
(n 1)sX2 (n 1)sX2
,
2n1;/2 2n1;1/2
6. El intervalo de confianza es:
IC1 (X2 )

(n 1)sx2 (n 1)sx2
,
2n1;/2 2n1;1/2

Ejemplo: calcular un intervalo de confianza para X2 y X


Ejemplo: 8.8 (Newbold) Una muestra aleatoria de quince pastillas para el dolor
de cabeza tiene una cuasi desviaci
on tpica de 0.8 % en la concentraci
on del
ingrediente activo. Calcule un IC al 90 % para la varianza de la poblaci
on para
estas pastillas. Obtenga tambien un IC para la desviaci
on tpica de la poblaci
on.
0

Poblaci
on:
X = concentraci
on del
ingrediente activo en una pastilla
(in %)X N(X , X2 )

'

MAS: n = 15

Muestra: sx = 0,8

Area=
0.05

Area=
0.05

214 ; 0.95 214 ; 0.05


=6.57

=23.68

2) = @
Objetivo: IC0,9 (X

1
(n1)sx2
(n1)sx2
A
, 2
2

n1;/2
n1;1/2

sx2 = 0,82 = 0,64

n = 15

1 = 0,9

/2 = 0,05

2n1;1/2

214;0,95 = 6,57

2n1;/2

IC0,9 (X2 )

214;0,05 = 23,68

14(0,64) 14(0,64)
,
23,68
6,57
(0,378, 1,364)
p
p
( 0,378, 1,364)

(0,61, 1,17)

=
IC0,9 (X )

Para obtener IC(X ) aplicamos


extremos de IC(X2 )

a los

Formulas para intervalos de confianza


Resumen para una poblacion
I

Sea X n una muestra aleatoria simple de una poblaci


on X con media X y
varianza X2

Par
ametro

Media

Hip
otesis
Datos normales
Varianza conocida


X
X N(0, 1)

X / n

Datos no normales
Muestra grande


X
X

approx. N(0, 1)

X / n

Datos Bernoulli
Muestra grande
Datos normales
Varianza desconocida
Varianza

Datos normales

Desv. tpica

Datos normales

(1 ) Intervalo Conf.

Cantidad pivotal

p
X pX
approx. N(0, 1)
p
X (1
pX )/n

X
X tn1
sX / n
2
(n1)sX
2
n1
2
X
2
(n1)sX
2
n1
2
X

x z/2 X , x + z/2 X
n
n

X x z/2 x , x + z/2 x
n
n
#
r
p
x (1
px )
pX p
x z/2
n

s
s
x tn1,/2 x , x + tn1,/2 x
n
n
0
1
(n1)sx2
(n1)sx2
2
A
X @ 2
, 2

n1;/2
n1;1/2
0v
1
v
u
u
(n1)sx2
u (n1)sx2
u
A
X @t 2
,t 2

n1;/2
n1;1/2

Intervalos de confianza para la media de la poblacion:


Que usar cuando?

X distribuci
on con media X y desviaci
on tpica X

.
.

conocida

&

basada en z
(exacta)

basada en t
(exacta)

X normal

desconocida

&
.

n peque
na

&

metodos mas
alla de Est II

basada en z
(aprox. TCL)

X  normal

n grande

También podría gustarte