Tema 1 Esp

Tema 1.
Inferencia estadstica para una poblacion

Contenidos
I
I
Inferencia estadstica
Estimadores puntuales
I
Estimaci
on de la media y la varianza de una poblaci
on
Estimaci
on de la media de la poblaci
on mediante intervalos de
confianza
I
Intervalos de confianza para la media de una poblaci

on normal con
varianza conocida
Intervalos de confianza para la media en muestras grandes
I
Intervalos de confianza para la proporci

on en una poblaci
on
Intervalos de confianza para la media de una poblaci

on normal con
varianza desconocida
Estimaci
on de la varianza de la poblaci
on mediante intervalos de
confianza
I
Intervalos de confianza para la varianza de una poblaci

on normal
Tema 1. Inferencia estadstica para una poblacion

Objetivos de aprendizaje
Al final de este tema debieras ser capaz de:
I
Estimar parametros de la poblaci

on desconocidos a partir de datos
muestrales
Construir intervalos de confianza para los parametros de la poblacion
desconocidos a partir de datos muestrales:
I
En el caso de una distribuci

on normal: intervalos de confianza para la
media y la varianza de la poblaci
on
En muestras grandes: intervalos de confianza para la media de la
poblaci
on y la proporci
on
Interpretar el significado de un intervalo de confianza
Entender el efecto del tama

no muestral, el nivel de confianza, etc
sobre la longitud del intervalo de confianza
Calcular un tama
no muestral necesario para controlar la longitud de
un intervalo de confianza
Tema 1. Inferencia estadstica para una poblacion
Referencias
I
Newbold, P. Estadstica para Administraci

on y Economa
I
Captulos 7 y 8 (8.1-8.6)
Ross, S. Introducci
on a la Estadstica
I
Captulo 8
Inferencia Estadstica: palabras clave (i)
Poblaci
on: el conjunto de toda la informaci
on numerica relativa a
una cantidad de interes.
I
Muestra: un subconjunto observado (por ejemplo, de tama

no n) de
valores de la poblaci
on.
I
Identificaremos el concepto de poblaci

on con el de una variable
aleatoria X .
La ley o distribuci
on de la poblaci
on es la distribuci
on de X , FX .
Representada como una colecci

on de n variables aleatorias
X1 , X2 , . . . , Xn , tpicamente
iid (independientes e identicamente distribuidas) .
Parametro: una constante que caracteriza a X o FX .
Inferencia Estadstica: palabras clave (ii)
Inferencia estadstica: el proceso mediante el que se llega a

conclusiones sobre una poblaci
on a partir de las medidas o las
observaciones realizadas sobre una muestra de individuos de la
poblaci
on.
Estadstico: una variable aleatoria definida como una funcion de una

muestra aleatoria, Y = f (X1 , X2 , . . . , Xn )
Estimador de un parametro: una variable aleatoria, por ejemplo T ,

funci
on de una muestra aleatoria, T = T (X1 , X2 , . . . , Xn ), que se
emplea para aproximar (estimar) el valor de un parametro de la
poblaci
on desconocido.
Estimaci
on: una realizaci
on concreta del estimador, por ejemplo T ,
correspondiente a una muestra observada, x1 , x2 , . . . , xn , y que
proporciona una aproximaci
on al valor del parametro de interes.
Inferencia estadstica: ejemplo
Queremos conocer
X = E[X ]
X F
Tenemos n copias
de X
X = E[X ]
Valor esperado de X
X1 , X2 , . . . , Xn F
Muestra
Tenemos n
valores observados de
X1 , X2 , . . . , Xn
Estimador de X (variable aleatoria)
X
Media muestral
x1 , x2 , . . . , xn
Muestra observada
Estimaci
on de X (un n
umero)
x
Media muestral
Estimadores puntuales: introduccion
Un estimador puntual de un parametro de una poblacion es una

funci
on, por ejemplo T , de la informaci
on muestral
X n = (X1 , . . . , Xn ) que toma un valor numerico.
Ejemplos de parametros de poblaciones, estimadores y estimaciones:
Par
ametro
poblaci
on
Media pobl. X
Prop. pobl. pX
Var. pobl. X2
X2
Var. pobl.
...
En general, X
media muestral
prop. muestral
T (X n )
X1 +...+Xn
n
2
2
i Xi n(X )
nP
)2
Xi2 n(X
muestral i n1
P
var. muestral
quasi var.
...
...
n
X2
n1
Estimador:
notaci
on
=
X
X
p
X
Estimaci
on:
notaci
on
x
p
x
X2
x2
sX2
sx2
...
x
...
X
Estimadores puntuales: propiedades (i)
Que caractersticas querramos que tuviese un estimador?

I
Ausencia de sesgo. Esta propiedad se da cuando un estimador tiene

sesgo igual a cero. Que es el sesgo? El sesgo es la diferencia entre
el valor esperado del estimador y el valor del parametro de interes.
Sesgo[X ] = E[X ] X
Poblaci
on
par
ametro
Media pobl. X
Prop. pobl. pX
Var. pobl. X2
Var. pobl. X2
En general, X
Estimador
T (X n )
X
p
X
X2
sX2
X
Sesgo
] X = 0
E[X
E[
pX ] pX = 0
E[
X2 ] X2 6= 0
E[sX2 ] X2 = 0
E[X ] X
Insesgado?
S
S
No
S
A menudo
Estimador insesgado
de mnima varianza?
S, si X normal
S
No
S, si X normal
Rara vez
Estimadores puntuales: propiedades (ii)
Eficiencia. Se mide por la varianza del estimador. Un estimador con

menos varianza es mas eficiente.
La eficiencia relativa de dos estimadores insesgados X ,1 y X ,2 para
un parametro X se define como
Var[X ,1 ]
Eficiencia relativa(X ,1 , X ,2 ) =
Var[X ,2 ]
Nota:
I
I
En algunos casos se emplea la definici

on inversa.
En todo caso, un estimador con menor varianza es m
as eficiente.
Estimadores puntuales: propiedades (iii)

I
Un criterio mas general para seleccionar estimadores (incluyendo

estimadores insesgados y sesgados) es el error cuadratico medio,
definido como
ECM[X ] = E[(X X )2 ] = Var[X ] + (Sesgo[X ])2
Nota:
I
I
I
El error cuadr
atico medio de un estimador insesgado es igual a su
varianza.
Un estimador con menor ECM es mejor.
El estimador insesgado de mnima varianza tiene la menor
varianza/ECM entre todos los estimadores.
Como encontrar una buena definici

on para un estimador T ?
I
En algunos casos se conoce un estimador o

ptimo: estimador
insesgado de mnima varianza
Si no es as, existen distintos metodos de construcci
on de
estimadores que proporcionan resultados razonables, por ejemplo:
I
I
Estimaci
on m
aximo verosmil
M
etodo de momentos
Estimacion puntual: ejemplo

Ejemplo: 7.1 (Newbold) Las ratios precio-beneficio para una muestra
aleatoria de diez acciones negociadas en la bolsa de NY en un da
concreto fueron
10
16
10
12
Emplee un procedimiento de estimaci

on insesgado para obtener
estimaciones puntuales para los siguientes parametros de la poblacion:
media, varianza, proporci
on de valores que exceden 8.5.
sx2
px
=
=
80
=8
10
782 10(8)2
= 15,78
10 1
1+1+0+1+1+0+0+0+0+0
10
0,4
Estimacion puntual: ejemplo

2
(X1 + 2X2 + . . . + nXn ) un estimador de la media de
Ejemplo: Sea
X = n(n+1)
la poblaci
on basado en una MAS X n . Compare este estimador con la media
.
muestral, X
2
es un estimador insesgado de X , con varianza X .
Sabemos que X
n
X tambi
en es insesgado:
"
E[
X ]
Y su varianza/ECM es:
"
E
n(n + 1)
V[
X ]
(X1 + 2X2 + . . . + nXn )
2
=
n(n + 1)
(E[X1 ] + 2E[X2 ] + . . . + nE[Xn ])
=indep.
#
2
(X1 + 2X2 + . . . + nXn )
n(n + 1)
!2
2
2
2
(V[X1 ] + 2 V[X2 ] + . . . + n V[Xn ])
n(n + 1)
2
=id
n(n + 1)
2X
n(n + 1)
(X + 2X + . . . + nX )
4
=id
n(n+1)/2
z
}|
{
(1 + 2 + . . . + n) = X
n2 (n + 1)2
2(2n + 1)
=
3n(n + 1)
2
X
Sesgo[
X ] = 0
ECM[
X ]
,
Eficiencia relativa(X
X ) =
X2 /n
2(2n+1) 2
3n(n+1) X
V[
X ] + 0
n(n+1)(2n+1)/6
}|
{
z
2
2
2
2
X (1 + 2 + . . . + n )
2(2n + 1)
=
3n(n + 1)
2
X
3(n + 1)
2(2n + 1)
es un
Puede verse que para n 2 este cociente es menor que 1, y por tanto X
estimador m
as eficiente para X .
De estimaciones puntuales a estimacion por intervalos de

confianza
I
Hasta ahora hemos considerado la estimaci

on puntual de un
parametro desconocido de una poblaci
on que, partiendo de una
MAS de n observaciones de X , proporciona una aproximacion
razonable para ese parametro desconocido.
Una estimaci
on puntual no tiene en cuenta la variabilidad del
proceso de estimaci
on, debida entre otras causas a:
I
I
I
El tama
no muestral - una muestra mayor debiera proporcionar una
informaci
on m
as precisa sobre el par
ametro de la poblaci
on.
Variabilidad en la poblaci
on - una muestra de una poblaci
on con
menos varianza debiera proporcionar estimaciones m
as precisas
Que se conozcan otros par
ametros de la poblaci
on.
etc
Estas limitaciones pueden tratarse mediante el uso de estimaciones por

intervalos de confianza, esto es, un metodo que proporciona un intervalo
de valores al que es probable que pertenezca el valor del parametro.
Estimadores por intervalos de confianza e intervalos de

confianza
on X con funcion de
Sea X n = (X1 , X2 , . . . , Xn ) una MAS de una poblaci
distribuci
on FX que depende de un parametro desconocido .
Un estimador por intervalos de confianza de con un nivel de confianza
(1 ) = 100(1 ) % es un intervalo (T1 (X n ), T2 (X n )) que satisface
P ( (T1 (X n ), T2 (X n )) = 1
Interpretaci
on: tenemos una probabilidad (1 ) de que el parametro
desconocido de la poblaci
on pertenecera a (T1 (X n ), T2 (X n )).
Un intervalo de confianza para con un nivel de confianza 1 es el
valor observado del estimador por intervalos de confianza,
(T1 (x n ), T2 (x n ))
Interpretaci
on: podemos tener una confianza de (1 ) de que el valor
del parametro desconocido de la poblaci
on estara en (T1 (x n ), T2 (x n )).
Niveles de confianza habituales
100(1 ) %
0.01
99 %
0.05
95 %
0.10
90 %
Obteniendo un estimador por intervalos de confianza:

procedimiento
1. Se busca una cantidad (aleatoria) relacionada con el parametro
desconocido y con la muestra X n , C (X n , ), cuya distribucion sea
conocida y no dependa del valor del parametro - esta cantidad se
conoce como la cantidad pivotal o el pivote para
2. Se pueden usar los cuantiles 1 /2 y /2 de esa distribucion, y la
definici
on del estimador por intervalos de confianza, para plantear la
ecuaci
on
doble desigualdad
}|
{
z
P(1 /2 cuantil<C (X n , )</2 cuantil) = 1 .
3. Para obtener los extremos del estimador por intervalo de confianza,
T1 (X n ) y T2 (X n ), se resuelve la doble desigualdad en .
4. El intervalo de confianza al 100(1 ) % para es (T1 (x n ), T2 (x n )).
Intervalo de confianza para la media de la poblacion,

poblacion normal con varianza conocida
no n obtenida de X . Bajo los supuestos:

1. Sea X n una MAS de tama
I
I
X sigue una distribuci

on normal con par
ametros X y X2
2
X es conocida (muy poco realista)
2. La cantidad pivotal para X es:

X
X
N(0, 1)
/ n
, X /n, (o de cualquier otro
Nota: la desviaci
on tpica de X
estadstico) se conoce como su error estandar

3. Si z1/2 y z/2 son los cuantiles
superiores (1 /2) y (/2) de
la distribuci
on N(0, 1), tenemos
P(z1/2 < Z < z/2 ) = 1
Densidad normal estandar

Si Z N(0, 1) entonces
E[Z ] = 0, V[Z ] = 1
z12 = z2
z2
Z
z/2 z }| {
X
z }| { X
< z/2 ) = 1
4. Se tiene que P(z1/2 <
X / n

5. Resolvemos la doble desigualdad para X :
z/2
X
z/2
n
X
z/2 X
n
X
z/2 + X
n
<
X
X
X / n
<
X <
<X
< X <
> X >
z/2
X
z/2
n
X
+ z/2
X
n
X
z/2
X
n
para obtener el estimador por intervalos de confianza

T1 (X n )
T2 (X n )
z
}|
{ z
}|
{
X
X
z/2
(X
, X + z/2 )
n
n
6. El intervalo de confianza es:
X
X
X
IC1 (X ) = x z/2 , x z/2
= x z/2
n
n
n
Ejemplo: calculo de un intervalo de confianza para X

Ejemplo: 8.2 (Newbold) Un proceso industrial produce bolsas de azucar
refinado. Los pesos de las bolsas siguen una distribuci
on normal con desviaci
on
tpica igual a 12 g. Una muestra aleatoria de venticinco bolsas tiene un peso
promedio de 198 g. Encuentre un intervalo de confianza al 95 % para el peso
promedio en la poblaci
on de las bolsas de azucar fabricadas con este proceso.
X
Poblaci
on:
Objetivo: IC0,95 (X ) = x z/2
n
X = peso de una bolsa (en g)
2
2
X N(X , X = 12 )
X = 12
'
MAS: n = 25
Muestra: x = 198
Area=
0.025
z0.025 = 1.96
n = 25
x = 198
1 = 0,95
/2 = 0,025
z/2
IC0,95 (X )
=
=
z0,025 = 1,96
12
198 1,96
25
(198 4,7)
(193,3, 202,7)
Interpretaci
on: Podemos tener una
confianza del 95 % de que X
est
a en (193,3, 202,7)
Interpretacion frecuentista del IC: nivel de confianza

En este ejemplo simulado se han generado 150 muestras de tama
no n = 50, de
una distribuci
on X N(X = 5, X2 = 12 ) y se construyeron 150 IC1 (X )
con = 0,1 y otros 150 intervalos con = 0,01.
(1 ) = 0,9, n = 50
(1 ) = 0,99, n = 50
150
X est
a en aprox. 150(0,99) = 148,5 interv.
(pero no en 150(0,01) = 1,5)
150
X est
a en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15)
|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
||
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|
6.0
5.5
5.0
Indice
100
50
100
Indice
0
50
|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
||
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|
4.5
4.0
6.0
Intervalo de confianza
La longitud del intervalo, L = x +
5.5
5.0
4.5
4.0
z/2
z/2 X
=2
z/2 X
, aumenta
al aumentar el nivel de confianza (a igualdad de otros valores). Por que?
Interpretacion frecuentista del IC: tamano muestral

Construimos ahora 150 muestras de tama
no n = 50 y otras 150 de tama
no
n = 200, de una distribuci
on X N(X = 5, X2 = 12 ) .
(1 ) = 0,9, n = 50
(1 ) = 0,9, n = 200
150
X en aprox. 150(0,9) = 135 interv.

(pero no en 150(0,1) = 15)
150
X en aprox. 150(0,9) = 135 interv.

(pero no en 150(0,1) = 15)
|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
|
|
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|
|| |
|
|
|
|
|
|
|| |
| |
|
|| |
| | |
|
|| |
||
| |
||
|| |
|
|
|
|
|
| | |
|
| |
||
| | |
| ||
||
|
|| |
|
| |
| ||
|
|
| |
|
|
|
| ||
|
||
|| |
|| |
||
|||
||
| |
|
|
|
|
||
|
|
||
|
| |
| | |
| | |
||
|
|
| | |
| | |
| |
|
|||
|
|| |
|
| ||
|
|
|| |
|
||
| ||
| |
|
6.0
5.5
5.0
Indice
50
0
100
Indice
0
50
100
4.5
4.0
6.0
5.5
5.0
4.5
La longitud de los intervalos decrece cuando el tama

no muestral aumenta
(suponiendo que los dem
as valores no cambien). Por que?
Pregunta: Cu
al es el efecto del valor de sobre la longitud?
4.0
Ejemplo: estimacion del tamano muestral

Ejemplo: 8.14 (Newbold) La longitud de las barras de acero fabricadas en un
proceso industrial siguen una distribuci
on normal con desviaci
on tpica 1.8 mm.
El encargado del proceso desea obtener un intervalo de confianza al 99 % para
dicha longitud, con un tama
no menor o igual a 0.5 mm a cada lado de la media
muestral. Que tama
no muestral sera necesario para tener esta propiedad?
Poblaci
on:
X = longitud de la barra (en mm)
X N(X , X2 = 1,82 )
'
MAS: n =?
longitud
z }| {
z/2
IC0,99 (X ): 2
2(0,5) = 1
n
Area=
0.005
z0.005 = 2.575
Objetivo: n tal que longitud IC 1

z/2
2
n
2z/2
2
22 z/2
2
(22 )(2,5752 )(1,82 )
85,93
Para satisfacer la petici

on del
encargado se necesitara una
muestra de tama
no al menos
igual a 86 observaciones.
Intervalo de confianza para la media de la poblacion en

muestras grandes

no n de X . Bajo las hipotesis:
I

on (no necesariamente normal) con par
ametros
X y X2
el tama
no muestral n es grande (n 30)
2. La cantidad pivotal para X basada en el Teorema Central del

Lmite es
X
X
approx. N(0, 1)
X / n

muestras grandes
3. Por tanto, si z1/2 y z/2 son
los cuantiles superiores (1 /2)
y (/2) de N(0, 1), tenemos
P(z1/2 < Z < z/2 ) = 1
Densidad normal estandar
z12 = z2
z2
Z
z/2 z }| {
X
z }| { X
< z/2 ) = 1
4. Imponemos la condici
on P(z1/2 <
X / n

muestras grandes
z/2 <
X
X
< z/2
X / n
para obtener el estimador por intervalos de confianza

T2 (X n )
T1 (X n )
z
}|
{ z
}|
{
(X z/2 , X + z/2 )
n
n
x
IC1 (X ) = (
x z/2 , x + z/2 )
n
n
Intervalo de confianza para la proporcion en la poblacion

en muestras grandes
Aplicacion de ICs para la media en muestras grandes
de una distr. Bernoulli con parametro pX
Sea X n , n 30, una MASp
(X = E[X ] = pX y X = pX (1 pX )). La proporci
on muestral pX es
.
un caso especial de media muestral con observaciones cero-uno, pX = X
Por tanto, del TCL,
p pX
p X
approx. N(0, 1)
p(1 p)/n
|
{z
}
X / n
Este resultado sigue siendo
v
alido si la desviaci
on tpica de la
poblaci
on se estima (no se conoce)
p
X pX
p
approx. N(0, 1)
p
(1 p
)/ n
|
{z
}
X / n
En muestras grandes, el intervalo de confianza para pX es:

!
r
r
px (1 px )
px (1 px )
IC1 (pX ) = px z/2
, px + z/2
n
n
Ejemplo: calculo de un intervalo de confianza para pX

Ejemplo: 8.6 (Newbold) A una muestra aleatoria de 344 ejecutivos de compras se les realiz
o la
pregunta Cu
al es la poltica de su empresa en relaci
on con los regalos que su personal de
compras pueda recibir de sus proveedores? 83 de estos ejecutivos respondieron que cada
empleado poda tomar su propia decisi
on. Calcule un intervalo de confianza al 90 % para la
proporci
on en la poblaci
on de los ejecutivos que dan libertad sobre estos regalos a sus empleados.
r
Poblaci
on:
X = 1 si un ejecutivo permite tomar
decisiones a su personal y 0 en otro caso
X Bernoulli(pX )
'
Muestra: p
x =
MAS: n = 344 grande
83
344
Objetivo: IC0,9 (pX ) =
p
x = 0,241
p
x z/2
z0.05 = 1.645
n = 344
1 = 0,9
/2 = 0,05
z/2
z0,05 = 1,645
0
IC0,9 (pX )
@0,241 1,645
= 0,241
Area=
0.05
p
x (1
px )
n
(0,241 0,038)
(0,203, 0,279)
0,241(1 0,241)
344
Interpretaci
on: Podemos tener una confianza
del 90 % de que la proporci
on de ejecutivos
que permiten tomar sus propias decisiones a
sus empleados, pX , est
a en (0,203, 0,279)
1
A
Intervalo de confianza para la media de la poblacion:

poblacion normal con varianza desconocida

I
I

on normal con par
ametros X y X2
X2 es desconocida (muy realista)
2. La cantidad pivotal para X es

X
X
tn1
sX / n

3. Si tn1;1/2 y tn1;/2 son los cuantiles
superiores (1 /2) y (/2) de una
distribuci
on t de Student con n 1 grados
de libertad (gl), tenemos
P(tn1;1/2
tn1
z}|{
< T < tn1;/2 ) = 1
Densidad t de Student
Recuerda: si T tn , E[T ] = 0, V[T ] =
tn1 ; 12 = tn1 ; 2
tn1 ; 2
n
n2
on
T tn1
z }| {
tn1;/2
X
z }| {
X
< tn1;/2 ) = 1
P(tn1;1/2 <
sX / n

tn1;/2
<
X
X
sX / n
<
tn1;/2
y obtenemos el estimador por intervalos de confianza

T1 (X n )
T2 (X n )
z
}|
{ z
}|
{
sX
sX
(X tn1;/2 , X + tn1;/2 )
n
n
sx
sx
IC1 () = (
x tn1;/2 , x tn1;/2 )
n
n
Ejemplo: calcular un intervalo de confianza para X

Ejemplo: 8.4 (Newbold) Se ha medido el consumo de combustible en una
muestra aleatoria de seis coches del mismo modelo, obteniendo en mpg: 18.6,
18.4, 19.2, 20.8, 19.4, 20.5. Calcule un intervalo de confianza al 90 % para el
consumo medio, suponiendo que la poblaci
on sigue una distribuci
on normal.
Poblaci
on: X = mpg de un coche
Objetivo: IC0,9 (X ) = x tn1;/2 sxn
de este modeloX N(X , X2 )
p
X2 desconocida
sx =
0,96 = 0,98
'
n=6
MAS: n = 6 peque
na
Muestra: x =
sx2
116,9
6
= 19,4833
2282,41 6(19,4833)2
=
= 0,96
61
Area=
0.05
t5 ; 0.05 = 2.015
x = 19,48
1 = 0,9
/2 = 0,05
tn1;/2
IC0,9 (X )
=
=
t5;0,05 = 2,015
0,98
19,48 2,105
6
(19,48 0,81)
(18,67, 20,29)
Interpretaci
on: Tenemos una
confianza del 90 % de que el
consumo promedio de este modelo,
X , estar
a entre 18.67 y 20.29 mpg
Ejemplo: calcular un intervalo de confianza para X

Ejemplo: 8.4 (cont.) en Excel: Ir al men
u: Datos, submen
u: Analisis de
Datos, escoger la funci
on: Estadstica Descriptiva.
Columna A datos en amarillo (media muestral, semilongitud tn1;/2 sxn ,
extremo inferior (celda: D3-D16), extremo superior (celda: D3+D16)).
Media muestral
Semilongitud IC
Datos
Distribuciones t de Student y 2 (chi-cuadrado)

, donde Z N(0, 1) y 2n sigue una
Sabemos que T tn si T = Z2
Tambien, 2n es la distribuci
on de la suma de los cuadrados de n variables
aleatorias N(0, 1) independientes.
Por ejemplo, la cuasi varianza muestral reescalada sigue una distribuci

on
chi cuadrado con n 1 grados de libertad.
Pn
n
2
X
2
(n 1)sX2
Xi X
i=1 (Xi X )
=
=
2n1
X2
X2
X
i=1
n /n
distribuci
on chi-cuadrado con gl = n, y ambas son independientes.
Por que n 1 y no n?
Si conociesemos el valor de X , el
n
umero de grados de libertad sera
n, porque tendramos n variables
X
aleatorias iid Xi
X
Si tenemos que estimar X mediante

, los gl son n 1, porque solo
X
tenemos n 1 variables aleatorias iid
Xi X
(si se conocen los valores de
X
n 1 de ellas, se puede deducir
f
acilmente el valor de la restante)
Decimos que empleamos un grado de libertad en el c

alculo de X
Distribuciones t de Student y 2 (chi-cuadrado)
0.15
Densidades de 2
0.0
0.00
0.1
0.05
0.2
N(0,1)
gl=10
gl=5
gl=3
gl=20
gl=15
gl=10
gl=5
0.10
0.3
0.4
Densidades de t y N(0, 1)
10
20
30
40
Intervalo de confianza para la varianza de la poblacion,

poblacion normal

I

on normal con varianza X2
2. La cantidad pivotal para X2 es

(n 1)sX2
2n1
X2

poblacion normal
3. Por tanto, si 2n1;1/2 y 2n1;/2 son
los cuantiles superiores (1 /2) y
(/2) de una distribuci
on chi-cuadrado
con n 1 grados de libertad, tenemos
P(2n1;1/2 < 2n1 < 2n1;/2 ) = 1
Densidad chi-cuadrado
Recuerda: E[2n ] = n, V[2n ] = 2n
on P(2n1;1/2
2n1 ; 1
2
2n1 ;
2
2n1
z }| {
(n 1)sX2
<
< 2n1;/2 ) = 1
2

poblacion normal
5. Resolvemos la doble desigualdad para X2 :
2n1;1/2
1
2n1;1/2
(n 1)sX2
2n1;1/2
<
(n1)sX2
X2
<
2n1;/2
>
X2
(n1)sX2
>
1
2n1;/2
> X2 >
(n 1)sX2
2n1;/2
y obtenemos el estimador por intervalos de confianza

!
(n 1)sX2 (n 1)sX2
,
2n1;/2 2n1;1/2
IC1 (X2 )
(n 1)sx2 (n 1)sx2
,
2n1;/2 2n1;1/2
Ejemplo: calcular un intervalo de confianza para X2 y X

Ejemplo: 8.8 (Newbold) Una muestra aleatoria de quince pastillas para el dolor
de cabeza tiene una cuasi desviaci
on tpica de 0.8 % en la concentraci
on del
ingrediente activo. Calcule un IC al 90 % para la varianza de la poblaci
on para
estas pastillas. Obtenga tambien un IC para la desviaci
on tpica de la poblaci
on.
0
Poblaci
on:
X = concentraci
on del
ingrediente activo en una pastilla
(in %)X N(X , X2 )
'
MAS: n = 15
Muestra: sx = 0,8
Area=
0.05
Area=
0.05
214 ; 0.95 214 ; 0.05

=6.57
=23.68
2) = @
Objetivo: IC0,9 (X
1
(n1)sx2
(n1)sx2
A
, 2
2
n1;/2
n1;1/2
sx2 = 0,82 = 0,64
n = 15
1 = 0,9
/2 = 0,05
2n1;1/2
214;0,95 = 6,57
2n1;/2
IC0,9 (X2 )
214;0,05 = 23,68
14(0,64) 14(0,64)
,
23,68
6,57
(0,378, 1,364)
p
p
( 0,378, 1,364)
(0,61, 1,17)
=
IC0,9 (X )
Para obtener IC(X ) aplicamos

extremos de IC(X2 )
a los
Formulas para intervalos de confianza

Resumen para una poblacion
I
Sea X n una muestra aleatoria simple de una poblaci

on X con media X y
varianza X2
Par
ametro
Media
Hip
otesis
Datos normales
Varianza conocida

X
X N(0, 1)
X / n
Datos no normales
Muestra grande

X
X
approx. N(0, 1)
X / n
Datos Bernoulli
Muestra grande
Datos normales
Varianza desconocida
Varianza
Datos normales
Desv. tpica
Datos normales
(1 ) Intervalo Conf.
Cantidad pivotal
p
X pX
approx. N(0, 1)
p
X (1
pX )/n

X
X tn1
sX / n
2
(n1)sX
2
n1
2
X
2
(n1)sX
2
n1
2
X
x z/2 X , x + z/2 X
n
n
X x z/2 x , x + z/2 x
n
n
#
r
p
x (1
px )
pX p
x z/2
n
s
s
x tn1,/2 x , x + tn1,/2 x
n
n
0
1
(n1)sx2
(n1)sx2
2
A
X @ 2
, 2
n1;/2
n1;1/2
0v
1
v
u
u
(n1)sx2
u (n1)sx2
u
A
X @t 2
,t 2
n1;/2
n1;1/2
Intervalos de confianza para la media de la poblacion:

Que usar cuando?
X distribuci
on con media X y desviaci
on tpica X
.
.
conocida
&
basada en z
(exacta)
basada en t
(exacta)
X normal
desconocida
&
.
n peque
na
&
metodos mas
alla de Est II
basada en z
(aprox. TCL)
X normal
n grande

Tema 1 Esp

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tema 1 Esp

Cargado por

Copyright:

Formatos disponibles

Tema 1.

Inferencia estadstica para una poblacion

Intervalos de confianza para la media de una poblaci

Intervalos de confianza para la proporci

Intervalos de confianza para la media de una poblaci

Intervalos de confianza para la varianza de una poblaci

Tema 1. Inferencia estadstica para una poblacion

Estimar parametros de la poblaci

En el caso de una distribuci

Interpretar el significado de un intervalo de confianza

Entender el efecto del tama

Tema 1. Inferencia estadstica para una poblacion

Newbold, P. Estadstica para Administraci

Inferencia Estadstica: palabras clave (i)

Muestra: un subconjunto observado (por ejemplo, de tama

Identificaremos el concepto de poblaci

Representada como una colecci

Parametro: una constante que caracteriza a X o FX .

Inferencia Estadstica: palabras clave (ii)

Inferencia estadstica: el proceso mediante el que se llega a

Estadstico: una variable aleatoria definida como una funcion de una

Estimador de un parametro: una variable aleatoria, por ejemplo T ,

Inferencia estadstica: ejemplo

Estimador de X (variable aleatoria)

Estimadores puntuales: introduccion

Un estimador puntual de un parametro de una poblacion es una

Estimadores puntuales: propiedades (i)

Que caractersticas querramos que tuviese un estimador?

Ausencia de sesgo. Esta propiedad se da cuando un estimador tiene

Estimadores puntuales: propiedades (ii)

Eficiencia. Se mide por la varianza del estimador. Un estimador con

En algunos casos se emplea la definici

Estimadores puntuales: propiedades (iii)

Un criterio mas general para seleccionar estimadores (incluyendo

Como encontrar una buena definici

En algunos casos se conoce un estimador o

Estimacion puntual: ejemplo

Emplee un procedimiento de estimaci

Estimacion puntual: ejemplo

(X1 + 2X2 + . . . + nXn )

(E[X1 ] + 2E[X2 ] + . . . + nE[Xn ])

De estimaciones puntuales a estimacion por intervalos de

Hasta ahora hemos considerado la estimaci

Estas limitaciones pueden tratarse mediante el uso de estimaciones por

Estimadores por intervalos de confianza e intervalos de

Obteniendo un estimador por intervalos de confianza:

Intervalo de confianza para la media de la poblacion,

no n obtenida de X . Bajo los supuestos:

X sigue una distribuci

2. La cantidad pivotal para X es:

Intervalo de confianza para la media de la poblacion,

Densidad normal estandar

Intervalo de confianza para la media de la poblacion,

para obtener el estimador por intervalos de confianza

Ejemplo: calculo de un intervalo de confianza para X

Interpretacion frecuentista del IC: nivel de confianza

La longitud del intervalo, L = x +

al aumentar el nivel de confianza (a igualdad de otros valores). Por que?

Interpretacion frecuentista del IC: tamano muestral

X en aprox. 150(0,9) = 135 interv.

X en aprox. 150(0,9) = 135 interv.

La longitud de los intervalos decrece cuando el tama

Ejemplo: estimacion del tamano muestral