Tema 1. Inferencia Estadística para Una Población PDF

Tema 1.
Inferencia estadı́stica para una población
Contenidos
I Inferencia estadı́stica
I Estimadores puntuales
I Estimación de la media y la varianza de una población
I Estimación de la media de la población mediante intervalos de
confianza
I Intervalos de confianza para la media de una población normal con
varianza conocida
I Intervalos de confianza para la media en muestras grandes
I Intervalos de confianza para la proporción en una población
I Intervalos de confianza para la media de una población normal con
varianza desconocida
I Estimación de la varianza de la población mediante intervalos de
confianza
I Intervalos de confianza para la varianza de una población normal
Tema 1. Inferencia estadı́stica para una población
Objetivos de aprendizaje
Al final de este tema debieras ser capaz de:
I Estimar parámetros de la población desconocidos a partir de datos
muestrales
I Construir intervalos de confianza para los parámetros de la población
desconocidos a partir de datos muestrales:
I En el caso de una distribución normal: intervalos de confianza para la
media y la varianza de la población
I En muestras grandes: intervalos de confianza para la media de la
población y la proporción
I Interpretar el significado de un intervalo de confianza
I Entender el efecto del tamaño muestral, el nivel de confianza, etc
sobre la longitud del intervalo de confianza
I Calcular un tamaño muestral necesario para controlar la longitud de
un intervalo de confianza
Tema 1. Inferencia estadı́stica para una población
Referencias
I Newbold, P. “Estadı́stica para Administración y Economı́a”
I Capı́tulos 7 y 8 (8.1-8.6)
I Ross, S. “Introducción a la Estadı́stica”
I Capı́tulo 8
Inferencia Estadı́stica: palabras clave (i)
I Población: el conjunto de toda la información numérica relativa a

una cantidad de interés.
I Identificaremos el concepto de población con el de una variable
aleatoria X .
I La ley o distribución de la población es la distribución de X , FX .
I Muestra: un subconjunto observado (por ejemplo, de tamaño n) de
valores de la población.
I Representada como una colección de n variables aleatorias
X1 , X2 , . . . , Xn , tı́picamente
iid (independientes e idénticamente distribuidas) .
I Parámetro: una constante que caracteriza a X o FX .
Inferencia Estadı́stica: palabras clave (ii)
I Inferencia estadı́stica: el proceso mediante el que se llega a

conclusiones sobre una población a partir de las medidas o las
observaciones realizadas sobre una muestra de individuos de la
población.
I Estadı́stico: una variable aleatoria definida como una función de una
muestra aleatoria, Y = f (X1 , X2 , . . . , Xn )
I Estimador de un parámetro: una variable aleatoria, por ejemplo T ,
función de una muestra aleatoria, T = T (X1 , X2 , . . . , Xn ), que se
emplea para aproximar (estimar) el valor de un parámetro de la
población desconocido.
I Estimación: una realización concreta del estimador, por ejemplo T ,
correspondiente a una muestra observada, x1 , x2 , . . . , xn , y que
proporciona una aproximación al valor del parámetro de interés.
Inferencia estadı́stica: ejemplo
Queremos conocer Tenemos n copias Tenemos n

µX = E[X ] de X valores observados de
X1 , X2 , . . . , Xn
X ∼ F ⇒ X1 , X2 , . . . , Xn ∼ F
Muestra ⇒ x1 , x2 , . . . , xn
Muestra observada
⇓ ⇓ ⇓
µX = E[X ]
Valor esperado de X
⇐ Estimador de µX (variable aleatoria)
X̄
Media muestral
⇐ Estimación de µX (un número)
x̄
Media muestral
Estimadores puntuales: introducción
I Un estimador puntual de un parámetro de una población es una

función, por ejemplo T , de la información muestral
X n = (X1 , . . . , Xn ) que toma un valor numérico.
I Ejemplos de parámetros de poblaciones, estimadores y estimaciones:
Parámetro Estimador: Estimación:
población T (X n ) notación notación
X1 +...+Xn
Media pobl. µX media muestral n X̄ = µ̂X x̄
Prop. pobl. pX prop. muestral p̂X p̂x
P 2 2
i Xi −n(X̄ )
Var. pobl. σX2 var. muestral nP σ̂X2 σ̂x2
Xi −n(X̄ )2
2
Var. pobl. σX2 quasi var. muestral i n−1 = n 2
n−1 σ̂X sX2 sx2
... ... ... ...
En general, θX ... θ̂X θ̂x
Estimadores puntuales: propiedades (i)
¿Qué caracterı́sticas querrı́amos que tuviese un estimador?

I Ausencia de sesgo. Esta propiedad se da cuando un estimador tiene
sesgo igual a cero. ¿Qué es el sesgo? El sesgo es la diferencia entre
el valor esperado del estimador y el valor del parámetro de interés.
Sesgo[θ̂X ] = E[θ̂X ] − θX
Población Estimador Estimador insesgado

parámetro T (X n ) Sesgo Insesgado? de mı́nima varianza?
Media pobl. µX X E[X̄ ] − µX = 0 Sı́ Sı́, si X normal
Prop. pobl. pX p̂X E[p̂X ] − pX = 0 Sı́ Sı́
Var. pobl. σX2 σ̂X2 E[σ̂X2 ] − σX2 6= 0 No No
Var. pobl. σX2 sX2 E[sX2 ] − σX2 = 0 Sı́ Sı́, si X normal
En general, θX θ̂X E[θ̂X ] − θX A menudo Rara vez
Estimadores puntuales: propiedades (ii)
I Eficiencia. Se mide por la varianza del estimador. Un estimador con

menos varianza es más eficiente.
I La eficiencia relativa de dos estimadores insesgados θ̂X ,1 y θ̂X ,2 para
un parámetro θX se define como
Var[θ̂X ,1 ]
Eficiencia relativa(θ̂X ,1 , θ̂X ,2 ) =
Var[θ̂X ,2 ]
Nota:
I En algunos casos se emplea la definición inversa.
I En todo caso, un estimador con menor varianza es más eficiente.
Estimadores puntuales: propiedades (iii)
I Un criterio más general para seleccionar estimadores (incluyendo
estimadores insesgados y sesgados) es el error cuadrático medio,
definido como
ECM[θ̂X ] = E[(θ̂X − θX )2 ] = Var[θ̂X ] + (Sesgo[θ̂X ])2
Nota:
I El error cuadrático medio de un estimador insesgado es igual a su
varianza.
I Un estimador con menor ECM es mejor.
I El estimador insesgado de mı́nima varianza tiene la menor
varianza/ECM entre todos los estimadores.
I Como encontrar una buena definición para un estimador T ?
I En algunos casos se conoce un estimador óptimo: estimador
insesgado de mı́nima varianza
I Si no es ası́, existen distintos métodos de construcción de
estimadores que proporcionan resultados razonables, por ejemplo:
I Estimación máximo verosı́mil
I Método de momentos
Estimación puntual: ejemplo
Ejemplo: 7.1 (Newbold) Las ratios precio-beneficio para una muestra
aleatoria de diez acciones negociadas en la bolsa de NY en un dı́a
concreto fueron
10 16 5 10 12 8 4 6 5 4
Emplee un procedimiento de estimación insesgado para obtener

estimaciones puntuales para los siguientes parámetros de la población:
media, varianza, proporción de valores que exceden 8.5.
80
x̄ = =8
10
782 − 10(8)2
sx2 = = 15,78
10 − 1
1+1+0+1+1+0+0+0+0+0
p̂x =
10
= 0,4
Estimación puntual: ejemplo
2
Ejemplo: Sea µ̂X = n(n+1) (X1 + 2X2 + . . . + nXn ) un estimador de la media de
la población basado en una MAS X n . Compare este estimador con la media
muestral, X̄ .
σ2
Sabemos que X̄ es un estimador insesgado de µX , con varianza nX .
µ̂X también es insesgado: Y su varianza/ECM es:
" # " #
2 2
E[µ̂X ] = E (X1 + 2X2 + . . . + nXn ) V[µ̂X ] = V (X1 + 2X2 + . . . + nXn )
n(n + 1) n(n + 1)
!2
2 2
= (E[X1 ] + 2E[X2 ] + . . . + nE[Xn ]) 2 2
=indep. (V[X1 ] + 2 V[X2 ] + . . . + n V[Xn ])
n(n + 1) n(n + 1)
2 n(n+1)(2n+1)/6
=id (µX + 2µX + . . . + nµX )
n(n + 1) 4
z }| {
2 2 2 2
=id σX (1 + 2 + . . . + n )
n(n+1)/2 n2 (n + 1)2
2µX z }| {
= (1 + 2 + . . . + n) = µX 2(2n + 1) 2
n(n + 1) = σX
3n(n + 1)
⇒ Sesgo[µ̂X ] = 0
2 2(2n + 1) 2
ECM[µ̂X ] = V[µ̂X ] + 0 = σX
3n(n + 1)
σX2 /n 3(n + 1)
Eficiencia relativa(X̄ , µ̂X ) = 2(2n+1) 2
=
σ 2(2n + 1)
3n(n+1) X
Puede verse que para n ≥ 2 este cociente es menor que 1, y por tanto X̄ es un
estimador más eficiente para µX .
De estimaciones puntuales a estimación por intervalos de
confianza
I Hasta ahora hemos considerado la estimación puntual de un

parámetro desconocido de una población que, partiendo de una
MAS de n observaciones de X , proporciona una aproximación
razonable para ese parámetro desconocido.
I Una estimación puntual no tiene en cuenta la variabilidad del
proceso de estimación, debida entre otras causas a:
I El tamaño muestral - una muestra mayor debiera proporcionar una
información más precisa sobre el parámetro de la población.
I Variabilidad en la población - una muestra de una población con
menos varianza debiera proporcionar estimaciones más precisas
I Que se conozcan otros parámetros de la población.
I etc
Estas limitaciones pueden tratarse mediante el uso de estimaciones por
intervalos de confianza, esto es, un método que proporciona un intervalo
de valores al que es probable que pertenezca el valor del parámetro.
Estimadores por intervalos de confianza e intervalos de
confianza
Sea X n = (X1 , X2 , . . . , Xn ) una MAS de una población X con función de
distribución FX que depende de un parámetro desconocido θ.
Un estimador por intervalos de confianza de θ con un nivel de confianza
(1 − α) = 100(1 − α) % es un intervalo (T1 (X n ), T2 (X n )) que satisface
P (θ ∈ (T1 (X n ), T2 (X n )) = 1 − α
Interpretación: tenemos una probabilidad (1 − α) de que el parámetro

desconocido de la población pertenecerá a (T1 (X n ), T2 (X n )).
Un intervalo de confianza para θ con un nivel de confianza 1 − α es el
valor observado del estimador por intervalos de confianza,
(T1 (x n ), T2 (x n ))
Interpretación: podemos tener una confianza de (1 − α) de que el valor

del parámetro desconocido de la población estará en (T1 (x n ), T2 (x n )).
Niveles de confianza habituales
α 0.01 0.05 0.10
100(1 − α) % 99 % 95 % 90 %
Obteniendo un estimador por intervalos de confianza:
procedimiento
1. Se busca una cantidad (aleatoria) relacionada con el parámetro

desconocido θ y con la muestra X n , C (X n , θ), cuya distribución sea
conocida y no dependa del valor del parámetro - esta cantidad se
conoce como la cantidad pivotal o el pivote para θ
2. Se pueden usar los cuantiles 1 − α/2 y α/2 de esa distribución, y la
definición del estimador por intervalos de confianza, para plantear la
ecuación
doble desigualdad
z }| {
P(1 − α/2 cuantil<C (X n , θ)<α/2 cuantil) = 1 − α.
3. Para obtener los extremos del estimador por intervalo de confianza,

T1 (X n ) y T2 (X n ), se resuelve la doble desigualdad en θ.
4. El intervalo de confianza al 100(1 − α) % para θ es (T1 (x n ), T2 (x n )).
Intervalo de confianza para la media de la población,
población normal con varianza conocida
1. Sea X n una MAS de tamaño n obtenida de X . Bajo los supuestos:

I X sigue una distribución normal con parámetros µX y σX2
I σX2 es conocida (muy poco realista)
2. La cantidad pivotal para µX es:
X̄ − µX
√ ∼ N(0, 1)
σ/ n
√
Nota: la desviación tı́pica de X̄ , σX / n, (o de cualquier otro
estadı́stico) se conoce como su error estándar
3. Si z1−α/2 y zα/2 son los cuantiles

superiores (1 − α/2) y (α/2) de
la distribución N(0, 1), tenemos
P(z1−α/2 < Z < zα/2 ) = 1 − α α α

1−α
2 2
Densidad normal estándar
Si Z ∼ N(0, 1) entonces
E[Z ] = 0, V[Z ] = 1
●
z1−α2 = − zα2
●
zα2
Z
−zα/2 z }| {
z }| { X̄ − µX
4. Se tiene que P(z1−α/2 < √ < zα/2 ) = 1 − α
σX / n
5. Resolvemos la doble desigualdad para µX :
X̄ −µX
−zα/2 < √
σX / n
< zα/2
σX σX
−zα/2 √ < X̄ − µX < zα/2 √
n n
σX σX
−zα/2 √ − X̄ < −µX < −X̄ + zα/2 √
n n
σX σX
zα/2 √ + X̄ > µX > X̄ − zα/2 √
n n
para obtener el estimador por intervalos de confianza
T1 (X n ) T2 (X n )
z }| { z }| {
σX σX
(X̄ − zα/2 √ , X̄ + zα/2 √ )
n n
6. El intervalo de confianza es:

„ « „ «
σX σX σX
IC1−α (µX ) = x̄ − zα/2 √ , x̄ − zα/2 √ = x̄ ∓ zα/2 √
n n n
Ejemplo: cálculo de un intervalo de confianza para µX
Ejemplo: 8.2 (Newbold) Un proceso industrial produce bolsas de azucar
refinado. Los pesos de las bolsas siguen una distribución normal con desviación
tı́pica igual a 12 g. Una muestra aleatoria de venticinco bolsas tiene un peso
promedio de 198 g. Encuentre un intervalo de confianza al 95 % para el peso
promedio en la población de las bolsas de azucar fabricadas con este proceso.
“ ”
σX
Población: Objetivo: IC0,95 (µX ) = x̄ ∓ zα/2 √ n
X = ”peso de una bolsa (en g)”
2 2
X ∼ N(µX , σX = 12 ) σX = 12
' MAS: n = 25
Muestra: x̄ = 198
n = 25
1 − α = 0,95
zα/2
⇒
=
x̄ = 198
α/2 = 0,025
z0,025 = 1,96
„
12
«
IC0,95 (µX ) = 198 ∓ 1,96 √
25
= (198 ∓ 4,7)
Area= = (193,3, 202,7)
0.025
Interpretación: Podemos tener una
●
confianza del 95 % de que µX
está en (193,3, 202,7)
z0.025 = 1.96
Interpretación frecuentista del IC: nivel de confianza
En este ejemplo simulado se han generado 150 muestras de tamaño n = 50, de
una distribución X ∼ N(µX = −5, σX2 = 12 ) y se construyeron 150 IC1−α (µX )
con α = 0,1 y otros 150 intervalos con α = 0,01.
µX está en aprox. 150(0,9) = 135 interv. µX está en aprox. 150(0,99) = 148,5 interv.
(pero no en 150(0,1) = 15) (pero no en 150(0,01) = 1,5)
(1 − α) = 0,9, n = 50 (1 − α) = 0,99, n = 50
150
150
| | | |
| |
| | | | | |
| | | |
|| | || |
| | | |
| | | |
| | | | | |
| | | | | |
| | | |
| | | |
|| | || |
| | | |
| |
| | | | | |
| | | | | |
| | | |
| || | ||
| || | ||
| | | |
| | | |
100
100
| | | | | |
| || | ||
|| ||
| |
| || | ||
| | | |
| | | |
| |
Indice
Indice
| |
| | | | | |
| | | |
| | | |
| | | | | |
| | | |
| | | |
| | | |
| || | ||
|| ||
| | | | | |
| | | |
| |
| | | | | |
| | | | | |
50
50
| |
|| | || |
| | | |
| | | |
| |
|| | || |
| |
| || | ||
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
|| ||
| | | |
| | | |
| | | |
| |
| | | | | |
| | | |
| | | |
| | | |
0
0
−6.0 −5.5 −5.0 −4.5 −4.0 −6.0 −5.5 −5.0 −4.5 −4.0
Intervalo de confianza Intervalo de confianza

zα/2 σ
“ zα/2 σX
” zα/2 σX
La longitud del intervalo, L = x̄ + √
n
− x̄ − √
n
=2 √
n
, aumenta
al aumentar el nivel de confianza (a igualdad de otros valores). ¿Por qué?
Interpretación frecuentista del IC: tamaño muestral
Construimos ahora 150 muestras de tamaño n = 50 y otras 150 de tamaño
n = 200, de una distribución X ∼ N(µX = −5, σX2 = 12 ) .
µX en aprox. 150(0,9) = 135 interv. µX en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15) (pero no en 150(0,1) = 15)
(1 − α) = 0,9, n = 50 (1 − α) = 0,9, n = 200
150
150
| | || |
|
| | | |
| |
| | | |
|| | || |
|
| |
| | | | |
| | | || |
| | | | | |
| | |
| | || |
| | ||
| | | |
| | ||
| | | || |
| | | | |
| | |
| |
| || | | |
| || | | |
| | ||
| | | | |
100
100
| | | | ||
| || ||
|| |
| || |
| || |
| | | |
| | | ||
| |
Indice
Indice
| |
| | | | | |
| | | |
| | | ||
| | | |
| | ||
| | || |
| | || |
| || ||
|| |||
| | | ||
| | | |
| |
| | | | |
|
| | | ||
|
50
50
| |
|| | | ||
| | | |
| | | | |
|
|| | | | |
| ||
| || | |
| | | | |
| |
| | | | |
| | | |
| | |
| | |||
| | |
| | || |
|| |
| | | ||
| | | |
| | || |
|
| | | |
||
| | | ||
| |
| | | | |
0
0
−6.0 −5.5 −5.0 −4.5 −4.0 −6.0 −5.5 −5.0 −4.5 −4.0
Intervalo de confianza Intervalo de confianza
La longitud de los intervalos decrece cuando el tamaño muestral aumenta

(suponiendo que los demás valores no cambien). ¿Por qué?
Pregunta: ¿Cuál es el efecto del valor de σ sobre la longitud?

Ejemplo: estimación del tamaño muestral
Ejemplo: 8.14 (Newbold) La longitud de las barras de acero fabricadas en un
proceso industrial siguen una distribución normal con desviación tı́pica 1.8 mm.
El encargado del proceso desea obtener un intervalo de confianza al 99 % para
dicha longitud, con un tamaño menor o igual a 0.5 mm a cada lado de la media
muestral. ¿Qué tamaño muestral serı́a necesario para tener esta propiedad?
Población: Objetivo: n tal que longitud IC ≤ 1
X = “longitud de la barra (en mm)”
X ∼ N(µX , σX2 = 1,82 ) zα/2 σ
2 √ ≤ 1
'
n
√
MAS: n =? n ≥ 2zα/2 σ
n ≥ 22 zα/2
2
σ2
longitud
z }| { n ≥ (22 )(2,5752 )(1,82 )
zα/2 σ
IC0,99 (µX ): 2 √ ≤ 2(0,5) = 1 = 85,93
n
Para satisfacer la petición del
encargado se necesitarı́a una
Area= muestra de tamaño al menos
0.005 igual a 86 observaciones.
z0.005 = 2.575
Intervalo de confianza para la media de la población en
muestras grandes
1. Sea X n una MAS de tamaño n de X . Bajo las hipótesis:

I X sigue una distribución (no necesariamente normal) con parámetros
µX y σX2
I el tamaño muestral n es grande (n ≥ 30)
2. La cantidad pivotal para µX basada en el Teorema Central del
Lı́mite es
X̄ − µX
√ ∼approx. N(0, 1)
σ̂X / n
muestras grandes
3. Por tanto, si z1−α/2 y zα/2 son

los cuantiles superiores (1 − α/2)
y (α/2) de N(0, 1), tenemos
P(z1−α/2 < Z < zα/2 ) = 1 − α α α

1−α
2 2
Densidad normal estándar

●
z1−α2 = − zα2
Z
●
zα2
−zα/2 z }| {
z }| { X̄ − µX
4. Imponemos la condición P(z1−α/2 < √ < zα/2 ) = 1 − α
σ̂X / n
muestras grandes
X̄ − µX
−zα/2 < √ < zα/2
σ̂X / n
para obtener el estimador por intervalos de confianza
T1 (X n ) T2 (X n )
z }| { z }| {
σ̂X σ̂X
(X̄ − zα/2 √ , X̄ + zα/2 √ )
n n

σ̂x σ̂x
IC1−α (µX ) = (x̄ − zα/2 √ , x̄ + zα/2 √ )
n n
Intervalo de confianza para la proporción en la población
en muestras grandes
Aplicación de ICs para la media en muestras grandes
Sea X n , n ≥ 30, una MASpde una distr. Bernoulli con parámetro pX
(µX = E[X ] = pX y σX = pX (1 − pX )). La proporción muestral p̂X es
un caso especial de media muestral con observaciones cero-uno, p̂X = X̄ .
Por tanto, del TCL,

p̂ − pX
p X
p(1 − p)/n
∼approx. N(0, 1)
Este resultado sigue siendo
válido si la desviación tı́pica de la

población se estima (no se conoce)
√
| {z }
σX / n p̂X − pX
p √ ∼approx. N(0, 1)
p̂(1 − p̂)/ n
√
| {z }
σ̂X / n
En muestras grandes, el intervalo de confianza para pX es:

r r !
p̂x (1 − p̂x ) p̂x (1 − p̂x )
IC1−α (pX ) = p̂x − zα/2 , p̂x + zα/2
n n
Ejemplo: cálculo de un intervalo de confianza para pX
Ejemplo: 8.6 (Newbold) A una muestra aleatoria de 344 ejecutivos de compras se les realizó la
pregunta “¿Cuál es la polı́tica de su empresa en relación con los regalos que su personal de
compras pueda recibir de sus proveedores?” 83 de estos ejecutivos respondieron que cada
empleado podı́a tomar su propia decisión. Calcule un intervalo de confianza al 90 % para la
proporción en la población de los ejecutivos que dan libertad sobre estos regalos a sus empleados.
r !
p̂x (1−p̂x )
Población: Objetivo: IC0,9 (pX ) = p̂x ∓ zα/2
n
X = 1 si un ejecutivo permite tomar
decisiones a su personal y 0 en otro caso
X ∼ Bernoulli(pX ) p̂x = 0,241 n = 344
'
1 − α = 0,9 ⇒ α/2 = 0,05
zα/2 = z0,05 = 1,645
MAS: n = 344 grande 0 1
s
0,241(1 − 0,241)
IC0,9 (pX ) = @0,241 ∓ 1,645 A
83 344
Muestra: p̂x = 344 = 0,241
= (0,241 ∓ 0,038)
= (0,203, 0,279)
Interpretación: Podemos tener una confianza

del 90 % de que la proporción de ejecutivos
Area=
que permiten tomar sus propias decisiones a
0.05 sus empleados, pX , está en (0,203, 0,279)
z0.05 = 1.645
Intervalo de confianza para la media de la población:
población normal con varianza desconocida

I X sigue una distribución normal con parámetros µX y σX2
I σX2 es desconocida (muy realista)
2. La cantidad pivotal para µX es
X̄ − µX
√ ∼ tn−1
sX / n
3. Si tn−1;1−α/2 y tn−1;α/2 son los cuantiles
superiores (1 − α/2) y (α/2) de una
distribución t de Student con n − 1 grados
de libertad (gl), tenemos
∼ tn−1 α α
z}|{ 1−α
P(tn−1;1−α/2 < T < tn−1;α/2 ) = 1 − α 2 2
Densidad t de Student

Recuerda: si T ∼ tn , E[T ] = 0, V[T ] = n
n−2
●
tn−1 ; 1−α2 = − tn−1 ; α2

●
tn−1 ; α2
4. Imponemos la condición
T ∼ tn−1
−tn−1;α/2 z }| {
z }| { X̄ − µX
P(tn−1;1−α/2 < √ < tn−1;α/2 ) = 1 − α
sX / n

X̄ −µ
−tn−1;α/2 < √X
sX / n
< tn−1;α/2
y obtenemos el estimador por intervalos de confianza
T1 (X n ) T2 (X n )
z }| { z }| {
sX sX
(X̄ − tn−1;α/2 √ , X̄ + tn−1;α/2 √ )
n n

sx sx
IC1−α (µ) = (x̄ − tn−1;α/2 √ , x̄ − tn−1;α/2 √ )
n n
Ejemplo: calcular un intervalo de confianza para µX
Ejemplo: 8.4 (Newbold) Se ha medido el consumo de combustible en una
muestra aleatoria de seis coches del mismo modelo, obteniendo en mpg: 18.6,
18.4, 19.2, 20.8, 19.4, 20.5. Calcule un intervalo de confianza al 90 % para el
consumo medio, suponiendo que la población sigue una distribución normal.
“ ”
Población: X = ”mpg de un coche Objetivo: IC0,9 (µX ) = x̄ ∓ tn−1;α/2 √sxn
de este modelo”X ∼ N(µX , σX2 )
σX2 desconocida
p
sx = 0,96 = 0,98
'
n=6 x̄ = 19,48
MAS: n = 6 pequeña 1 − α = 0,9 ⇒ α/2 = 0,05
116,9 tn−1;α/2 = t5;0,05 = 2,015
Muestra: x̄ = 6
= 19,4833 „ «
0,98
IC0,9 (µX ) = 19,48 ∓ 2,105 √
2282,41 − 6(19,4833)2 6
sx2 = = 0,96
6−1 = (19,48 ∓ 0,81)
= (18,67, 20,29)
Interpretación: Tenemos una

Area=
0.05 confianza del 90 % de que el
consumo promedio de este modelo,
● µX , estará entre 18.67 y 20.29 mpg
t5 ; 0.05 = 2.015
Ejemplo: calcular un intervalo de confianza para µX
Ejemplo: 8.4 (cont.) en Excel: Ir al menú: Datos, submenú: Análisis de
Datos, escoger la función: Estadı́stica Descriptiva.
Columna A datos en amarillo (media muestral, semilongitud tn−1;α/2 √sxn ,
extremo inferior (celda: D3-D16), extremo superior (celda: D3+D16)).
Media muestral
Semilongitud IC
Datos
Distribuciones t de Student y χ2 (chi-cuadrado)
I Sabemos que T ∼ tn si T = √ Z2 , donde Z ∼ N(0, 1) y χ2n sigue una
χn /n
distribución chi-cuadrado con gl = n, y ambas son independientes.
I También, χ2n es la distribución de la suma de los cuadrados de n variables
aleatorias N(0, 1) independientes.
I Por ejemplo, la cuasi varianza muestral reescalada sigue una distribución
chi cuadrado con n − 1 grados de libertad.
Pn 2 n „ «2
(n − 1)sX2 i=1 (Xi − X̄ )
X Xi − X̄
= = ∼ χ2n−1
σX2 σX2 i=1
σ X
¿Por qué n − 1 y no n?
Si conociesemos el valor de µX , el Si tenemos que estimar µX mediante

número de grados de libertad serı́a X̄ , los gl son n − 1, porque solo
n, porque tendrı́amos n variables tenemos n − 1 variables aleatorias iid
aleatorias iid Xi σ−µ
X
X Xi −X̄
σX
(si se conocen los valores de
n − 1 de ellas, se puede deducir
fácilmente el valor de la restante)
Decimos que empleamos un grado de libertad en el cálculo de µX

Distribuciones t de Student y χ2 (chi-cuadrado)
Densidades de t y N(0, 1)
Densidades de χ2

0.4
0.15
gl=20
0.3
N(0,1) gl=15
gl=10 gl=10
0.10
gl=5 gl=5
0.2
gl=3
0.05
0.1
0.00
0.0
−4 −2 0 2 4 0 10 20 30 40
Intervalo de confianza para la varianza de la población,
población normal

I X sigue una distribución normal con varianza σX2
2. La cantidad pivotal para σX2 es
(n − 1)sX2
∼ χ2n−1
σX2
población normal
3. Por tanto, si χ2n−1;1−α/2 y χ2n−1;α/2 son

los cuantiles superiores (1 − α/2) y
(α/2) de una distribución chi-cuadrado
con n − 1 grados de libertad, tenemos
P(χ2n−1;1−α/2 < χ2n−1 < χ2n−1;α/2 ) = 1 − α
α α
1−α

2 2
Densidad chi-cuadrado ● ●
χ2n−1 ; 1−α χ2n−1 ; α

Recuerda: E[χ2n ] = n, V[χ2n ] = 2n 2 2
χ2n−1
z }| {
(n − 1)sX2
4. Imponemos la condición P(χ2n−1;1−α/2 < < χ2n−1;α/2 ) = 1 − α
σ2
población normal
5. Resolvemos la doble desigualdad para σX2 :
(n−1)sX2
χ2n−1;1−α/2 < σX2
< χ2n−1;α/2
1 σX2 1
> (n−1)sX2
>
χ2n−1;1−α/2 χ2n−1;α/2
(n − 1)sX2 (n − 1)sX2
> σX2 >
χ2n−1;1−α/2 χ2n−1;α/2
y obtenemos el estimador por intervalos de confianza

!
(n − 1)sX2 (n − 1)sX2
,
χ2n−1;α/2 χ2n−1;1−α/2

!
(n − 1)sx2 (n − 1)sx2
IC1−α (σX2 ) = ,
χ2n−1;α/2 χ2n−1;1−α/2
Ejemplo: calcular un intervalo de confianza para σX2 y σX
Ejemplo: 8.8 (Newbold) Una muestra aleatoria de quince pastillas para el dolor
de cabeza tiene una cuasi desviación tı́pica de 0.8 % en la concentración del
ingrediente activo. Calcule un IC al 90 % para la varianza de la población para
estas pastillas. Obtenga también un IC para la desviación tı́pica de la población.
0 1
(n−1)sx2 (n−1)sx2
Población: 2) = @
Objetivo: IC0,9 (σX
χ2
, 2
χ
A
n−1;α/2 n−1;1−α/2
X = çoncentración del
ingrediente activo en una pastilla
(in %)”X ∼ N(µX , σX2 ) sx2 = 0,82 = 0,64 n = 15
'
1 − α = 0,9 ⇒ α/2 = 0,05
MAS: n = 15 χ2n−1;1−α/2 = χ214;0,95 = 6,57
χ2n−1;α/2 = χ214;0,05 = 23,68
Muestra: sx = 0,8 „ «
14(0,64) 14(0,64)
IC0,9 (σX2 ) = ,
23,68 6,57
Area= Area=
= (0,378, 1,364) ⇒
p p
0.05 0.05 IC0,9 (σX ) = ( 0,378, 1,364)
● ● = (0,61, 1,17)
χ214 ; 0.95 χ214 ; 0.05 √
=6.57 =23.68
Para obtener IC(σX ) aplicamos a los
extremos de IC(σX2 )
Fórmulas para intervalos de confianza
Resumen para una población

I Sea X n una muestra aleatoria simple de una población X con media µX y
varianza σX2
Parámetro Hipótesis Cantidad pivotal (1 − α) Intervalo Conf.
„ «
X̄ −µX σ σ
Datos normales √ ∼ N(0, 1) µX ∈ x̄ − zα/2 √X , x̄ + zα/2 √X
Varianza conocida σX / n n n
„ –
X̄ −µX σ̂ σ̂
Media Datos no normales √ ∼approx. N(0, 1) µX ∈ x̄ − zα/2 √x , x̄ + zα/2 √x
Muestra grande σ̂X / n n n
r #
Datos Bernoulli p̂X −pX p̂x (1−p̂x )
∼approx. N(0, 1) pX ∈ p̂x ∓ zα/2
n
q
Muestra grande p̂X (1−p̂X )/n
Datos normales
„ «
X̄ −µX s s
Varianza descono- √ ∼ tn−1 µX ∈ x̄ − tn−1,α/2 √x , x̄ + tn−1,α/2 √x
sX / n n n
cida 0 1
2
(n−1)sX (n−1)sx2 (n−1)sx2
Varianza Datos normales ∼ χ2
n−1
2
σX ∈ @ 2 , 2 A
σ2 χ χ
X n−1;α/2 n−1;1−α/2
0v 1
2
v
(n−1)sX u (n−1)sx2 (n−1)sx2
u u
∼ χ2 σX ∈ @t 2
u
Desv. tı́pica Datos normales n−1 ,t 2 A
σ2 χ χ
X n−1;α/2 n−1;1−α/2
Intervalos de confianza para la media de la población:
¿Qué usar cuándo?
X ∼ distribución con media µX y desviación tı́pica σX
.X ∼ normal
&X normal
.
σ conocida
&
σ desconocida
.
n pequeña
&
n grande
↓
basada en z
↓
basada en t
↓ ↓
métodos más basada en z
(exacta) (exacta) allá de Est II (aprox. TCL)

Tema 1. Inferencia Estadística para Una Población PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tema 1. Inferencia Estadística para Una Población PDF

Cargado por

Copyright:

Formatos disponibles

Tema 1.

Inferencia estadı́stica para una población

I Población: el conjunto de toda la información numérica relativa a

I Inferencia estadı́stica: el proceso mediante el que se llega a

Queremos conocer Tenemos n copias Tenemos n

I Un estimador puntual de un parámetro de una población es una

¿Qué caracterı́sticas querrı́amos que tuviese un estimador?

Población Estimador Estimador insesgado

I Eficiencia. Se mide por la varianza del estimador. Un estimador con

ECM[θ̂X ] = E[(θ̂X − θX )2 ] = Var[θ̂X ] + (Sesgo[θ̂X ])2

Emplee un procedimiento de estimación insesgado para obtener

I Hasta ahora hemos considerado la estimación puntual de un

Interpretación: tenemos una probabilidad (1 − α) de que el parámetro

Interpretación: podemos tener una confianza de (1 − α) de que el valor

1. Se busca una cantidad (aleatoria) relacionada con el parámetro

3. Para obtener los extremos del estimador por intervalo de confianza,

1. Sea X n una MAS de tamaño n obtenida de X . Bajo los supuestos:

3. Si z1−α/2 y zα/2 son los cuantiles

P(z1−α/2 < Z < zα/2 ) = 1 − α α α

Densidad normal estándar

6. El intervalo de confianza es:

Intervalo de confianza Intervalo de confianza

Intervalo de confianza Intervalo de confianza

La longitud de los intervalos decrece cuando el tamaño muestral aumenta

Pregunta: ¿Cuál es el efecto del valor de σ sobre la longitud?

1. Sea X n una MAS de tamaño n de X . Bajo las hipótesis:

3. Por tanto, si z1−α/2 y zα/2 son

P(z1−α/2 < Z < zα/2 ) = 1 − α α α

Densidad normal estándar

5. Resolvemos la doble desigualdad para µX :

para obtener el estimador por intervalos de confianza

6. El intervalo de confianza es:

Por tanto, del TCL,

válido si la desviación tı́pica de la

En muestras grandes, el intervalo de confianza para pX es:

Interpretación: Podemos tener una confianza

1. Sea X n una MAS de tamaño n de X . Bajo las hipótesis:

tn−1 ; 1−α2 = − tn−1 ; α2

5. Resolvemos la doble desigualdad para µX :

y obtenemos el estimador por intervalos de confianza

6. El intervalo de confianza es:

Interpretación: Tenemos una

Si conociesemos el valor de µX , el Si tenemos que estimar µX mediante

Decimos que empleamos un grado de libertad en el cálculo de µX

1. Sea X n una MAS de tamaño n de X . Bajo las hipótesis:

3. Por tanto, si χ2n−1;1−α/2 y χ2n−1;α/2 son

χ2n−1 ; 1−α χ2n−1 ; α

y obtenemos el estimador por intervalos de confianza

6. El intervalo de confianza es:

Resumen para una población

Parámetro Hipótesis Cantidad pivotal (1 − α) Intervalo Conf.

X ∼ distribución con media µX y desviación tı́pica σX

También podría gustarte