Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTG1037
1 FCNM - ESPOL
Tabla de contenidos
1. Estimación
1.1. Introducción a la estimación estadı́stica
1.2. Propiedades de los estimadores puntuales: insesgadez,
eficiencia y consistencia
1.3. Procedimientos de estimación por punto: método de los
momentos y máxima verosimilitud
1.4. Intervalos de confianza para una y dos muestras: media,
varianza y proporciones. Determinación del tamaño de la
muestra
Tabla de Contenidos
1. Estimación
1.1. Introducción a la estimación estadı́stica
1.2. Propiedades de los estimadores puntuales: insesgadez,
eficiencia y consistencia
1.3. Procedimientos de estimación por punto: método de los
momentos y máxima verosimilitud
1.4. Intervalos de confianza para una y dos muestras: media,
varianza y proporciones. Determinación del tamaño de la
muestra
Objetivo de esta unidad
1. Estimación
1.1. Introducción a la estimación estadı́stica
1.2. Propiedades de los estimadores puntuales: insesgadez,
eficiencia y consistencia
1.3. Procedimientos de estimación por punto: método de los
momentos y máxima verosimilitud
1.4. Intervalos de confianza para una y dos muestras: media,
varianza y proporciones. Determinación del tamaño de la
muestra
Estadı́stico Muestral
Definición
T ∼ G , G es la Distribución Muestral
Estadı́stico Muestral
Media muestral
▶ Población {1, 2, 3, 4, 5}
▶ Muestras de tamaño n = 2
25 posibles muestras
Estadı́stico Muestral
Media muestral
0.04; x̄ = 1, 5
0.08; x̄ = 1.5, 4.5
gx̄ (x̄) = 0.12; x̄ = 2, 4
0.16; x̄ = 2.5, 3.5
0.20; x̄ = 3
µx̄ = 3 Var(x̄) = 1
Estadı́stico Muestral
Estadı́stico Suma
▶ X1 , X2 , . . . , Xn son i.i.d. con media µ y varianza σ 2
▶ Sn : Rn → R : Sn (X1 , X2 , . . . , Xn ) = X1 + X2 + . . . + Xn
▶ Estima el total T = X1 + X2 + . . . + XN de la población
Estadı́stico de Orden
▶ Mı́nimo
▶ Máximo
▶ Mediana (u otro cuantil).
Outline
1. Estimación
1.1. Introducción a la estimación estadı́stica
1.2. Propiedades de los estimadores puntuales: insesgadez,
eficiencia y consistencia
1.3. Procedimientos de estimación por punto: método de los
momentos y máxima verosimilitud
1.4. Intervalos de confianza para una y dos muestras: media,
varianza y proporciones. Determinación del tamaño de la
muestra
Propiedades de los Estimadores
▶ Insesgadez
▶ Eficiencia
▶ Consistencia
Insesgadez
Insesgadez
E (θ̂) = θ
Ejemplos
▶ La media muestral x̄ es un estimador insesgado de la media
poblacional µ → E (x̄) = µ
1 Pn
▶ S 2 = n−1 2
i=1 (Xi − X̄ ) es un estimador insesgado de la
varianza poblacional σ 2
▶ Sn2 = n1 ni=1 (Xi − X̄ )2 . es insesgado?
P
n−1 2
- E [Sn2 ] = n σ .
2
- B(Sn2 ) = n−1 2
n σ − σ 2 = − σn .
Error cuadrático medio (ECM)
Eficiencia:
CRB
eff(θ̂) =
Var(θ̂)
θ̂1 es más eficiente que θ̂2 si Var(θ̂1 ) < Var(θ̂2 ).
Consistencia
1. Estimación
1.1. Introducción a la estimación estadı́stica
1.2. Propiedades de los estimadores puntuales: insesgadez,
eficiencia y consistencia
1.3. Procedimientos de estimación por punto: método de los
momentos y máxima verosimilitud
1.4. Intervalos de confianza para una y dos muestras: media,
varianza y proporciones. Determinación del tamaño de la
muestra
Métodos de estimación
Momentos no centrados
mk = E [X k ]
(P
x k P(X = x), si X es discreta;
mk = R x∈S k
x∈S x fX (x) dx, si X es continua
m1 = E [X ] = µ
Método de los momentos (MOM)
µk = E [(X − E [X ])k ]
µ1 = 0
µ2 = σ 2
Método de los momentos (MOM)
mk = E [X k ]
Ejemplo: estimar λ
m1 = m̂1
Z ∞ n
X
x λ exp{−λx} dx = (1/n) Xi
0 i=1
1
= x̄
λ
1
λ̂ =
x̄
1
Efectivamente µ = λ
Método de máxima verosimilutud
Su logaritmo natutal:
n
X
ℓ(θ) = fθ (xi ; θ)
i=1
Método de máxima verosimilutud
Ejemplo: X1 , . . . , Xn es una muestra aleatoria (iid) de tiempos de
espera n autos para ser revisados en la ATM. X ∼ exp(λ).
(
λ exp{−λx}, x ≥ 0;
fX (x, λ) =
0, de lo contrario
La funcion de verosimilitud de λ
n
Y
fλ (λ; x) = fλ (λ; xi )
i=1
Método de máxima verosimilutud (MLE)
Ejemplo: estimar λ
n
X
ℓ(λ) = (log(λ) − λxi )
i=1
n
∂ℓ(λ) 1 X
=n − xi = 0
∂λ λ
i=1
n
1 X
= (1/n) xi = x̄
λ
i=1
1
λ̂ =
x̄
Ejemplo
La empresa H para una mejor planificación financiera quiere
estimar el valor promedio de las cuentas por cobrar anuales por
cliente. Para ello toma una muestra aleatoria de 30 cuentas
1. Estimación
1.1. Introducción a la estimación estadı́stica
1.2. Propiedades de los estimadores puntuales: insesgadez,
eficiencia y consistencia
1.3. Procedimientos de estimación por punto: método de los
momentos y máxima verosimilitud
1.4. Intervalos de confianza para una y dos muestras: media,
varianza y proporciones. Determinación del tamaño de la
muestra
Ejemplo
Supongamos que la junta financiera de la empresa H nos pide
presentar dos escenarios, uno positivo (que el promedio de cuentas
por cobrar del cliente sea bajo) y otro negativo (sea alto).
▶ Necesitamos calcular el error de estimación de x̄
▶ Los intervalos de confianza incluyen la información del
estimador y su margen de error.
θ̂ ± error de estimación
Resumen intervalos de confianza
Una muestra X
Para n Supuesto Intervalo
σ2 conocido >30 x̄ ± zα/2 √σn
µ σ2 desconocido >30 x̄ ± zα/2 √sn
σ2 conocido ≤30 X ∼ N(µ, σ 2 ) x̄ ± zα/2 √σn
σ2 desconocido ≤30 X ∼ N(µ, σ 2 ) x̄ ± tα/2,n−1 √sn
s2 2
σ2 X ∼ N(µ, σ 2 ) (n − 1) χ2 ≤ σ 2 ≤ (n − 1) χ2 s
α/2,n−1 q 1−α/2,n−1
p
r
≤500 ω p̂ + (1 − ω)0.5 ± zα/2 ωp̂(1−p̂)+(1−ω)0.5(1−0.5)
n+z 2
,
α/2
n
ω= 2
n+zα/2
q
p̂x (1−p̂x )+2p̂x p̂y +p̂y (1−p̂y )
py − px dos proporciones dependientes (p̂y − p̂x ) ± zα/2 n
Dos muestras independientes X, Y
nym Supuesto Intervalo
q
µ1 − µ2 varianzas iguales, conocida >30 d ± zα/2 σ m1 + n1
q
varianzas iguales, desconocida >30 d ± zα/2 s m1 + n1
X ∼ N(µ1 , σ12 )
q
varianzas iguales, conocida ≤30 d ± zα/2 σ m1 + n1
Y ∼ N(µ2 , σ22 )
X ∼ N(µ1 , σ12 )
q
varianzas iguales, desconocida ≤30 d ± tα/2,m+n−2 s m1 + 1
Y ∼ N(µ2 , σ22 ) n
∼ N(µ1 , σ12 )
q
X σ12 σ2
varianzas desiguales, conocida d ± zα/2 n + m2
Y ∼ N(µ2 , σ22 ) q
d ± tα/2,v s m1 + n1
X ∼ N(µ1 , σ12 ) s2
varianzas desiguales, desconocida s2
Y ∼ N(µ2 , σ22 ) ( nx + my )2
v= (sx2 /n)2 (s 2 /m)2
n−1
+ ym−1
σ22 X ∼ N(µ1 , σ12 ) sy2 1 σy 2 sy2
≤ ≤ F
sx2 α/2,n−1,m−1
σ12 Y ∼ N(µ2 , σ22 ) sx2 Fα/2,m−1,n−1 σx2
q
p̂x (1−p̂x ) p̂y (1−p̂y )
py − px (p̂y − p̂x ) ± zα/2 n + m
Dos muestras dependientes X, Y
nym Supuesto
2 Intervalo
µ1 σ1 σ12
µ1 − µ2 varianzas y covarianza conocidas X,Y ∼ N , 2
σd
d¯ ± zα/2 √ n
; σd2 = σ12 − 2σ12 + σ22
µ2 σ212 σ2
µ1 σ1 σ12
varianzas desconocidas X,Y ∼ N , d¯ ± tα/2,n−1 √sdn
µ2 σ12 σ22
Teorema del Lı́mite Central
▶ Estimador de la varianza S 2
2 P
▶ Para algunas distribuciones Sσ2 −
→1
D P
▶ Teorema de Slutsky: Si Xn −
→ X y Yn −
→ c, entonces
D
Xn /Yn −
→ X /c
r
√ X̄ − µ S 2 √ X̄ − µ D
n / = n −
→ Z /1 = Z ∼ N(0, 1)
σ σ2 S
Una muestra
Intervalos de confianza para µ cuando n es grande
σ 2 conocido
√ X̄ − µ
P(−zα/2 ≤ n ≤ zα/2 ) ≈ 1 − α
σ
Para una realización en una muestra observada:
σ σ
x̄ − zα/2 √ ≤ µ ≤ x̄ + zα/2 √
n n
Intervalos de confianza para µ cuando n es grande
σ 2 desconocido
√ X̄ − µ
P(−zα/2 ≤ n ≤ zα/2 ) ≈ 1 − α
S
Para una realización en una muestra observada:
s s
x̄ − zα/2 √ ≤ µ ≤ x̄ + zα/2 √
n n
Intervalos de confianza para µ cuando X ∼ N(µ, σ 2 )
√ X̄ − µ
n = Z ∼ N(0, 1)
σ
S2
(n − 1) ∼ χ2n−1
σ2
Intervalos de confianza para µ cuando X ∼ N(µ, σ 2 )
√ X̄ − µ
n ∼ tn−1
S
Para una realización en una muestra observada:
s s
x̄ − tn−1,α/2 √ ≤ µ ≤ x̄ + tn−1,α/2 √
n n
Intervalos de confianza para µ cuando X ∼ N(µ, σ 2 )
Intervalos de confianza para µ
Ejemplo
Supongamos que la junta financiera nos indica que basados en
estudios previos se estimó que la varianza es σ 2 = 4000. Y quieren
estar muy seguros del monto esperado de cuentas por cobrar
porque necesitan incluirlo en el presupuesto anual. La compañı́a
puede aceptar un error de estimación máximo de 5. Usted con sus
conocimientos estadı́sticos sabe que para hacer un estimador más
preciso necesita incrementar el número de observaciones en su
muestra.
Pregunta
▶ ¿Cuántas observaciones necesita para que con 99% de
confianza el error máximo de su estimación sea 5 ?
Determinación del tamaño de la muestra
▶ Error: E = X̄ − µ
▶ Con probabilidad 1 − α:
σ
|E | ≤ zα/2 √ = emax
n
▶ Despejando
2 σ2
zα/2
n= 2
emax
Determinación del tamaño de la muestra
Ejemplo
σ 2 = 4000.
Respuesta
▶ ¿Cuántas observaciones necesita para que con 99% de
confianza el error máximo de su estimación sea 5 ?
2.5762 (4000)
n= = 1061.724 → 1062
25
Intervalos de confianza para σ 2 cuando X ∼ N(µ, σ 2 )
n≥2
S2
(n − 1) ∼ χ2n−1
σ2
Intervalo de (1 − α)% de confianza
s2 s2
(n − 1) ≤ σ 2 ≤ (n − 1)
χ2α/2,n−1 χ21−α/2,n−1
Intervalos de confianza para σ 2 cuando X ∼ N(µ, σ 2 )
Ejemplo: empresa H
Supongamos que las cuentas por cobrar siguen una distribución
normal.
n = 30, s 2 = 3987.388
s2 s2
(n − 1) ≤ σ 2 ≤ (n − 1)
χ2α/2,n−1 χ21−α/2,n−1
▶ α?
▶ χ2α/2,n−1 ?
▶ χ21−α/2,n−1 ?
▶ (ll, ul) ?
Intervalos de confianza para proporciones
Proporción p:
▶ Xi ∼ Bernoulli(p)
▶ E [Xi ] = p y Var[Xi ] = p(p − 1)
▶ Estimador p̂ = x̄
▶ Cuando n es grande el intervalo de confianza serı́a
r
p(1 − p)
p̂ ± zα/2
n
▶ Sin embargo este intervalo no tiene solución dado que p es
desconocido.
Intervalos de confianza para proporciones
Dos soluciones:
▶ Intervalo de Wald (n suficientemente grande)
r
p̂(1 − p̂)
p̂ ± zα/2
n
▶ Intervalo de confianza de Score (más robusto cuando n es
pequeño)
s
ω p̂(1 − p̂) + (1 − ω)0.5(1 − 0.5)
ω p̂ + (1 − ω)0.5 ± zα/2 2
,
n + zα/2
n
donde ω = 2
n+zα/2
Intervalos de confianza para proporciones
(n − 1)sx2 + (m − 1)sy2
s2 =
m+n−2
Intervalos para diferencia de medias
▶ α = 0.06
▶ Fα/2,m−1,n−1 ? , F1−α/2,m−1,n−1 ?, (ll, ul)?
▶ ¿Se podrı́a concluir que las varianzas poblacionales son
iguales?
Intervalos para diferencia de proporciones
▶ di = yi − xi , i = 1, . . . , n.
▶ d1 , . . . , dn iid N(δ, σd2 ), σd2 = σx2 − 2σxy + σy2 .
▶ d¯ = ni=1 di /n
P
▶ sd2 = n−1 1 Pn ¯2
i=1 (di − d)
▶ Intervalo de confianza para δ
sd
d¯ ± tα/2,n−1 √
n
Intervalos para diferencia de medias (2): Dos muestras
pareadas (no independientes)
Individuo 1 2 3 4 5 6 7
A 190 192 168 145 176 140 202
D 170 150 155 122 167 156 160
Individuo 8 9 10 11 12 13 14
A 160 165 175 184 178 142 200
D 176 145 125 120 140 122 165
Intervalos para diferencia de medias (2): Dos muestras
pareadas (no independientes)
p
r
≤500 ω p̂ + (1 − ω)0.5 ± zα/2 ωp̂(1−p̂)+(1−ω)0.5(1−0.5)
n+z 2
,
α/2
n
ω= 2
n+zα/2
q
p̂x (1−p̂x )+2p̂x p̂y +p̂y (1−p̂y )
py − px dos proporciones dependientes (p̂y − p̂x ) ± zα/2 n
Dos muestras independientes X, Y
nym Supuesto Intervalo
q
µ1 − µ2 varianzas iguales, conocida >30 d ± zα/2 σ m1 + n1
q
varianzas iguales, desconocida >30 d ± zα/2 s m1 + n1
X ∼ N(µ1 , σ12 )
q
varianzas iguales, conocida ≤30 d ± zα/2 σ m1 + n1
Y ∼ N(µ2 , σ22 )
X ∼ N(µ1 , σ12 )
q
varianzas iguales, desconocida ≤30 d ± tα/2,m+n−2 s m1 + 1
Y ∼ N(µ2 , σ22 ) n
∼ N(µ1 , σ12 )
q
X σ12 σ2
varianzas desiguales, conocida d ± zα/2 n + m2
Y ∼ N(µ2 , σ22 ) q
d ± tα/2,v s m1 + n1
X ∼ N(µ1 , σ12 ) s2
varianzas desiguales, desconocida s2
Y ∼ N(µ2 , σ22 ) ( nx + my )2
v= (sx2 /n)2 (s 2 /m)2
n−1
+ ym−1
σ22 X ∼ N(µ1 , σ12 ) sy2 1 σy 2 sy2
≤ ≤ F
sx2 α/2,n−1,m−1
σ12 Y ∼ N(µ2 , σ22 ) sx2 Fα/2,m−1,n−1 σx2
q
p̂x (1−p̂x ) p̂y (1−p̂y )
py − px (p̂y − p̂x ) ± zα/2 n + m
Dos muestras dependientes X, Y
nym Supuesto
2 Intervalo
µ1 σ1 σ12
µ1 − µ2 varianzas y covarianza conocidas X,Y ∼ N , 2
σd
d¯ ± zα/2 √ n
; σd2 = σ12 − 2σ12 + σ22
µ2 σ212 σ2
µ1 σ1 σ12
varianzas desconocidas X,Y ∼ N , d¯ ± tα/2,n−1 √sdn
µ2 σ12 σ22