ESTIMACIÓN
PUNTUAL E
INTERVALOS
-Febrero 2020-
MSC. Luis Carlos Ibañez
Recordatorio
El propósito de la estadística es usar la información contenida en una muestra
para hacer inferencias acerca de la población de la cual se toma la muestra.
Por ejemplo, un fabricante de máquinas lavadoras podría estar interesado en
estimar la proporción “p” de lavadoras que esperaría que fallen antes de la
expiración de la garantía de un año. Otros parámetros poblacionales
importantes son la media poblacional, la varianza y la desviación
estándar.
Otro ejemplo, podríamos estimar la media del tiempo de espera “m” en una
caja registradora del supermercado o la desviación estándar del error de
medición de un instrumento electrónico
Recordatorio
Estimación
Puntual
Estimación por
Intervalos
Estimación Puntual
Un solo valor o punto constituye la estimación de p o m.
La información de la muestra permite calcular el valor de una estimación puntual. Dicha
estimación se logra con el uso de un estimador del parámetro objetivo.
Un estimador es una regla, a menudo expresada como una fórmula, que indica cómo
calcular el valor de una estimación con base en las mediciones contenidas en una muestra.
Por ejemplo, la media muestral es un posible estimador puntual de la media poblacional.
𝑛
1
ത
𝑌 = 𝑌𝑖
𝑛
𝑖=1
Ejemplo: edad de los estudiantes del A2
Estimación por Intervalos
Podríamos decir que la estimación de p o m está entre dos números (entre este y este
numero).
La información de la muestra permite calcular el valor de una estimación por intervalos.
Dicha estimación se logra con el uso de dos estimadores que permitan construir el
intervalo. Usualmente la media y la desviación estándar.
Un estimador es una regla que especifica el método para usar las mediciones muestrales
en el cálculo de dos números que forman los puntos extremos del intervalo.
𝑛
1 𝑛
𝑌ത = 𝑌𝑖 1
𝑛
𝑖=1 𝑠2 = 𝑦 − 𝑦ത 2
𝑖
𝑛−1
𝑖=1
Ejemplo: edad de los estudiantes del A2
Ninguna técnica es mejor que la otra. Sin embargo, algunos estimadores se consideran
buenos y otros malos.
Ejemplo de construcción: Diez ingenieros deben estimar el costo de un proyecto. Para ello
todos podrían usar métodos diferentes de estimación y por tanto llegar a diferentes
evaluaciones del costo total. Estos ingenieros, llamados estimadores en la industria de la
construcción, basan sus estimaciones en lineamientos especificados y en la intuición. Cada
estimador representa una regla subjetiva humana única para obtener una sola estimación.
¿Como podemos establecer criterios de bondad para comparar estimadores estadísticos?
Sesgo y error cuadrático medio
Suponga que dispara un solo tiro (estimación puntual) y acierta en el centro del blanco.
¿Concluimos que es un excelente tirador? ¿Se atrevería a sostener el blanco cuando se
haga un segundo tiro?
Obviamente, no podríamos afirmar que el hombre es un experto tirador si nos basamos en
tan pequeña cantidad de evidencia.
Por otra parte, si 100 tiros en sucesión aciertan en el blanco, podríamos tener confianza
suficiente en el tirador y considerar sostener el blanco para el siguiente tiro si la
compensación es adecuada.
La cuestión es que no podemos evaluar la bondad de un procedimiento de estimación
puntual con base en el valor de una sola estimación; más bien, debemos observar los
resultados cuando el procedimiento de estimación se usa en innumerables veces.
Por tanto, evaluamos la bondad del estimador puntual al construir una distribución de
frecuencia de los valores de las estimaciones obtenidas en muestreo repetido y observar
cómo se agrupa esta distribución alrededor del parámetro objetivo.
Suponga que deseamos especificar una estimación puntual para un parámetro poblacional al
que se lee como “beta
que llamaremos β. El estimador de β estará indicado por el símbolo β,
sombrero”. El “sombrero” indica que estamos estimando el parámetro.
Con el ejemplo del disparo de revólver en mente, podemos decir que es altamente deseable
que la distribución de estimaciones ⎯o bien, en forma más apropiada, la distribución muestral
de estimaciones⎯ se agrupe alrededor del parámetro objetivo como se muestra en la figura.
En otras palabras, quisiéramos que la media o valor esperado de la distribución de
= β.
estimaciones fuera igual al parámetro estimado; esto es, E(β)
Se dice que los estimadores puntuales que
satisfacen esta propiedad son insesgados.
La distribución muestral para un estimador
> β,
puntual sesgado positivamente, E(β)
Si es sesgado, ¿Cómo calculamos el sesgo?
= E(β)−β.
S(β)
Por ejemplo, veamos estas dos posibles distribuciones muestrales para los estimadores
puntuales insesgados. ¿Qué distribución preferiríamos? ¿Por qué?
Media y Varianza
Dados dos estimadores insesgados de un parámetro u seleccionaríamos el estimador con
la menor varianza mientras, todo lo demás permanece igual.
Más que usar el sesgo y la varianza de un estimador puntual para caracterizar su
bondad, podríamos emplear una técnica que se conoce como Error Cuadrático Medio.
2
Fórmula: መ =𝐸
MSE(𝛽) 𝛽መ − 𝛽 ,
Calcula el promedio del cuadrado de la distancia entre el estimador y su parámetro
objetivo.
El error cuadrático medio de un estimador puntual 𝛽መ es una función de su media y su
varianza.
Ejemplo: Métodos de Inflación
Estimadores puntuales insesgados
Si tenemos una muestra de tamaño n, estos podrían ser los
estimadores:
Parámetro Tamaño Estimador መ
E(𝛽) Error estándar
objetivo β muestral Puntual 𝑠𝛽
µ n 𝑌ത µ 𝑠
𝑛
p n 𝑌 p 𝑝𝑞
𝑝ො = 𝑁
𝑛
Estimadores puntuales insesgados
Ahora si queremos comparar dos muestras aleatorias independientes
con n1 y n2 observaciones seleccionadas de dos poblaciones
diferentes:
Parámetro Tamaño Estimador መ
E(𝛽) Error
objetivo β muestral Puntual estándar 𝑠𝛽
𝜇1 − 𝜇2 n1 y n2 𝑌ഥ1 − 𝑌ഥ2 𝜇1 − 𝜇2
𝜎12 𝜎22
+
𝑛1 𝑛2
𝑝1 − 𝑝2 n1 y n2 𝑝ො1 − 𝑝ො2 𝑝1 − 𝑝2 𝑝1 𝑞1 𝑝2 𝑞2
+
𝑛1 𝑛2
Aún cuando la falta de sesgo es con frecuencia una propiedad deseable
para un estimador puntual, no todos los estimadores son insesgados.
Recordemos que la varianza se define como:
𝑛
1
𝑠2 = 𝑦𝑖 − 𝑦ത 2
𝑛−1
𝑖=1
Pero porqué no dividirlo entre n
𝑛
1
𝑠 ′2 = 𝑦𝑖 − 𝑦ത 2
𝑛
𝑖=1
s2 s’2 son, respectivamente, estimadores sesgados e insesgados de la
varianza poblacional. s2 es la varianza muestral porque es un estimador
insesgado
Sea 𝑌1 , 𝑌2,…… 𝑌𝑛 una muestra aleatoria con 𝐸 𝑌𝑖 = 𝜇 𝑦 𝑉 𝑌𝑖 = 𝜎 2 .
Demuestre que 𝑛
1
𝑠 ′2 = 𝑦𝑖 − 𝑦ത 2
𝑛
𝑖=1
𝑛
1
Es un estimador sesgado para 𝜎 2 y que 𝑠2 = 𝑦𝑖 − 𝑦ത 2
𝑛−1
𝑖=1
Es un estimador insesgado para 𝜎 2
Evaluación de la bondad de un estimador puntual
Es en términos de las distancias entre las estimaciones que genera y el
parámetro objetivo. Esta cantidad, que varía aleatoriamente en muestreo
repetido, se denomina error de estimación (sesgo)
Ejemplo:
Una muestra de n=100 votantes, seleccionados al azar en una ciudad,
mostró y = 560 a favor del candidato Fernández. Estime p, la fracción
de votantes de la población que están a favor de Fernández y precise
un límite de 2 en el error de estimación.
Recordemos el estimador 𝑝Ƹ = Y/n = 560 / 1000 = 0.56
Ahora pregunto, ¿Qué tan confiable es este valor?
Recordemos que la distribución de probabilidad de p sombrero se aproxima
en forma muy precisa mediante una distribución normal. Como n = 1000,
cuando b = 2 desviación, la probabilidad de que e sea menor que b es
aproximadamente 0.95
𝑝𝑞Τ (056∗0.44)
b = 2 error estándar = 2 * 𝑛 =2* ൗ1000 = 0.03
Podemos tener una confianza de 95% que nuestra estimación puntual, 0.56
está a no mas de 0.03 del valor verdadero de p.
Ejemplo:
Una comparación de la durabilidad de dos tipos de llantas para automóvil se
obtuvo de muestras de pruebas en carretera n1= n2 = 100 llantas de cada
tipo. Se registró el número de millas hasta quedar inútiles, el desgaste se
definió como el número de millas hasta que la cantidad restante de superficie
de rodamiento llegó a un valor pequeño especificado previamente. Las
mediciones para los dos tipos de llantas se obtuvieron de manera
independiente y se calcularon las siguientes medias y varianzas
𝑌ഥ1 = 26,400 𝑌ഥ2 = 25,100
𝑠12 = 1,440,000 𝑠22 = 1,960,000
Estime la diferencia en la media de millas hasta quedar inútiles y precise un
límite de error estándar de 2.
Estimados de Intervalo
En el caso ideal, el intervalo resultante tiene dos propiedades: primero,
contiene el parámetro objetivo β; en segundo, su amplitud será
relativamente pequeña.
Los estimadores de intervalo suelen recibir el nombre de intervalos de
confianza, dado que tenemos que especificar un grado de confianza en el
que estamos trabajando.
Los puntos extremos superior e inferior de un intervalo de confianza se
denominan límites de confianza superior e inferior, respectivamente. La
probabilidad de que un intervalo de confianza (aleatorio) incluya a β (una
cantidad fija) se llama coeficiente de confianza o nivel de confianza.
Por tanto, si sabemos que el coeficiente de confianza asociado con nuestro
estimador es alto, podemos estar suficientemente seguros de que cualquier
intervalo de confianza, construido con el uso de los resultados de una sola
muestra, contendrá a β.
En ese sentido, suponga que 𝛽𝐼 y 𝛽𝑆 son los límites de confianza inferior y
superior, respectivamente, para un parámetro. Entonces, si
P(𝛽𝐼 < β < 𝛽𝑆 ) = 1 – α; donde α representa el coeficiente o nivel de
significancia.
En general, en muestra grandes todos los estimadores puntuales vistos
anteriormente, tienen distribuciones muestrales aproximadamente
normales. Entonces, para este tipo de muestras, Z posee
aproximadamente una distribución normal estándar.
𝛽መ − 𝛽 𝛽መ − 𝛽
𝑍= 𝑍=
𝜎𝛽 𝑠𝛽
Entonces, los puntos extremos para un intervalo de confianza de
100(1-α)% para β están dados por
𝛽𝐼 = 𝛽መ − 𝑧𝛼 ∗ 𝜎𝛽 𝑠 = 𝛽መ + 𝑧𝛼 ∗ 𝜎
𝐵 𝛽
2 2
Ejemplo de μ:
Se registraron los tiempos de compra de n= 64 clientes seleccionados al azar en un
supermercado. El promedio y varianza de los 64 tiempos de compra fueron 33
minutos y 256 minutos2, respectivamente. Estime μ, el verdadero promedio de
tiempo de compra por cliente, con un coeficiente de confianza de 0.90
Ejemplo de p:
Dos marcas de refrigeradoras, denotas por A y B, están garantizadas
por 1 año. En una muestra aleatoria de 50 refrigeradoras de la marca A,
se observó 12 de ellos fallaron antes de terminar el período de garantía.
Una muestra aleatoria independiente de 60 refrigeradoras de la marca
B también reveló 12 fallas durante el período de garantía. Calcule la
diferencia real (p1 – p2) entre las proporciones de fallas durante el
periodo de garantía, con un coeficiente de confianza de 0.98 (z= 2.33)
Ejemplo Excel
1. Seleccionar el menú Datos
2. Elegir Análisis de Datos
3. Estadística Descriptiva
4. Cuando aparezca el cuadro de diálogo
Estadística Descriptiva:
a) Ingresar los datos en el rango de Entrada
b) Seleccionar Agrupado por columnas
c) Seleccionar rótulos en el primer renglón (si hay)
d) Seleccionar rango de salida
e) Seleccionar todas las casillas
MUCHAS GRACIAS!
-Febrero 2020-