Está en la página 1de 52

ESTIMACIÓN

- CURSO 2022 -
INTRODUCCIÓN (1)
La inferencia estadística se ocupa de tomar decisiones o
predicciones acerca de parámetros, es decir, las medidas
numéricas descriptivas que caracterizan a una población.
Tres parámetros que abordamos en las unidades anteriores son la
media poblacional µ, la desviación poblacional estándar σ y la
proporción binomial p.
En inferencia estadística, un problema práctico se expone en el
marco de una población con un parámetro específico de interés.
Por ejemplo, el metalurgista podría medir el promedio de
coeficientes de expansión de dos tipos de acero y luego comparar
sus valores.
INTRODUCCIÓN (2)
Los métodos para hacer inferencias acerca de parámetros
poblacionales están clasificados en dos categorías:
 Estimación: estimar o predecir el valor del parámetro
 Prueba de hipótesis: tomar una decisión acerca del valor de un
parámetro, con base en alguna idea preconcebida acerca de
cuál podría ser su valor

Ejemplo 1: Los circuitos, en computadoras y otros equipos electrónicos,


están formados por una o más tarjetas de circuito impreso (PCB) y es
frecuente que las computadoras sean reparadas con sólo cambiar una o
más de estas tarjetas. En un intento por hallar el ajuste apropiado de un
proceso de chapa aplicado a uno de los lados de una PCB, un supervisor
de producción podría estimar el grosor aproximado de chapa de cobre en
las PCB utilizando muestras de varios días de operación. Como no sabe
del grosor promedio µ antes de observar el proceso de producción, el suyo
es un problema de estimación.
INTRODUCCIÓN (3)

Para estimar el valor de un parámetro, se puede usar información


de la muestra en la forma de un estimador. Los estimadores se
calculan usando información de las observaciones muestrales y,
por definición son también estadísticos.

Definición:
Un estimador es una regla, generalmente expresada como
fórmula, que nos dice cómo calcular una estimación basada
en la información de la muestra.
INTRODUCCIÓN (4)
Los estimadores se usan en dos formas diferentes:
• Estimación puntual: Con base en datos muestrales, se calcula
un solo número para estimar el parámetro. La regla o fórmula que
describe este cálculo se denomina estimador puntual y el
número resultante recibe el nombre de estimación puntual.
• Estimación de intervalo: Con base en datos muestrales, dos
números se calculan para formar un intervalo dentro del cual se
espera esté el parámetro. La regla o fórmula que describe este
cálculo se denomina estimador de intervalo y el par de números
resultantes se llama estimación de intervalo o intervalo de
confianza.
ESTIMACIÓN PUNTUAL
INTRODUCCIÓN (1)
En una situación práctica, puede haber varios estadísticos que
podrían usarse como estimadores puntuales para un parámetro.
Para determinar cuál de las opciones es mejor, se necesita saber
cómo se comporta el estimador en un muestreo repetido, descrito
por su distribución muestral.
Analogía

Fuente: Mendelhall (2007)


PROPIEDADES DE UN BUEN ESTIMADOR (1)
Las distribuciones muestrales dan información que se puede usar
para seleccionar el mejor estimador. ¿Qué características serían
valiosas?
1) INSESGADEZ:
La distribución muestral del estimador puntual debe estar
centrada sobre el verdadero valor del parámetro a ser
estimado. Esto es, el estimador no debe subestimar o sobreestimar
de manera consistente al parámetro de interés. Un estimador como
éste se dice que es insesgado.

Definición:
Se dice que un estimador de un parámetro es insesgado si la
media de su distribución es igual al verdadero valor del parámetro.
De otro modo, se dice que el estimador está sesgado.
PROPIEDADES DE UN BUEN ESTIMADOR (2)
PROPIEDADES DE UN BUEN ESTIMADOR (3)

2) VARIANZA MÍNIMA:
La segunda característica deseable de un estimador es que la
dispersión (medida por la varianza) de la distribución
muestral debe ser tan pequeña como sea posible.

Esto asegura que, con una alta probabilidad, una estimación


individual caerá cerca del valor verdadero del parámetro.

Es preferible el estimador con la varianza más pequeña,


porque las estimaciones tienden a estar más cerca del
verdadero valor del parámetro, que en una distribución con la
varianza más grande.
PROPIEDADES DE UN BUEN ESTIMADOR (4)
PROPIEDADES DE UN BUEN ESTIMADOR (5)
PROPIEDADES DE UN BUEN ESTIMADOR (6)
Ejemplos de estimador insesgado y de varianza mínima:

Sesgado

Insesgado

Varianza mínima
ESTIMADORES MÁS UTILIZADOS

(Valor numérico)
ESTIMACIÓN POR
INTERVALOS DE CONFIANZA
INTRODUCCIÓN (2)
Ejemplo 2:
Suponga que se hace gran número de mediciones independientes,
todas mediante el mismo procedimiento, del diámetro de un pistón.
La media muestral de las mediciones es 14,0 cm, y la incertidumbre
en esta cantidad, que representa la desviación estándar de la
media muestral, es 0,1 cm. Suponga que las mediciones no están
sesgadas. El valor 14,0 proviene de una distribución normal, ya que
es el promedio de un gran número de mediciones. Ahora el diámetro
verdadero del pistón no será exactamente igual a la media muestral
de 14,0 cm. Sin embargo, dado que ésta proviene de una
distribución normal, se puede utilizar dicha desviación estándar para
determinar qué tan cerca está probablemente del diámetro
verdadero.
INTRODUCCIÓN (3)
Ejemplo 2 – cont.:
Pueden plantearse dos situaciones, a saber:
• Es muy improbable que la media muestral sea diferente del
diámetro verdadero en más de tres desviaciones estándares. Por
tanto, se tiene una enorme confianza de que el diámetro
verdadero esté en el intervalo (13,7 ; 14,3).
• Es menos probable que la media muestral difiera del valor
verdadero en más de una desviación estándar. Por tanto, se tiene
que existe poca certeza de que el diámetro verdadero se
encuentre en dicha cercanía (13,9 ; 14,1).

Los intervalos (13,7 ; 14,3) y (13,9 ; 14,1) son intervalos de


confianza para el diámetro verdadero del pistón.
INTRODUCCIÓN (4)

La estimación por intervalos nos permite conocer con que


error estamos trabajando. Consiste en dar 2 valores θI y θS
tales que la probabilidad de que θI y θS encierren al
verdadero valor de θ (parámetro), sea igual a " 1 - α "
(confianza del intervalo ó nivel de confianza).

P (θI < θ < θS) = 1 - α

θI y θS son variables, no así θ (parámetro) ya que es un


número que no conocemos, por eso se lee: ″la probabilidad
que θI y θS encierren al valor θ es 1 - α”
INTRODUCCIÓN (5)
VARIABLES FUNDAMENTALES

Una variable aleatoria es una variable fundamental o pivotal si


y solo si:

1. depende del parámetro (no conocido) al cual se le


construye el intervalo

2. depende del mejor estimador insesgado (conocido) del


parámetro al cual se le construye el intervalo

3. debe tener una distribución fija y conocida, independiente


del parámetro al cual se le construye el intervalo
INTRODUCCIÓN (6)

EJEMPLO: Sea X ~ N (µ
µ, σ2) donde σ2 es conocida. Hallar la
variable fundamental para µ.

2 1 3
X− E[ X ] X− µ
Z= = ~ N (0, 1 )
V[ X ] σ n
Conocidos
INTERVALOS DE CONFIANZA
PARA UNA POBLACIÓN
INTERVALO DE CONFIANZA PARA LA MEDIA (1)
Población normal con σ2 conocida (1)
INTERVALO DE CONFIANZA PARA LA MEDIA (2)
Población normal con σ2 conocida (2)
La media muestral x es el mejor estimador puntual de la población por:
INTERVALO DE CONFIANZA PARA LA MEDIA (3)
Población normal con σ2 conocida (3)

Ejemplo 3:
Un ingeniero que supervisa el control de calidad quiere calcular la
media del peso de cajas que se han llenado con cereal mediante una
máquina específica, durante cierto día. Para ello, toma una muestra
aleatoria de 100 cajas que se han llenado con esa máquina, en ese
día. Calcula que la media muestral del peso de llenado es x = 12,05
kg y la desviación estándar s = 0,1 kg.
Debido a que la media poblacional no será exactamente igual a la
media muestral de 12,05; es mejor construir un intervalo de
confianza alrededor de 12,05 que quizá contenga a aquélla.
Luego es posible cuantificar el nivel de confianza de que la media
poblacional esté realmente contenida por el intervalo.
INTERVALO DE CONFIANZA PARA LA MEDIA (3)
Población normal con σ2 conocida (3)
Ejemplo 3 – cont.:
Con el propósito de ver cómo construir un intervalo de confianza en
este ejemplo, sea µ la media poblacional desconocida y   la
varianza respectiva.
Sean  , . . . ,  los 100 pesos del llenado de las cajas
muestreadas. El valor observado de la media muestral es x = 12,05.
Ya que X es la media de una muestra grande, el teorema del límite
central garantiza que proviene de una distribución normal cuya
media es µ y cuya desviación estándar es σx = σ⁄ n.
INTERVALO DE CONFIANZA PARA LA MEDIA (4)
Población normal con σ2 conocida (4)
Ejemplo 3 – cont.:
La figura 1 muestra una curva normal, que representa la distribución de X. Aquí
se indica que 95% intermedio de la curva se extiende una distancia 1.96 σx a
cada lado de la media poblacional.
El valor observado X = 12,5
constituye una sola muestra de
esta distribución. No se tiene
manera alguna de saber de qué
parte de la curva fue extraído
este valor especial de X

Fuente: Navidi (2006)


INTERVALO DE CONFIANZA PARA LA MEDIA (5)
Población normal con σ2 conocida (5) Ejemplo 3 – cont.:
La figura 2 representa una muestra cuya media X está fuera de 95%
intermedio de la curva. Sólo 5% de todas las muestras se encuentra en
dicha categoría. Para estas muestras más inusuales el intervalo de
confianza de 95% X ± 1.96 σx no contiene la media poblacional µ.

Fuente: Navidi (2006)


INTERVALO DE CONFIANZA PARA LA MEDIA (6)
Población normal con σ2 conocida (6) Ejemplo 3 – cont.:

Fuente: Navidi (2006)


INTERVALO DE CONFIANZA PARA LA MEDIA (7)
Población normal con σ2 conocida (7)
INTERVALO DE CONFIANZA PARA LA MEDIA (8)
Población normal con σ2 conocida (8)
Un intervalo de confianza de nivel 100(1 – α)% para µ es:
X ± ⁄ σx , o X ± ⁄ σ⁄ n
INTERVALO DE CONFIANZA PARA LA MEDIA (9)
Población normal con σ2 conocida (9)

1−α
X− µ
Z= ~ N (0, 1 )
σ n
α/2 α/2
z1 0 z
2
El mejor intervalo de confianza es el que tiene menor
longitud. Cuando la distribución es simétrica, se
demuestra que éste es también simétrico, por lo tanto
dada la confianza “1 – α” podemos hallar dos valores de
z tal que P (z1 < z < z2) = 1 – α
*La longitud L = z2 - z1 es mínima cuando z1 = – z2
INTERVALO DE CONFIANZA PARA LA MEDIA (10)
Población normal con σ2 conocida (10)
INTERVALO DE CONFIANZA PARA LA MEDIA (11)
Población normal con σ2 conocida (11)
P ( − z1 < z < z1 ) = 1 − α

 −µ  1−α
P  −z α < < z α  =1− α
X α/2 α/2
 1− σ n 1−  -z z1
 2 2 1

 σ σ 
P X − z α <µ< X + z α  =1− α
 1− n 1− n
 2 2 

Aclaración:
Aclaración Cuando reemplazamos las variables del intervalo por
valores numéricos tomados de una muestra particular, el
intervalo numérico NO debe tener asociada ninguna probabilidad.
INTERVALO DE CONFIANZA PARA LA MEDIA (12)
Población normal con σ2 conocida (12)
INTERVALO DE CONFIANZA PARA µ ; con σ conocido.
Si x es la media de una muestra aleatoria de tamaño n de una
población normal con varianza conocida σ2 , el intervalo de
confianza de (1 – α) 100% para µ es

o
σ
µ = x ± z α
1− n
2
INTERVALO DE CONFIANZA PARA LA MEDIA (13)
Población normal con σ2 conocida (13)
Se ha visto que el intervalo de confianza de µ , con σ conocido, lo
podemos escribir
σ
µ = x ± z α
1− n
2

El error (E) en la estimación de µ es


σ
E = µ− X = z α .
1−
2 n
Con frecuencia, se desea saber que tan grande debe ser una
muestra n para asegurar que el error en la estimación de µ será
menor que la cantidad específica E. 2
 α
z . σ 
 1− 2 
Despejando se tiene n= 
 E 
 
INTERVALO DE CONFIANZA PARA LA MEDIA (14)
Población normal con σ2 conocida (14)
EJEMPLO 4:
Si se quiere determinar la amplitud mecánica media de un
gran grupo de trabajadores. ¿Qué tamaño debe tener una
muestra aleatoria para asegurar con una probabilidad de 0.95
que la media muestral no diferirá de la media real por mas de
tres (3) puntos? Suponer que se sabe por experiencia que
σ = 20.
 σ σ 
P− z α <µ − X < z α  =1− α
 1− n 1− n
 2 2 
INTERVALO DE CONFIANZA PARA LA MEDIA (15)
Población normal con σ2 conocida (15)
σ σ
µ−X = z α = E ≤3 n =z α
1− n 1− E
2 2
2
 σ 
n=z α 
 1− E 
 2 
α
1 - α = 0.95 → 1- = 0.975
2
2
n =  1.96 ×  = 171
20
z 0.975 =1.96 → 
 3 
INTERVALO DE CONFIANZA PARA LA MEDIA (16)
Población normal con σ2 desconocida (1)
INTERVALO DE CONFIANZA PARA LA MEDIA (17)
Población normal con σ2 desconocida (2)
Con frecuencia, se intenta estimar la media de una población
cuando se desconoce la varianza poblacional. Si se tiene una
muestra aleatoria n de una distribución normal, entonces la variable
fundamental es
X −µ
t= ~ t ( n −1)
S n

En estas condiciones con σ desconocida, T puede utilizarse para


determinar el intervalo de confianza de µ. El procedimiento es el
mismo que cuando se conocía σ excepto que este último se
sustituye por S y la distribución normal estándar por la distribución t.
INTERVALO DE CONFIANZA PARA LA MEDIA (18)
Población normal con σ2 desconocida (3)
Con referencia a la figura, se puede asegurar que,
1−α

P ( t1 < t < t2 ) = 1 - α
α/2 α/2
t1 0 t
2

El objetivo es que L = t2 - t1 sea mínimo lo que se logra con:


t1 = − t α y t2 = t α
1− 1−
2 2
Estandarizando
 − µ 
P  −t α < < t α  =1− α
X
 1− S n 1− 
 2 2
INTERVALO DE CONFIANZA PARA LA MEDIA (19)
Población normal con σ2 desconocida (4)
Se despeja en función de µ, con lo cual se tiene que para el caso
particular de la muestra aleatoria de tamaño n , se calcula la media
x y la desviación estándar s y, puede obtenerse una probabilidad de
(1 – α) 100% para µ.

 
P X − t α  =1− α
S S
< µ < X+t α
 1− n 1− n
 2 2 
INTERVALO DE CONFIANZA PARA LA MEDIA (20)
Población normal con σ2 desconocida (5)
INTERVALO DE CONFIANZA PARA µ ; con σ desconocido.
Si x y s son la media y la desviación estándar, respectivamente, de
una muestra aleatoria de tamaño n de una población normal con
varianza desconocida σ2 , el intervalo de confianza de (1 – α)100%
para µ es

o s
µ= x ±t α
1− n
2
INTERVALO DE CONFIANZA PARA LA MEDIA (21)
Población normal con σ2 desconocida (6)
Se ha visto que el intervalo de confianza de µ , con σ desconocido,
lo podemos escribir
s
µ = x ±t α
1− n
2
El error (E) en la estimación de µ es

y
s
L = 2E = 2t α
1− n
2
INTERVALO DE CONFIANZA PARA LA MEDIA (22)
Población normal con σ2 desconocida (7)
EJEMPLO 5: Hallar un intervalo del 95 % para µ si los datos son
X = 66,3 y S = 8,4 con n = 12
α t 0,975 ( 11 ) =2,20
α = 0,05 1 - = 0,975
2
 S 

P X−t α
S
< µ < X+t α =1− α
 1− n 1− n 
 2 2 
Aclaración: Cuando reemplazamos las variables del intervalo por valores
numéricos tomados de una muestra particular, el intervalo numérico NO debe tener
asociada ninguna probabilidad.

8,4 8,4
66,3 - 2,20 × ≤ µ ≤ 66,3 + 2,20 ×
12 12
61 ≤ µ ≤ 71,6
INTERVALO DE CONFIANZA PARA LA VARIANZA (1)
INTERVALO DE CONFIANZA PARA LA VARIANZA (2)
Si se toma una muestra de tamaño n de una población normal con
varianza σ2 , y se calcula la varianza muestral s2 se obtine el valor
del estadístico S2. Esta varianza muestral calculada se utiliza como
una estimación puntual insesgada de σ2 . Por lo que al estadístico
S2 se le denomina estimador de σ2 .
Puede establecerse una estimación del intervalo de σ2 a partir de la
utilización de la variable fundamental

(n −1)S2
χ2 = ~ χ(2n −1)
σ2
INTERVALO DE CONFIANZA PARA LA VARIANZA (3)
Cuando las muestras son seleccionadas de una población normal,
se puede escribir:
α/2
 
  1-α
P  χ 2α < χ 2 < χ 2 α  =1− α
 1− 
 2 2  χ 2
α χ 2
α X
1−
2 2

A partir de la variable fundamental y dada la confianza, podemos


hallar:

 2 ( n −1 ) S2 
P  χα < < χ α  = 1− α
2
 σ 2 1− 
 2 2
INTERVALO DE CONFIANZA PARA LA VARIANZA (4)
Al invertir cada término (con lo cuál cambia el sentido de las
desigualdades), se obtiene:

 
 1 σ2 1 
P 2 < <  = 1− α
 χ α (n −1)S2 χα2 
 1− 2 2

Luego, al multiplicar cada término de la desigualdad por (n – 1) S2,


se obtiene:
 
 (n −1) S2 ( n − 1) S2
P 2 < σ2 < 2
 = 1− α
 χ α χα 
 1− 2 2 
INTERVALO DE CONFIANZA PARA LA VARIANZA (5)

INTERVALO DE CONFIANZA PARA σ2

Si s2 es la varianza de una muestra aleatoria de tamaño n de una

población normal, un intervalo de confianza de (1 – α)100% para σ2


es:
INTERVALO DE CONFIANZA PARA LA VARIANZA (6)
EJEMPLO 6: Una prueba para determinar el consumo de gasolina
de cierto motor experimental dio los siguientes resultados, de 12
pruebas la S = 2.2 litros. Construir un intervalo del 95% para la
verdadera variabilidad del consumo de gasolina de este motor.
α χ 2
= 3. 82 χ 2
= 21.9
1 − = 0.975 0.025 (11) 0.975 (11)
2
 
 (n −1)S2 ( n − 1) S2
P < σ2 <  = 1− α
 χ 2 α χα2 
 1− 2 2 

11× 4.84 2 11× 4.84


≤σ ≤ 2.43 ≤ σ2 ≤ 13.93
21.9 3.82
INTERVALO DE CONFIANZA PARA PROPORCIONES (1)
Si se toma una muestra aleatoria de tamaño n de una población grande, y que X (≤ n) observaciones
de dicha muestra. Entonces  = / es un estimador puntual de la proporción de la población p.
Nótese que n y p son los parámetros de una distribución binomial. Se sabe que la distribución de
muestreo de  es aproximadamente normal con media p y varianza p(1-q)/n, si p no está muy
próximo a 0 o 1 y si n es relativamente grande. Por lo tanto, la distribución de
p̂ − P
z= ~ N ( 0 ,1 ) P(z1 < z < z 2 ) =1 − α
PQ n
 p̂ − P 
P −z α < <z α  =1− α
 1− PQ n 1− 
 2 2 
 P Q 
P  p̂ − z α
PQ
< P < p̂ + z α =1− α
 1− n 1− n 
 2 2 
 p̂ q̂ 
P  p̂ − z α
p̂ q̂
n ≥ 30 < P < p̂ + z α = 1− α
 1− n 1− n 
 2 2 
INTERVALO DE CONFIANZA PARA PROPORCIONES (2)
EJEMPLO: En una muestra aleatoria de 500 familias de cierta
ciudad que poseen televisores se observo que 340 poseían
receptores de color. Encontrar un intervalo de confianza del 95 %
para la proporción real de familias en dicha cuidad con receptores
de color.
p̂ = 340 500 = 0,68 z0.975 = 1.96

 p̂ q̂ 
P  p̂ − z α
p̂ q̂
< P < p̂ + z α = 1− α
 1− n 1− n 
 2 2 
0.68 × 0.32 0.68 × 0.32
0.68 - 1.96 ≤ P ≤ 0.68 + 1.96
500 500
0,64 < P < 0,72

También podría gustarte