Documentos de Académico
Documentos de Profesional
Documentos de Cultura
- CURSO 2022 -
INTRODUCCIÓN (1)
La inferencia estadística se ocupa de tomar decisiones o
predicciones acerca de parámetros, es decir, las medidas
numéricas descriptivas que caracterizan a una población.
Tres parámetros que abordamos en las unidades anteriores son la
media poblacional µ, la desviación poblacional estándar σ y la
proporción binomial p.
En inferencia estadística, un problema práctico se expone en el
marco de una población con un parámetro específico de interés.
Por ejemplo, el metalurgista podría medir el promedio de
coeficientes de expansión de dos tipos de acero y luego comparar
sus valores.
INTRODUCCIÓN (2)
Los métodos para hacer inferencias acerca de parámetros
poblacionales están clasificados en dos categorías:
Estimación: estimar o predecir el valor del parámetro
Prueba de hipótesis: tomar una decisión acerca del valor de un
parámetro, con base en alguna idea preconcebida acerca de
cuál podría ser su valor
Definición:
Un estimador es una regla, generalmente expresada como
fórmula, que nos dice cómo calcular una estimación basada
en la información de la muestra.
INTRODUCCIÓN (4)
Los estimadores se usan en dos formas diferentes:
• Estimación puntual: Con base en datos muestrales, se calcula
un solo número para estimar el parámetro. La regla o fórmula que
describe este cálculo se denomina estimador puntual y el
número resultante recibe el nombre de estimación puntual.
• Estimación de intervalo: Con base en datos muestrales, dos
números se calculan para formar un intervalo dentro del cual se
espera esté el parámetro. La regla o fórmula que describe este
cálculo se denomina estimador de intervalo y el par de números
resultantes se llama estimación de intervalo o intervalo de
confianza.
ESTIMACIÓN PUNTUAL
INTRODUCCIÓN (1)
En una situación práctica, puede haber varios estadísticos que
podrían usarse como estimadores puntuales para un parámetro.
Para determinar cuál de las opciones es mejor, se necesita saber
cómo se comporta el estimador en un muestreo repetido, descrito
por su distribución muestral.
Analogía
Definición:
Se dice que un estimador de un parámetro es insesgado si la
media de su distribución es igual al verdadero valor del parámetro.
De otro modo, se dice que el estimador está sesgado.
PROPIEDADES DE UN BUEN ESTIMADOR (2)
PROPIEDADES DE UN BUEN ESTIMADOR (3)
2) VARIANZA MÍNIMA:
La segunda característica deseable de un estimador es que la
dispersión (medida por la varianza) de la distribución
muestral debe ser tan pequeña como sea posible.
Sesgado
Insesgado
Varianza mínima
ESTIMADORES MÁS UTILIZADOS
(Valor numérico)
ESTIMACIÓN POR
INTERVALOS DE CONFIANZA
INTRODUCCIÓN (2)
Ejemplo 2:
Suponga que se hace gran número de mediciones independientes,
todas mediante el mismo procedimiento, del diámetro de un pistón.
La media muestral de las mediciones es 14,0 cm, y la incertidumbre
en esta cantidad, que representa la desviación estándar de la
media muestral, es 0,1 cm. Suponga que las mediciones no están
sesgadas. El valor 14,0 proviene de una distribución normal, ya que
es el promedio de un gran número de mediciones. Ahora el diámetro
verdadero del pistón no será exactamente igual a la media muestral
de 14,0 cm. Sin embargo, dado que ésta proviene de una
distribución normal, se puede utilizar dicha desviación estándar para
determinar qué tan cerca está probablemente del diámetro
verdadero.
INTRODUCCIÓN (3)
Ejemplo 2 – cont.:
Pueden plantearse dos situaciones, a saber:
• Es muy improbable que la media muestral sea diferente del
diámetro verdadero en más de tres desviaciones estándares. Por
tanto, se tiene una enorme confianza de que el diámetro
verdadero esté en el intervalo (13,7 ; 14,3).
• Es menos probable que la media muestral difiera del valor
verdadero en más de una desviación estándar. Por tanto, se tiene
que existe poca certeza de que el diámetro verdadero se
encuentre en dicha cercanía (13,9 ; 14,1).
EJEMPLO: Sea X ~ N (µ
µ, σ2) donde σ2 es conocida. Hallar la
variable fundamental para µ.
2 1 3
X− E[ X ] X− µ
Z= = ~ N (0, 1 )
V[ X ] σ n
Conocidos
INTERVALOS DE CONFIANZA
PARA UNA POBLACIÓN
INTERVALO DE CONFIANZA PARA LA MEDIA (1)
Población normal con σ2 conocida (1)
INTERVALO DE CONFIANZA PARA LA MEDIA (2)
Población normal con σ2 conocida (2)
La media muestral x es el mejor estimador puntual de la población por:
INTERVALO DE CONFIANZA PARA LA MEDIA (3)
Población normal con σ2 conocida (3)
Ejemplo 3:
Un ingeniero que supervisa el control de calidad quiere calcular la
media del peso de cajas que se han llenado con cereal mediante una
máquina específica, durante cierto día. Para ello, toma una muestra
aleatoria de 100 cajas que se han llenado con esa máquina, en ese
día. Calcula que la media muestral del peso de llenado es x = 12,05
kg y la desviación estándar s = 0,1 kg.
Debido a que la media poblacional no será exactamente igual a la
media muestral de 12,05; es mejor construir un intervalo de
confianza alrededor de 12,05 que quizá contenga a aquélla.
Luego es posible cuantificar el nivel de confianza de que la media
poblacional esté realmente contenida por el intervalo.
INTERVALO DE CONFIANZA PARA LA MEDIA (3)
Población normal con σ2 conocida (3)
Ejemplo 3 – cont.:
Con el propósito de ver cómo construir un intervalo de confianza en
este ejemplo, sea µ la media poblacional desconocida y la
varianza respectiva.
Sean , . . . , los 100 pesos del llenado de las cajas
muestreadas. El valor observado de la media muestral es x = 12,05.
Ya que X es la media de una muestra grande, el teorema del límite
central garantiza que proviene de una distribución normal cuya
media es µ y cuya desviación estándar es σx = σ⁄ n.
INTERVALO DE CONFIANZA PARA LA MEDIA (4)
Población normal con σ2 conocida (4)
Ejemplo 3 – cont.:
La figura 1 muestra una curva normal, que representa la distribución de X. Aquí
se indica que 95% intermedio de la curva se extiende una distancia 1.96 σx a
cada lado de la media poblacional.
El valor observado X = 12,5
constituye una sola muestra de
esta distribución. No se tiene
manera alguna de saber de qué
parte de la curva fue extraído
este valor especial de X
1−α
X− µ
Z= ~ N (0, 1 )
σ n
α/2 α/2
z1 0 z
2
El mejor intervalo de confianza es el que tiene menor
longitud. Cuando la distribución es simétrica, se
demuestra que éste es también simétrico, por lo tanto
dada la confianza “1 – α” podemos hallar dos valores de
z tal que P (z1 < z < z2) = 1 – α
*La longitud L = z2 - z1 es mínima cuando z1 = – z2
INTERVALO DE CONFIANZA PARA LA MEDIA (10)
Población normal con σ2 conocida (10)
INTERVALO DE CONFIANZA PARA LA MEDIA (11)
Población normal con σ2 conocida (11)
P ( − z1 < z < z1 ) = 1 − α
−µ 1−α
P −z α < < z α =1− α
X α/2 α/2
1− σ n 1− -z z1
2 2 1
σ σ
P X − z α <µ< X + z α =1− α
1− n 1− n
2 2
Aclaración:
Aclaración Cuando reemplazamos las variables del intervalo por
valores numéricos tomados de una muestra particular, el
intervalo numérico NO debe tener asociada ninguna probabilidad.
INTERVALO DE CONFIANZA PARA LA MEDIA (12)
Población normal con σ2 conocida (12)
INTERVALO DE CONFIANZA PARA µ ; con σ conocido.
Si x es la media de una muestra aleatoria de tamaño n de una
población normal con varianza conocida σ2 , el intervalo de
confianza de (1 – α) 100% para µ es
o
σ
µ = x ± z α
1− n
2
INTERVALO DE CONFIANZA PARA LA MEDIA (13)
Población normal con σ2 conocida (13)
Se ha visto que el intervalo de confianza de µ , con σ conocido, lo
podemos escribir
σ
µ = x ± z α
1− n
2
P ( t1 < t < t2 ) = 1 - α
α/2 α/2
t1 0 t
2
P X − t α =1− α
S S
< µ < X+t α
1− n 1− n
2 2
INTERVALO DE CONFIANZA PARA LA MEDIA (20)
Población normal con σ2 desconocida (5)
INTERVALO DE CONFIANZA PARA µ ; con σ desconocido.
Si x y s son la media y la desviación estándar, respectivamente, de
una muestra aleatoria de tamaño n de una población normal con
varianza desconocida σ2 , el intervalo de confianza de (1 – α)100%
para µ es
o s
µ= x ±t α
1− n
2
INTERVALO DE CONFIANZA PARA LA MEDIA (21)
Población normal con σ2 desconocida (6)
Se ha visto que el intervalo de confianza de µ , con σ desconocido,
lo podemos escribir
s
µ = x ±t α
1− n
2
El error (E) en la estimación de µ es
y
s
L = 2E = 2t α
1− n
2
INTERVALO DE CONFIANZA PARA LA MEDIA (22)
Población normal con σ2 desconocida (7)
EJEMPLO 5: Hallar un intervalo del 95 % para µ si los datos son
X = 66,3 y S = 8,4 con n = 12
α t 0,975 ( 11 ) =2,20
α = 0,05 1 - = 0,975
2
S
P X−t α
S
< µ < X+t α =1− α
1− n 1− n
2 2
Aclaración: Cuando reemplazamos las variables del intervalo por valores
numéricos tomados de una muestra particular, el intervalo numérico NO debe tener
asociada ninguna probabilidad.
8,4 8,4
66,3 - 2,20 × ≤ µ ≤ 66,3 + 2,20 ×
12 12
61 ≤ µ ≤ 71,6
INTERVALO DE CONFIANZA PARA LA VARIANZA (1)
INTERVALO DE CONFIANZA PARA LA VARIANZA (2)
Si se toma una muestra de tamaño n de una población normal con
varianza σ2 , y se calcula la varianza muestral s2 se obtine el valor
del estadístico S2. Esta varianza muestral calculada se utiliza como
una estimación puntual insesgada de σ2 . Por lo que al estadístico
S2 se le denomina estimador de σ2 .
Puede establecerse una estimación del intervalo de σ2 a partir de la
utilización de la variable fundamental
(n −1)S2
χ2 = ~ χ(2n −1)
σ2
INTERVALO DE CONFIANZA PARA LA VARIANZA (3)
Cuando las muestras son seleccionadas de una población normal,
se puede escribir:
α/2
1-α
P χ 2α < χ 2 < χ 2 α =1− α
1−
2 2 χ 2
α χ 2
α X
1−
2 2
2 ( n −1 ) S2
P χα < < χ α = 1− α
2
σ 2 1−
2 2
INTERVALO DE CONFIANZA PARA LA VARIANZA (4)
Al invertir cada término (con lo cuál cambia el sentido de las
desigualdades), se obtiene:
1 σ2 1
P 2 < < = 1− α
χ α (n −1)S2 χα2
1− 2 2
p̂ q̂
P p̂ − z α
p̂ q̂
< P < p̂ + z α = 1− α
1− n 1− n
2 2
0.68 × 0.32 0.68 × 0.32
0.68 - 1.96 ≤ P ≤ 0.68 + 1.96
500 500
0,64 < P < 0,72