Está en la página 1de 28

Unidad III (parte 1)

Inferencia Estadística: Estimación

Coordinación Análisis Estadístico para


Ingeniería 10115

Módulo Básico de Ingeniería

Departamento de Matemática y Ciencia de la Computación

Facultad de Ciencia

Primer semestre 2022

1
Índice Página
Vector Aleatorio de Dimensión n 3
Introducción a Inferencia Estadística 7
Distribuciones Muestrales 8
Estimación Puntual 9
Estimación por Intervalos 14
Intervalo de confianza para la media poblacional µ (σ2 conocido) 16
Determinación del tamaño de muestra 18
Intervalos de confianzas para parámetros más usuales 19
Aplicaciones de IC (Ejercicios) 20

2
Vector Aleatorio de Dimensión n

3
4
5
6
Introducción a Inferencia Estadística

7
Teorema Fundamental en Inferencia, es el Teorema del Límite Central (T.L.C.)

8
Estimación Puntual

9
Ejemplos de EMV
Sea (x1, x2, …, xn) ma(n) desde ~ N(µ , σ2); con media µ desconocida y varianza
σ2 desconocida.
(i) EMV(µ)
indep. n
L(μ) = f(x i ;μ)
i=1
2
1 xi - μ
n
1 -
2 σ
L(μ)= e Aplicamos ln
i=1 2 σ2
2
n
1 1 x i -μ
ln L(μ)= ln - Aplicamos derivada con respecto a µ
i=1 2πσ 2 2 σ

ln L(μ) n
x i -μ
= 0+
μ i=1 σ
ln L(μ) n
=0 ˆ
(x i -μ)=0
μ i=1
n
ˆ=0
x i - nμ ˆ=X
μ
i=1

(ii) EMV(σ2). Por comodidad vamos a denotar σ2 = θ


1
n
1 - ˆ2
(x i - μ)
L(θ)= e 2θ
i=1 2 θ
n
1 1
ln L(θ)= ln ln(θ1/2 ) ˆ 2 ya sabemos por (i) μ̂ = X
(x i -μ)
i 1 2 2θ
ln L(θ) n
1 1 n
θ+(xi -X)2
= 0- + 2 (x i - X)2 =
θ i=1 2θ 2θ i=1 2θ2
ln L(θ) n
ˆ (x -X)2 =0
=0 θ+ i
θ i=1
n

n
(x i -X)2
ˆ
nθ+ (x i -X)2 =0 θ̂= i=1
= Sn2
i=1 n
Observación:
2
El EMV(σ ) = S n es sesgado, es decir, E(Sn2 ) ≠ σ . Sn2 subestima a la verdadera varianza σ
2 2 2

n
(x i -X)2
2
El estadístico que se utiliza como estimador de σ es
2
Sn-1 = i=1
= S2 varianza muestral
n-1
corregida (se corrigió el sesgo)

10
Ejercicios
1. El ingeniero a cargo del control de calidad debe estimar la verdadera longitud (X)
media µ y la verdadera varianza σ2 de piezas fabricadas en un proceso. Se
midieron 36 piezas (seleccionadas al azar). Los resultados en milímetros se
muestran a continuación:
X= longitud de la pieza
32,0 32,5 32,0 31,3 32,5 31,5
31,8 31,6 32,1 31,0 32,4 32,0
31,8 32,4 32,0 31,8 33,0 32,0
31,8 32,3 32,5 32,2 31,9 31,8
32,1 31,6 32,1 32,2 31,8 32,5
32,4 31,3 32,0 32,2 31,6 32,1
Asuma que X ~ Normal, deetermine las estimaciones puntuales:
Estimaciones puntuales
n μ̂ = x 𝜎̂2 = s2
36

2. Sea (Y1, Y2, …, Yn) ma(n) desde ~ Bernoulli(p), p parámetro desconocido,


1, éxito
Donde cada Y= i
i= 1,2, …,n
0, fracaso
Determine el Estimador Máximo Verosímil de p

3. En el problema 1, las piezas se consideran aceptables deben cumplir:


31,1 < longitud < 32,5.

Determine la estimación MV de las piezas no aceptables.


1 ; X < 31,1 X > 32,5 (no aceptable)
Y=
i
i = 1,2, …, 36
0 ;3 1,1 X 32,5 (aceptable)
4. Una empresa que exporta salmón a Norteamérica, empaca el producto en bandejas de
dimensión estándar. El ingeniero a cargo de la producción necesita cuantificar la
productividad de las personas de empaque, para lo cual define como variable el número de
bandejas terminadas en una hora de trabajo. Al modelar el comportamiento de la variable, el
ingeniero propone la siguiente función de cuantía:

11
a) Si considera una muestra aleatoria X1 , X 2 ,...X n 
de la variable X ¿Cuál es el
X 8
estimador máximo verosímil del parámetro ? Resp.: EMV() =
3

b) Al supervisar la productividad de un operario, durante 40 períodos, de una hora


elegidos al azar, el resultado fue el siguiente:
X 8 9 10 11
ni 8 10 12 10
Determine la estimación máximo verosímil de (1-) sobre la base de esta muestra.
7
Resp.:
15
5. Sea (X1,X2,…X10) una m.a. (10) de X ~ N(;  ). Sean ̂1 y ̂ 2 dos estimadores de , tal que
2

X  X10 X  2X 5  X10
ˆ 1  1 ˆ 2  1
2 4
Analice insesgamiento de ̂1 y ̂ 2 e indique cual de los estimadores es mejor. Justifique su
respuesta.
6. El tiempo (X), en minutos, que demora de una determinada tarea, dentro de un proceso
industrial, es una variable aleatoria con función de densidad:

a) Determinar el estimador máximo verosímil del parámetro θ para una muestra aleatoria
de tamaño n de la variable aleatoria X donde θ es desconocido.
X
Resp.: EMV(θ) =
2
b) Mediante un muestreo aleatorio simple se eligieron 15 tareas y se registró el tiempo que
demoraron en minutos, obteniéndose:
5,56 2,23 0,58 1,37 0,21 1,98 2,44 2,71
10,12 4,69 3,47 1,73 3,51 1,19 0,97
Calcular la estimación máximo verosímil del tiempo medio de duración de estas tareas.
Resp.: 2,8507 minutos

12
7. Se sabe que la duración en años de un soporte para fijación de una herramienta de corte, es una
variable aleatoria con función de densidad:

𝜃
(1+𝑥 )𝜃+1
𝑠𝑖 0 < 𝑥 < 1 ; 𝜃 > 1
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Para una muestra aleatoria de 10 herramientas con ese tipo de soporte, se obtuvo la siguiente
información:
0,97 0,46 0,16 0,60 0,47 1,80 0,13 0,17 1,78 0,22

1
Determine la estimación máximo verosímil de μX = (duración media)
θ-1
8. En un proceso de manufactura de cierto artículo, se está planificando el siguiente control de calidad:
Cada día se selecciona al azar y en forma independiente una muestra de 5 artículos de la producción,
para determinar la proporción p diaria de artículos que necesitan reparación.
a) Basándose en una muestra aleatoria de tamaño n, determine el Estimador Máximo
Verosímil del parámetro p del modelo probabilístico implícito en el enunciado. Analice si
es un estimador insesgado para el parámetro p y determine su varianza.
X pq
Resp.: p̂MV = ˆMV ) = p
E(p ˆMV ) =
v(p
5 5n

b) Se observaron 200 días con los resultados siguientes

Número de artículos que


necesitan reparación n° de días
(X)
0 56
1 82
2 44
3 12
4 4
5 2
Total 200

Calcule e interprete la estimación Máximo Verosímil de p Resp.: p̂MV = 0,232

13
Estimación por intervalos

Los modelos probabilísticos como la distribución Normal, distribución


Bernoulli, u otros representan simbólicamente a una población. Estos
modelos están identificados por parámetros (constantes) que usualmente
son desconocidos. El problema que estudiamos en estimación puntual es:
como estimar los parámetros desconocidos poblacionales a partir de los
datos muestrales.

Por otra parte, la estimación puntual de un parámetro desconocido θ no


toma en cuenta la variabilidad inherente al hecho de que la estadística que
se utiliza como estimador del parámetro es una variable aleatoria y por lo
tanto hay una dispersión inevitable que hay que incorporar a la estimación,
es decir, se le debe dar calidad a la estimación indicando un intervalo de
la forma K1 < θ < K2 que permita precisar la incertidumbre existente en
la estimación. Los valores K1 y K2 se determinan a partir de los datos
muestrales.

En general, para construir un estimador por intervalo para el parámetro


desconocido θ, se obtienen los estadísticos K1 y K2 tales que:

P(K1 < θ < K2) = 1 - α

El intervalo resultantes es K1 < θ < K2, se denomina Intervalo de Confianza


con un nivel o coeficiente de confianza (1- α) para el parámetro desconocido θ,
se acostumbra a denotarlo como IC(1-α)(θ) =[k1 , k2]
Los límites k1 y k2 dependen de los datos de la muestra y se calculan de
manera tal que si se construyen muchos intervalos, cada uno con distinta
muestra de tamaño n, de la población de interés, el 100(1 – α)% de ellos

14
contendrán al verdadero valor del parámetro. Por ejemplo, un IC95%(µ),
tiene la propiedad de que el 95% de los intervalos construidos contienen el
verdadero valor de la media µ poblacional
Fijado (1- α) (usualmente entre 0,90 y 0,99) los límites k1 y k2 se
determinan a través de los estadísticos o distribuciones muestrales
ˆ
g(θ,θ) vistas anteriormente tal que:

ˆ
P(a < g(θ,θ) < b) = 1 – α

Despejando el parámetro θ, se obtiene

P(k1 < θ < k2) = 1 – α

límite límite
inferior superior

Intervalo de confianza para la media poblacional µ (IC(µ))


(Población Normal, varianza σ2 conocida)

Sea (X1, X2, …,Xn) una muestra aleatoria simple de la población con
media µ y varianza σ2 conocida.

Ya sabemos que el estimador puntal de µ es el promedio de la muestra X


X-μ
y Z= es su distribución muestral estandarizada N(0, 1). Por lo tanto,
σ n

esta variable Z permite construir un intervalo de confianza.

15
Gráficamente

z1 /2 valor de la normal estándar (percentil)

X-μ
P -z1-α/2 z1-α/2 = 1 - α , se obtiene:
σ n

σ σ
P -z1-α/2· X-μ z1-α/2· =1-α
n n

Despejando µ, resulta:

σ σ
P X - z1-α/2· μ X + z1-α/2· =1-α
n n

σ
IC(µ) : x z1-α/2· con (1-α)100% de confianza.
n

σ
Observación: ≡ error típico o error estándar ≡ variabilidad de los promedios muestrales.
n

16
Ejemplo: Los siguientes datos corresponden al peso en gramos de 10 artículos
de cierto tipo, seleccionados aleatoriamente:

521, 742, 593, 635, 788, 717, 606, 639, 666, 624.

Se sabe que el peso es una variable aleatoria distribuida Normal con desviación
estándar σ = 80 grs., estime con 95% de confianza el verdadero peso medio.

1 – α = 0,95 α = 0,05 α/2 = 0,025 1 – α/2 = 0,975

z1 /2 x σ
n Percentil 97,5 en Z (media de la muestra) (Des. Estándar poblacional)

10 1,96 653,1 80
80
IC(µ) = 653,1 + 1,96·
10

= 653,1 + 49,5842

IC(µ) = [603,5158 ; 702,6842] con 95% de confianza. (603,52 < µ < 702,68)

COMPLETE LA TABLA SIGUIENTE (realice comentarios)


Nivel de confianza
1-α
z1 / 2 z1-α/2·σ n IC(µ)

0,90
Z0,95 = 1,6449

0,95 z0,975 = 1,9600 49,5842 [603,5158 ; 702,6842]

0,99

σ
La exactitud o precisión de la estimación por intervalo es E = z1-α/2·
n
también se llamada máximo error de la estimación.
17
La expresión:

σ σ σ
P -z1-α/2· X-μ z1-α/2· =1-α o P |X - μ| z1-α/2· =1-α
n n n

Significa que al emplear la media de la muestra x para estimar µ, el error


σ
|X - μ| es a lo más z1-α/2· con 100(1-α)% de confianza.
n

σ
Observación: La amplitud del intervalo de confianza es 2 z1-α/2· = 2E
n

Determinación del tamaño de muestra (muestreo aleatorio simple)

Para determinar el tamaño de muestra n, con el objeto de estimar la media


σ
poblacional µ, con (1 – α) de nivel de confianza y con error E = z1-α/2·
n
especificado, la formula apropiada es:

2
z1-α/2·σ
n (tamaño de muestra mínimo)
E

Ejemplo de tamaño de muestra:


La duración de un cierto componente sigue una distribución normal de media μ
desconocida y desviación estándar σ = 100 horas. Se desea enviar una muestra
de dichos componentes al laboratorio para que realicen pruebas y estimen la
duración media. Se quiere que la duración media muestral no difiera de μ en más
de 50 horas (E = 50), con un nivel de confianza 1 – α = 0,95.

Determine el tamaño de la muestra para realizar la estimación

18
Intervalos de confianzas para estimar parámetros más usuales

(media, varianza y proporción)

Estimador
Situación Parámetro Distribución Muestral
puntual IC
m.a. (n) de una
población X x -μ σ
μ Z  N(0 , 1) x z1-α/2·
N(µ, σ2) ; σ/ n n
σ2 conocido
(n 1)S2 2
m.a.(n) de una   (n-1)
población σ2 S2 σ2 (n-1)s2 (n-1)s2
,
N(µ, σ2) (corregido) es una distribución 2 2
aproximada de S
2 (n-1;1-α/2) (n-1;α/2)

x -μ
m.a.(n) de una T  t(n - 1)
población S/ n  s 
N(µ, σ2) ;
μ  x  t (n-1;1-α/2) · n 
2
X
Simétrica respecto a la
 
σ desconocido
media “0”
m.a. (n) de una
población
Bernoulli
 1 ; Éxito p̂ - p
xi =  Z  N(0 , 1); ˆˆ
0 ;Fracaso pq pq
p p̂ z1-α/2·
i = 1,2, .. ,n p̂ n n
µ= p y cuando n es grande
σ2 = pq

Tamaño (mínimo) de muestra aleatoria Tamaño (mínimo) de muestra


simple. aleatoria simple.
Población Normal Población Bernoulli

2 2
z1-α/2·σ  z · pq 
n n   1-α/2
 
E  E 

19
Aplicaciones de IC (ejercicios)

1. En un proyecto de construcción, se midió la resistencia (X) al esfuerzo


cortante de 50 probetas del terreno, algunos resultados se presentan a
continuación:
X = resistencia al esfuerzo cortante de una probeta (lb)

n x (s)2
50 3265 (466,0954)2

Asumiendo Normalidad en la resistencia al esfuerzo cortante:

1.1. Estime 2 con 95% de confianza.


1.2. Estime, con 95% de confianza, la verdadera resistencia media µ del
esfuerzo cortante.

20
2. En una m.a. de 100 resistores que fabricó cierta industria, se encuentra que
12 no cumplen con las especificaciones de tolerancia.

2.1. Determinar un intervalo de confianza de 95% para la proporción verdadera


de resistores que no cumplen con las especificaciones de tolerancia.

1 ; el resistor no cumple con las especificaciones


xi = 
0 ;el resistor cumple con las especificaciones

ˆˆ
pq
n p̂ q̂ z1-α/2 n IC(p)

2.2. Se desea estimar la proporción verdadera que no cumple con las


especificaciones de tolerancia, con una amplitud de 0,08 (amplitud = 2E) y
un coeficiente de confianza de 0,95. ¿Cuántos resistores se deben
seleccionar? (utilice p = 0,15)

3. Se estimó la varianza del trabajo (X) en horas semanales, de todos los


ingenieros que trabajan en una fábrica, para ello se utilizó una m.a. de 21
ingenieros obteniendo:
s = 7 horas, IC( σ 2 ) = [31.20 , 90.32]

Asumiendo que X se distribuye Normal, determine el nivel de confianza


utilizado en la estimación de la varianza.

21
4. Los valores obtenidos de las longitudes en micras de 30 filamentos,
seleccionados aleatoriamente de la producción de una máquina, son los
siguientes:

102 98 93 100 98 105


115 130 100 86 95 103
116 118 89 102 128 101
112 114 106 114 100 116
120 106 110 100 106 117

4.1. Determine IC(2). Con 1 -  = 0.90.


4.2. Estimar la longitud media de los filamentos de la producción de la
máquina con un 90% de confianza. ¿ = 100? Justifique.
4.3. Estime la proporción de filamentos con longitud inferior a 100 micras,
producidos por la máquina.

22
5. Una máquina produce las varillas de metal utilizadas en el sistema de
suspensión de un automóvil. Se toma una muestra aleatoria de n = 15 varillas.
Se mide el diámetro (X), se obtiene la siguiente información:

X = Diámetro, en mm., de la varilla.

x = 8,234 mm s = 0,025298 mm

IC() = [8,2200 ; 8,2480]

Determine el nivel de confianza (1- α) que se utilizó para la estimación del


diámetro promedio de la varilla (asuma que X se distribuye Normal)

23
6. Una conocida fábrica de muebles desea conocer la resistencia de las repisas
de los modelos de estanterías que venden. Para ello, realizaron un
experimento que consistió en tomar 25 repisas e ir añadiendo peso en ellas
hasta que se rompan, anotando el peso (X) que han soportado (en kg). Se
obtuvo el siguiente resumen estadístico con los datos recogidos:

X = peso máximo soportado por la repisa, en kg.


n promedio Desv. estándar
25 35,7 kg 4,2 kg
Suponiendo normalidad en la variable de estudio:

6.1. Estime con 95% de confianza la media real del peso máximo soportado por
las repisas. ¿Aconsejaría a la fábrica de muebles que en las
especificaciones de la estantería pusieran que la carga máxima que soporta
la repisa es de 38 kg?. Justifique su respuesta.
6.2. Estime con 95% de confianza, la varianza del peso máximo soportado por la
repisa.

7. Se quiere medir la velocidad de un nuevo modelo de procesador, para ello


se va a ejecutar un programa de simulación en “n” computadores, con dicho
modelo incorporado. Suponiendo que la variable aleatoria X, tiempo (um) de
ejecución, es normal, con varianza 9 (um)2.. Determine el tamaño de muestra
necesario, para estimar el tiempo medio de ejecución del programa de
simulación con 95% de confianza y precisión de 1um.

24
8. Con el objeto de estimar los parámetros de la resistencia (X) a la compresión de cierto tipo
de vigas de acero, se analizó una muestra aleatoria de 50 vigas. Alguna información de las
mediciones realizadas se presentan a continuación:

Asumiendo que se cumplen los supuestos necesarios, estime con 95% de confianza:

a) La varianza de la resistencia a la compresión.


b) La proporción de vigas con resistencia a la compresión de por lo menos 4150 g/cm2.
c) La resistencia a la compresión promedio.

d) ¿Son suficientes 50 vigas para cometer un error inferior o igual a 12 kg/cm2 en


la estimación de la resistencia promedio a la compresión? Justifique con 95%
de confianza.

25
9. Las concentraciones (X) de contaminantes atmosféricos, como monóxido de
carbono (CO), se pueden medir con un espectrómetro. Tres laboratorios que tiene
contaminantes con una concentración de monóxido de carbono de 75 ppm
realizaron mediciones con el instrumento, los datos obtenidos se presentan a
continuación:

Laboratorio 1

73,6 76,0 73,2 74,5 74,2 76,0 80,3 70,9 70,0 75,2

73,6 76,6 73,9 73,1 75,9 78,8 77,8 78,2 76,0 72,3

77,8 76,6 70,5 73,8 78,1 75,4 76,1 77,5 73,4 75,7

80,5 76,6 74,3 74,5 77,1 76,8 71,3 72,0 77,5 82,1

Laboratorio 2
30 30
xi 2241,84 xi2 167946,9876
i=1 i=1

Laboratorio 3
CO ppm 71,0 – 73,5 73,5 – 76,0 76,0 – 78,5 78,5 – 81,0 81,0 – 83,5
ni 7 10 16 11 6

Asumiendo que se cumplen los supuestos necesarios.

a) Estime, con 99% de confianza, la varianza de la concentración de CO, utilice


los datos entregadas por el Laboratorio 1.

b) Estime, con 90% de confianza la concentración media de CO, con las


mediciones entregadas por el Laboratorio 2. ¿Puede suponerse µ = 75, en
base al intervalo calculado anteriormete?

c) Con 95% de confianza, estime la proporción de mediciones de CO que


sobrepasa los 75 ppm de CO, utilice los datos entregados por el laboratorio 3.

26
10. El óxido de azufre es un gas que tiene efectos nocivos en la salud humana,
vegetal y en otros materiales, éste se produce por combustión de carbón y
petróleo y por la metalurgia. En una estación de monitoreo de un Complejo
Metalúrgico se realizaron mediciones diarias del óxido de azufre (μg/m 2), que
emanan de los procesos. La norma indica que la cantidad máxima de óxido de
azufre permitida es 300 (μg/m2). Al tomar una muestra de 80 de dichas
mediciones, se obtuvo:

X: Cantidad de óxido
de azufre (μg/m2) N° de días
180 - 230 7
230 - 280 14
280 - 330 32
330 - 380 19
380 - 430 8

Asumiendo válidos los supuestos necesarios:

a) Estime con 90% de confianza, la proporción de días, en que la cantidad de


óxido de azufre detectada en el complejo metalúrgico supera el límite permitido

b) Se estimó a través de un intervalo de confianza la varianza de la cantidad de


óxido de azufre, obteniendo IC(σ2) = [2124,794079 ; 4258,784877].
Determine el nivel de confianza utilizado en la estimación de la varianza.

c) Se debe realizar otro estudio en el Complejo Metalúrgico con el objeto de


estimar con 95% de confianza, la cantidad promedio de óxido de azufre que se
emanan. Cuántas mediciones se deben hacer si se quiere cometer un error de
estimación de a lo más 8 μg/m2. Utilice la varianza de la distribución de
frecuencias como aproximación de la varianza poblacional.

27
11. (Evaluación 2 -2021-2) En la producción de cierto artículo fabricado por una industria
tecnológica, el número (X) de unidades terminadas con fallas, en cada turno de 8 horas,
es una variable aleatoria con la siguiente función de probabilidad, donde el parámetro α es
desconocido:

𝑒 −𝛼 𝛼 𝑥
f(x,α) = 𝑥!
; x = 0, 1, 2, 3, 4, 5, ….∞; 𝛼 > 0;

E(X) = 𝛼, E(X2) = 𝛼 2 + 𝛼

a) Se proponen los estimadores 𝛼 ̂1 y 𝛼


̂2 para el parámetro α, basados en una
muestra aleatoria de tamaño n, tal que:
𝑋1 + 𝑋2 +𝑋𝑛 𝑋1 +2𝑋2 −𝑋𝑛
𝛼
̂1 = 3
𝛼
̂2 = 2

Analice cuál de los dos estimadores es más eficiente, es decir, el estimador insesgado
de menor varianza.

b) Determine el estimador máximo verosímil del parámetro α, para una muestra


aleatoria de tamaño n de la variable aleatoria X.

c) De los registros de la industria se determinó una muestra aleatoria de 100 turnos, todos
de 8 hrs., se obtuvo la siguiente información respecto del Número de unidades con
falla:

N° de unidades
0 1 2 3 4 5 6 7 8 9 10 11 12
con falla
Cantidad de
1 3 8 13 17 18 15 10 7 4 2 1 1
turnos

Estime, con 90% de confianza, la proporción de turnos con al menos siete unidades con
falla.

28

También podría gustarte