Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Facultad de Ciencia
1
Índice Página
Vector Aleatorio de Dimensión n 3
Introducción a Inferencia Estadística 7
Distribuciones Muestrales 8
Estimación Puntual 9
Estimación por Intervalos 14
Intervalo de confianza para la media poblacional µ (σ2 conocido) 16
Determinación del tamaño de muestra 18
Intervalos de confianzas para parámetros más usuales 19
Aplicaciones de IC (Ejercicios) 20
2
Vector Aleatorio de Dimensión n
3
4
5
6
Introducción a Inferencia Estadística
7
Teorema Fundamental en Inferencia, es el Teorema del Límite Central (T.L.C.)
8
Estimación Puntual
9
Ejemplos de EMV
Sea (x1, x2, …, xn) ma(n) desde ~ N(µ , σ2); con media µ desconocida y varianza
σ2 desconocida.
(i) EMV(µ)
indep. n
L(μ) = f(x i ;μ)
i=1
2
1 xi - μ
n
1 -
2 σ
L(μ)= e Aplicamos ln
i=1 2 σ2
2
n
1 1 x i -μ
ln L(μ)= ln - Aplicamos derivada con respecto a µ
i=1 2πσ 2 2 σ
ln L(μ) n
x i -μ
= 0+
μ i=1 σ
ln L(μ) n
=0 ˆ
(x i -μ)=0
μ i=1
n
ˆ=0
x i - nμ ˆ=X
μ
i=1
n
(x i -X)2
ˆ
nθ+ (x i -X)2 =0 θ̂= i=1
= Sn2
i=1 n
Observación:
2
El EMV(σ ) = S n es sesgado, es decir, E(Sn2 ) ≠ σ . Sn2 subestima a la verdadera varianza σ
2 2 2
n
(x i -X)2
2
El estadístico que se utiliza como estimador de σ es
2
Sn-1 = i=1
= S2 varianza muestral
n-1
corregida (se corrigió el sesgo)
10
Ejercicios
1. El ingeniero a cargo del control de calidad debe estimar la verdadera longitud (X)
media µ y la verdadera varianza σ2 de piezas fabricadas en un proceso. Se
midieron 36 piezas (seleccionadas al azar). Los resultados en milímetros se
muestran a continuación:
X= longitud de la pieza
32,0 32,5 32,0 31,3 32,5 31,5
31,8 31,6 32,1 31,0 32,4 32,0
31,8 32,4 32,0 31,8 33,0 32,0
31,8 32,3 32,5 32,2 31,9 31,8
32,1 31,6 32,1 32,2 31,8 32,5
32,4 31,3 32,0 32,2 31,6 32,1
Asuma que X ~ Normal, deetermine las estimaciones puntuales:
Estimaciones puntuales
n μ̂ = x 𝜎̂2 = s2
36
11
a) Si considera una muestra aleatoria X1 , X 2 ,...X n
de la variable X ¿Cuál es el
X 8
estimador máximo verosímil del parámetro ? Resp.: EMV() =
3
X X10 X 2X 5 X10
ˆ 1 1 ˆ 2 1
2 4
Analice insesgamiento de ̂1 y ̂ 2 e indique cual de los estimadores es mejor. Justifique su
respuesta.
6. El tiempo (X), en minutos, que demora de una determinada tarea, dentro de un proceso
industrial, es una variable aleatoria con función de densidad:
a) Determinar el estimador máximo verosímil del parámetro θ para una muestra aleatoria
de tamaño n de la variable aleatoria X donde θ es desconocido.
X
Resp.: EMV(θ) =
2
b) Mediante un muestreo aleatorio simple se eligieron 15 tareas y se registró el tiempo que
demoraron en minutos, obteniéndose:
5,56 2,23 0,58 1,37 0,21 1,98 2,44 2,71
10,12 4,69 3,47 1,73 3,51 1,19 0,97
Calcular la estimación máximo verosímil del tiempo medio de duración de estas tareas.
Resp.: 2,8507 minutos
12
7. Se sabe que la duración en años de un soporte para fijación de una herramienta de corte, es una
variable aleatoria con función de densidad:
𝜃
(1+𝑥 )𝜃+1
𝑠𝑖 0 < 𝑥 < 1 ; 𝜃 > 1
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Para una muestra aleatoria de 10 herramientas con ese tipo de soporte, se obtuvo la siguiente
información:
0,97 0,46 0,16 0,60 0,47 1,80 0,13 0,17 1,78 0,22
1
Determine la estimación máximo verosímil de μX = (duración media)
θ-1
8. En un proceso de manufactura de cierto artículo, se está planificando el siguiente control de calidad:
Cada día se selecciona al azar y en forma independiente una muestra de 5 artículos de la producción,
para determinar la proporción p diaria de artículos que necesitan reparación.
a) Basándose en una muestra aleatoria de tamaño n, determine el Estimador Máximo
Verosímil del parámetro p del modelo probabilístico implícito en el enunciado. Analice si
es un estimador insesgado para el parámetro p y determine su varianza.
X pq
Resp.: p̂MV = ˆMV ) = p
E(p ˆMV ) =
v(p
5 5n
13
Estimación por intervalos
14
contendrán al verdadero valor del parámetro. Por ejemplo, un IC95%(µ),
tiene la propiedad de que el 95% de los intervalos construidos contienen el
verdadero valor de la media µ poblacional
Fijado (1- α) (usualmente entre 0,90 y 0,99) los límites k1 y k2 se
determinan a través de los estadísticos o distribuciones muestrales
ˆ
g(θ,θ) vistas anteriormente tal que:
ˆ
P(a < g(θ,θ) < b) = 1 – α
límite límite
inferior superior
Sea (X1, X2, …,Xn) una muestra aleatoria simple de la población con
media µ y varianza σ2 conocida.
15
Gráficamente
X-μ
P -z1-α/2 z1-α/2 = 1 - α , se obtiene:
σ n
σ σ
P -z1-α/2· X-μ z1-α/2· =1-α
n n
Despejando µ, resulta:
σ σ
P X - z1-α/2· μ X + z1-α/2· =1-α
n n
σ
IC(µ) : x z1-α/2· con (1-α)100% de confianza.
n
σ
Observación: ≡ error típico o error estándar ≡ variabilidad de los promedios muestrales.
n
16
Ejemplo: Los siguientes datos corresponden al peso en gramos de 10 artículos
de cierto tipo, seleccionados aleatoriamente:
521, 742, 593, 635, 788, 717, 606, 639, 666, 624.
Se sabe que el peso es una variable aleatoria distribuida Normal con desviación
estándar σ = 80 grs., estime con 95% de confianza el verdadero peso medio.
z1 /2 x σ
n Percentil 97,5 en Z (media de la muestra) (Des. Estándar poblacional)
10 1,96 653,1 80
80
IC(µ) = 653,1 + 1,96·
10
= 653,1 + 49,5842
IC(µ) = [603,5158 ; 702,6842] con 95% de confianza. (603,52 < µ < 702,68)
0,90
Z0,95 = 1,6449
0,99
σ
La exactitud o precisión de la estimación por intervalo es E = z1-α/2·
n
también se llamada máximo error de la estimación.
17
La expresión:
σ σ σ
P -z1-α/2· X-μ z1-α/2· =1-α o P |X - μ| z1-α/2· =1-α
n n n
σ
Observación: La amplitud del intervalo de confianza es 2 z1-α/2· = 2E
n
2
z1-α/2·σ
n (tamaño de muestra mínimo)
E
18
Intervalos de confianzas para estimar parámetros más usuales
Estimador
Situación Parámetro Distribución Muestral
puntual IC
m.a. (n) de una
población X x -μ σ
μ Z N(0 , 1) x z1-α/2·
N(µ, σ2) ; σ/ n n
σ2 conocido
(n 1)S2 2
m.a.(n) de una (n-1)
población σ2 S2 σ2 (n-1)s2 (n-1)s2
,
N(µ, σ2) (corregido) es una distribución 2 2
aproximada de S
2 (n-1;1-α/2) (n-1;α/2)
x -μ
m.a.(n) de una T t(n - 1)
población S/ n s
N(µ, σ2) ;
μ x t (n-1;1-α/2) · n
2
X
Simétrica respecto a la
σ desconocido
media “0”
m.a. (n) de una
población
Bernoulli
1 ; Éxito p̂ - p
xi = Z N(0 , 1); ˆˆ
0 ;Fracaso pq pq
p p̂ z1-α/2·
i = 1,2, .. ,n p̂ n n
µ= p y cuando n es grande
σ2 = pq
2 2
z1-α/2·σ z · pq
n n 1-α/2
E E
19
Aplicaciones de IC (ejercicios)
n x (s)2
50 3265 (466,0954)2
20
2. En una m.a. de 100 resistores que fabricó cierta industria, se encuentra que
12 no cumplen con las especificaciones de tolerancia.
ˆˆ
pq
n p̂ q̂ z1-α/2 n IC(p)
21
4. Los valores obtenidos de las longitudes en micras de 30 filamentos,
seleccionados aleatoriamente de la producción de una máquina, son los
siguientes:
22
5. Una máquina produce las varillas de metal utilizadas en el sistema de
suspensión de un automóvil. Se toma una muestra aleatoria de n = 15 varillas.
Se mide el diámetro (X), se obtiene la siguiente información:
x = 8,234 mm s = 0,025298 mm
23
6. Una conocida fábrica de muebles desea conocer la resistencia de las repisas
de los modelos de estanterías que venden. Para ello, realizaron un
experimento que consistió en tomar 25 repisas e ir añadiendo peso en ellas
hasta que se rompan, anotando el peso (X) que han soportado (en kg). Se
obtuvo el siguiente resumen estadístico con los datos recogidos:
6.1. Estime con 95% de confianza la media real del peso máximo soportado por
las repisas. ¿Aconsejaría a la fábrica de muebles que en las
especificaciones de la estantería pusieran que la carga máxima que soporta
la repisa es de 38 kg?. Justifique su respuesta.
6.2. Estime con 95% de confianza, la varianza del peso máximo soportado por la
repisa.
24
8. Con el objeto de estimar los parámetros de la resistencia (X) a la compresión de cierto tipo
de vigas de acero, se analizó una muestra aleatoria de 50 vigas. Alguna información de las
mediciones realizadas se presentan a continuación:
Asumiendo que se cumplen los supuestos necesarios, estime con 95% de confianza:
25
9. Las concentraciones (X) de contaminantes atmosféricos, como monóxido de
carbono (CO), se pueden medir con un espectrómetro. Tres laboratorios que tiene
contaminantes con una concentración de monóxido de carbono de 75 ppm
realizaron mediciones con el instrumento, los datos obtenidos se presentan a
continuación:
Laboratorio 1
73,6 76,0 73,2 74,5 74,2 76,0 80,3 70,9 70,0 75,2
73,6 76,6 73,9 73,1 75,9 78,8 77,8 78,2 76,0 72,3
77,8 76,6 70,5 73,8 78,1 75,4 76,1 77,5 73,4 75,7
80,5 76,6 74,3 74,5 77,1 76,8 71,3 72,0 77,5 82,1
Laboratorio 2
30 30
xi 2241,84 xi2 167946,9876
i=1 i=1
Laboratorio 3
CO ppm 71,0 – 73,5 73,5 – 76,0 76,0 – 78,5 78,5 – 81,0 81,0 – 83,5
ni 7 10 16 11 6
26
10. El óxido de azufre es un gas que tiene efectos nocivos en la salud humana,
vegetal y en otros materiales, éste se produce por combustión de carbón y
petróleo y por la metalurgia. En una estación de monitoreo de un Complejo
Metalúrgico se realizaron mediciones diarias del óxido de azufre (μg/m 2), que
emanan de los procesos. La norma indica que la cantidad máxima de óxido de
azufre permitida es 300 (μg/m2). Al tomar una muestra de 80 de dichas
mediciones, se obtuvo:
X: Cantidad de óxido
de azufre (μg/m2) N° de días
180 - 230 7
230 - 280 14
280 - 330 32
330 - 380 19
380 - 430 8
27
11. (Evaluación 2 -2021-2) En la producción de cierto artículo fabricado por una industria
tecnológica, el número (X) de unidades terminadas con fallas, en cada turno de 8 horas,
es una variable aleatoria con la siguiente función de probabilidad, donde el parámetro α es
desconocido:
𝑒 −𝛼 𝛼 𝑥
f(x,α) = 𝑥!
; x = 0, 1, 2, 3, 4, 5, ….∞; 𝛼 > 0;
E(X) = 𝛼, E(X2) = 𝛼 2 + 𝛼
Analice cuál de los dos estimadores es más eficiente, es decir, el estimador insesgado
de menor varianza.
c) De los registros de la industria se determinó una muestra aleatoria de 100 turnos, todos
de 8 hrs., se obtuvo la siguiente información respecto del Número de unidades con
falla:
N° de unidades
0 1 2 3 4 5 6 7 8 9 10 11 12
con falla
Cantidad de
1 3 8 13 17 18 15 10 7 4 2 1 1
turnos
Estime, con 90% de confianza, la proporción de turnos con al menos siete unidades con
falla.
28