Está en la página 1de 86

Estadı́stica Aplicada 2

Estimación puntual e intervalar

José J. Cerda-Hernández, Ph.D.


jcerdah@uni.edu.pe

Universidad Nacional de Ingenierı́a


Department of Economics

UNI

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 1 / 86


Población

La colección de todos los posibles elementos bajo investigación es denomi-


nada de población o universo.

En todos los problemas estadı́sticos debemos inicialmente definir cuál será la


población objetivo. Con ello, estarán relacionadas las cantidades de interés.
Se pude definir que los habitantes del Perú forman nuestra población
de interés, en este caso el número de elementos de nuestra población
será de 32milones aprox.
Se puede definir como población a los alumnos que forman parte de
esta clase.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 2 / 86


Muestra

Es un subconjunto de la población.

La muestra es utilizada cuando no tenemos acceso a toda la población y


sirve como base para inferir sobre cantidades de interés relacionadas a la
población.
los habitantes del Perú forman nuestra población de interés, una
posible muestra serián los alumnos de esta disciplina.
10 carros de una determinada marca para hacer pruebas de seguridad.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 3 / 86


Tipos de Muestra

Existen varias formas de seleccionar muestras de las poblaciones:

Muestra aleatoria: cuando los elementos de la población se eligen de forma


aleatoria, usando cualquier mecanismo de azar.

Muestra aleatoria simple: Se garantiza que todos los individuos de la


población tengan la misma probabilidad de ser elegidos en la muestra y que
cada uno de sus elementos se elijan de forma independiente.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 4 / 86


Muestra sistemática: Previamente los individuos de la población se en-
cuentran en una lista, después se elige uno al azar (xi) y a continuación, a
intervalos constantes, se eligen todos los demás hasta completar la muestra.
Los intervalos son seleccionados en base a un coeficiente de elevación k =
N/n.
Donde: N es el tamaño de la población y n el de la muestra.La elección de
los elementos muestrales vendrán dados por xi + k, xi + 2k, ....

Ejemplo: Si de una población de 500 se debe tomar una muestra de tamaño


50, el intervalo de selección es de tamaño 10. Este intervalo de selección
indica que se habrá que seleccionar cada décimo caso de la población para
integrarlo a la muestra. Se inicia la selección de la muestra eligiendo medi-
ante un método aleatorio el primer caso. Suponiendo que en este ejemplo
el primer caso seleccionado sea el número 13, el segundo será el 23 y ası́
sucesivamente hasta completar el tamaño de muestra deseado.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 5 / 86


Muestra estratificada: se dividen los elementos de la población en clases
o estratos (edad, renta, etc...) y dentro de cada uno de ellos se eligen los
elementos por m. a. s. o sistemático. Muestra no aleatoria: Se seleccionan
los individuos de forma subjetiva (opinática), lo que puede introducir cierto
sesgo a los resultados obtenidos.

El tipo de muestreo que usaremos a lo largo del curso es Muestreo Aleatorio


Simple.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 6 / 86


Muestra Aleatoria Simple

Todos los elementos de la población tienen la misma probabilidad de ser


seleccionados. Se repite el processo hasta que n elementos sean selec-
cionadas. Tendremos una muestra con reposición, si es permitido que una
unidad pueda ser sorteada mas de una vez, y sin reposición, si el elemento
es removido de la población.
Definición: Una amostra aleatória simple de tamaño n de una populación
modelada por uma variable aleatoria X , con una distribución dada, es un
conjunto de n variable aleatoria independentes

X1 , X2 , ..., Xn ,

cada una con la misma distribución de X .

Intuitivamente, Xi representa la observación del i-ésimo elemento


sorteado.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 7 / 86


Distribución conjunta de v.a. independientes

Caso continuo:
Si X1 , X2 , .., Xn son variables aleatorias continuas, independientes e idénticamen
distribuidas. La distribución de densidad conjunta es dada por:
n
Y
f (x1 , . . . , xn ) = fXi (xi )
i=1

Caso discreto:
Si X1 , X2 , .., Xn son variables aleatorias discretas, independientes e idénticament
distribuidas, entonces
n
Y
P(X1 = x1 , . . . , Xn = xn ) = P(Xi = xi )
i=1

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 8 / 86


Estadı́stica y Parámetro
Una vez obtenida la muestra de una población dada , muchas veces estamos
interesados en calcular alguna función de esta muestra. Por ejemplo, la
média de la muestra (X1 , X2 , ..., Xn ) es dada por

X1 + · · · + Xn
X =
n
Definición: Una estadı́stica T es un a función de una muestra X1 , X2 , ..., Xn .
Las estadı́sticas mas comunes son:
X1 + · · · + Xn
Media muestral: X = .
n
1 Pn 2
Varianza muestral: Var (X ) = i=1 Xi − X , etc
n−1
Definición: Denominamos de parámetro una medida usada para describir
una caracterı́stica de la población. Ası́, si una población es modelada por
una v.a X , la esperanza y la varianza E (X ) y Var (X ), respectivamente,
serian parámetros de la v.a. X .
J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 9 / 86
Distribución Muestral: Se llama ası́ a la función de distribución (o prob-
abilidad) de un estadı́stico.

Error Estándar del Estadı́stico: es la desviación estándar de la distribución


muestral de un estadı́stico.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 10 / 86


Estimadores y Estimaciones

Estimadores son funciones muestrales (estadı́sticas), definidas antes de ob-


servar la muestra, que sirven para estimar un parámetro de la función de
densidad de probabilidad. Colocaremos un sombrero encima del parámetro
para denotar el estimador. Utilizaremos la letra mayúscula para denotar el
estimador.
Exemplo: media muestral µ̂ = X es varianza muestral σ̂ 2 = SX2 .

Estimativa es el valor numérico del estimador despues de observar la mues-


tra. Utilizaremos la letra minúscula para denotar la estimación.
Exemplo Como E(X ) = µX e Var (X ) = σX2 son los parámetros de la dis-
tribución de personas normales, usando los estimadores adecuados tenemos
las estimaciones:

µX ≈ X = 3, 8 e σX2 ≈ SX2 = 3, 1.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 11 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 12 / 86
Propiedades de los Estimadores
Como vimos el problema de la estimación es determinar una función h(X 1, X 2, ·
que sea próxima de θ, segun algun criterio. El primer criterio es el seguinte:
Definición: El estimador T es insesgado para θ si

E(T ) = θ, para todo θ

El sesgo de un estimador T para um parámetro θ es igual a E(T ) − θ .


Luego, un estimador T es insesgado para θ , si el sesgo es igual a cero para
todo θ.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 13 / 86


Ejemplo: La media muestral X es un estimador insesgado para la media
poblacional µ.

Esto demuestra que X es un estimador insesgado.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 14 / 86


Exemplo:
P Considere una población con N elementos, con media poblacional
µ = N1 N
i=1 Xi , y varianza poblacional dada por

N
1 X
σ2 = (Xi − µ)2 .
N
i=1

Un posible estimador para σ 2 , basado en una muestra aleatoria simple de


tamaño n de esa población, es
n
2 1X
σ̂ = (Xi − X )2 .
n
i=1

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 15 / 86


 n−1 2
Demuestre que ese estimador es sesgado: E σ̂ 2 = σ .
n
Pn Pn
i=1 (Xi − X )2 = i=1 (Xi − µ + µ + X )2
Pn Pn
= i=1 (Xi − µ)2 − 2 i=1 (Xi − X )(Xi − µ)
Pn
+ i=1 (X − µ)2
Pn
= i=1 (Xi − µ)2 − n(X − µ)2

Por lo anterior, un estimador insesgado para la varianza poblacional es


n
1 X
σ̂ 2 = (Xi − X )2 , E(σ̂ 2 ) = σ 2 .
n−1
i=1

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 16 / 86


Standard Error: Reporting a Point Estimate

Ejemplo:

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 17 / 86


Definición: Una sucesión {Tn } de estimadores de θ es consistente si

lim E(Tn ) = θ
n→∞

e
lim Var (Tn ) = 0.
n→∞

Ejemplo: Vimos que σ̂ 2 es insesgado para σ 2 . Demonstrar que


n−1 4
Var (σ̂ 2 ) = 2σ .
n2
Por lo tanto, Var (σ̂ 2 ) → 0, cuando n → ∞, i.e., σ̂ 2 es consistente.
Definición: Si T y T 0 son dos estimadores insesgados de un mismo parámetro
θ, y
Var (T ) < Var (T 0 ),
entonces decimos que T es más eficiente que T 0 .

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 18 / 86


Ejemplo: Supongamos un experimento consistiendo de n provas de Bernoulli,
con probabilidad de sucesso p. Sea X el número de éxitos, y considere los
estimadores

X 1 , si la primera prueba resultar un éxito
(a) p̂1 = , (b) p̂2 =
n 0 , caso contrario.

Determine la esperanza y a varianza de cada estimador. Por qué p̂2 no es


un buen estimador? Verifique si p̂1 y p̂2 son consistentes.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 19 / 86


Error cuadrático medio

Sea X1 , . . . , Xn una muestra aleatoria simple extraı́da de una población con


función de densidad f (x, θ) , y sea θ̂ un estimador de θ).
Se denomina error cuadrático medio (E.C.M) del estimador θ̂ al valor dado
por:
 2    2
ECM(θ̂) = E θ̂ − θ = Var θ̂ + E(θ̂) − θ

Si el estimador es insesgado, entonces


 
ECM(θ̂) = Var θ̂

Lo que generalmente se busca es minimizar el ECM. Esto sólo ocurre con


estimadores insesgados.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 20 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 21 / 86
Formas de estimación

Dos posibles procedimentos de estimación son:

Vamos a observar n elementos, extraidos de forma aleatoria com reposición


de la población
X1 , X2 , . . . , Xn

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 22 / 86


Distribución muestral de la Media

Vamos observar n elementos, extraı́dos de forma aleatoria sin reposición de


la población X1 , X2 , . . . , Xn . El estimador puntual para X , también denom-
inado media muestral, es definido como
n
1X
X = Xi
n
i=1

Propiedad: Sea X una v.a. con media µ y varianza σ 2 , y sea X1 , X2 , ..., Xn


una muestra aleatoria simple de X . Entonces,

σ2
E(X ) = µ e Var (X ) =
n
Es decir, la media muestral es un estimador insesgado y consistente.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 23 / 86


Distribución muestral de la Varianza
Vamos a observar n elementos, extraı́dos de forma aleatoria sin reposición
de la población X1 , X2 , . . . , Xn . El estimador puntual para S 2 , también
denominado varianza muestral, es definido por
n
1 X
S2 = (Xi − X )2 .
n−1
i=1

Propiedad: Sea X una variable aleatoria con média µ y varianza σ 2 , y sea


X1 , X2 , ..., Xn una muestra aleatoria simple de X . Entonces,

2σ 4
E(S 2 ) = σ 2 e Var S 2 =

n−1
Recordemos que:

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 24 / 86


Distribución Muestral de la Proporción

El estimador puntual para p, también denominado proporción muestral, es


definido por
Yn
p̂ =
n
siendo que
Yn : denota el número de elementos en la muestra que tienen la caracteris-
tica;
n: denota el tamaño de la muestra.
Propiedad: Sea p̂ el estimador de la proporción de una muestra X1 , X2 , ..., Xn
una muestra aleatoria simple. Entonces,

p(1 − p)
E(p̂) = p, e Var (p̂) = .
n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 25 / 86


Ejemplo: Sea,
p: proporción de alumnos de la UNI que fueron al teatro por lo menos una
vez en el último mes, y
Yn : número de estudiantes que responden “si” en una pesquisa con n en-
trevistados.
Supongamos que fueron entrevistados n = 500 estudiantes y que, de esos,
k = 100 afirmaron que fueron al teatro por lo menos una vez en el último
mes.
La estimación puntual (proporción muestral) para p es dada por:

K 100
p̂ = = = 0, 20
n 500
es decir, 20% de los estudiantes entrevistados afirmaron que fueron al teatro
por lo menos una vez en el último mes.
Note que, otra muestra del mismo tamaño puede generar otra esti-
mación puntual para p.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 26 / 86


Ejemplo: Los datos siguientes corresponden al diámetro, en mm, de 30
esferas de rodamiento producidas por una máquina

137; 154; 159; 155; 167; 159; 158; 159; 152; 169; 154; 158; 140; 149; 145

157; 160; 155; 155; 143; 157; 139; 159; 139; 129; 162; 151; 150; 134; 151
x = 151, 9mm, s = 9, 7mm
Supogamos que para satisfazer las especificaciones del consumidor, el
diámetro de las piezas deben estar compreendidos entre
[140mm, 160mm]. Determine la estimación puntual de la proporción
de piezas fabricadas por la máquina satisfaciendo las especificaciones.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 27 / 86


Métodos de Estimación Puntual

1. Método de Máxima verosimilitud

Definición: Sea X una variable aleatoria cuya función de probabilidad f (x)


depende de un parámetro θ (f (x, θ)).
Sea X1 , ..., Xn una m.a.s de X y sean x1 , x2 , ..., xn los valores observados de
la muestra. La función de verosimilitud de la muestra se define asi:
n
Y
L(θ) = f (x1 , ..., x2 , θ) = f (xi , θ)
i=1

Observación: si θ hace máxima a L(θ), entonces también hace máxima a


su logaritmo ln(L(θ)).

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 28 / 86


Para convertir el producto de la función de máxima verosimilitud en suma,
se aplica la función ln(L(θ)) y determinar θ por la ecuación:
n
∂L X ∂f (xi , θ)
= =0
∂θ ∂θ
i=1

Si, la distribución de probabilidad tiene varios parámetros desconocidos, θ1


, θ2 ,..., θk entonces en lugar de una ecuación, tendremos k ecuaciones:
∂L ∂L ∂L
= 0, = 0, · · · , =0
∂θ1 ∂θ2 ∂θk

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 29 / 86


Ejemplo: Sea X una v.a. con f.d.p f (x) = θe −θx , para x > 0 y θ > 0.
Calcular el estimador de máxima verosimilitud para el parámetro θ.
Primero construimos la función de verosimilitud:

Tomamos logaritmo natural para simplificar la expresión (es equivalente):

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 30 / 86


Derivamos el logaritmo natural de la función de verosimilitud e igualamos a
cero:

De lo anterior obtenemos
n
n X
− xi = 0
θ
i=1

Por lo tanto
n 1
θ̂ = Pn =
i=1 xi x

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 31 / 86


Ejemplo: Let X be a Bernoulli random variable. The probability mass
function is

where p is the parameter to be estimated. The likelihood function of a


random sample of size n is

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 32 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 33 / 86
Ejemplo:

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 34 / 86


Método de los Momentos
The general idea behind the method of moments is to equate population
moments, which are defined in terms of expected values, to the correspond-
ing sample moments. The population moments will be functions of the
unknown parameters. Then these equations are solved to yield estimators
of the unknown parameters.

Ejemplo:

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 35 / 86


Ejemplo:

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 36 / 86


Ejemplo: Distribución Gamma

En estadı́stica la distribución gamma es una distribución de probabilidad


continua con dos parámetros r > 0 y λ > 0 cuya función de densidad es

(λx)r −1

λe −λx , x ≥0

f (x) = Γ(r )
0 , caso contrario

donde Γ es la función gamma. Para valores r ∈ N Γ(r ) = (r − 1)!


r r
E(X ) = Var (X ) =
λ λ2
Notación: X ∼ Gamma(r , λ)

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 37 / 86


Usando el método de los momentos queremos encontrar estimadores para r
y λ:

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 38 / 86


Distribución de la media y la proporción muestral

Cuál es la distribución muestral de la media muestral X ?

Cuál es la distribución muestral de la proporción muestral pb ?

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 39 / 86


Teorema del Lı́mite Central para la media muestral

Para muestras aleatorias simples (X1 , X2 , ..., Xn ), retiradas de una población


con media µ y varianza σ 2 finita, la distribución muestral de la media X se
aproxima, para n grande, de una distribución normal, con media µ varianza
σ 2 /n, es decir,
σ2
 
X ≈ N µ,
n
o equivalentemente
X −µ
lim p = N(0, 1)
n→∞ σ 2 /n
Regla empı́rica: muestras de tamaño de 30 elementos, la aproximación
TCL puede ser considerada buena.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 40 / 86


Ejemplo: Supongamos que una máquina está regulada para producir lámparas
con tiempo de vida útil medio de 10.000 horas (siguiendo una distribución
exponencial). De una muestra de 50 lámparas producidas por esta máquina,
se verifica el tempo de vida útil de cada una de ellas. Determine la proba-
bilidad que el tempo de vida útil medio sea menor o igual a 8.000 horas.
Solución: Se sabe que el tempo de vida útil de una lâmpara es distribuido
de acuerdo con un a Exponencial. Portanto, como el tempo de vida útil
medio es de 10.000 horas, se tiene que la média poblacional es de 104 horas
y la varianza poblacional es igual a 108 horas. Como la muestra es mayor
que 30 (TLC), la media muestral tiene una distribución N(104 , 108 /50). Por
lo tanto,
√ 8000 − 10000 √
 
P(X ≤ 8000) ≈ P Z ≤ 50 = P(Z ≤ − 2) = 0, 0793
10000

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 41 / 86


Teorema del Lı́mite Central para la proporción muestral
El estimador puntual para p, também denominado proporción muestral, es
definido como
Yn
p̂ =
n
siendo que Yn : denota el número de elementos en la muestra que presenta
la caracterı́stica; n: denota el tamaño de la muestra colectada.
p(1 − p)
E(p̂) = p, e Var (p̂) = .
n
Entonces la distribución muestral de la proporción p̂ se aproxima, para n
grande, de una distribución normal, con media p y varianza p(1 − p)/n, es
decir,
 
p(1 − p)
p̂ ≈ N p,
n
o equivalentemente
p̂ − p
lim p = N(0, 1)
n→∞ p(1 − p)/n
J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 42 / 86
Ejemplo: Un fabricante de vacunas afirma que su vacuna para gripe in-
muniza 80% de los casos. Una muestra de 25 individuos entre aquellos
que tomaram la vacuna fueron sorteados y pruebas fueron conducidos para
verificar la inmunización (o no). Si el fabricante está en lo correto, cual es
la probabilidad que proporción de los inmunizados en muestra sea inferior a
0,75? y superior a 0,85?
Solución: Sea p̂ la proporción de inmunizados en la muestra. En este
ejemplo n = 25. Piden P(p̂ ≤ 0, 75), más por el Teorema del Limite Central
P(p̂ ≤ 0, 75) ≈ N(p, p(1 − p)/n). En este ejemplo p = 0, 8.
!
p̂ − 0, 8 0, 75 − 0, 8
P(p̂ ≤ 0, 75) ≈ P p ≤p = P(Z ≤ −0, 625)
0, 8 × 0, 2/25 0, 8 × 0, 2/25

Entonces P(p̂ ≤ 0, 75) ≈ 1 − P(Z ≤ 0, 625).

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 43 / 86


Tamaño adecuado de la muestra

OBJETIVO. determinar el tamaño de una muestra a selecionar de una


población de modo a obtener un error de estimación previamente estipulado,
con cierto grado de confianza. El objetivo es determinar el menor valor de
n tal que:
P(|X − µ| < ) ≥ γ
en que γ es el grado de confianza necesário para que el error muestra sea a
lo más igual a .
Como la distribución muestral de X es N(µ, σ 2 /n), el tamaño mı́nimo de la
muestra n debe satisfazer
 √ √ 
n n
P(− ≤ X − µ ≤ ) = P − ≤Z ≤ =γ
σ σ

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 44 / 86


 √ √ 
n n
P(− ≤ X − µ ≤ ) = P − ≤Z ≤ =γ
σ σ

n
Denotando por zγ = σ , tenemos que

P(−zγ ≤ Z ≤ zγ ) = γ

Entonces
σ 2 (zγ )2
n=
2

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 45 / 86


En el caso de la proporção tenemos:
√ √ !
n n
P(− ≤ p̂ − p ≤ ) = P − p ≤Z ≤ p =γ
p(1 − p) p(1 − p)

n
Denotando por zγ = √ , tenemos que
p(1−p)

P(−zγ ≤ Z ≤ zγ ) = γ

Entonces
p(1 − p) (zγ )2
n=
2

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 46 / 86


Ejemplo: Una variable aleatoria X tiene distribución muestral N(3, 22).
Cuál deb e ser el tamaño n de una muestra aleatoria de X para que la
media muestral de X tenga 90% de los valores menores que 3,5?
Solución: Se desea calcular P(X ≤ 3, 5) = 0, 9

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 47 / 86


Ejemplo: El número de llamadas por hora, por atendiente, en una central
de reclamos de un determinado producto sigue una distribución de Poisson
con parámetro λ = 100. Cada atendiente gana una comisión en su salario
fijo caso el atienda en media mas que 102 llamadas por hora.
Con base en una muestra aleatoria de n = 40 horas, cuál es la
probabilidad que una atendiente reciba la comisón? Recuerde que si
X es una variable aleatoria de Poisson(λ), entonces
E(X ) = Var (X ) = λ.
Cuál es el tamaño de la muestra necesaria para que la probabilidade
calculada en el item anterior sea menor que 0, 06?

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 48 / 86


Ejemplo: Los datos siguientes corresponden al diámetro, en mm, de 30
esferas de rodamiento producidas por una máquina

137; 154; 159; 155; 167; 159; 158; 159; 152; 169; 154; 158; 140; 149; 145

157; 160; 155; 155; 143; 157; 139; 159; 139; 129; 162; 151; 150; 134; 151
x = 151, 9mm, s = 9, 7mm
Supogamos que para satisfacer las especificaciones del consumidor, el
diámetro de las piezas deben estar compreendidos entre
[140mm, 160mm]. Determine la estimación puntual de la proporción
de piezas fabricadas por la máquina satisfaciendo las especificaciones.
Que tamaño de muestra necesitamos de modo que la estimación
puntual este, a lo más, a 0.02 de la proporción verdadera p, con una
probabilidad de 0.95?
Es posible reducir el tamaño de la muestra del caso anterior si
tenemos la información de que como mı́nimo 70% de esferas de
rodamiento satisfacem las especificaciones del consumidor?

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 49 / 86


Estimación con Intervalo de Confianza

Los estimadores por intervalos de confianza están basados en la distribución


muestral del estimador.
Un intervalo de confianza de un parámetro desconocido θ es un in-
tervalo de la forma [L, U], donde L y U dependen de la muestra, i.e., son
estadı́sticas.
El objetivo de la estimación por intervalo es determinar L y U tal que

P(L ≤ θ ≤ U) = γ

Note que θ no es aleatorio, L y U son aleatorios.


Existe una probabilidad γ de seleccionar una muestra tal que el intervalo
[L, U] contenga el valor de θ.
Si esta afirmación es verdadeira: en 100γ% de las veces θ estará incluido
en el intervalo [L, U].

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 50 / 86


Nivel de confianza del Intervalo

Tal intervalo es llamado de intervalo de 100γ% de confianza para θ, y γ es


llamado el nivel de confianza del intervalo.

Balance: Cuanto mayor es el intervalo de confianza, más probable que él


contenga el verdadero valor de θ. Mas, cuanto mayor es el intervalo, menos
información se tiene respecto del verdadero valor de θ.

Situación ideal: Tener un intervalo [L, U] relativamente pequeño con alta


confianza.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 51 / 86


Estimación por intervalo de confianza para la media: Usando la es-
tadı́stica: média muestral X
Caso 1 - población de varianza conocida
Caso 2 - población de varianza desconocida

Estimación por intervalo de confianza para la proporción: Usando la


estadı́stica: proporción muestral p̂
Caso 1 - población de proporción conocida
Caso 2 - población de proporción desconocida

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 52 / 86


Nivel de significancia vs Nivel de confianza

Nivel de significancia = α
Nivel de confianza = γ = 1 − α

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 53 / 86


Intervalo de confianza para media

Sea X1 , . . . , Xn una muestra aleatoria simple de X . La estadı́stica de la


media muestral es
X1 + · · · + Xn
X =
n
σ2
Recuerde que E(X ) = µ y Var (X ) = .
n

Tenemos dos casos:

Caso 1 - población de varianza conocida


Caso 2 - población de varianza desconocida

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 54 / 86


Población de varianza σ 2 conocida
Asumimos que el tamaño de la población es suficientemente grande com-
parado con el tamaño de la muestra. Por el TLC
X −µ
p ≈ N(0, 1)
σ 2 /n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 55 / 86


Con la ayuda de la tabla de la Norma N(0, 1) buscamos −zα/2 y zα/2 .

Ası́, el intervalo de confianza para la media de la población usando una


muestra de tamaño n, con desviación estándar σ conocida, con nivel de
confianza (1 − α).100% es
 
σ σ
IC (µ, (1 − α).100%) = X − zα/2 √ , X + zα/2 √
n n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 56 / 86


Población de varianza σ 2 desconocida.

Ahora aplicamos la estrategia de usar la información que se tiene. Asumimos


que el tamaño de la población es suficientemente grande comparado con el
tamaño de la muestra. Además, suponemos una muestra aleatoria simple
de una distribución normal.
En el caso en que σ 2 es desconocido, se propone usar S 2 (que es una v.a.)
en lugar de σ 2 . En este caso tenemos que

X −µ
p ≈ t(n−1) .
S 2 /n

Por lo tanto
 
S S
IC (µ, (1 − α).100%) = X − tα/2,n−1 √ , X + tα/2,n−1 √
n n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 57 / 86


Población finita

Cuando el muestreo es sin reemplazo en poblaciones finitas de N elementos


se usa el factor de corrección
N −n
N −1

Entonces, para una población finita de N elementos y un muestreo sin


reposición, además siendo la desviación estándar poblacional σ conocida y
n ≥ 30, el intervalo que contiene el parámetro µ es:
" r r #
σ N −n σ N −n
IC (µ, (1 − α).100%) = X − zα/2 √ , X + zα/2 √
n N −1 n N −1

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 58 / 86


Si la desviación estándar poblacional σ es desconocida y n ≥ 30, el intervalo
que contiene el parámetro µ es:

" r r #
S N −n S N −n
IC1−α (µ) = X − tα/2,n−1 √ , X + tα/2,n−1 √
n N −1 n N −1

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 59 / 86


En resumen:
Varianza conocida
 
σ σ
IC (µ, (1 − α).100%) = X − zα/2 √ , X + zα/2 √
n n

Varianza desconocida
 
S S
IC (µ, (1 − α).100%) = X − tα/2,n−1 √ , X + tα/2,n−1 √
n n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 60 / 86


Ejemplo: Los datos a seguir corresponde al diámetro, en mm, de 30 esferas
de rodamiento producidas por una máquina

137; 154; 159; 155; 167; 159; 158; 159; 152; 169; 154; 158; 140; 149; 145

157; 160; 155; 155; 143; 157; 139; 159; 139; 129; 162; 151; 150; 134; 151

Construir un intervalo de confianza, al 95% de confianza, para la


media de la población de todas las posibles esferas producidas por la
máquina.
Supongamos que σ 2 = 100. Calcular un intervalo de confianza, al
95% de confianza, para la media de la población.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 61 / 86


Ejemplo: Un fabricante de baterias para reloj solicita al sector de engenierı́a
una evaluación rigurosa de la duración (en años) del produto. Supongamos
que la duración del producto sigue una distribución normal. Una serie de
baterias fueron seleccionadas para hacer pruebas. Los resultados, en años
fueron:

1.2; 1.4; 1.7; 1.3; 1.2; 2.3; 2.0; 1.5; 1.8; 1.4; 1.6; 1.5; 1.6; 1.5; 1.3

Determine una estimativa para la media y varianza muestral del


tiempo de duración de la bateria.
Calcule un intervalo de 99% de confianza para la verdadera media del
tiempo de duración de la bateria.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 62 / 86


Observación:

Si la variable X en la población tiene distribución normal, entonces

X −µ X −µ
p ≈ N(0, 1) , p ≈ t(n−1) .
σ 2 /n S 2 /n

Si el tamaño n de la muesstra es grande, entonces

X −µ X −µ
p ≈ N(0, 1) , p ≈ N(0, 1).
σ 2 /n S 2 /n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 63 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 64 / 86
Intervalo de confiaza de la proporción

Sea X1 , . . . , Xn una muesstra aleatória simple de X ∼ Bern(p). La estad


ı́stica de la media muesstra es
X1 + · · · + Xn
p̂ =
n
donde Xi = 0 ou 1. También fue denotado por Yn = X1 + · · · + Xn .
p(1−p)
Recordemos que E(p̂) = p e Var (p̂) = n .

Entonces tenemos solo el siguiente caso:

Caso - proporción p de la población es desconocida.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 65 / 86


Intervalo de confiaza de la proporción

Sea X1 , . . . , Xn una muestra aleatoria simple de X . La estadı́stica de la


proporción muesstra es
Yn
p̂ =
n
Por el TLC tenemos que
 
p(1 − p)
p̂ ≈ N p,
n


p̂ − p
Z=p ≈ N(0, 1)
p(1 − p)/n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 66 / 86


Ası́, el intervalo de confianza para la proporción en una población usando
una amostra de tamaño n, con coeficiente de confianza (1 − α).100% es

p " p #
p(1 − p) p(1 − p)
IC (p, (1 − α).100%) = p̂ − zα/2 √ , p̂ + zα/2 √
n n

Se desea estimar el intervalo de confianza para el parámetro p (de-


sconocido). El resultado arriba está en función de p.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 67 / 86


Tenemos dos opciones simples de usar:

Substituir p por p̂ (estimativa optimista)


" p p #
p̂(1 − p̂) p̂(1 − p̂)
IC (p, (1 − α).100%) = p̂ − zα/2 √ , p̂ + zα/2 √ .
n n

Usar el hecho que p(1 − p) ≤ 1/4


 
1 1
IC (p, (1 − α).100%) = p̂ − zα/2 √ , p̂ + zα/2 √ .
2 n 2 n

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 68 / 86


Ejemplo: Los datos a seguir corresponde al diámetro, en mm, de 30 esferas
de rodamiento producidas por una máquina

137; 154; 159; 155; 167; 159; 158; 159; 152; 169; 154; 158; 140; 149; 145

157; 160; 155; 155; 143; 157; 139; 159; 139; 129; 162; 151; 150; 134; 151

Construir un intervalo de confianza, al 95% de confianza, para la


media de la población de todas las posibles esferas producidas por la
máquina.
Supongamos que para satisfazer las esecificaciones del consumidor, el
diámetro de las piezas deben estar compreendidos entre
[140mm, 160mm]. Determine un intervalo de confianza de 98% para
la verdadera proporción de piezas fabricadas por la máquina
satisfaciendo las especificaciones.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 69 / 86


Ejemplo: Pruebas de compresión en muestras de concreto son realizadas
para verificar si el concreto tiende el valor mı́nimo de 30Mpa. Docientas
piezas de concreto son testeadas observando que 10 de ellas no atienden el
valor mı́nimo especificado.
Calcule un intervalo de 98% de confianza para la verdadera
proporción de piezas que no atienden el valor mı́nimo especificado.
Utilize la variância estimada de la proporción muestral.
Cuántas piezas de prueba serian necesarias para que el intervalo del
item anterior tenga un margem de error de 0.03Mpa?

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 70 / 86


Ejemplo: Se está realizando un estudio con un nuevo medicamento. Se
desea estimar la proporción p de pacientes para los cuales el tempo de
reacción después de la utilización del medicamente es menor que 5 minutos.
Para este estudio, el nuevo medicamento será administrado en una muestra
de pacientes y el tiempo de reacción de cada uno será registrado.
1 Cual debe ser el tamaño de la muestra para que el error cometido al
estimar p sea a lo más 0, 05, con un coeficiente de confianza del 95%?
2 Se los pesquisadores garantizan que p es por lo menos 80%, cuál es el
tamanho de la muestra necesária para atender las mismas exigencias
del item (a)?
3 Una muestra de 30 pacientes da los siguientes tiempos de reaación:

4.0; 3.5; 6.1; 5.8; 5.4; 4.4; 4.9; 3.9; 5.1; 5.3; 4.1; 4.2; 4.8; 4.7; 3.8;

4.8; 5.3; 5.5; 3.6; 3.5; 4.7; 3.3; 3.7; 6.3; 5.7; 3.9; 4.6; 4.7; 4.1; 4.3
Dar una estimación puntual para p y, en base a ella, construir un
intervalo de 95% de confianza para p.

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 71 / 86


Intervalo de confianza para la diferencia de medias de dos
poblaciones

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 72 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 73 / 86
J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 74 / 86
Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de
tamaños n1 y n2 seleccionadas de dos poblaciones con medias µ1 y µ2 .
Suponemos que las varianzas son conocidas σ12 y σ22 .
Si las poblaciones son normales entonces X 1 ∼ N(µ1 , σ12 /n1 ) y X 2 ∼
N(µ2 , σ22 /n2 ) y

X 1 − X 2 ∼ N(µ1 − µ2 , σ12 /n1 + σ22 /n2 )

Si las poblaciones NO son normales, para n1 , n2 ≥ 30, por el Teorema Cen-


tral del Lı́mite se tiene que X 1 −X 2 es aproximadamente N(µ1 −µ2 , σ12 /n1 +
σ22 /n2 ).

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 75 / 86


Si las poblaciones NO son normales, para n1 , n2 ≥ 30, por el Teorema Cen-
tral del Lı́mite se tiene que X 1 −X 2 es aproximadamente N(µ1 −µ2 , σ12 /n1 +
σ22 /n2 ).
Entonces

X 1 − X 2 − z1− α2 · ET ≤ µ1 − µ2 ≤ X 1 − X 2 + z1− α2 · ET
q
σ12 σ22
donde ET = n1 + n2

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 76 / 86


Si las varianzas poblacionales son desconocidas (y tenemos normalidad),
podemos tener dos casos:
Caso 1: σ12 = σ22 = σ 2 Un estimador insesgado de la varianza común σ 2 es

(n1 − 1)S12 + (n2 − 1)S22


Sc2 =
n1 + n2 − 2
q
sc2 sc2
Sea ET = n1 + n2 , entonces el intervalo de confianza será de

X 1 − X 2 − t1− α2 ,n1 +n2 −2 · ET ≤ µ1 − µ2 ≤ X 1 − X 2 + t1− α2 ,n1 +n2 −2 · ET

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 77 / 86


Caso 2: σ12 6= σ22 Un estimador insesgado de la varianza común σ 2 es

(n1 − 1)S12 + (n2 − 1)S22


Sc2 =
n1 + n2 − 2
q
s12 s22
Sea ET = n1 + n2 , entonces el intervalo de confianza será de

X 1 − X 2 − t1− α2 ,r · ET ≤ µ1 − µ2 ≤ X 1 − X 2 + t1− α2 ,r · ET

donde 2
s12 /n1 + s22 /n2

r=
[s12 /n1 ]2 [s22 /n2 ]2
n1 −1 + n2 −1

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 78 / 86


Intervalo de confianza para la diferencia de proporciones de
dos poblaciones

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 79 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 80 / 86
Intervalo de confianza para la varianza de una población

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 81 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 82 / 86
J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 83 / 86
Intervalo de confianza para la razón de varianzas de dos
poblaciones

Sean S12 y S22 las varianzas de dos muestras aleatorias independientes de


tamaños n1 y n2 seleccionadas de dos poblaciones normales respectivas con
varianzas σ12 y σ22 . Sea la siguiente distribución

S12 /σ12
F = ∼ F (n1 − 1, n2 − 1)
S22 /σ22

Con esa distribución se construye el intervalor de confianzas

s12 σ2 s2
2
· f α2 ,n1 −1,n2 −1 ≤ 12 ≤ 12 · f1− α2 ,n1 −1,n2 −1
s2 σ2 s2

J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 84 / 86


J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 85 / 86
J. Cerda-Hernández, Ph.D. (Depart. Econ.) Estadı́stica 2 UNI 86 / 86

También podría gustarte