Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Inferencia Estadistica PDF
Inferencia Estadistica PDF
7.1. Introduccin
En este tema estudiaremos como aproximar distintos parmetros poblacionales a partir de una m.a.s. formada
por observaciones independientes de una poblacin, en los que sigue cuando digamos m.a.s. entenderemos que
es una muestra aleatoria formada por observaciones independientes.
Normalmente el parmetro (por ejemplo , . . . ) tendr distribucin conocida o la aproximaremos por el
T.L.C.
7.2. Estimadores
Definicin 115 Estadstico: Sean X1 , . . . , Xn n v.a. iid que forman una m.a.s. de una poblacin. Un esta-
dstico es una funcin de una de una muestra.
Podemos decir que un estadstico una variable aleatoria que es funcin de la muestra.
Definicin 116 Estimador puntual: Un estimador puntual de un parmetro es un estadstico que da como
resultado un nico valor del que se espera que se aproxime a .
Una realizacin del estimador T (x1 , . . . , xn ) = en una muestra se llama estimacin puntual de parmetro.
Ejemplo 117 Dada una m.a.s. X1 , . . . , Xn y una realizacin de la misma x1 , . . . , xn los principales estimadores
de los parmetros poblacionales que hemos visto son:
Parmetro
Poblacional Estimador()
Estimacin()
Pn Pn
Xi xi
X X = Pi=1
n x= i=1
Pnn
n
(Xi X)2 (xi x)2
X SX = P i=1n1 sP
X =
i=1
n1
n n
Xi xi
p pX = 1n n
1
78
Borrador RAM EST. SIS. 15-03-2004 79
Definicin 119 Estimador insesgado Sea un estimador de un parmetro poblacional . Diremos que es
= .
insesgado si E()
Es este caso la estimacin puntual se dice que es insesgada.
Ejemplo 120 En el ejemplo anterior para cualquier muestra de tamao n, X1 , . . . , Xn , tenemos que E(X) =
X por lo tanto X es un estimador insesgado de X .
Proposicin 121 Dada una m.a.s. La media, varianza y proporcin muestrales son estimadores insesgados de
sus correspondientes parmetros poblacionales.
Definicin 122 Sesgo: Sea un estimador puntual de un parmetro poblacional , llamaremos sesgo de a:
= E()
Sesgo()
Definicin 123 Eficiencia: Sean 1 y 2 dos estimadores de un parmetro poblacional obtenidos de la misma
muestra.
Ejemplo 124 Sea x1 , . . . , xn la realizacin ordenada de menor a mayor de una muestra de tamao n. Se define
la mediana(muestral como
x n+1 si n es impar
Me = 2
x n +x n +1
2
2
2
si n es par
Como vimos en problemas la mediana es tambin un valor de tendencia central, pero es un buen estimador
de ?
2
Se puede demostrar que si la poblacin tiene distribucin normal con media y varianza X entonces
2 1.57 2
E(M e) = y V ar(M e) = 2 nX n X
entonces Ef f.rel = VVar(M e)
ar(x) = 1.57
Luego si la muestra es de una poblacin normal X es ms eficiente (un 57 % ms de varianza) que la
Mediana.
1
Ejemplo 126
Definicin 128 Dada una funcin de verosimilitud L() de una muestra, sea = g(x1 , . . . , xn ) el punto donde
= max L(). Entonces
se alcanza en mximo de L() para la realizacin de la muestra x1 , . . . , xn , es decir L()
definimos el estimador de mxima verosimilitud de como el valor:
= g(X1 , . . . , Xn )
En ocasiones es conveniente trabajar con el logaritmo de la funcin de verosimilitud ya que el mximo de
log(L()) y L() es el mismo y suele ser ms fcil de maximizar.
Ejemplo 129 Sea X1 , . . . Xn una muestra con observaciones independientes, de una poblacin Bernouilli, por
ejemplo se pregunta a 100 personas si votarn al partido P.X. en las prximas elecciones y se anota un 1 si
lo votan y cero en cualquier otro caso. Sea = T (X1 , . . . , Xn ) un estimador cualquiera. Sea p la proporcin
poblacional de personas que votarn a P.X. Entonces
P (Xi = 1) = p y P (Xi = 0) = 1 p = q,
o lo que es lo mismo
1 Ms concretamente estos estimadores son del tipo UMVUE del acrnimo ingls Uniformly Minimum Variance Unbiased
P (X = xi ) = pxi q 1xi si xi = 0, 1
Como las observaciones son independientes. la funcin de verosimilitud es:
Derivando respecto de p
n n
X 1 X 1
( xi ) (n xi ) =0
i=1
p i=1
1p
Despejando
n
X n
X
(1 p) xi p(n xi ) = 0
i=1 i=1
por lo tanto Pn
i=1 xi
p=
n
luego el estimador mximo verosmil de p es la proporcin muestral, que es el que maximiza la funcin de
verosimilitud L(p).
De modo similar se puede definir los estimadores mximo verosmiles cuando el nmero de parmetros no
conocidos de la distribucin son ms de uno.
% para el
Definicin 130 Sea un parmetro, el intervalo (A, B) es un intervalo de confianza del (1 )100
parmetro si
P (A < < B) = 1 .
El valor 1 recibe el nombre de nivel de confianza, es la "cola"de probabilidad sobrante que normalmente
se reparte por igual (/2) a cada lado del intervalo. Es muy frecuente que el nivel de confianza se d en tanto
por ciento.
En lo que sigue daremos distintas maneras de calcular o aproximar intervalos de confianza para distintos
parmetros.
Borrador RAM EST. SIS. 15-03-2004 82
Ejemplo 131 Comencemos calculando un intervalo centrado en 0 para esta Z que tenga probabilidad 0.975.
X
0.975 = P (2.24 < < 2.24) =
n
P (X 2.24 < < X + 2.24 )
n n
Hemos encontrado un intervalo de confianza para , y adems la probabilidad de que se encuentre en el
intervalo
X 2.24 n , X + 2.24 n
es 0.975; luego es un intervalo de confianza con nivel de confianza 97.5 %
Ejemplo 132 Supongamos que tenemos una muestra con n = 16 de una v.a. normal de forma que x = 20, y
la desviacin tpica poblacional es conocida = 4. Entonces un intervalo de confianza al 97.5 % para ser:
(2.24)4 (2.24)4
20 , 20 +
16 16
La probabilidad con que el verdadero valor del parmetro se encuentra en el intervalo (17.76, 22.24) es
0.975, o lo que es lo mismo:
P (17.76 < < 22.24) = 0.975
Interpretacin: En el 97.5 % de la muestras de tamao 16 el verdadero valor del parmetro se encontrar
dentro del intervalo correspondiente.
En general si tenemos una m.a.s. X1 , . . . , Xn de una poblacin normal (representado por la v.a. X) con
distribucin normal de media y varianza conocida 2 el intervalo de confianza para al nivel de confianza
(1 ) 100 % ser:
X
1 = P (z/2 < Z < z1/2 ) = P (z/2 < < z1/2 ) =
n
P (z/2 < X < z1/2 ) = P (X + z/2 < < X + z1/2 )
n n n n
Borrador RAM EST. SIS. 15-03-2004 83
Ejemplo 133 Para discutir la conveniencia de aumentar sus instalaciones una empresa desea estimar la de-
manda que espera recibir. Para ello, selecciona al azar a diez de sus clientes, observando el nmero de unidades
demandadas en el ltimo ao por stos se distribuye de la forma siguiente:
Nm. Unidades Nm. Clientes Unidades Clientes
1.000 1 1.000
1.002 2 2.004
1.004 1 1.004
1.006 2 2.012
1.008 1 1.008
1.010 2 2.020
1.012 1 1.012
Total 10 10.06
Supongamos que la demanda sigue una distribucin normal con varianza poblacional conocida 2 = 16 y que
se espera que en el futuro siga comportndose como en el periodo anterior, calcular un intervalo de confianza
al 90 % para la media de la demanda futura.
Solucin: Tenemos las siguientes condiciones:
Ejemplo 134 Se tom una muestra de 147 expertos en investigacin de mercados y se les pidi que calificasen
en una escala de 1 (totalmente en desacuerdo) a 10 (totalmente de acuerdo) la siguiente afirmacin: A veces
utilizo tcnicas de investigacin que garantizan la obtencin de los resultados que mi cliente o jefe desea. La
calificacin media de la muestra fue 6.06 y la desviacin tpica muestral fue 1.43. Se pide calcular un intervalo
de confianza al 90 % para la media de las puntuaciones.
Solucin: El enunciado no nos asegura que la poblacin sea normal pero como el tamao de la poblacin
es grande podemos aplicar el resultado anterior.
Tenemos n = 147, S = 1.43, 1 = 0.1 entonces 2 = 0.05 y por lo tanto z10.05 1.65
El
intervalo para la media poblacional
de las puntuaciones al nivel de confianza del 90 % es
1.43 1.43
6.06 1.65 147 , 6.06 + 1.65 147 =
(5.8654, 6.2546)
Distribucin t de Student
Si queremos calcular un intervalo de confianza para en una poblacin normal con varianza poblacional
desconocida necesitamos una nueva distribucin: la t de Student.
Dada una muestra de n observaciones con media muestral X y desviacin tpica muestral SX procedente de
una poblacin normal con media la variable aleatoria:
X
t= X
S
n
P (t t) = 1 P (t t)
Notacin: Sea t una v.a. que sigue una distribucin t de Student con g.l. Denotaremos por t, al valor
para el que se verifica que:
P (t t, ) = .
Luego t, es el cuantil de una t de Student con g.l. y t, = t,1 .
Ejemplo 136 Un fabricante de cartuchos de tinta para impresoras afirma en su publicidad que sus cartuchos
imprimirn un promedio de 500 pginas*; donde el asterisco remite a una nota a pie de pgina donde afir-
ma que: Datos tcnicos: Muestra mensual de tamao n = 25 poblacin supuesta normal nivel de
confianza del 90 %.
Una organizacin de consumidores desea comprobar estas afirmaciones y toma tambin una muestra al azar
de tamao n = 25 obteniendo como media x = 518 pginas y una desviacin estndar SX = 40. Comprobar que
con esta muestra la media poblacional que afirma el fabricante cae dentro del intervalo de confianza del 90 %
Solucin: El problema se reduce a calcular, bajo las condiciones que afirma el fabricante el intervalo de
confianza para con = 0.1.
Mirando en las tablas de la t de Student para n 1 = 24 g.l. tenemos que tn1 , 1 2 = t24,10.05 = 1.711
El intervalo para la media al 90 % es
40 40
518 1.711 , 518 + 1.711 = (504.312, 531.688) .
25 25
Es este caso la afirmacin del fabricante queda contradicha por la muestra pues 500 cae fuera del intervalo.
En cualquier caso se equivoca a favor del consumidor.
Ejemplo 137 En una muestra aleatoria de 500 familias que poseen televisores en una ciudad se encontr que
340 se haban suscrito al canal TEVE. Encontrar un intervalo de confianza del 95 % para la proporcin actual
de familias de esta ciudad que estn suscritas a TEVE.
Borrador RAM EST. SIS. 15-03-2004 86
Tenemos una poblacin binomial donde los xitos son las familias que tienen contrato con TEVE. Sea X el
nmero de familias contratadas con TEVE entre una muestra aleatoria de tamao n. Entonces X sigue una dis-
tribucin binomial con n repeticiones y probabilidad de xito p (proporcin poblacional de familias contratadas
ppX p
a TEVE). Si llamamos pX = X n a la proporcin muestral, sabemos que Z = p(1p)
sigue aproximadamente
n
una distribucin normal estndar.
Pero como es evidente no conocemos p as que no tenemos ms remedio que aproximar el denominador
r r
p(1 p) pX (1 pX )
n n
p
Si la muestra es grande Z = p ppX(1 p
seguir siendo aproximadamente normal estndar.
X X)
n
De la frmula anterior no podemos determinar el tamao de la muestral sin conocer pX as que nos
podremos en el caso peor:
El mximo de
q
pX (1pX )
n
se alcanza en pX = 0.5 y en este caso
q
0.5(10.5)
n por lo tanto en el peor de los casos2
2
0.25z1
n= A2
2
.
de 18 aos. Encuesta telefnica, seleccin aleatoria, de tamao mil, error en las proporciones 3 % con una confianza del 95 %
supuesto que p = q = 12
Borrador RAM EST. SIS. 15-03-2004 87
P (2 2, ) =
es decir el cuantil 2 de una v.a. con distribucin 2 . Estos valores estn tabulados para distintos g.l. en la
tabla de la distribucin 2 .
Ejemplo 138 Sea 210 una v.a. que tiene distribucin 2 con 10 g.l. Entonces 210,0.995 = 25.19 y 210,0.005 =
2.16, es decir
P (2.16 210 25.19) = P (210 25.19) P (210 2.16) = (1 0.005) (1 0.995) = 0.995 0.005 = 0.99
1 = P (2, 2 2 2,1 2 )
Si tenemos una muestra de tamao n de una poblacin normal con desviacin tpica muestral SX
2
, dado un
(n1)S2
nivel de confianza 1 tendremos que 2n1 = 2
X
y entonces:
2
(n 1)SX (n 1)SX
2
(n 1)SX2
P (2n1, 2 2
) = P(
n1,1 2 2
)
2 2n1,1 2n1,
2 2
Luego, bajo estas condiciones, un intervalo de confianza para la varianza poblacional del (1 )100 % es
!
(n 1)SX2
(n 1)SX2
, .
2n1,1 2n1,
2 2
P (2n1 < 2n1, 2 ) =
2
y
2n1,1 2
es el valor tal que
P (2n1 2n1,1 2 ) = 1
2
donde 2n1 es una v.a. que sigue una distribucin 2 con n 1 g.l.
Observacin El intervalo de confianza para 2 no est centrado en SX
2
.
Borrador RAM EST. SIS. 15-03-2004 88
Ejemplo 139 Una cadena de hoteles tiene una Lnea 900 para recibir reservas telefnicas. Un ndice de la
calidad del servicio es el tiempo de espera, el tiempo que transcurre desde que el telfono suena por primera
vez hasta que el operador responde. El estndar de la cadena es que el tiempo promedio de espera no debe
ser superior a 30 segundos adems se supone que la distribucin del tiempo de espera ser aproximadamente
normal. La cadena tiene inspectores que visitan los distintos hoteles y verifican todos los aspectos del servicio.
Estas personas realizan cada semana 30 llamadas para hacer reservas y anotan, entre otros indicadores el tiempo
de espera en cad una de ellas. En una semana los tiempos de espera en segundos son:
12, 13, 13, 14, 14, 14, 15, 15, 16, 17, 17, 18, 18, 19, 19, 25, 25, 26, 27, 30, 33, 34, 35, 40, 40, 51, 51, 58,
59, 83
Calcular un intervalo de confianza para la varianza y la desviacin poblacionales al nivel 95 %.
Solucin: Sea X el tiempo de espera. Haciendo los clculos tenemos que (redondeando al segundo decimal):
X = 28.37 y sX = 17.37
Como 1 = 0.95 tenemos que 2 = 0.025, entonces mirando en las tablas de la 2 (y redondeando tambin
al segundo decimal)
2
2n1, 2 = 229,0.975 = 45.72 y n1 , 1 = 229,0.025 = 16.05.
2
Por lo tanto un intervalo de confianza del 95 % para 2 es
(13.83, 23.35) .