Está en la página 1de 9

www.elsolucionario.

net
390 Estadística

9.3 Estimación de parámetros por intervalos


9.3.1 Intervalo de confianza
Una estimación de punto no nos dice cuán próxim o está la estimación al
parámetro que se estima, por lo tanto, no es muy significativa, sin no se nene
alguna medida del error que se con.ete en la estimación. Es deseable pues tener
cierto grado de confianza de que la estim ación de punto se halle dentro de cierta
variación.
La estimación p o r intervalo (propuesto por J. Neyman en 1937), es la
estimación de un parámetro 0 dentro de un intervalo de extremos cerrados [a,¿>],

www.elsolucionario.net
donde los números a y b se obtienen a partir de la distribución de la estadística
que estima puntualmente el parámetro; y a partir de los valores de la muestra.
Sea X , , X 2, . . . , Xn una muestra aleatoria de tamaño n escogida de una
población f{x, 0), cuyos valores experim entales (o datos) respectivos son
x x, x 2.....x n Sea además, la variable aleatoria © = H ( X x, X 2,.... X n) una
estadística para estim ar el parám etro 0 cuya distribución de probabilidad sea
conocida. Si dado el número 1 —a , y si a partir de la distribución de © se pueden
encontrar las variables aleatorias A = H l ( A , , A ' 2, . . . , Xn ) , y
B = H 2( X x, X 2,..., X „ ) talesque:

p \a < 0 < fí]= 1 - a

entonces, se dice que el intervalo aleatorio [A , B] es el intervalo estimador del


parámetro 0 con el grado o nivel de confianza de (1 - a ) x 100% , o que 0 e [A, B]
con probabilidad 1 —a .

Además, si a = H ]( x ], x 2,...,xn), y b = H 2( x ¡ , x 2,...,x„). son los valores


numéricos que resultan de sustituir los valores de la muestra en las estadísticas A y
B respectivamente, entonces, se dice que el intervalo numérico [a, b] es el
intervalo de confianza del (1 - a ) x 100% para 0, o que 0 e [a, b) con nivel o grado
de confianza de 1 (1 - a ) x 100%.
La diferencia, pues, entre los intervalos [¿4, B] y [a, b], es que el primero es
un intervalo aleatorio y por lo tanto tiene validez afirmar que la probabilidad
que contenga al parámetro 0 es igual a 1 - a . M ientras que el segundo es un
intervalo numérico fijo, y en este caso, ,:t> tiene validez afirmar que la
probabilidad P\a < 0 < ¿ ] = l - a .

www.FreeLibros.me
www.elsolucionario.net
Estimación de parámetros 391

La in te rp re ta c ió n del intervalo de confianza es como sigue: Si a partir de los


Jatos de una muestra aleatoria de tamaño n, hemos constru.do el intervalo
a < B < b con grado de confianza, por ejemplo, del 95% paia el parámetro G.
entonces si se seleccionan repetidamente 100 muestras de tamaño n, tendremos
100 intervalos semejantes al intervalo [a b ] , y se confía que 95 de estos 100
intervalos contengan el parámetro 8.
La probabilidad 1 - a , o el porcentaje ( l - a ) x ] 0 0 % es denominado el
grado (o nivel) de confianza. Sus valores más utilizados son 0.95, 98, 0.99 entre
otros. Al número a se le denomina también riesgo de estimación por intervalo.
A los números a y b se les denomina los limites de confianza o de
tolerancia del parámetro 0 . El número a es el límite inferior de confianza y el

www.elsolucionario.net
número b es el límite superior de confianza.
Por otra parte, si la estadística A ] verifica:

p [¿ , < e ] = 1 - a

se concluye que el intervalo [ü( ,+oo[ es un intervalo de estimación unilateral del


parámetro 0 del (1 - a ) x 100% , donde ci{ es el valor de A¡ que se obtiene a partir
de la muestra.
Simi ¡ármente, si la estadística B \ verifica:

P [ 8 < £ ,] = l- a

se concluye que el intervalo ] —oo, ¿>, J es un intervalo de estimación unilateral del


parámetro 0 del (1 - a ) x 100% , donde b¡ es el valor de Bx que se obtiene a partir
de la muestra.

9.4 Intervalo de confianza para la media \i

9.4.1 Intervalo de confianza para la media fi:


Varianza d 2 supuesta conocida
Sea X x, X X n una muestra aleatoria de tamaño n seleccionada de una
población normal ( o de cualquier otro tipo, siendo n grande) con media p y
varianza a 2 supuestamente conocida.
El mejor estimador puntual del parámetro p es la media muestral X

www.FreeLibros.me
www.elsolucionario.net
392 Estadística

Se puede utilizar, entonces, la distribución muestral de la inedia X para


determinar el intervalo de confianza del parámetro p.
Si la población es norm al N([\, a 2) , entonces, la distribución del
estadístico X es normal N(\i, G'ln) para cualquier valor de n (n > 2 ).
Si la población no es norm al, pero tiene media p y varianza a finitas,
entonces, siempre que el tamaño n de la muestra sea suficientemente grande,
(n > 30), por el teorema del límite central, la distribución de X es
aproximadamente normal N(\\, cT ln).
Por tanto, según sea el caso, la distribución de la variable aleatoria.

7 X -ii

www.elsolucionario.net
es exactamente (o aproximadamente) normal N(0, H

Luego, dado el valor 1 - a (o en %), en la distribución de Z, se pueden


determinar los valores + Z ^aj 2 (figura 9.1) tales que:

^ Z < Zi_a/2 ] = 1- a.

Sustituyendo Z = ( X — (j.)cr/\ [ ñ , se tiene,

X - |i
“l-a/2 — ¡ i — —^i-a/2 = 1 - a .
a /v «

De donde resulta.
— a — _ a
X — Z]_a/2 i— —M — X + ~ i—ct/2 i— = 1 - a.
xn

P[A < | i < B] = 1 - a .

donde A = X - z,_a/2 c s /J ñ y B = X + Zi_a/2 ct/a/h son variables aleatorias.

Esto es, si X es estimador de H, se tiene la probabilidad 1 - a de que el


intervalo (aleatorio o estimador) [A, B] contenga al parámetro p.

Luego,

www.FreeLibros.me
www.elsolucionario.net
Estimación de parámetros 393

Si x es el valor de la media X paia una muestra aleatoria de tamaño n escogida

d 2 una población con v a ria ría a 2 supuesta conocida, el intervalo de confianza del

(1 -a )x lO O % para p es:

— ^ I- c t/2 i— - P - ■* ^ ^ l-a /2 i—
Vn V«

El valor Z x_a¡2 se busca en la tabla normal /V(0,1), tal que P[Z < Z x_a¡2 ] = 1—ot/2 .

www.elsolucionario.net
La ilustración, es la figura 9.1, en la que los valores a - x - z,_a/2 o /V ñ y

b = x + Z\_a¡2 c / - J ñ son los límites de conpanza de (j., inferior y superior,


respectivamente.

intervalo de n

F ig u r a 9.1: Intervalo de e sn m ac .ó n p a ra ja (con estad ística Z.)

In terp retació n . Si se seleccionan repetidamente 100 muestras de tamaño n, y


calculamos las medias de cada una de ellas, tendremos 100 intervalos semejantes
al intervalo [ a , b \, y se confía que 95 de estos 100 intervalos contengan el
parámetro p y 5 de los 100 no lo contengan como se muestra en la figura 9 Ib. Los
puntos circulares en el centro de cada intervalo indican la estimación puntual de p.
Notar que todos los intervalos son del mismo ancho, ya que este último sólo
depende de Z\_a / 2 una v e/ que se determina x En la figura 9.1b los intervalos
correspondientes a las medias x 2 , x 4 no contienen al parámetro p, mientras que el
resto de los intervalos si contienen al parámetro.

www.FreeLibros.me
www.elsolucionario.net
394 Estadística

------- -------
*1 muestra 1
*2 muestra 2
*3 muestra 3
, muestra 4
*5 muestra S
í6 muestra 6
*7 muestra 7

www.elsolucionario.net
Fig. 9.1b

NOTA. (Población finita, muestreo sin reemplazo)


Si la muestra aleatoria de tamaño n es escogida sin reposición de una
población fin ita de tam año N , entonces, si n > 3 0 , la variable aleatoria:

X-ix
Z' =
N-n
Í N- l
JñV
tiene distribución aproximadamente normal N(Ú I ). Utilizando la distribución de Z
se determina el intervalo de confianza de (j..

Luego, si X es un valor de la media X para una muestra aleatoria de tamaño n


escogida de una población fin ita de tam año N con varianza a 2 supuesta conocida,
el intervalo de confianza del ( l - a ) x l 0 0 % para n es:

a ¡N-n _ a ¡N-n
^l-a/2
^ V ~ Ñ ^ - iX- X + Z'- a /2 J ñ \ ~ Ñ ^ Í -

NOTA. (Error estándar)


Se denom ina error estándar de un estim ador a la desviación estándai del
estimador. A su valor numérico se denomina error estándar estimado. Por
ejemplo, el error estándar (E.S.) de la media de una muestra de una población
infinita (o población finita con sustitución) es

www.FreeLibros.me
www.elsolucionario.net
Estimación de parámetros 395

Si la población es finita de tamaño N y e\ muestreo es sin reposición el e rro r


está n d a r (E.S.) de la media muestral es:

a N -n
x V ^ V /v -r

Luego, el intervalo de confianza del (1 - a ) x 100% para (i se puede obtener a


partir de los lím ites de to leran cia o confianza:

x + Z i^ E .S .

EJEM PLO 9.7.

www.elsolucionario.net
Una muestra aleatoria de 100 hogares de una ciudad indica que el promedio
de los ingresos mensuales es de $500. Encuentre un intervalo de confianza del 95%
para la media poblacional de los ingresos de todos los hogares de esa ciudad.
Suponga a — $ 1 0 0 .

SOLUCION.
Sea X el ingreso familiar mensual de esa ciudad, cuyo promedio p se quiere
estimar a partir de una muestra aleatoria de tamaño n = 100. La estimación puntual
de (i es x = 5 0 0 . Para el nivel de confianza 1 - a = 0.95 , en latabla normal
estándar se encuentra: ¿ ]_ a /2 = Z0 .9 7 5 = 1-96.

El error estándar de la media X es O jt = ~^= = = 10.


yfn V100
Los límites de tolerancia de |A son:

x + z,_a/2a ^ = 5 0 0 + 1.96(10) = 5 0 0 + 19.6

Luego, el intervalo de confianza del 95% para n es: [480.4, 519.6]


Esto es, se tiene u n a confianza del 95% que el prom edio del ingreso
fam iliar (i de esa ciudad, está en el intervalo [$480.4, $519.6],

NOTA. M uestras diferentes darán diferentes valores de jc , y portanto darán


diferentes intervalos de estimación de |x Decir que el intervalo de estimación
contiene al parámetro con confianza 95%, equivale a decir que 95 por LOO de los
■ntervalos contienen a la media |J. y que sólo el 5 por 100 no lo contienen

EJEMPLO 9.8.
Un analista de investigación de mercados escoge una muestra aleatoria de 100
clientes de un conjunto de 500 clientes de una gran tienda que declararan ingresos
mayores a $5,000. El encuentra que los clientes de la muestra gastaron en la tienda

www.FreeLibros.me
www.elsolucionario.net
396 Estadística

un promedio de $2500. Si con este valor de la muestra se estima que el gasto


promedio de la población finita varía de 2446 a 2554, ¿qué nivel de confian/a se
utilizó?. Suponga que la desviación estándar de la población es a = $300.

SOLUCION.

El intervalo de confianza del 1 - a en % para la media n, es la expresión:

_ o IN-n _ a ¡N-n
x ~ z'~a/2 X V z,-a/2 V a^T'

donde, * = $ 2 ,5 0 0 , = o 300 /5 0 0 -1 0 0 = 2 6 g 5 9 7

www.elsolucionario.net
x J ñ \N - 1 V Í00V 5 0 0 -1

De (i e [2446, 2554], se obtiene 2554 = 2,500 + Zi_a/2 (26.8597).

Luego, Z|_a /2 = 2 .0 1 , a = 0.0444,

1 - a =0.9556.

N O TA . ( E r r o r de estim ación)
Si x estima a (i, entonces, el e r r o r de la estim ación es el valor numérico
| í - [i| (ver figura que sigue).

error

.I - . ■ - - I ----------m I—
a X b
a = X - Z ^ a/2^ x y b = x + z i-a/2c x

El valor mínimo del error de estimación es igual a cero, esto ocurre, cuando x
estima exactamente a f i .

El valor máximo del error de estimación es igual a Zi-a/ 2 a x , ya que del


intervalo de estimación de JJ. resulta:

| * - n | á z i-a /2 °x -
Luego,

Si 3c esüm a a ^ , entonces, se tiene una confianza del ( l - a ) x l 0 0 % de que el error


de 4a estimación no será superior a Zi_r/2 CTx ’ ^ ontk cr es el error estándar de la
media.

www.FreeLibros.me
www.elsolucionario.net
Estimación de parámetros 397

Por ejem plo, en el ejemplo 9.7 se tiene una confianza del 95% de que al estimar
).i por S500 el error de la estimación no será superior a S I9.6.

Mientras que en el ejemplo 9,8 se tiene una confianza del 95.56% de que al
estimar (i como $2500 el error de la estimación no será superior a $54.

NOTA. (T am año de la m u estra).


Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de
manera que si p se estima por 3c", el error de estimación no sea mayor que un valor
dado e. En efecto, el valor de n se obtiene de

www.elsolucionario.net
z l-a/2CTx - e

Entonces,
Si x estima a p., entonces, se tiene u n a confianza del ( l - a ) x l 0 0 % de que el
e rro r no será m ay o r que el v a lo r d ado e cuando el tamaño de la muestra sea

( z l-a/2a )2

Si la población es finita de tamaño /V y el muestreo es sin sustitución, el error


estándares o ^ = y < J ñ \ ] ( N - n ) / ( N -1 ) y el valor de n se calcula por:

z l a/2o 2 + e 2( N - \ )

Por ejemplo:
a) En el ejemplo 9.7, se tiene una confianza del 95% de que al estimar la media de
la población, el error de la estim ación no será mayor de $ 18 cuando el tamaño n
de la muestra es:

„ = U , —/ ^ = (1 .9 6 )^ (1 0 0 )^
e2 (18)

b) En el ejemplo 9.8, se tiene una confianza del 97% de que al estimar la media de
la población, el error de la estimación no será mayor de $50 cuando el tamaño n
de la muestra es:

, ZI? ° ] N - ------- C - ' 7 > W ( 5 0 0 ) g | 2 6 .7 9 s l 2 7 .


¿i-a/ 2 CT + e 2( N - 1) (2.17) (300) + (5 0 )2( 5 0 0 - l)

www.FreeLibros.me
www.elsolucionario.net
398 Estadística

N O TA . (E stim ación del to tal de la población)


Si la muestra aleatoria de tamaño rt. se escoge de una población finita dc
tamaño N, entonces,

total de la población-. ^ X ¡ = N\x .


i=i

La estimación puntual del total N [l es N x .


El intervalo de confianza del ((1 - a)100% ) para n es:

X —Z\_a i 2 G % —P X + Z]_a / 2 ® x

www.elsolucionario.net
Luego, el intervalo de confianza del ((1 - a ) 100% ) para N[i es:

N ( x - Zi_a/2C>x ) < N p < N(X +

donde = (p /y [ ñ \j(N - n ) / ( N - 1) es el error estándar

Para dar un ejem plo, en el ejem plo 9.8, la estimación puntual del total de
gastos de la población N\i es N x =500($2500) = $1,250,000 .
Ademas, los límites de confianza al 959? para el total N [l son:

N i x + z ^ O x l l = 500< 2500 + 1.96 x 26.8597) = 1.250,000 + 26322.506

Luego, N\i e [1,223,677.494, 1,276,322.506] con confian/a 95%.


Consecuentemente, si el total de la población JVjJ. se estima cn $1,250,000. se
tiene una confianza del 95% de que el error de la estimación no será superior a
$26322.506.

9.4.2 Intervalo de confianza para la media jn:


Varianza o 2 supuesta desconocida

A) Población no normal
Si la población no es normal pero el tamaño de la muestra es ->uficientemenie
grande ( n > 3 0 ), se utiliza la desviación estándar s de la muestr, como
estimación puntual dc la desviación estándar o dc la población. Entonces, utilizando

www.FreeLibros.me

También podría gustarte