Está en la página 1de 11

3.

Teora de la Estimacin Estadstica La inferencia estadstica es el proceso de usar resultados muestrales para obtener conclusiones respecto a las caractersticas de una poblacin. En esta seccin estudiaremos los procedimientos estadsticos que permitan estimar dos parmetros de una poblacin: la media y la proporcin. Razn para estimar Los administradores utilizan las estimaciones porque se deben tomar decisiones racionales, sin que tengan la informacin pertinente completa y con una gran incertidumbre acerca de lo que pueda deparar el futuro, pero con la intencin de que las estimaciones constituyan una buena aproximacin de los parmetros desconocidos de la poblacin. Estimador Es la regla o procedimiento, expresado en general por medio de una frmula, que se utiliza para deducir la estimacin. Estimacin Es un valor especfico observado de un estimador, por lo que asigna uno o varios valores numricos a un parmetro de una poblacin sobre la base de datos de muestra. Tipos de estimacin a) Estimacin puntual: consiste en un solo estadstico muestral que se usa para estimar el valor verdadero de un parmetro de una poblacin que es desconocido. Por ejemplo, la media muestral x es una estimador puntual de la media n muestral p es un estimador puntual de la verdadera poblacional proporcin poblacional p . Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno de estimacin es prcticamente improbable que el valor de la estimacin coincida con el verdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin con alguna medida que nos permitiera expresar la cercana del estimador al parmetro. Una solucin a ello no los brindan los estimadores por Intervalos de Confianza.

b) Estimacin por intervalo: es la estimacin de un parmetro de la poblacin dado por dos nmeros que forman un intervalo que contiene al parmetro con una cierta probabilidad.

 

Conceptos bsicos. Nivel de Confianza Est asociado con la probabilidad de que el intervalo de confianza contenga al parmetro de la poblacin y es expresado en porcentaje. Los niveles de confianza que ms se utilizan son 90%, 95% y 99%. Lo denotaremos por 1 , donde es un valor tal que 0 < < 1 . Note que a medida que e acerca a 0, 1 se acerca a 1, sto significa que aumenta la probabilidad de que el intervalo construido contenga al verdadero valor del parmetro que estamos estimando. Nivel de Significacin: Llamaremos as al valor de . Lmites de Confianza Son el lmite inferior y superior de un intervalo de confianza.

Percentiles de la Distribucin Normal. Denotaremos z1 al percentil 1 de la distribucin Normal Estndar, es decir a 2

aquel valor real tal que: P( Z z 1- 2 ) = 1 2 Interpretacin de los intervalos de confianza Un intervalo de confianza se puede interpretar de dos maneras diferentes. Ejemplo: una directora de tiendas cree que el gasto medio de sus clientes en el ltimo ao se encuentra en el intervalo de 35 a 38 dlares y concede una confianza del 95% a ese intervalo. Interpretacin 1: confa al 95% en que la media poblacional se encuentra entre 35 y 38 dlares. Nota: no significa que haya una probabilidad de 0.95 35 y 38 dlares. En sentido apriorstico (antes de formar el intervalo de confianza) o no est comprendido en l; es decir, el 0.95 de probabilidad se asigna a nuestro grado de confianza de que el intervalo contenga en l.  3 212)& ' 0  (0( & % % ! ! # $! ! T !        % U # T ! !  S #   % G  ( 0 % E0 BFE)`I Y X)G ) (W V  Q %  % G    (   (    %  9 7 5T 4 RPIH0 FE3)DC)B@A@86!3 211)& ' ( 0 ( & %!  ! ! ! ! # $! " ! 

Interpretacin 2: si se construyen todos los intervalos de confianza posibles, el 95% de ellos incluir el parmetro desconocido.

Intervalos de confianza para la media poblacional y la proporcin (muestras grandes) Con el objeto de mostrar cmo se construyen los intervalos de confianza, realizaremos la deduccin de uno de ellos. Para el resto de los intervalos el procedimiento es similar as que se darn slo las expresiones para el clculo de los mismos. Para la construccin de los Intervalos es necesario tener en cuenta la distribucin muestral de los estimadores de inters, as que diferenciaremos los casos de manera anloga a como lo hicimos para estudiar las distribuciones en el muestreo. I ) Intervalos de Confianza para la Media de una poblacin con varianza conocida. Poblacin Normal Poblacin Infinita con tamao de muestra n > 30 n 0,05 Poblacin Finita , muestreo sin reemplazo con N

Supongamos que deseamos estimar la media de una poblacin de la cual conocemos su varianza 2 , bajo una de las 3 condiciones anteriores. Sabemos que bajo estas condiciones la distribucin muestral de la media es normal, exactamente:
Z= x ~ N (0,1) n
x < z = 1 por lo que P 1 2 2 n Como la distribucin Normal es simtrica, tenemos que:
P ( Z > z1 ) = P ( Z < z1 ) =
2 2

o equivalentemente, . P( z1 < Z < z1 ) = 1


2 2

Si sustituimos Z por

x y despejamos , que es nuestro parmetro desconocido,

n obtenemos el intervalo de confianza del 1- % para

; x + z1 x z1 2 2 n n

n 0,05 N Recuerde que en este caso para el error de la distribucin de muestreo de la media necesitamos calcular el factor de correccin, as que obtenemos:

Poblacin Finita , muestreo sin reemplazo con

x z1 2 n

N n ; x + z 1 2 N 1 n

N n N 1

b) Varianza de la Poblacin desconocida tamao de muestra n > 30

que al seguir el procedimiento anterior se obtiene:

   3 ) 7$ 7 C 1 ) &$  7  31 ) &$   FE@#D B(A%@98665420('%#"! 

  

= S , por lo

S S ; x + z1 x z1 2 2 n n Intervalos de confianza para la media poblacional (muestras pequeas) En muchas aplicaciones, obtener una muestra grande es poco probable e incluso imposible, por ejemplo, las compaas de seguro que comprueban la resistencia de los carros a las colisiones. Destruir a propsito 30 o ms carros puede ser algo caro. Cuando hay que tomar una muestra pequea, la distribucin t de student es ms apropiada.

La distribucin t (a) Caractersticas

s s ; x + t1 (n 1) x t1 2 (n 1) 2 n n

Es simtrica respecto de la media. El eje horizontal es una asntota y la grfica se extiende de Su varianza es mayor que 1 por lo que grficamente esta distribucin es ms achatada y ms dispersa que la normal. La varianza de la distribucin depende de los grados de libertad (es el nmero de valores que podemos escoger libremente. gl = n 1) n 1 La varianza es 2 = n 3 Cuando n

)@ 6 CCBA1@ 976" 5 3 10)(&$# "!    D " 2 2% 8 4 2 '%  

siendo t1 (n 1) el percentil 1- 2 de la distribucin t de Student con n-1 grados de


2

libertad.

Ejemplo3.1 Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en el ro. Suponga que los datos siguen una distribucin normal con una desviacin estndar de 0.3. Solucin: La estimacin puntual de es 2.6. La varianza de la poblacin es conocida el valor de z del 95% es 1.96, por lo tanto el intervalo lo calcularamos como: y por tanto [2.5,2.7] con una confianza del 95%. O en otras 36 palabras, la probabilidad de que la concentracin media de zinc est entre 2.5 y 2.7 gramos por mililitro es de 0.95.

2.6

1.96 * 0.3

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo ser ms amplio:

2.6

2.575 * 0.3 36

[2.47,2.73]

la probabilidad de que la concentracin media de zinc est entre 2.47 y 2.73 gramos por mililitro es de 0.99.

. Como se puede observar en los resultados del ejercicio se tiene un error de estimacin mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un nivel de confianza del 95%.

Ejemplo3.2 Extraemos una muestra de 61 estudiantes universitarios, ellos responden a una prueba de inteligencia en la que alcanzan una media de 80 y una varianza de 100. Entre qu lmites se hallar la verdadera inteligencia media de los estudiantes, a un nivel de confianza del 99%? 1 = 0.99 = 0.01 1 = 0.995 2 La varianza poblacional es desconocida y la poblacin no es normal, pero el tamao muestral es mayor que 30, por tanto buscamos en las tablas la distribucin t de Student t 0.995 (60) = 2.66 . Sabemos que X = 80 y s = 10 . Sustituyendo en el intervalo de confianza tenemos: 10 10 ,80 + 2.66 80 2.66 61 61 por tanto, [76.57,83.43] con un nivel de confianza del 99%. Nota: En este caso como n>30, pueden utilizarse los percentiles de la distribucin Normal en lugar de los de la t de student en el clculo del intervalo de Confianza.

Ejemplo 3.3 Una empresa elctrica fabrica 3000 focos con una duracin aproximadamente distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de 300 focos tiene una duracin promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media de la poblacin de todos los focos que produce esta empresa. Solucin: En este caso la varianza de la poblacin es conocida, la poblacin es finita, as que:
n 300 = = 0.1 > 0.05 , de manera que necesitamos calcular el factor de correccin: N 3000

N n = N 1

2700 = 0.95 2999

= 40 , n = 30, = 0.04 1

= 0.98 2 segn la tabla de la normal tenemos : z 0.98 = 2.054


y obtenemos el intervalo: 780 0.95 *

2.054 * 40 30 0

por tanto [775.3, 784.7], lo que quiere decir que con una probabilidad de 0.96 podemos afirmar que la duracin promedio de los focos se encontrar en ese intervalo. La expresin z12

y z1- 2 s x es el margen de error. Grficamente:

c) Para la proporcin: tericamente, la distribucin binomial es la distribucin correcta para utilizarse en la construccin de intervalos de confianza para estimar una proporcin, sin embargo, debido a que el clculo de probabilidades binomiales es muy tedioso podemos aproximar a una normal al aumentar el tamao de la muestra y siempre que np y n(1-p) sean mayores o iguales 5.

p z1

p ( 1 p) ; p + z1 n

p ( 1 p) n
p ( 1 p) n

Nuevamente el margen de error de estimacin es S p = z1

Determinacin de tamao de muestra en estimacin Qu tan grande deber ser la muestra seleccionada para realizar una estimacin por Intervalo de Confianza?, si es muy pequea se puede fallar en la obtencin de los objetivos de nuestro anlisis; pero si es demasiado grande desperdiciamos recursos cuando tomamos la muestra. Siempre se tendr algo de error de muestreo debido a que no hemos estudiado a la poblacin completa, cada vez que tomamos una muestra perdemos algo de informacin til con respecto a la poblacin; pero ese error se puede controlar si se selecciona una muestra cuyo tamao sea adecuado. Dado un nivel de confianza que se desea, hay dos factores principales que influyen en el tamao muestral necesario: a) La variabilidad de la poblacin (queda fuera del control del investigador). b) El grado de error que se puede tolerar en la estimacin. Si queremos estimar la media y el error de estimacin permitido es e entonces z1 2 el tamao de muestra necesario es n = e , e= x
2

Si el parmetro a estimar es la proporcin , entonces: z 21 2 p (1 p ) n= e= p p e2

p=0,5.

Ejemplo 3.4 Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras? Solucin:
e = 4 = 12.2 z 0.975 1.96 * 12.2 = 1.96 entonces n = = 35.73 4
2

 ) ! ! 4 & )  & 4 & 5  ! 5 &  ) &  & $ !   aQR%QA`Y%EG%8X3GEWV%%DU4  7T@Q(S'%R%8@

H &! 4 & ) & 4 & 5 C & 4 9  ! 5 &  ) &  & $!   7%EG%F 3ED6BA@87%%64  3210('%#" 
a a colocar

  

  QPI

En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza en que difiere en menos de 4 libras de x .

Ejemplo 3.5 Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 95% de confianza que la media real est dentro de 10 horas de la media real? Solucin:
1.96 * 40 n= = 61.5 10
2

Se necesita una muestra de 62 focos para estimar la media de la poblacin y tener un error mximo de 10 horas. Qu pasara si en lugar de tener un error de estimacin de 10 horas slo se requiere un error de 5 horas?
1.96 * 40 n= = 61.46 10
2

Se necesita una muestra de 62 focos como mnimo. Se puede observar como el tamao de la muestra aumenta considerablemente al disminuir el error permitido a la mitad, pero esto tiene como beneficio una estimacin ms exacta. Ejemplo 3.6 1.Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos, ella supone que el 50% del electorado conoce su opinin.Qu

tamao de muestra se necesita si se requiere una confianza del 95% y un error mximo de estimacin de 0.10? Solucin: La proporcin de residentes que conoce la opinin de la legisladora es de 0.5, as que:

p (1 p ) z1 / 2 0.5 * 0.5 *1.96 2 n= = = 96.04 e2 0.12

Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la estimacin tenga un error mximo de 0.10. Control de la anchura del intervalo Es evidente que si se estrecha el intervalo, se suministrar al investigador una estimacin ms exacta del valor del parmetro. Hay dos mtodos corrientes para estrechar un intervalo, pero para ambos se debe hacer un sacrificio adicional. Estos procedimientos son: a) Ajuste del nivel de confianza: por la propia naturaleza de los intervalos de confianza, si se acepta un nivel de confianza ms bajo, se podra generar un intervalo ms preciso, menos amplio, pero eso aumenta la probabilidad de error. b) Ajuste del tamao de la muestra: el aumentar el tamao de la muestra disminuye el error esperado y es ms probable que se d una estimacin ms ajustada del valor verdadero del parmetro, con ello se puede conservar un nivel de confianza determinado y al mismo tiempo disminuir la anchura del intervalo; pero el sacrificio es un aumento ya sea de tiempo, del gasto, etc.; que se exige para recoger los datos para una muestra mayor.

También podría gustarte