Está en la página 1de 11

3.

1 LA ESTIMACIN
La estimacin es un proceso que consiste en emplear los estadsticos
obtenidos de una muestra X
,
para inferir o estimar los parmetros
de la poblacin ( o o ).
Existen dos clases de estimacin:

- Estimacin puntual.
- Estimacin por intervalos de confianza.

3.1.1 Estimacin Puntual

En una situacin prctica es posible usar varios estadsticos como
estimadores puntuales para un parmetro de la poblacin. Cmo se puede
decidir cul de las diversas opciones es la mejor? Para hacerlo se necesita
observar el comportamiento del estimador en el muestreo repetido, descrito
por su distribucin muestral.

Si realizamos un experimento de tiro al blanco. El parmetro de inters es
el centro del blanco al que se tira. Cada flecha tirada por el tirador,
representa una sola estimacin de la muestra, la cual representa al
estimador. Suponiendo que otra persona tira y da en el centro del blanco.
Se puede concluir que l es un excelente estimador? Permanecera al
lado del blanco mientras se realiza un segundo tiro? Probablemente no, por
que no tiene ninguna medida de qu tan bien se desempea en ensayos
repetidos Siempre que tira al blanco, da al blanco o de forma constante
pega muy alto o muy bajo? Sus tiros se agrupan muy cerca alrededor del
blanco, o por lo general falla por un amplio margen? En la figura 2.1 se
muestran varias configuraciones del blanco. Cul blanco consideras que
corresponda a los mejores tiros?

Figura 2.1 Cul tirador el mejor?


x
x x x
x xx x
x x x

x x x x
x x x x
x x x
x



x x
x x

x x
x x
x x x
x x



x x x
x x x
x x x
Consistentemente
abajo del blanco
Consistentemente
arriba del blanco
Fuera del blanco por
un amplio margen
Mejor puntera.



Para un estimador puntual estadstico de la distribucin muestral del
estimador proporciona informacin acerca del mejor estimador. Dos
caractersticas son valiosas en un estimador puntual.

1. La distribucin muestral del estimador puntual se debe centrar sobre
el verdadero valor del parmetro por estimar. Es decir, el estimador
no debe subestimar o sobrestimar de forma consistente el parmetro
de inters. Se dice que tal estimador es insesgado.


Se dice que el estimador de un parmetro es in-sesgado si la media de su
distribucin es igual al valor verdadero del parmetro. De otra manera, se
dice que el estimador es sesgado.


La figura 2.2 muestra las distribuciones muestrales para un estimador in-
sesgado y un estimador sesgado. La distribucin muestral para el estimador
sesgado se recorre a la derecha del valor verdadero del parmetro. Este
estimador sesgado tiene ms probabilidades de sobre estimar el valor del
parmetro que uno in-sesgado.






Figura 2.2

Distribuciones
Para estimadores
sesgados e in
sesgados.





Estimador
Insesgado
Estimador
sesgado





Valor verdadero
del parmetro

2. La segunda caracterstica deseable de un estimador es que la
dispersin (medida por la varianza) de la distribucin muestral
debe ser tan pequea como sea posible. Esto asegura que, con una
probabilidad alta, un estimador individual quedar cerca del
verdadero valor del parmetro. En la figura 2.3 se muestran las
distribuciones mustrales para dos estimadores insesgados, una con
una varianza pequea
1
y la otra con una varianza ms grande.
Naturalmente, se preferira al estimador con la varianza ms pequea
porque las estimaciones tienden a quedar ms cerca del verdadero
valor del parmetro que en la distribucin con la varianza ms
grande.


1
Los estadsticos comnmente usan el trmino varianza de un estimador cuando en realidad se refieren a
la varianza de la distribucin muestral del estimador. Esta expresin es de uso casi universal.
3.




Figura 2.3

Comparacin de la
variabilidad del
estimador.




Estimador con
Varianza menor


Estimador con
Varianza mayor




Valor verdadero
del parmetro

En situaciones de muestreo de la vida real se podra saber que la
distribucin muestral de un estimador se centra respecto del parmetro que
se intenta estimar, pero todo lo que se tiene es la estimacin calculada de
las n mediciones contenidas en la muestra.
Qu tan lejos del valor verdadero quedar su estimacin del parmetro?
Qu tan cerca del centro del blanco estar la flecha del tirador? La
distancia entre la estimacin y el verdadero valor del parmetro se llama
error de estimacin.

La distancia entre una estimacin y el parmetro estimado se llama
error de estimacin.

En est unidad se considerarn tamaos de muestras grandes, por
consiguiente los estimadores insesgados que se estudiarn tienen
distribuciones muestrales que pueden aproximarse mediante una
distribucin normal (debido al teorema del lmite central). Es importante
recordar que para cualquier estimador puntual con una distribucin normal,
la regla emprica establece que alrededor del 95% de las estimaciones
puntuales estarn alrededor de dos (o con ms exactitud, 1.96) desviaciones
estndar de la media de esa distribucin. Para estimadores insesgados esto
implica que la diferencia entre el estimador puntual y el valor verdadero del
parmetro ser menor que 1.96 desviaciones estndar o 1.96 errores
estndar (SE, por sus siglas en ingles), y esta cantidad, conocida como
margen de error, proporciona una lmite prctico para el error de
estimacin (figura 2.4) Puede ser que el error de estimacin exceda este
margen de error, pero es poco probable.















Valor verdadero


Margen de error Margen de error



Una estimacin particular




Figura 2.4
Distribucin muestral de un estimador in-sesgado.




95%
1.96
x
o 1.96
x
o
Estimacin puntual de un parmetro poblacional

Estimador puntual: un estadstico que se calcula usando mediciones
muestrales
Margen de error: 1.96 x error estndar del estimador.

Cmo se estima una media o proporcin poblacional?
- Para estimar la media poblacional , en el caso de una poblacin
cuantitativa, el estimador puntual x es in-sesgado con error estndar
dado por

n
x
o
o =

El margen de error se calcula como
|
|
.
|

\
|

n
o
96 . 1

Si no se conoce el valor de o , y n es 30 o ms grande, se puede usar la
desviacin estndar de la muestra para aproximar o .
2

- Para estimar la proporcin poblacional p en el caso de una poblacin
binomial, el estimador puntual
n
x
p = es in-sesgado con error
estndar dado como

n
pq
x
= o
El margen de error se calcula como
n
pq
96 . 1

Y se estima como
n
q p
96 . 1

Supuestos: 5 5 > > nq y np . Puesto que se desconocen los valores
de p y q, usar 5 5 > > q n y p n


2
Cuando la muestra es grande este estadstico est aproximadamente normalmente distribuido, ya sea que
la poblacin muestreada sea o no normal.

Para calcular los errores estndar de estas dos estimaciones puntuales se
puede calcular los errores estndar de estas dos estas dos estimaciones
puntuales se necesit estimar o con s, p con p y q con q . Estas
aproximaciones de los errores estndar diferirn slo ligeramente del
verdadero valor de
x
o cuando el tamao de la muestra n sea grande, y
tendrn poco efecto en el margen de error. De hecho en la tabla 2.1 se
muestra que, para la mayora de los valores de p sobre todo cuando p est
entre 0.3 y 0.7 hay un cambio muy pequeo en pq , el numerador de
x
o cuando cambia p.

Tabla 2.1
Algunos valores calculados de
pq
p q
pq
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.09
0.16
0.21
0.24
0.25
0.24
0.21
0.16
0.09
0.30
0.40
0.46
0.49
0.50
0.49
0.46
0.40
0.30


Ejemplo 3.1
Un investigador est interesado en la posibilidad de fusionar las
capacidades de la televisin y la Internet. Una muestra aleatoria de n = 50
usuarios de Internet a los que se encuest para determinar el tiempo que
pasan viendo la televisin produjo un promedio de 11.5 horas a la semana
con una desviacin estndar de 3.5 horas. Usa est informacin para
estimar la media poblacional del tiempo que los usuarios de Internet pasan
viendo la televisin.



Solucin
La variable aleatoria media es el tiempo a la semana que se dedica a ver
televisin. sta es la variable aleatoria cuantitativa que es mejor descrita
por su media

. La estimacin puntual de

, el tiempo promedio que los


usuarios de Internet dedican a ver televisin, es
5 . 11 = x
horas. El
margen de error es
|
|
.
|

\
|
=
|
|
.
|

\
|
=
50
96 . 1 96 . 1 96 . 1
o o
o
n
x


Aun que no se conoce
o
, el tamao de la muestra es grande, y se puede
aproximar el valor de
o
mediante s. Por consiguiente, el margen de error
es aproximadamente.

1 97 . 0
50
5 . 3
96 . 1
50
5 . 3
96 . 1 96 . 1 ~ =
|
|
.
|

\
|
=
|
|
.
|

\
|
=
|
|
.
|

\
|
n
s


Puede sentirse seguro de que la estimacin muestral de 11.5 horas de ver
televisin para los usuarios de Internet est a 1 hora de la media
poblacional.


3.1.2 Importancia de la Estimacin por Intervalo

Es una forma de establecer la precisin o confiabilidad de un estimador
puntual. La construccin de este intervalo a partir de la informacin
observada y recopilada de una muestra provee una banda alrededor del
parmetro estimado, asegurando con una probabilidad determinada que
dicho parmetro est ubicado dentro del intervalo. A dicho intervalo se le
conoce de varias maneras: de confianza, estimado de confianza, regin de
confianza, intervalo de confianza (IC).

La probabilidad de que un intervalo contenga al parmetro que se estima se
le llama Coeficiente de confianza el cual se denota por ) 1 ( o para estimar
el parmetro poblacional respectivo.

La estimacin por intervalos de confianza consiste en emplear un conjunto
de valores dentro del cual se espera se encuentre el valor del parmetro en
cuestin. La ventaja de este tipo de estimacin por intervalos de confianza
es que muestra su exactitud a menor valor del intervalo de confianza.



Figura 2.5.
Los valores de una variable aleatoria normal se
encuentran en el intervalo
o 3


Los nmeros del extremo de
estos intervalos se llaman limites
de confianza del 68.27%,
95.45% y 99.73%

El porcentaje de confianza
recibe el nombre de nivel de
confianza. Los nmeros 1.96,
2.58, etc. en los lmites de
confianza se llaman valores
crticos y se denotan como
c
z
.

Podemos encontrar los valores
crticos a partir de los niveles de
confianza y viceversa.

En la tabla 2.2 se muestran los valores de
c
z correspondientes a varios
niveles de confianza que se utilizan en la prctica. Se puede encontrar los
valores de
c
z para los niveles de confianza que no estn en la tabla a partir
del rea bajo la curva normal que se encuentra en la tabla I del apndice I

Nivel de
Confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80%

75% 68.27% 50%
Valores crticos
c
z
3 2.58 2.33 2.05 2 1.96 1.645 1.28


1.15 1 0.6745
o 0.0027 0.01 0.02 0.04 0.0455 0.05 0.10 0.20
0.25
0.3173 0.5
Tabla 2.2 Algunos Niveles de confianza que se utilizan en la prctica.


Puesto que el rea total bajo la curva es 1, el rea restante en las dos colas
es o , y cada cola contiene un rea
2
o
. El valor de z que tiene con rea de
cola
2
o
a su derecha se llama
2
o
z
, y el rea entre
2
o
z
y
2
o
z
es el
coeficiente de confianza ) 1 ( o
. Los valores de
2
o
z
que los
experimentadores suelen usar sern comunes para nosotros cuando
empecemos a construir intervalos de confianza para diferentes situaciones
prcticas.
















2
o
z
0
2
o
z

Figura 2.6
o
o o
=
|
.
|

\
|
< < 1
2 2
z Z z P


) 1 ( o
2
o

2
o

También podría gustarte