Está en la página 1de 11

TEMA 2: ESTIMACIN PUNTUAL.

ESTIMACIN POR INTERVALOS DE


CONFIANZA.
1.

INTRODUCCIN A LA INFERENCIA ESTADSTICA

El objetivo bsico de la inferencia estadstica es hacer inferencias o sacar


conclusiones sobre la poblacin a partir de la informacin contenida en una
muestra aleatoria de la poblacin. Ms especficamente, podemos decir que la
inferencia estadstica consiste en el proceso de seleccin y utilizacin de un
estadstico muestral, mediante el cual, utilizando la informacin que nos
proporciona una muestra aleatoria, nos permite sacar conclusiones sobre
caractersticas poblacionales.
Cualquier inferencia o conclusin obtenida de la poblacin, necesariamente,
estar basada en un estadstico muestral, es decir, en la informacin
proporcionada por la muestra (formalmente definimos un estadstico como una
funcin de las observaciones muestrales). La eleccin del estadstico apropiado
depender de cul sea el parmetro poblacional que nos interese. El valor
verdadero del parmetro ser desconocido y un objetivo sera estimar su valor,
por lo que tal estadstico se denomina estimador.
Las inferencias sobre el valor de un parmetro poblacional se pueden obtener
bsicamente de dos maneras: a partir de estimacin o bien a partir del
contraste de hiptesis.
En la estimacin, basta seleccionar un estadstico muestral cuyo valor se
utilizar como estimador del valor del parmetro poblacional.
En el contraste de hiptesis, se hace una hiptesis sobre el valor del parmetro
y se utiliza la informacin proporcionada por la muestra para decidir si la
hiptesis se acepta o no.
Ambos mtodos de inferencia estadstica utilizan las mismas relaciones tericas
entre resultados muestrales y valores poblacionales. As pues, una muestra es
sacada de la poblacin y un estadstico muestral es utilizado para hacer
inferencias sobre el parmetro poblacional. En estimacin, la informacin
muestral es utilizada para estimar el valor del parmetro . En el contraste de
hiptesis, primero se formula la hiptesis sobre el valor de y la informacin
muestral se utiliza para decidir si la hiptesis formulada debera ser o no
rechazada.
Pero cuando se utiliza la inferencia para estimar un parmetro poblacional
debemos decir cmo de buena es esa inferencia, o sea debemos dar una medida
de su bondad. Para ello ser necesario conocer la diferencia existente entre la
estimacin del parmetro poblacional, calculada a partir de una muestra
especfica de tamao n, y el valor verdadero del parmetro poblacional.
2. EL PROBLEMA DE LA ESTIMACIN: ESTIMACIN PUNTUAL

La estimacin estadstica se divide en dos grandes grupos: la estimacin


puntual y la estimacin por intervalos. La estimacin puntual consiste en
obtener un nico nmero calculado a partir de las observaciones muestrales, y
que es utilizado como estimacin del valor del parmetro . Se le llama
1

estimacin puntual porque a ese nmero, que se utiliza como estimacin del
parmetro , se le puede asignar un punto sobre la recta real. En la estimacin
por intervalos se obtienen dos puntos ( un extremo inferior y un extremo
superior) que definen un intervalo sobre la recta real, el cual contendr con
cierta seguridad el valor del parmetro .
El estimador del parmetro poblacional es una funcin de las variables
aleatorias u observaciones muestrales y se representa por
$ =g ( X 1 , X 2 ,..., X n )
Para una realizacin particular de la muestra ( x1 , x2 ,..., xn ) se obtiene un valor
especfico del estimador que recibe el nombre de estimacin del parmetro
poblacional y lo notaremos por
$ = g ( x1 , x2 ,..., xn )
Vemos pues que existe diferencia entre estimador y estimacin. El estimador es
un estadstico y, por tanto, una variable aleatoria y el valor de esta variable para
una muestra concreta ( x1 , x2 ,..., xn ) ser la estimacin puntual. El estimador
tendr su distribucin muestral.
En la tabla 2.1 expresamos diferentes parmetros poblacionales, sus
estimadores y sus estimaciones.
Parmetro
poblacion Estimador
al

Estimacin

Media
Varianza
2
Proporci
n p

Xi
i 1

n
1 n
2 S 2
( X i X )2

n 1 i 1
p

X
nmeroxit os

n
nmeroprue bas

x
i 1

n
1 n
s2
xi x
n 1 i 1

x
n

TABLA 2.1 Parmetros poblacionales, estimadores y estimaciones.


Para la eleccin de estos estimadores puntuales nos hemos basado,
principalmente en la intuicin y en la posible analoga de los parmetros
poblacionales con sus correspondientes valores muestrales, pero ste no ser el
mtodo ms adecuado para la obtencin de estimadores puntuales, aunque en
este caso se obtienen estimadores satisfactorios para los parmetros
poblacionales. En general, el problema de obtener estimadores puntuales no
ser tan sencillo, por ello tenemos que dar propiedades que seran deseables
que se cumplieran por los diferentes estimadores puntuales obtenidos, aunque
no existe un mecanismo o mtodo nico que nos permita obtener el mejor
estimador puntual en todas las circunstancias.
Nuestro objetivo ahora ser
dar algunas propiedades deseables de los
estimadores puntuales, con el fin de poder conocer la bondad de los mismos,

pues cuantas ms propiedades verifiquen los estimadores puntuales mejores


sern.

* PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES


a) Estimador insesgado
Si tenemos un gran nmero de muestras de tamao n y obtenemos el valor del
estimador en cada una
de ellas, sera deseable que la media de todas estas estimaciones coincidiera
con el valor de .
Se dice que un estimador es insesgado si su esperanza matemtica coincide
con el valor del parmetro a
estimar.
b) Estimador eficiente
Se dice que los estimadores son eficientes cuando generan una distribucin
muestral con el mnimo
error estndar ,es decir, entre dos estimadores insesgados de un parmetro
dado es ms eficiente el de
menor varianza.
c) Estimador consistente
Un estimador se dice consistente cuando su valor tiende hacia el verdadero
valor del parmetro a
medida que aumenta el tamao de la muestra . Es decir, la probabilidad de
que la estimacin sea el
verdadero valor del parmetro tiende a 1.
d) Estimador suficiente
Se dice de un estimador que es suficiente cuando es capaz de extraer de los
datos toda la informacin importante sobre el parmetro.
3. ESTIMACIN POR INTERVALOS
La estimacin puntual es poco til, pues solo obtenemos un valor como
aproximacin al que tratamos de estimar. Es mucho ms interesante obtener un
intervalo dentro del cual se tiene una cierta confianza de que se encuentre el
parmetro que tratamos de estimar.
El objetivo que se pretende con los intervalos de confianza es obtener un
intervalo de poca amplitud y con una alta probabilidad de que el parmetro se

encuentre en su interior. As pues, elegiremos probabilidades cercanas a la


unidad, que se representan por 1- y cuyos valores ms frecuentes suelen ser
0'90, 0'95 y 0'99.
Luego si deseamos obtener una estimacin por intervalo
del parmetro
poblacional desconocido, tendremos que obtener dos estadsticos
X 1 , X 2 ,..., X n
y X 1 , X 2 ,..., X n que nos darn los valores extremos del
intervalo, tales que
P X 1 , X 2 ,..., X n X 1 , X 2 ,..., X n 1
Al valor 1- se le llama coeficiente de confianza, y
Al valor 100(1-) % se le llama nivel de confianza.
a) Intervalo de confianza para la proporcin poblacional.
Si p representa la proporcin de xitos en una muestra aleatoria de tamao n
suficientemente grande y
q=1-p, entonces un intervalo de confianza
aproximado para la proporcin poblacional p al nivel de confianza del 100(1-)
% viene dado por:

p q
p q
, p z
p z

n
n
2
2

en donde z / 2 es tal que

2
y la variable aleatoria Z sigue una distribucin N(0,1).
P[Z> z / 2 ]=

b) Intervalo de confianza para la media de una poblacin normal, siendo


conocida
Supongamos que tenemos una muestra aleatoria de n observaciones de una
distribucin N(, ). Si es conocida, y la media muestral observada es x ,
entonces el intervalo de confianza para la media poblacional , al nivel de
confianza del 100(1-)% viene dado por:

x z / 2

, x z / 2
n
n

donde z / 2 es tal que


P ( Z z / 2 )
y la variable aleatoria ZN(0,1).

c) Intervalo de confianza para la media de una poblacin normal, siendo


desconocida y n<30.
Supongamos que tenemos
distribucin N(,). Si
muestral observadas son
confianza para la media
viene dado por:

una muestra aleatoria de n<30 observaciones de una


es desconocida, y la media y la desviacin tpica
x y s, respectivamente, entonces el intervalo de
poblacional , al nivel de confianza del 100(1-)%
s$
s$
, x t / 2
n
n

x t / 2

donde t / 2 es tal que

2
sigue una distribucin t-Student con n-1 grados de libertad.
P tn 1 t / 2

y la variable tn 1

d) Intervalo de confianza para la varianza de una poblacin normal.


Supongamos una muestra aleatoria de n observaciones de una distribucin
2
N(,). Si es desconocida y la varianza muestral observada es s$ entonces el
intervalo de confianza para la varianza poblacional 2 al nivel de confianza del
100(1-)% viene dado por:
( n 1) s (n 1) s
, 2
2

n 1, / 2 n 1,1 / 2
2
donde n 1,1 / 2 es tal que:

P n21 n21,1 / 2

2
y n 1, / 2 es tal que:

P n21 n21, / 2 1
y la variable aleatoria
grados de libertad.

n21

sigue una distribucin 2

de Pearson

con n-1

e) Intervalo de confianza para la diferencia de medias en poblaciones


normales independientes
Supongamos dos muestras independientes de tamao nx y n y procedentes de
poblaciones normales.

N x , x

N y , y , respectivamente. Si las medias para las muestras

observadas son

y , entonces un intervalo de confianza, al nivel de


x e
confianza del 100(1-)%, para las diferencias de medias poblacionales x y
viene dado por:

( x y ) z / 2

2
2
x2 y
x2 y

, ( x y ) z / 2

nx n y
nx n y

en donde z / 2 es el nmero tal que: P Z z / 2


una N(0, 1).

y la variable aleatoria Z sigue


2

4. ESTIMACIN DEL TAMAO MUESTRAL


Sabemos que si tomamos una muestra aleatoria simple de tamao n procedente
de una poblacin N(,), siendo conocida, el intervalo de confianza al nivel
del 100(1-)% para la media poblacional vena dado por:

I x z / 2
, x z / 2
n
n

Siendo la amplitud del intervalo

L ( x z / 2
) ( x z / 2
) 2 z / 2
n
n
n

(*)

Si, previamente, se fija la longitud del intervalo L y deseamos conocer el


tamao de la muestra para obtener ese intervalo al nivel de confianza del
100(1-)%, bastar despejar n de la expresin (*), pues L, z / 2 y son
conocidos, y tendremos que el tamao de la muestra ser:
n 4 z2 / 2

2
L2

el cual nos permitir construir un intervalo al nivel de confianza del 100(1-)%


y de amplitud L para la media de una poblacin normal con conocida.
Tambin podramos hacer el siguiente razonamiento cuando sea conocido, si
la media

fuera el valor central del intervalo, entonces x estimara


puntualmente a sin error alguno,

x
|---------------------------|----------------|---------------------------|

x z / 2
x z / 2

error

Pero generalmente x no ser exactamente igual a y entonces se comete un


error, E=| x -|, que como mximo ser:

E= z / 2
n
entonces si queremos determinar el tamao de muestra necesario para obtener
un intervalo de confianza para la media poblacional , admitiendo un error E,
tendremos que despejando de la expresin anterior:
n z2 / 2

2
E2

z2 / 2 p q z2 / 2 p q
Igualmente se tendra para una proporcin : n=4
=
L2
E2

EJERCICIOS TEMA 17
1. En un hospital psiquitrico se ha estudiado una muestra de 150 pacientes y
se ha observado que 38 de ellos tienen una cierta tendencia al suicidio. Hallar
un intervalo de confianza al nivel de 95% para el parmetro proporcin de
individuos con tendencia al suicidio de la poblacin.
2. Se desea hacer un estudio de mercado sobre el nivel de aceptacin de un tipo
de detergente. Para ello, se ha tomado una muestra aleatoria formada por 60
personas, de las cuales 45 son asiduas usuarias del citado detergente. Hallar un
intervalo de confianza al nivel de 99% para la poblacin de usuarios del citado
detergente en una comarca muy poblada.
3. Un psiclogo escolar ha estudiado que el tiempo de reaccin de 1 de
Primaria se distribuye normalmente. Con una muestra de 100 alumnos, la
media de tiempo de reaccin fue de 45 segundos y la desviacin tpica de 0,04
segundos. Hallar un intervalo de confianza para la media de tiempos de
reaccin al nivel de confianza de:
a)
b)
c)
d)

90%
95%
99%
Interpretar los resultados obtenidos.

4. El nivel de desarrollo cognitivo de nios de 5 aos se distribuye segn una


normal con una varianza poblacional igual a 11,56. Se ha elegido una muestra
aleatoria formada por 60 nios de 5 aos y se ha determinado que la media del
nivel de desarrollo cognitivo es igual a 13 puntos. Hallar un intervalo de
confianza para la media poblacional al nivel de 95%.
Cuntos nios se debera haber tomado en la muestra para estar seguro, al
nivel del 95%, de que el error mximo es 0,1?
5. Se sospecha que el nmero de unidades que contiene cada dosis de un
medicamento no llega a las 10.000 que se indican en el envase pero el
laboratorio que lo fabrica afirma que el contenido medio de la dosis es de
10.000 unidades. Para comprobarlo, tomamos al azar 100 dosis y determinamos
el nmero de unidades de cada una, obteniendo de media 9940 unidades y de
desviacin tpica 120 unidades.
Si suponemos que la distribucin del nmero de unidades en la poblacin es
normal, qu podemos decir acerca de la afirmacin del laboratorio para un
nivel de confianza del 99%?

6. Se afirma que la estatura media de las personas adultas de una determinada


regin es de 1,80m. Queremos tener una confianza del 99% en saber si la
afirmacin anterior es correcta o errnea. Para ello, tomamos una muestra al
azar de 100 personas adultas, a las que medimos sus alturas, obteniendo de
media 1,78 m. y de desviacin tpica 0,10 m. Suponemos que la variable objeto
de estudio es normal.
7. Las edades en que se produce la muerte, para una muestra aleatoria de 39
individuos fallecidos de tuberculosis, dan una media de 50 aos y una
desviacin tpica muestral de 6 aos. Suponiendo normal la distribucin, se
pide:
a) Estimaciones por puntos no sesgados de la media y la varianza.
b) Hallar un intervalo de confianza para la media al nivel del 99%.
8. Los tiempos de reaccin ante la palabra = divorcio ? se distribuyen
normalmente tanto entre los hombres como entre las mujeres. La desviacin
tpica poblacional de dichos tiempos en el caso de los hombres es 6 segundos y
en las mujeres es 7 segundos. Con el fin de estimar la diferencia de medias
poblacionales, se escoge una muestra formada por 40 hombres y 38 mujeres,
obtenindose tiempos medios de reaccin 15 segundos y 14 segundos,
respectivamente. Hallar un intervalo de confianza para la diferencia de medias
poblacionales al nivel del 90%.
9. En un estudio sobre hbitos de alimentacin en murcilagos, se sabe que la
distancia que recorren volando en una pasada en busca de alimento sigue una
distribucin normal tanto en los machos como en las hembras. Las desviaciones
tpicas poblacionales son 80 y 75 metros, respectivamente. Con el fin de estimar
la diferencia de medias de distancias recorridas, se toma una muestra formada
por 40 machos y 35 hembras y se determinan las medias muestrales, que son,
respectivamente, 230 y 140 metros. Hallar un intervalo de confianza para la
diferencia de medias recorridas poblacionales al nivel del 95%.
10. De una poblacin de personas comparables con exceso de peso se
seleccionan dos grupos A y B de 100 y 50 individuos, respectivamente. A los
individuos del grupo A se les suministra una nueva dieta D1 con la que sufren
una prdida media de peso al cabo de un mes de 7,9 Kg. con una desviacin
tpica de 0,2 Kg. A los individuos del grupo B se le suministra una dieta D2 con
la que sufren una prdida media de peso al cabo de un mes de 6,8 Kg., con una
desviacin tpica de 0,3 Kg. Hallar los lmites de confianza del 95% para la
diferencia del nmero medio de Kg. perdidos producido por el suministro de las
dos dietas D1 y D2 .
11. En un Instituto de Investigaciones Dermatolgicas se est investigando una
afeccin cutnea de tipo cancergeno. Se eligen 40 ratas de una misma raza
aleatoriamente y se les provoca el cncer citado; a continuacin se las frota con
un medicamento. Se elige como variable de respuesta el nmero de horas que
tarda el cncer en desaparecer. Se obtuvieron los siguientes resultados: x =10

horas y s=101 horas. Se admite que la variable de respuesta sigue una


distribucin normal. Se pide:
a) Calcular el intervalo de confianza para la media de la variable de respuesta,
al nivel del 90%.
b) Si =99 horas, calcular el intervalo de confianza al 99% para la media de la
variable de respuesta elegida.
c) Que tamao de muestra se necesita para que al nivel de confianza del 95%,
la longitud del intervalo sea de 5 horas, supuesto = 99 horas?
12. Con el fin estimar la proporcin de votantes favorables a un candidato, se
ha elegido un muestra al azar formada por 100 personas y se ha detectado que
47 de ellas son favorables al candidato. Si el error mximo que se comete es de
0,1 determinar el tamao de la muestra, en cada caso, para que la confianza en
que el candidato salga elegido sea del
a) 90%
b) 95%
c) 99%.
13. Una muestra aleatoria formada por 130 datos extrados de poblacin normal
de varianza igual a 80 presenta una media muestral de 120. Se pide:
a) Hallar el intervalo de confianza para la media poblacional a los niveles de
confianza del 95% y del 90%.
b) Comparar los intervalos desde el punto de vista de la informacin que
generan.
c) Se quiere tener una confianza del 95% de que la estimacin no se separa en
ms de 1,2 de la verdadera media. Cuantas observaciones adicionales debern
tomarse?
14. Un director de una compaa de autobuses est interesado en la
puntualidad de su servicio. Toma una muestra aleatoria s, de tamao 20 y
encuentra una media de demora en minutos de 6,8 y una s muestral de 120.
a) Construir un intervalo de confianza para al 99%.
b) Cul debera ser el tamao n muestral para que el largo total del intervalo
sea de 10 minutos?
15. Un fabricante de una determinada marca de vehculos de lujo sabe que el
consumo de gasolina de sus vehculos se distribuye normalmente. Se selecciona
una muestra aleatoria de 6 coches y se observa el consumo cada 100 km.,
obteniendo las siguientes observaciones 192, 194, 184, 186, 205, 208
Obtener un intervalo de confianza para el consumo medio de gasolina de todos
los vehculos de esa marca al nivel del 90%.
16. El precio de un determinado artculo perecedero en los comercios de
alimentacin de una ciudad sigue una distribucin normal. Se toma una muestra
aleatoria de 8 comercios y se observa el precio de ese artculo, obteniendo las
siguientes observaciones:

10

132, 125, 130, 139, 126, 138, 124, 140


Obtener el nivel de confianza del 95%
a) Un intervalo de confianza para la media poblacional
b) Un intervalo de confianza para la varianza poblacional
17. Se sabe que los estudiantes de una provincia duermen un nmero de horas
diarias que se distribuye segn una ley Normal de media horas y desviacin
tpica =2 horas.
a) A partir de una muestra de 64 alumnos se ha obtenido el siguiente intervalo
de confianza (7,26 - 8,14) para la media de la poblacin.
Determinar el nivel de confianza con que se ha construido dicho intervalo.
b) Determinar el tamao muestral mnimo necesario para que el error que se
cometa al estimar la media de la poblacin por un intervalo de confianza sea,
como mximo, de 0,75 h. con un nivel de confianza del 98%.
18. En una poblacin una variable aleatoria sigue una ley Normal de media
desconocida y desviacin tpica 2.
a) Observada una muestra de tamao 400, tomada al azar, se ha obtenido una
media muestral igual a 50. Calcule un intervalo, con el 97% de confianza, para
la media de la poblacin.
b) Con el mismo nivel de confianza, qu tamao mnimo debe obtener la
muestra para que la amplitud del intervalo que se obtenga sea, como mximo,
1?
19. Se ha medido la talla de 100 personas elegidas al azar, mediante muestra
aleatoria s, de entre los estudiantes varones de bachillerato de una gran ciudad,
obtenindose una talla media de 175 m. Se sabe que la desviacin tpica de la
poblacin es 0,2 m.
Con qu nivel de confianza se ha construido el intervalo (173 , 177) para la
media poblacional?
20. La longitud de la ballena azul se distribuye segn una ley Normal con
desviacin tpica 7,5 m. En un estudio estadstico realizado a 25 ejemplares se
ha obtenido el intervalo de confianza (2106, 2694) para la longitud media.
a) Calcule la longitud media de los 25 ejemplares de la muestra.
b) Calcule el nivel de confianza con el que se ha construido dicho intervalo.

11

También podría gustarte