Está en la página 1de 7

ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA.

1. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

El objetivo básico de la inferencia estadística es hacer inferencias o sacar conclusiones sobre la población a
partir de la información contenida en una muestra aleatoria de la población. Más específicamente, podemos
decir que la inferencia estadística consiste en el proceso de selección y utilización de un estadístico
muestral, mediante el cual, utilizando la información que nos proporciona una muestra aleatoria, nos permite
sacar conclusiones sobre características poblacionales.

Cualquier inferencia o conclusión obtenida de la población, necesariamente, estará basada en un estadístico


muestral, es decir, en la información proporcionada por la muestra (formalmente definimos un estadístico
como una función de las observaciones muestrales). La elección del estadístico apropiado dependerá de
cuál sea el parámetro poblacional que nos interese. El valor verdadero del parámetro será desconocido y un
objetivo sería estimar su valor, por lo que tal estadístico se denomina estimador.

Las inferencias sobre el valor de un parámetro poblacional θ se pueden obtener básicamente de dos
maneras: a partir de estimación o bien a partir del contraste de hipótesis.

En la estimación, basta seleccionar un estadístico muestral cuyo valor se utilizará como estimador del valor
del parámetro poblacional.

En el contraste de hipótesis, se hace una hipótesis sobre el valor del parámetro θ y se utiliza la información
proporcionada por la muestra para decidir si la hipótesis se acepta o no.

Ambos métodos de inferencia estadística utilizan las mismas relaciones teóricas entre resultados muestrales
y valores poblacionales. Así pues, una muestra es sacada de la población y un estadístico muestral es
utilizado para hacer inferencias sobre el parámetro poblacional. En estimación, la información muestral es
utilizada para estimar el valor del parámetro θ. En el contraste de hipótesis, primero se formula la hipótesis
sobre el valor de θ y la información muestral se utiliza para decidir si la hipótesis formulada debería ser o no
rechazada.

Pero cuando se utiliza la inferencia para estimar un parámetro poblacional debemos decir cómo de buena es
esa inferencia, o sea debemos dar una medida de su bondad. Para ello será necesario conocer la diferencia
existente entre la estimación del parámetro poblacional, calculada a partir de una muestra específica de
tamaño n, y el valor verdadero del parámetro poblacional.

2. EL PROBLEMA DE LA ESTIMACIÓN: ESTIMACIÓN PUNTUAL

La estimación estadística se divide en dos grandes grupos: la estimación puntual y la estimación por
intervalos. La estimación puntual consiste en obtener un único número calculado a partir de las
observaciones muestrales, y que es utilizado como estimación del valor del parámetro θ. Se le llama
estimación puntual porque a ese número, que se utiliza como estimación del parámetro θ, se le puede
asignar un punto sobre la recta real. En la estimación por intervalos se obtienen dos puntos (un extremo
inferior y un extremo superior) que definen un intervalo sobre la recta real, el cual contendrá con cierta
seguridad el valor del parámetro θ.

1
El estimador del parámetro poblacional θ es una función de las variables aleatorias u observaciones
muestrales y se representa por
 =g ( X 1 , X 2 ,..., X n )
x , x ,..., x
Para una realización particular de la muestra ( 1 2 n ) se obtiene un valor específico del estimador que

recibe el nombre de estimación del parámetro poblacional θ y lo notaremos por


 = g ( x1 , x2 ,..., xn )
Vemos pues que existe diferencia entre estimador y estimación. El estimador es un estadístico y, por tanto,
x1 , x2 ,..., xn ) será la estimación
una variable aleatoria y el valor de esta variable para una muestra concreta (
puntual. El estimador θ tendrá su distribución muestral.

En la siguiente tabla expresamos diferentes parámetros poblacionales, sus estimadores y sus


estimaciones.

Parámetro
Estimador Estimación
poblacional
n n

Media  ∑ Xi x i

μ^ = X̄= i=1 x  i 1
n n
n
1 1 n
 
2
Varianza 
2
σ^ 2 =S2 = ∑
n−1 i=1
( X i − X̄ )2 s 
2
 xi  x
n  1 i 1
X númeroéxitos x
Proporción p ^p= = ^p=
n númeropruebas n

TABLA. Parámetros poblacionales, estimadores y estimaciones.

Para la elección de estos estimadores puntuales nos hemos basado, principalmente en la intuición y en la
posible analogía de los parámetros poblacionales con sus correspondientes valores muestrales, pero éste no
será el método más adecuado para la obtención de estimadores puntuales, aunque en este caso se obtienen
estimadores satisfactorios para los parámetros poblacionales. En general, el problema de obtener
estimadores puntuales no será tan sencillo, por ello tenemos que dar propiedades que serían deseables que
se cumplieran por los diferentes estimadores puntuales obtenidos, aunque no existe un mecanismo o
método único que nos permita obtener el mejor estimador puntual en todas las circunstancias.

Nuestro objetivo ahora será dar algunas propiedades deseables de los estimadores puntuales, con el fin de
poder conocer la bondad de los mismos, pues cuantas más propiedades verifiquen los estimadores
puntuales mejores serán.

* PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES

a) Estimador insesgado

2
Si tenemos un gran número de muestras de tamaño n y obtenemos el valor del estimador en cada una de
ellas, sería deseable que la media de todas estas estimaciones coincidiera con el valor de μ.

Se dice que un estimador es insesgado si su esperanza matemática coincide con el valor del parámetro a
estimar.

b) Estimador eficiente

Se dice que los estimadores son eficientes cuando generan una distribución muestral con el mínimo error
estándar, es decir, entre dos estimadores insesgados de un parámetro dado es más eficiente el de menor
varianza.

c) Estimador consistente

Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parámetro a medida
que aumenta el tamaño de la muestra. Es decir, la probabilidad de que la estimación sea el verdadero valor
del parámetro tiende a 1.

d) Estimador suficiente

Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la información
importante sobre el parámetro.

3. ESTIMACIÓN POR INTERVALOS

La estimación puntual es poco útil, pues solo obtenemos un valor como aproximación al que tratamos de
estimar. Es mucho más interesante obtener un intervalo dentro del cual se tiene una cierta confianza de que
se encuentre el parámetro que tratamos de estimar.

El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud y con
una alta probabilidad de que el parámetro θ se encuentre en su interior. Así pues, elegiremos probabilidades
cercanas a la unidad, que se representan por 1-α y cuyos valores más frecuentes suelen ser 0.90, 0.95 y
0.99.

Luego si deseamos obtener una estimación por intervalo del parámetro poblacional θ desconocido,
  X 1 , X 2 ,..., X n    X 1 , X 2 ,..., X n 
tendremos que obtener dos estadísticos y que nos darán los
valores extremos del intervalo, tales que

P   X 1 , X 2 ,..., X n       X 1 , X 2 ,..., X n    1  

Al valor (1-α)100% se le llama nivel de confianza.

3
a) Intervalo de confianza para la proporción poblacional.

Si p representa la proporción de éxitos en una muestra aleatoria de tamaño n suficientemente grande y


q=1-p, entonces un intervalo de confianza aproximado para la proporción poblacional p al nivel de confianza
del 100(1-α)% viene dado por:
^p q^ ^p q^
[ √
p^ −z α
2
n
, p^ + z α
2
√ ] n

z / 2 es tal que
en donde

z
P[Z>  / 2 ]= 2

y la variable aleatoria Z sigue una distribución N(0,1).

b) Intervalo de confianza para la media de una población normal, siendo σ conocida

Supongamos que tenemos una muestra aleatoria de n observaciones de una distribución N(μ, σ). Si σ es

conocida, y la media muestral observada es x , entonces el intervalo de confianza para la media poblacional
μ, al nivel de confianza del 100(1-α) % viene dado por:

   
 x  z / 2 , x  z / 2 
 n n
z / 2 es tal que
donde

P ( Z  z / 2 ) 
2
y la variable aleatoria Z→N (0,1).

c) Intervalo de confianza para la media de una población normal, siendo σ desconocida y n<30.

Supongamos que tenemos una muestra aleatoria de n<30 observaciones de una distribución N(μ,σ). Si σ es
desconocida, y la media y la desviación típica muestral observadas son x y s, respectivamente, entonces el
intervalo de confianza para la media poblacional μ, al nivel de confianza del 100(1-α) % viene dado por:

 s s 
 x  t /2 , x  t /2 
 n n 
t / 2 es tal que
donde

P  tn 1  t / 2  
2
tn 1 sigue una distribución t-Student con n-1 grados de libertad.
y la variable

4
d) Intervalo de confianza para la diferencia de medias en poblaciones normales independientes

nx y n y procedentes de poblaciones normales.


Supongamos dos muestras independientes de tamaño
N  x , x  N   , 
y y y
, respectivamente. Si las medias para las muestras observadas son x e y ,
entonces un intervalo de confianza, al nivel de confianza del 100(1-α)%, para las diferencias de medias
x   y
poblacionales viene dado por:

σ 2x σ 2y σ 2x σ 2y
[ ( x̄− ȳ )−z α / 2
√ + ,( x̄− ȳ )+ z α /2
nx n y √ ] +
nx n y


z / 2 es el número tal que: P  Z  z / 2  
donde 2 y la variable aleatoria Z sigue una N(0, 1).

4. ESTIMACIÓN DEL TAMAÑO MUESTRAL

Sabemos que si tomamos una muestra aleatoria simple de tamaño n procedente de una población N(μ,σ),
siendo σ conocida, el intervalo de confianza al nivel del 100(1-α)% para la media poblacional μ venía dado
por:
   
I    x  z / 2 , x  z / 2 
 n n

Siendo la amplitud del intervalo


  
L  ( x  z / 2 )  ( x  z / 2 )  2 z / 2
n n n (*)

Si, previamente, se fija la longitud del intervalo L y deseamos conocer el tamaño de la muestra para obtener
z / 2 y σ
ese intervalo al nivel de confianza del 100(1-α)%, bastará despejar n de la expresión (*), pues L,
son conocidos, y tendremos que el tamaño de la muestra será:

2
n  4 z2 / 2
L2

el cual nos permitirá construir un intervalo al nivel de confianza del 100(1-α) % y de amplitud L para la media
de una población normal con σ conocida.

5
También podríamos hacer el siguiente razonamiento cuando σ sea conocido, si la media μ fuera el valor

central del intervalo, entonces x estimaría puntualmente a μ sin error alguno,

x=μ
|---------------------------|----------------|---------------------------|
← error →
 
x  z / 2 x  z / 2
n n

Pero generalmente x no será exactamente igual a μ y entonces se comete un error, E=| x -μ|, que como
máximo será:

z / 2
E= n

entonces si queremos determinar el tamaño de muestra necesario para obtener un intervalo de confianza
para la media poblacional μ, admitiendo un error E, tendremos que despejando de la expresión anterior:

2
n  z2 / 2
E2

z 2α /2 p^ q^ z 2α /2 p^ q^
Igualmente se tendría para una proporción: n = 4 L2 = E2

EJERCICIOS

1. En un hospital psiquiátrico se ha estudiado una muestra de 150 pacientes y se ha observado que 38 de


ellos tienen una cierta tendencia al suicidio. Hallar un intervalo de confianza al nivel de 95% para el
parámetro proporción de individuos con tendencia al suicidio de la población.

2. El nivel de desarrollo cognitivo de niños de 5 años se distribuye según una normal con una varianza
poblacional igual a 11,56. Se ha elegido una muestra aleatoria formada por 60 niños de 5 años y se ha
determinado que la media del nivel de desarrollo cognitivo es igual a 13 puntos. Hallar un intervalo de
confianza para la media poblacional al nivel de 95%.
¿Cuántos niños se debería haber tomado en la muestra para estar seguro, al nivel del 95%, de que el
error máximo es 0,1?

3. Se sospecha que el número de unidades que contiene cada dosis de un medicamento no llega a las
10.000 que se indican en el envase, pero el laboratorio que lo fabrica afirma que el contenido medio de la
dosis es de 10.000 unidades. Para comprobarlo, tomamos al azar 100 dosis y determinamos el número
de unidades de cada una, obteniendo de media 9940 unidades y de desviación típica 120 unidades.
Si suponemos que la distribución del número de unidades en la población es normal, ¿qué podemos decir
acerca de la afirmación del laboratorio para un nivel de confianza del 99%?

6
4. Se afirma que la estatura media de las personas adultas de una determinada región es de 1,80m.
Queremos tener una confianza del 99% en saber si la afirmación anterior es correcta o errónea. Para ello,
tomamos una muestra al azar de 100 personas adultas, a las que medimos sus alturas, obteniendo de
media 1,78 m. y de desviación típica 0,10 m. Suponemos que la variable objeto de estudio es normal.

5. Los tiempos de reacción ante la palabra “divorcio” se distribuyen normalmente tanto entre los hombres
como entre las mujeres. La desviación típica poblacional de dichos tiempos en el caso de los hombres es
6 segundos y en las mujeres es 7 segundos. Con el fin de estimar la diferencia de medias poblacionales,
se escoge una muestra formada por 40 hombres y 38 mujeres, obteniéndose tiempos medios de reacción
15 segundos y 14 segundos, respectivamente. Hallar un intervalo de confianza para la diferencia de
medias poblacionales al nivel del 90%.

6. De una población de personas comparables con exceso de peso se seleccionan dos grupos A y B de 100
D
y 50 individuos, respectivamente. A los individuos del grupo A se les suministra una nueva dieta 1 con
la que sufren una pérdida media de peso al cabo de un mes de 7,9 Kg. con una desviación típica de 0,2
D
Kg. A los individuos del grupo B se le suministra una dieta 2 con la que sufren una pérdida media de
peso al cabo de un mes de 6,8 Kg., con una desviación típica de 0,3 Kg. Hallar los límites de confianza
del 95% para la diferencia del número medio de Kg. perdidos producidos por el suministro de las dos
D1 y D2 .
dietas

7. Una muestra aleatoria formada por 130 datos extraídos de población normal de varianza igual a 80
presenta una media muestral de 120. Se pide:
 Hallar el intervalo de confianza para la media poblacional a los niveles de confianza del 95% y del
90%.
 Comparar los intervalos desde el punto de vista de la información que generan.
 Se quiere tener una confianza del 95% de que la estimación no se separa en más de 1,2 de la
verdadera media. ¿Cuántas observaciones adicionales deberán tomarse?

8. Se sabe que los estudiantes de una provincia duermen un número de horas diarias que se distribuye
según una ley Normal de media μ horas y desviación típica σ = 2 horas. A partir de una muestra de 64
alumnos se ha obtenido el siguiente intervalo de confianza (7,26 - 8,14) para la media de la población.
 Determinar el nivel de confianza con que se ha construido dicho intervalo.
 Determinar el tamaño muestral mínimo necesario para que el error que se cometa al estimar la
media de la población por un intervalo de confianza sea, como máximo, de 0,75 h. con un nivel de
confianza del 98%.

9. En una población una variable aleatoria sigue una ley Normal de media desconocida y desviación típica
2.
 Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una media muestral igual a
50. Calcule un intervalo, con el 97% de confianza, para la media de la población.
 Con el mismo nivel de confianza, ¿qué tamaño mínimo debe obtener la muestra para que la amplitud
del intervalo que se obtenga sea, como máximo, 1?

También podría gustarte