Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El objetivo básico de la inferencia estadística es hacer inferencias o sacar conclusiones sobre la población a
partir de la información contenida en una muestra aleatoria de la población. Más específicamente, podemos
decir que la inferencia estadística consiste en el proceso de selección y utilización de un estadístico
muestral, mediante el cual, utilizando la información que nos proporciona una muestra aleatoria, nos permite
sacar conclusiones sobre características poblacionales.
Las inferencias sobre el valor de un parámetro poblacional θ se pueden obtener básicamente de dos
maneras: a partir de estimación o bien a partir del contraste de hipótesis.
En la estimación, basta seleccionar un estadístico muestral cuyo valor se utilizará como estimador del valor
del parámetro poblacional.
En el contraste de hipótesis, se hace una hipótesis sobre el valor del parámetro θ y se utiliza la información
proporcionada por la muestra para decidir si la hipótesis se acepta o no.
Ambos métodos de inferencia estadística utilizan las mismas relaciones teóricas entre resultados muestrales
y valores poblacionales. Así pues, una muestra es sacada de la población y un estadístico muestral es
utilizado para hacer inferencias sobre el parámetro poblacional. En estimación, la información muestral es
utilizada para estimar el valor del parámetro θ. En el contraste de hipótesis, primero se formula la hipótesis
sobre el valor de θ y la información muestral se utiliza para decidir si la hipótesis formulada debería ser o no
rechazada.
Pero cuando se utiliza la inferencia para estimar un parámetro poblacional debemos decir cómo de buena es
esa inferencia, o sea debemos dar una medida de su bondad. Para ello será necesario conocer la diferencia
existente entre la estimación del parámetro poblacional, calculada a partir de una muestra específica de
tamaño n, y el valor verdadero del parámetro poblacional.
La estimación estadística se divide en dos grandes grupos: la estimación puntual y la estimación por
intervalos. La estimación puntual consiste en obtener un único número calculado a partir de las
observaciones muestrales, y que es utilizado como estimación del valor del parámetro θ. Se le llama
estimación puntual porque a ese número, que se utiliza como estimación del parámetro θ, se le puede
asignar un punto sobre la recta real. En la estimación por intervalos se obtienen dos puntos (un extremo
inferior y un extremo superior) que definen un intervalo sobre la recta real, el cual contendrá con cierta
seguridad el valor del parámetro θ.
1
El estimador del parámetro poblacional θ es una función de las variables aleatorias u observaciones
muestrales y se representa por
=g ( X 1 , X 2 ,..., X n )
x , x ,..., x
Para una realización particular de la muestra ( 1 2 n ) se obtiene un valor específico del estimador que
Parámetro
Estimador Estimación
poblacional
n n
Media ∑ Xi x i
μ^ = X̄= i=1 x i 1
n n
n
1 1 n
2
Varianza
2
σ^ 2 =S2 = ∑
n−1 i=1
( X i − X̄ )2 s
2
xi x
n 1 i 1
X númeroéxitos x
Proporción p ^p= = ^p=
n númeropruebas n
Para la elección de estos estimadores puntuales nos hemos basado, principalmente en la intuición y en la
posible analogía de los parámetros poblacionales con sus correspondientes valores muestrales, pero éste no
será el método más adecuado para la obtención de estimadores puntuales, aunque en este caso se obtienen
estimadores satisfactorios para los parámetros poblacionales. En general, el problema de obtener
estimadores puntuales no será tan sencillo, por ello tenemos que dar propiedades que serían deseables que
se cumplieran por los diferentes estimadores puntuales obtenidos, aunque no existe un mecanismo o
método único que nos permita obtener el mejor estimador puntual en todas las circunstancias.
Nuestro objetivo ahora será dar algunas propiedades deseables de los estimadores puntuales, con el fin de
poder conocer la bondad de los mismos, pues cuantas más propiedades verifiquen los estimadores
puntuales mejores serán.
a) Estimador insesgado
2
Si tenemos un gran número de muestras de tamaño n y obtenemos el valor del estimador en cada una de
ellas, sería deseable que la media de todas estas estimaciones coincidiera con el valor de μ.
Se dice que un estimador es insesgado si su esperanza matemática coincide con el valor del parámetro a
estimar.
b) Estimador eficiente
Se dice que los estimadores son eficientes cuando generan una distribución muestral con el mínimo error
estándar, es decir, entre dos estimadores insesgados de un parámetro dado es más eficiente el de menor
varianza.
c) Estimador consistente
Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parámetro a medida
que aumenta el tamaño de la muestra. Es decir, la probabilidad de que la estimación sea el verdadero valor
del parámetro tiende a 1.
d) Estimador suficiente
Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la información
importante sobre el parámetro.
La estimación puntual es poco útil, pues solo obtenemos un valor como aproximación al que tratamos de
estimar. Es mucho más interesante obtener un intervalo dentro del cual se tiene una cierta confianza de que
se encuentre el parámetro que tratamos de estimar.
El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud y con
una alta probabilidad de que el parámetro θ se encuentre en su interior. Así pues, elegiremos probabilidades
cercanas a la unidad, que se representan por 1-α y cuyos valores más frecuentes suelen ser 0.90, 0.95 y
0.99.
Luego si deseamos obtener una estimación por intervalo del parámetro poblacional θ desconocido,
X 1 , X 2 ,..., X n X 1 , X 2 ,..., X n
tendremos que obtener dos estadísticos y que nos darán los
valores extremos del intervalo, tales que
3
a) Intervalo de confianza para la proporción poblacional.
z / 2 es tal que
en donde
z
P[Z> / 2 ]= 2
Supongamos que tenemos una muestra aleatoria de n observaciones de una distribución N(μ, σ). Si σ es
conocida, y la media muestral observada es x , entonces el intervalo de confianza para la media poblacional
μ, al nivel de confianza del 100(1-α) % viene dado por:
x z / 2 , x z / 2
n n
z / 2 es tal que
donde
P ( Z z / 2 )
2
y la variable aleatoria Z→N (0,1).
c) Intervalo de confianza para la media de una población normal, siendo σ desconocida y n<30.
Supongamos que tenemos una muestra aleatoria de n<30 observaciones de una distribución N(μ,σ). Si σ es
desconocida, y la media y la desviación típica muestral observadas son x y s, respectivamente, entonces el
intervalo de confianza para la media poblacional μ, al nivel de confianza del 100(1-α) % viene dado por:
s s
x t /2 , x t /2
n n
t / 2 es tal que
donde
P tn 1 t / 2
2
tn 1 sigue una distribución t-Student con n-1 grados de libertad.
y la variable
4
d) Intervalo de confianza para la diferencia de medias en poblaciones normales independientes
σ 2x σ 2y σ 2x σ 2y
[ ( x̄− ȳ )−z α / 2
√ + ,( x̄− ȳ )+ z α /2
nx n y √ ] +
nx n y
z / 2 es el número tal que: P Z z / 2
donde 2 y la variable aleatoria Z sigue una N(0, 1).
Sabemos que si tomamos una muestra aleatoria simple de tamaño n procedente de una población N(μ,σ),
siendo σ conocida, el intervalo de confianza al nivel del 100(1-α)% para la media poblacional μ venía dado
por:
I x z / 2 , x z / 2
n n
Si, previamente, se fija la longitud del intervalo L y deseamos conocer el tamaño de la muestra para obtener
z / 2 y σ
ese intervalo al nivel de confianza del 100(1-α)%, bastará despejar n de la expresión (*), pues L,
son conocidos, y tendremos que el tamaño de la muestra será:
2
n 4 z2 / 2
L2
el cual nos permitirá construir un intervalo al nivel de confianza del 100(1-α) % y de amplitud L para la media
de una población normal con σ conocida.
5
También podríamos hacer el siguiente razonamiento cuando σ sea conocido, si la media μ fuera el valor
x=μ
|---------------------------|----------------|---------------------------|
← error →
x z / 2 x z / 2
n n
Pero generalmente x no será exactamente igual a μ y entonces se comete un error, E=| x -μ|, que como
máximo será:
z / 2
E= n
entonces si queremos determinar el tamaño de muestra necesario para obtener un intervalo de confianza
para la media poblacional μ, admitiendo un error E, tendremos que despejando de la expresión anterior:
2
n z2 / 2
E2
z 2α /2 p^ q^ z 2α /2 p^ q^
Igualmente se tendría para una proporción: n = 4 L2 = E2
EJERCICIOS
2. El nivel de desarrollo cognitivo de niños de 5 años se distribuye según una normal con una varianza
poblacional igual a 11,56. Se ha elegido una muestra aleatoria formada por 60 niños de 5 años y se ha
determinado que la media del nivel de desarrollo cognitivo es igual a 13 puntos. Hallar un intervalo de
confianza para la media poblacional al nivel de 95%.
¿Cuántos niños se debería haber tomado en la muestra para estar seguro, al nivel del 95%, de que el
error máximo es 0,1?
3. Se sospecha que el número de unidades que contiene cada dosis de un medicamento no llega a las
10.000 que se indican en el envase, pero el laboratorio que lo fabrica afirma que el contenido medio de la
dosis es de 10.000 unidades. Para comprobarlo, tomamos al azar 100 dosis y determinamos el número
de unidades de cada una, obteniendo de media 9940 unidades y de desviación típica 120 unidades.
Si suponemos que la distribución del número de unidades en la población es normal, ¿qué podemos decir
acerca de la afirmación del laboratorio para un nivel de confianza del 99%?
6
4. Se afirma que la estatura media de las personas adultas de una determinada región es de 1,80m.
Queremos tener una confianza del 99% en saber si la afirmación anterior es correcta o errónea. Para ello,
tomamos una muestra al azar de 100 personas adultas, a las que medimos sus alturas, obteniendo de
media 1,78 m. y de desviación típica 0,10 m. Suponemos que la variable objeto de estudio es normal.
5. Los tiempos de reacción ante la palabra “divorcio” se distribuyen normalmente tanto entre los hombres
como entre las mujeres. La desviación típica poblacional de dichos tiempos en el caso de los hombres es
6 segundos y en las mujeres es 7 segundos. Con el fin de estimar la diferencia de medias poblacionales,
se escoge una muestra formada por 40 hombres y 38 mujeres, obteniéndose tiempos medios de reacción
15 segundos y 14 segundos, respectivamente. Hallar un intervalo de confianza para la diferencia de
medias poblacionales al nivel del 90%.
6. De una población de personas comparables con exceso de peso se seleccionan dos grupos A y B de 100
D
y 50 individuos, respectivamente. A los individuos del grupo A se les suministra una nueva dieta 1 con
la que sufren una pérdida media de peso al cabo de un mes de 7,9 Kg. con una desviación típica de 0,2
D
Kg. A los individuos del grupo B se le suministra una dieta 2 con la que sufren una pérdida media de
peso al cabo de un mes de 6,8 Kg., con una desviación típica de 0,3 Kg. Hallar los límites de confianza
del 95% para la diferencia del número medio de Kg. perdidos producidos por el suministro de las dos
D1 y D2 .
dietas
7. Una muestra aleatoria formada por 130 datos extraídos de población normal de varianza igual a 80
presenta una media muestral de 120. Se pide:
Hallar el intervalo de confianza para la media poblacional a los niveles de confianza del 95% y del
90%.
Comparar los intervalos desde el punto de vista de la información que generan.
Se quiere tener una confianza del 95% de que la estimación no se separa en más de 1,2 de la
verdadera media. ¿Cuántas observaciones adicionales deberán tomarse?
8. Se sabe que los estudiantes de una provincia duermen un número de horas diarias que se distribuye
según una ley Normal de media μ horas y desviación típica σ = 2 horas. A partir de una muestra de 64
alumnos se ha obtenido el siguiente intervalo de confianza (7,26 - 8,14) para la media de la población.
Determinar el nivel de confianza con que se ha construido dicho intervalo.
Determinar el tamaño muestral mínimo necesario para que el error que se cometa al estimar la
media de la población por un intervalo de confianza sea, como máximo, de 0,75 h. con un nivel de
confianza del 98%.
9. En una población una variable aleatoria sigue una ley Normal de media desconocida y desviación típica
2.
Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una media muestral igual a
50. Calcule un intervalo, con el 97% de confianza, para la media de la población.
Con el mismo nivel de confianza, ¿qué tamaño mínimo debe obtener la muestra para que la amplitud
del intervalo que se obtenga sea, como máximo, 1?