Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTIMACIÓN DE PARÁMETROS
Antes de comenzar con la unidad, desarrollaremos una distribución para variable aleatoria
continua que es de interés para la compresión de los temas de inferencia estadística.
Si se obtiene una muestra de una población normal, entonces la media muestral tiene una
distribución normal sin importar el tamaño de la muestra. Sin embargo, se puede demostrar que de
hecho no importa el modelo de probabilidad del cual se obtenga la muestra; mientras la media y la
En muchos casos, puede concluirse en forma segura que la aproximación será buena
mientras n > 30.
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o
finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita
teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como
infinita. Vamos a estudiar inicialmente una población infinita (o a muestreo con reposición) y luego a
una población finita.
Sean las posibles muestras de tamaño n en una población. Cada muestra puede ser
representada o caracterizada por un estadístico (media, desviación típica, proporción, etc.) cuyo valor
será diferente para cada muestra. Si tomamos como variable aleatoria el valor del estadístico de cada
muestra, tendremos una distribución del estadístico que se llama distribución muestral. En el
ejemplo que desarrollaremos, será distribución muestral de medias (porque caracterizamos a las
muestras a través de sus promedios aritméticos).
Supongamos que podemos saber los valores que toma una variable para la población en
estudio
σ = 3,29
Podemos representar a estas muestras a través de algún estadístico, la elección para esta
distribución es el estadístico media muestral ( ). Las representaciones serán:
Ahora pensemos que nuestra variable es la media muestral. La gráfica de la distribución de
probabilidades es:
Si queremos caracterizar a esta media lo haremos a través de sus estadísticos media y varianza que
por ser una distribución especial tienen sus símbolos identificatorios:
Realizando el cálculo
Con este cálculo podemos comparar la media poblacional con la media muestral de medias y
observamos que son iguales.
Concluimos que podemos estimar al parámetro µ con el estadístico y que esa estimación es
insesgada.
Si calculamos
Observamos que si bien tienen relación el estadístico con el parámetro no es de igualdad. Para
establecerla deberíamos corregir con el factor 2:
Si hubiésemos trabajado con muestras de tamaño n = 3, el factor de corrección sería este número.
Entonces generalizando.
Para el desvío
ESTIMACIÓN DE PARÁMETROS
En general, hay dos tipos de inferencia, una inferencia deductiva que es un juicio o
generalización que se basa en un razonamiento como el que realiza Laplace en la definición clásica
de probabilidad de Laplace o “a priori”.
Por ejemplo, al lanzar dos monedas perfectamente equilibradas, la probabilidad de cada una
de caer "cara" o “cruz” es = 0,5 (premisa). El número esperado de "caras" en el lanzamiento de las
dos monedas deber ser 1. Si las premisas son ciertas, las conclusiones no pueden ser falsas.
Un estadístico muestral será en general diferente del parámetro de la población y sólo por
coincidencia serán iguales. La diferencia entre el valor de un estadístico muestral y el
correspondiente parámetro de la población se suele llamar error de estimación (e). Se sabrá el error
si se conoce el parámetro poblacional, pero éste por lo general se desconoce. La única manera de
tener alguna certeza al respecto es haciendo todas las observaciones posibles de la población, lo cual,
es imposible o impracticable. De hecho, la razón de ser, de la inferencia estadística es la falta de
conocimientos acerca de las características de la población.
- problemas de estimación
- pruebas de hipótesis.
Como al inferir un parámetro poblacional desconocido se suele hacer una afirmación o juicio,
este último sólo ofrece una estimación.
ESTIMACIÓN
La inferencia estadística, se aplica en la investigación empírica, para lograr conocimiento de
una gran clase de unidades estadísticas (seres humanos, plantas, parcelas de tierra…), a partir de un
número relativamente pequeño de los mismos elementos.
Una colección o agregación grande de elementos que deseamos estudiar, o de los cuales
deseamos hacer inferencias, se llama población. El término población tiene mayor significado
cuando hablamos de muestra de una población, es decir, una parte o subconjunto de ella.
Los valores de las medidas descriptivas calculadas para las poblaciones, se llaman
parámetros. Para las muestras, estas mismas medidas descriptivas se llaman estadísticos.
Se acostumbra simbolizar los estadísticos con letras latinas (romanas) y los parámetros con
letras griegas.
Estadístico Parámetro
Media aritmética X µ
Variancia S2 σ2
Desvío estándar S σ
Coeficiente de correlación R ρ
Las poblaciones pueden ser finitas o infinitas. Para la mayoría de los propósitos de
investigación, se supone que las poblaciones son infinitas.
Una población finita puede ser extremadamente grande. Es posible concebir un proceso de
conteo de los elementos de la población, el cual puede ser computado; luego la población es
técnicamente finita.
Para que una muestra sirva adecuadamente como base para obtener estimadores de
parámetros poblacionales, debe ser representativa de la población. El muestreo aleatorio de una
población producirá muestras que son representativas de la población.
Si una muestra se extrae al azar, es representativa de la población en todos los aspectos, o sea,
el estadístico diferirá del parámetro sólo por azar. La habilidad para estimar el grado de error (error
de muestreo), es un rasgo importante de una muestra aleatoria.
ESTIMACIÓN DE PARÁMETROS
La teoría clásica de la Inferencia Estadística trata los métodos por los que se selecciona una
muestra de una población y, basándonos en las pruebas de las muestras, podemos realizar:
Estimación puntual
Para poder utilizar la información que se tenga de la mejor manera posible, se necesita que
sean buenos estimadores, para ello se deberá cumplir:
x1 + x2
b) Eficiencia: Si se utilizan dos estimadores del mismo parámetro ( X y con x1 y x2 valores
2
extremos de lo muestra), entonces aquel cuya distribución muestral tenga menor variancia, es un
estimador más eficiente o más eficaz que el otro. Es decir:
X es eficiente ⇔ σ X2 es mínima
P{| X − µ | ≥ e} → 0 si n → ∞
O equivalentemente: P{| X − µ | ≤ e} → 1 si n → ∞
Es decir, para que el estimador sea consistente, es necesario que la probabilidad de X que
esté a menos de cierta distancia "e" del parámetro µ, tienda a 1 al tender n a infinito.
Se sabe que la media muestral y la variancia son estimadores consistentes ya que tienden a
acercarse a los correspondientes valores de la población a medida que aumenta el tamaño de la
muestra. Pero un estadístico muestral puede ser un estimador sin consistencia.
d) Suficiencia: Un estimador suficiente del parámetro µ es aquel que agota toda la información
pertinente sobre µ que se puede disponer en la muestra. Por ejemplo, si se toma una muestra de n =
30 valores, con el fin de estimar µ, pueden utilizarse como estimadores la primera, la décimo quinta o
la última observación, o el promedio entre la primera y la quinta observación. Pero estos estimadores
no son suficientes pues no contienen toda la información disponible de la muestra. La media
aritmética X calculada con las 30 observaciones sí lo es pues las tiene en cuenta a todas.
Lo dicho hasta ahora se refiere a una estimación puntual, es decir, estimar un parámetro a
través de un único valor. Esta estimación no es muy conveniente pues con ella no se puede
determinar el error de muestreo, ni la precisión de la estimación, ni la confianza que merece tal
estimación.
Existen otros métodos para estimar parámetros poblacionales que son mucho más precisos.
Por ejemplo:
P{X − Z cσ X ≤ µ ≤ X + Z cσ X } = 1 − α
Donde:
Por ejemplo, si se toma α = 0,1, entonces 1-α = 0,9 y se dice que se tiene un intervalo de
confianza del 90% y que la probabilidad de que el intervalo contenga al verdadero valor del
parámetro es del 90%. Es decir, que si repetidamente se muestra y se construye tal intervalo una y
otra vez, 9 de cada 10 de estos intervalos, contendrá al parámetro y 1 de ellos no.
Se puede pensar que 1 significa certeza, seguridad y α significa riesgo. La seguridad menos
el riesgo, es decir 1 - α da, por lo tanto, el coeficiente de confianza de nuestras afirmaciones.
En el caso anterior, se tiene una confianza de que 9 de cada 10 intervalos que se extraigan
como muestra, contendrán el verdadero valor del parámetro. Pero una vez determinado el intervalo,
es decir, una vez calculados numéricamente los extremos, ya no debe hablarse en términos de
confiabilidad ni en términos probabilísticos, pues la situación pasa a ser completamente
determinística. De forma tal que, asociado a un intervalo de confianza ya calculado, se tiene una
probabilidad 0 ó 1 de que contenga al parámetro a estimar y no hay otra opción, ya que lo contiene o
no lo contiene.
Los extremos del intervalo son variables aleatorias, mientras que el parámetro a determinar es
constante.
En general, los pasos a seguir para estimar un parámetro por el método de los intervalos de confianza,
son:
CASO 1
“ σ conocido”
Estamos estudiando un elemento de una distribución muestral de medias. Para representarla a partir de
la distribución Z, la fórmula de tipificación será:
X − µX X −µ
Z= en función de los valores poblacionales Z =
σX σ
n
n = 30 1 - α = 0,95
Si consideramos un intervalo desde un valor -Zc hasta un valor Zc, de la distribución normal
tipificada Z , tal que al intervalo [-Zc, Zc] le corresponda el 95% del área bajo la curva (llamado nivel
de confianza)
O sea que debe tomarse una muestra de aproximadamente 52 pacientes en lugar de 30. Por el
contrario, si el investigador deseara un error de estimación menor, por ejemplo 1 mmHg,
manteniendo el nivel de confianza en 95%, el tamaño de la muestra requerido será:
Por lo tanto:
Ejemplo 2:
Una muestra de 15 aves tomadas al azar en un establecimiento con 5000 aves, (que elabora
alimentos balanceados), permitió establecer un aumento de peso promedio de 90 gf por semana y por
ave, y un desvío típico de 10 gf. Se busca estimar el incremento de peso promedio para las 5000 aves
del establecimiento con un intervalo de confianza del 90%.
Respuesta:
n = 15 = 90 g S = 10 g ¿ICM0,90?
Por tabla:
y el intervalo resulta:
Interpretando este resultado, se dice que el aumento de peso por ave por semana en el establecimiento
está entre 85,5 y 94,6 gf, con un 90% de confianza.
EJERCITACIÓN
1) Una población consiste de cuatro números 5, 8, 10 y 13. Considere todas las muestras posibles
de tamaño 2 que pueden obtenerse con reemplazo de esta población. Calcule:
a.- la media poblacional.
4) Cada persona de un grupo de 500 lanza una moneda 120 veces. ¿Cuántas personas se esperaría
que reportaran que:
a.- entre 40 % y 60 % de sus lanzamientos resultaron caras?
5) Los focos del fabricante A tienen una vida media de 1400 horas, con desviación estándar de 200
horas, mientras que la vida promedio de los focos del fabricante B de 1200 horas, con una
desviación estándar de 100 horas. Si se prueban muestras aleatorias de 125 focos de cada marca,
a.- ¿cuál es la probabilidad de que los focos de la marca A tengan una vida media de por lo
menos 160 horas más que los focos de la marca B?
b.- ¿cuál es la probabilidad de que los focos de la marca A tengan una vida media de por lo
menos 250 horas más que los focos de la marca B?
6) En una muestra de cinco mediciones, los registros de un científico para el diámetro de una
esfera fueron 6,33; 6,37; 6,36; 6,32 y 6,37 cm. Determine estimadores sin sesgo y eficientes
de:
a.- La media poblacional.
b.- La varianza poblacional.
b Siempre será posible y no habrá dificultades en disponer del conjunto de todas las
observaciones que constituyen la población estudiada.
i Una de las propiedades deseables que debe reunir un estimador, es que sea sesgado.