Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTIMADORES
ESTIMADORES
La estadística inferencial aporta las técnicas necesarias para extraer conclusiones sobre el valor
poblacional de un determinado parámetro a partir de la evaluación de una muestra.
Las conclusiones derivadas de este proceso inferencial siempre estarán sujetas a error como
consecuencia de la variabilidad aleatoria unida al propio procedimiento de selección muestral.
Por ello, resulta necesario disponer no sólo de una estimación puntual, sino también de un
intervalo de confianza, que facilite un rango de valores verosímiles para el parámetro poblacional,
así como de una prueba de significación estadística, que permita determinar el grado de
compatibilidad de los datos muestrales con una hipótesis predeterminada.
Simplificando, puede decirse que el análisis estadístico inferencial conduce a dos clases de
resultados: valores “p” e intervalos de confianza.
Estimación por intervalo: proporciona un rango de posibles valores, dentro del cual
estimamos (bajo cierta probabilidad) que estará el parámetro desconocido. Si a partir de una
muestra se afirma que el porcentaje de la población que es fumadora se sitúa entre un 18 y 22%
se está haciendo una estimación por intervalo de la proporción poblacional de fumadores.
ESTIMACIÓN PUNTUAL
Un estimador puntual es simplemente un estadístico muestral (media aritmética, varianza, etc.)
que se emplea para estimar parámetros (media poblacional, varianza poblacional, etc.).
Una forma natural de estimar muchos parámetros poblacionales consiste en utilizar el estadístico
muestral correspondiente. Así, la media muestral es un estimador puntual de la media poblacional
y la proporción de casos de una enfermedad en la muestra es un estimador puntual de la
probabilidad de tener la enfermedad en la población.
Los méritos de un estimador no se juzgan por la estimación resultante en una muestra concreta,
sino por la distribución de todos los posibles valores o estimaciones a que pueda dar lugar; esto es,
por las propiedades de su distribución muestral.
Insesgado: cuando el estimador muestral coincide con el poblacional, sin ninguna desviación
sistemática. Es decir, un estimador es insesgado si su valor medio sobre todas las posibles
muestras de tamaño n coincide con el parámetro poblacional.
E (x ) = µ y E (p) = π
Eficiente: aquel estimador muestral de igual valor a otros, pero que presenta la mínima
varianza. Interesa que las distintas estimaciones difieran lo menos posible del parámetro
poblacional; es decir, que la varianza muestral del estimador sea mínima. De esta forma, se tendrá
una mayor confianza en que la estimación resultante de la muestra finalmente seleccionada esté
próxima al parámetro poblacional.
El error estándar es a la muestra, lo que la desviación estándar es al individuo. Por tanto, el error
estándar de la media mide nuestro grado de incertidumbre respecto a la capacidad de la media
muestral para estimar la media poblacional.
Por ejemplo, si la desviación estándar de la edad de una muestra de 100 pacientes es 20 años, el
EE de la media valdría 20 / √ 100 = 2 , y esperaríamos que las medias de muestras repetidas de
tamaño 100 tuviesen una distribución normal cuya desviación estándar fuese 2.
Siguiendo con el ejemplo anterior, si lo único que sabemos es que la media muestral Es x = 39
años, nuestra única posibilidad es confiar es que esta media muestral esté entre ese 95% de
medias muestrales situadas en el entorno de +2 errores estándar de la verdadera media
poblacional. Es decir, sumándole y restándole 2 errores estándar, tendremos un rango de valores
en el que confiamos (con un 95% de confianza) que se encuentra la verdadera media poblacional.
Si repetimos todo el proceso 100 veces, el 95% de intervalos así calculados contendrán a la
verdadera media poblacional.
La expresión más general para hacer estimaciones calculando intervalos de confianza es sumar y
restar al estimador muestral z veces el EE del estimador:
Si el I.C. es al nivel de confianza del 95% (en general, 1- ), implica que hay un 5% de error (en
general,) repartido en dos colas, una a cada lado. Cada cola valdría el 2.5% ( / 2 = 0.025); en este
caso, z valdría1 1.96.