Está en la página 1de 3

ESTIMADORES

La estadística inferencial aporta las técnicas necesarias para extraer conclusiones sobre el valor
poblacional de un determinado parámetro a partir de la evaluación de una muestra.

Las conclusiones derivadas de este proceso inferencial siempre estarán sujetas a error como
consecuencia de la variabilidad aleatoria unida al propio procedimiento de selección muestral.

Por ello, resulta necesario disponer no sólo de una estimación puntual, sino también de un
intervalo de confianza, que facilite un rango de valores verosímiles para el parámetro poblacional,
así como de una prueba de significación estadística, que permita determinar el grado de
compatibilidad de los datos muestrales con una hipótesis predeterminada.

En estadística se estima y se tiene en cuenta el error aleatorio al calcular intervalos de confianza y


al aplicar pruebas de contrastes de hipótesis.

CONCEPTOS GENERALES SOBRE ESTIMACIÓN DE PARAMÉTROS


Una estimación consiste en apostar por un valor para un parámetro poblacional, habitualmente
calculando también un rango de valores entre los que puede situarse dicho parámetro
poblacional. Por tanto, un intervalo de confianza es simplemente un rango de valores en el que
confiamos que se contenga el parámetro poblacional (Altman, 1991).

Simplificando, puede decirse que el análisis estadístico inferencial conduce a dos clases de
resultados: valores “p” e intervalos de confianza.

Todo el proceso de estimación parte de los correspondientes estimadores muestrales. Un


estimador es una función de los valores de una muestra que se elabora para indagar el valor de un
parámetro de la población de la que procede la muestra. El valor de esta característica en la
población es lo que denominamos parámetro.

Las estimaciones pueden ser de dos tipos:


Estimación puntual: obtendremos un punto, un valor, como estimación del parámetro
desconocido, quedando sin especificar cómo de buena es la aproximación. Si a partir de una
muestra se afirma que el 20% de una población es fumadora se está haciendo una estimación
puntual de la proporción de fumadores.

Estimación por intervalo: proporciona un rango de posibles valores, dentro del cual
estimamos (bajo cierta probabilidad) que estará el parámetro desconocido. Si a partir de una
muestra se afirma que el porcentaje de la población que es fumadora se sitúa entre un 18 y 22%
se está haciendo una estimación por intervalo de la proporción poblacional de fumadores.

ESTIMACIÓN PUNTUAL
Un estimador puntual es simplemente un estadístico muestral (media aritmética, varianza, etc.)
que se emplea para estimar parámetros (media poblacional, varianza poblacional, etc.).
Una forma natural de estimar muchos parámetros poblacionales consiste en utilizar el estadístico
muestral correspondiente. Así, la media muestral es un estimador puntual de la media poblacional
y la proporción de casos de una enfermedad en la muestra es un estimador puntual de la
probabilidad de tener la enfermedad en la población.

No obstante, para un determinado parámetro poblacional, pueden contemplarse distintos


estimadores alternativos. Algunos estimadores de la media poblacional distintos de la media
muestral podrían ser, por ejemplo, la mediana, la media del 50% central de la muestra o la media
de los valores máximo y mínimo.

Los méritos de un estimador no se juzgan por la estimación resultante en una muestra concreta,
sino por la distribución de todos los posibles valores o estimaciones a que pueda dar lugar; esto es,
por las propiedades de su distribución muestral.

En general, se puede afirmar que un estimador puede ser:

Insesgado: cuando el estimador muestral coincide con el poblacional, sin ninguna desviación
sistemática. Es decir, un estimador es insesgado si su valor medio sobre todas las posibles
muestras de tamaño n coincide con el parámetro poblacional.

La media y la proporción muestral son estimadores insesgados de la media y la proporción


poblacional:

E (x ) = µ y E (p) = π

Sesgado: cuando el estimador muestral no se corresponde con el poblacional, debido a un error


sistemático.

Eficiente: aquel estimador muestral de igual valor a otros, pero que presenta la mínima
varianza. Interesa que las distintas estimaciones difieran lo menos posible del parámetro
poblacional; es decir, que la varianza muestral del estimador sea mínima. De esta forma, se tendrá
una mayor confianza en que la estimación resultante de la muestra finalmente seleccionada esté
próxima al parámetro poblacional.

Suficiente: aquel estimador que utiliza toda la información contenida en la muestra.


Un buen estimador es aquel que es insesgado, eficiente y suficiente (Rothman y Greenland, 1998)

ESTIMACIÓN POR INTERVALO


Como hemos comentado anteriormente, las estimaciones puntuales obtenidas a partir de una
muestra diferirán del parámetro poblacional y, en consecuencia, quedará un margen de
incertidumbre que se expresa en términos del error estándar (EE) del estimador. Así, resulta
natural querer disponer de una medida del parámetro poblacional que incorpore tanto la
estimación puntual como su error estándar. Esta medida es el intervalo de confianza (I.C.), que
facilita un rango de valores dentro del cual se encontrará el verdadero valor del parámetro
poblacional con un cierto grado de confianza.
El error est0ándar es un concepto central en los intervalos de confianza, no tiene aplicación para
expresar la variabilidad de los individuos de una población, es sólo un indicador de la variabilidad
de las medias calculadas en muchas posibles muestras que se tomen de una población, todas ellas
de tamaño n.

El error estándar es a la muestra, lo que la desviación estándar es al individuo. Por tanto, el error
estándar de la media mide nuestro grado de incertidumbre respecto a la capacidad de la media
muestral para estimar la media poblacional.

Por ejemplo, si la desviación estándar de la edad de una muestra de 100 pacientes es 20 años, el
EE de la media valdría 20 / √ 100 = 2 , y esperaríamos que las medias de muestras repetidas de
tamaño 100 tuviesen una distribución normal cuya desviación estándar fuese 2.

Siguiendo con el ejemplo anterior, si lo único que sabemos es que la media muestral Es x = 39
años, nuestra única posibilidad es confiar es que esta media muestral esté entre ese 95% de
medias muestrales situadas en el entorno de +2 errores estándar de la verdadera media
poblacional. Es decir, sumándole y restándole 2 errores estándar, tendremos un rango de valores
en el que confiamos (con un 95% de confianza) que se encuentra la verdadera media poblacional.
Si repetimos todo el proceso 100 veces, el 95% de intervalos así calculados contendrán a la
verdadera media poblacional.

Este mismo razonamiento se aplica a otros estimadores muestrales distintos de la media:


proporciones, varianza, diferencias de medias, diferencias de proporciones...

La expresión más general para hacer estimaciones calculando intervalos de confianza es sumar y
restar al estimador muestral z veces el EE del estimador:

Parámetro = (estimador + z x EE del estimador) donde z es el valor correspondiente de la


distribución normal.

A veces, en vez de z, se usa la distribución t de Student, debido a que no disponemos de s (la


desviación estándar poblacional) sino sólo de σ (la desviación estándar muestral).

Si el I.C. es al nivel de confianza del 95% (en general, 1- ), implica que hay un 5% de error (en
general,) repartido en dos colas, una a cada lado. Cada cola valdría el 2.5% ( / 2 = 0.025); en este
caso, z valdría1 1.96.

El intervalo de confianza calculado dependerá de:

 Lo estimado en la muestra (porcentaje, media,..) El I.C. está formado por valores


ligeramente menores y mayores que la aproximación ofrecida por la muestra.
 El tamaño muestral. Cuantos más datos hayan participado en el cálculo, más pequeño
esperamos que sea la diferencia entre el valor estimado y el valor real desconocido.
 La probabilidad, nivel de confianza (1-), con la que el método dará una respuesta
correcta. Niveles de confianza habituales para los I.C. son el 95% y el 99%.

También podría gustarte