Está en la página 1de 11

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN SUPERIOR


UNIVERSIDAD YACAMBÚ
NÚCLEO PORTUGUESA

Estimación Estadística

NOMBRE:

ANDRES JOSE DE PASQUALI


V-25606410

Sección: NP02N0V 2019-2

Araure, julio de 2019


Estimación estadística

En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor
aproximado de un parámetro de una población a partir de los datos proporcionados por una
muestra. Por ejemplo, una estimación de la media de una determinada característica de una
población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño
n.1

Estimación puntual

Una estimación puntual de un parámetro poblacional es cuando se utiliza un único valor para
estimar ese parámetro, es decir, se usa un punto en concreto de la muestra para estimar el valor
deseado.

Cuando estimamos un parámetro de forma puntual, podemos saber con certeza, cual es ese valor.
Imaginemos una población de 30 personas de las que seleccionamos una muestra de 20 para las
que conocemos sus edades. Estimar de forma puntual la media de edad, sería tan sencillo como
sumar esos 20 datos y dividirlos entre el total de la muestra estadística.

Pensemos ahora en que queremos estimar la altura media de esa muestra. Al contrario que antes,
no tenemos el valor de la altura de cada persona. En este caso no podríamos realizar una estimación
puntual, es decir, no podríamos hallar un valor concreto de esa altura media. En este caso
tendríamos que realizar una estimación por intervalos, es decir, podríamos acotar el valor más alto
y más bajo de las alturas de las personas con cierta seguridad o lo que en estadística se conoce como
cierto nivel de confianza.

Propiedades deseables de un estimador

Las propiedades deseables de un estimador son las siguientes:

 Insesgadez: Un estimador es insesgado cuando la esperanza matemática del este es igual al


parámetro que se desea estimar. Por tanto, la diferencia entre el parámetro a estimar y la
esperanza de nuestro estimador tendría que ser 0.

 Eficiente: Un estimador es más eficiente o tiene la capacidad de estimar de forma precisa


cuando su varianza es reducida. Por lo tanto, ante 2 estimadores, siempre elegiremos el que
tenga una varianza menor.
 Consistencia: Un estimador consistente es aquel que a medida que la medida que la
muestra crece se aproxima cada vez más al valor real del parámetro. Por lo tanto, cuantos
más y valores entran en la muestra, el parámetro estimado será más preciso

Ejemplos de estimaciones puntuales

Para obtener una estimación puntual se usa un estadístico que recibe el nombre de estimador o
función de decisión. Algunos ejemplos de estadísticos son:

 La media muestral que sirve como estimación puntual de la media poblacional.

 La desviación típica muestral que sirve de estimación para la desviación típica de la


población.

Estimación por intervalos

La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable
se encuentre el parámetro. La obtención del intervalo se basa en las siguientes consideraciones:

a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades de


ocurrencia de los estadísticos muestrales.

b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad de que


el estimador se halle dentro de los intervalos de la distribución muestral.

c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se establece


alrededor del estimador. Si repetimos el muestreo un gran número de veces y definimos un
intervalo alrededor de cada valor del estadístico muestral, el parámetro se sitúa dentro de cada
intervalo en un porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de
confianza".
Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal, y
resulta:

La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son los
valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden obtener
en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas
como Excel). Seguidamente generamos una muestra de la población y obtenemos su Media, que es
igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el parámetro poblacional
(5.1) está incluido dentro de sus límites:
Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la
distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un número grande de muestras observamos que el 95%
de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra dentro del
intervalo definido alrededor de cada uno de los valores de la Media muestral. El porcentaje de veces
que el valor de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es
denominado nivel de confianza.

Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del
intervalo sea igual al 99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral en las
tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas como
Excel), y son los valores cuya función de probabilidad es igual a 0.995 y 0.005 respectivamente).

Ejemplo

La siguiente imagen muestra la distribución de las Medias muestrales obtenidas de 100000 muestras
aleatorias y los intervalos alrededor de cada una de las Medias obtenidas de diez de las muestras:

donde ls y le simbolizan los límites superior e inferior del intervalo de confianza al 95%.
Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7) incluyen
el valor del parámetro dentro sus límites.

Error muestral

Error muestral o error de estimación es el error que surge a causa de observar una muestra de la
población completa.

La estimación de un valor de interés, como la media o el porcentaje, estará generalmente sujeta a


una variación entre una muestra y otra. Estas variaciones en las posibles muestras de una
estadística pueden, teóricamente, ser expresadas como errores muestrales, sin embargo,
normalmente, en la práctica el error exacto es desconocido. El error muestral se refiere en términos
más generales al fenómeno de la variación entre muestras. Cuando este no es mencionado se
considera que el margen de error base es el 0.02% (0.2 para muestreo paralelo y 2 para muestreo
directo).

El error muestral deseado, generalmente puede ser controlado tomando una muestra aleatoria de
la población, suficientemente grande, sin embargo, el costo de esto puede ser limitante. Si las
observaciones son tomadas de una muestra aleatoria, la teoría estadística brinda cálculos
probabilísticos del tamaño deseado del error muestral para una estadística en particular o
estimación. Estos usualmente son expresados en términos del error estándar.

El error muestral puede ser contrastado con el error no muestral, el cual se refiere al conjunto de
las desviaciones del valor real que no van en función de la muestra escogida, entre los cuales se
encuentran varios errores sistemáticos y algunos errores aleatorios. Resultan mucho más difíciles
de cuantificar que el error muestral.

¿Por qué sucede este error?

El error del proceso de muestreo ocurre cuando los investigadores toman diferentes sujetos de la
misma población, y aun así, los sujetos tienen diferencias individuales. Debes recordar que cuando
tomas una muestra, se trata de un subconjunto de toda la población y, por lo tanto, puede haber
una diferencia entre la muestra y la población.

La causa más frecuente de dicho error es un procedimiento de muestreo sesgado. Todo investigador
debe tratar de establecer una muestra que esté libre de sesgos y sea representativa de toda la
población. Así, el investigador es capaz de minimizar o eliminar el error de muestreo.

Otra causa posible de este error es la casualidad. Se lleva a cabo el proceso


de aleatorización y muestreo de probabilidad para minimizar el error del proceso de muestreo, pero
igualmente es posible que todos los sujetos asignados al azar no sean representativos de la
población.

El resultado más común de error de muestreo es el error sistemático en donde los resultados de la
muestra difieren significativamente de los resultados de toda la población. Se entiende que, si la
muestra no es representativa de toda la población, lo más probable es que los resultados de la
muestra difieran de los resultados de toda la población.

Tamaño de la muestra y error de muestreo

Dados dos estudios exactamente iguales, dos métodos de muestreo iguales y la misma población,
el estudio con un tamaño de muestra más grande tendrá menos error del proceso de muestreo que
el estudio con un tamaño menor de la muestra. Debes recordar que a medida que aumenta el
tamaño de la muestra, se acerca al tamaño de toda la población y, por lo tanto, se aproxima a todas
las características de la población, disminuyendo el error del proceso de muestreo.
Desviación estándar y error de muestreo

La desviación estándar se utiliza para expresar la variabilidad de la población. Más técnicamente, es


la diferencia promedio de todas las puntuaciones reales de los sujetos de la media o promedio de
todas las puntuaciones. Por lo tanto, si la muestra tiene una alta desviación estándar, se deduce que
la muestra también tiene un alto error del proceso de muestreo.

Se entiende más fácilmente si relacionas la desviación estándar con el tamaño de la muestra. Debes
tener en cuenta que a medida que aumenta el tamaño de la muestra, la desviación estándar
disminuye.

Imagina que tienes sólo 10 sujetos. Con este tamaño de la muestra tan pequeño, la tendencia de
sus resultados es que variarán mucho, produciendo una alta desviación estándar. Ahora imagina
que el tamaño de la muestra aumentó a 100. La tendencia de sus puntuaciones es a agruparse,
produciendo una desviación estándar baja.

Formas de eliminar el error de muestreo

Sólo hay una manera de eliminar este error. Consiste en eliminar el concepto de muestra y probar
a toda la población.

En la mayoría de los casos esto no es posible. Por consiguiente, lo que el investigador debe hacer es
minimizar el error del proceso de muestreo. Esto se puede lograr con un muestreo probabilístico
adecuado y no sesgado y mediante el uso de un gran tamaño de la muestra.

¿Cómo determinar el tamaño de una muestra?

04/11/2015 | ES

Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en cualquier


estudio de investigación de mercados, se debe justificar convenientemente de acuerdo al
planteamiento del problema, la población, los objetivos y el propósito de la investigación.
Estimación del tamaño muestral requerido

El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden incluir por


ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que estará en campo.

Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:

1. Tamaño de la población. Una población es una colección bien definida de objetos o


individuos que tienen características similares. Hablamos de dos tipos: población objetivo,
que suele tiene diversas características y también es conocida como la población teórica. La
población accesible es la población sobre la que los investigadores aplicaran sus
conclusiones.

2. Margen de error (intervalo de confianza). El margen de error es una estadística que expresa
la cantidad de error de muestreo aleatorio en los resultados de una encuesta, es decir, es la
medida estadística del número de veces de cada 100 que se espera que los resultados se
encuentren dentro de un rango específico.

3. Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor con una
determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95% significa que
los resultados de una acción probablemente cubrirán las expectativas el 95% de las veces.

4. La desviación estándar. Es un índice numérico de la dispersión de un conjunto de datos (o


población). Mientras mayor es la desviación estándar, mayor es la dispersión de la
población.

Cálculo del tamaño de la muestra desconociendo el tamaño de la población

La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la población es


la siguiente:
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)

Cálculo del tamaño de la muestra conociendo el tamaño de la población

La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la población es la


siguiente:

En donde, N = tamaño de la población Z = nivel de confianza, P = probabilidad de éxito, o proporción


esperada Q = probabilidad de fracaso D = precisión (Error máximo admisible en términos de
proporción).

TIPOS DE MUESTREO

El muestreo es una herramienta para determinar qué parte de una población debemos analizar
cuando no es posible realizar un censo. Depende de los objetivos del estudio el elegir una muestra
probabilística o no probabilística.

MUESTREO PROBABILÍSTICO

Se basa en el principio de equiprobabilidad, esto quiere decir que todos los individuos de la muestra
seleccionada tendrán las mismas probabilidades de ser elegidos. Lo anterior nos asegura que la
muestra extraída contará con representatividad.

Al azar simple

 Sistemática

 Estratificada
 Conglomerados

Características:

 No hay discreción del investigador.

 Los elementos se seleccionan por reglas mecánicas.

 Hay error muestral.

 Se conoce la probabilidad de inclusión.

MUESTREO NO PROBABILÍSTICO

No sirven para hacer generalizaciones, pero sí para estudios exploratorios. En este tipo de muestras,
se eligen a los individuos utilizando diferentes criterios relacionadas con las características de la
investigación, no tienen la misma probabilidad de ser seleccionados ya que el investigador suele
determinar la población objetivo.

 Por juicio u opinión.

 Por cuotas.

 De bola de nieve.

 De conveniencia.

Características:

 La muestra es discrecional

 Los elementos se seleccionan por facilidad conveniencia y no por reglas fijas

 No hay error muestral o no se puede calcular

 No se conoce la posibilidad de inclusión