Está en la página 1de 25

TEORÍA DEL MUESTREO Y LA ESTIMACIÓN

TIPOS DE MUESTREO

Existen dos métodos generales para seleccionar muestras de poblaciones: Muestreo no


aleatorio o de juicio y Muestreo aleatorio o probabilístico.

En el muestreo probabilístico, todos los elementos de la población tienen posibilidad de


figurar en la muestra.

En el muestreo de juicio, se usan el conocimiento y la opinión personal para identificar los


elementos de la población que van a incluirse en la muestra. Una muestra seleccionada por
muestreo de juicio se basa en el conocimiento de la población por parte de algún "experto".
Métodos de muestreo aleatorio

Muestreo aleatorio simple.

En el muestreo aleatorio simple se seleccionan las muestras mediante métodos que


permiten a cada muestra posible tener igual probabilidad de ser seleccionada y a cada
elemento de la población tener igual probabilidad de quedar incluido en la muestra. La
forma más simple de seleccionar una muestra al azar consiste en usar números aleatorios.

Muestreo sistemático.

En el muestreo sistemático, los elementos se seleccionan de la población con un intervalo


uniforme que se mide en el tiempo, en el orden o en el espacio.

El muestreo sistemático difiere del muestreo aleatorio simple en que cada elemento tiene
iguales posibilidades de ser seleccionado, pero cada muestra no tiene esa misma
probabilidad.

En el muestreo sistemático, se corre el riesgo de introducir un error en el proceso muestral


si los elementos presentan un patrón secuencial.
Muestreo estratificado.

Para aplicar el muestreo estratificado, dividimos la población en grupos homogéneos


relativos, llamados estratos. Después recurrimos a uno de dos métodos posibles. O bien
seleccionamos al azar en cada estrato un número especificado de elementos
correspondientes a la proporción del estrato de la población total o extraemos un número
igual de elementos de cada estrato y damos un peso a los resultados de acuerdo con la
proporción del estrato en la población total. En ambas estrategias, el muestreo estratificado
garantiza que todos los elementos de la población tengan una posibilidad de ser
seleccionados.

El muestreo estratificado es adecuado cuando la población ya está dividida en grupos de


diferentes tamaños y queremos reconocer ese hecho. La ventaja de las muestras
estratificada estriba, pues, en que cuando se diseñan bien, reflejan más exactamente las
características de la población de donde se extrajeron que otras clases de muestreo.
Muestreo por conglomerados.

En el muestreo por conglomerados, dividimos la población en grupos o conglomerados y


luego seleccionamos una muestra aleatoria de ellos. Suponemos que esos conglomerados
son representativos de la población entera.

Tanto en el muestreo estratificado como en el muestreo por conglomerados, la población se


divide en grupos bien definidos.

Usamos el muestreo estratificado cuando cada grupo presenta una pequeña variación en
su interior, pero existe una amplia variación entre ellos.

Usamos el muestreo por conglomerados en el caso contrario: cuando se advierte


considerable variación dentro de cada grupo pero los grupos son esencialmente
semejantes entre sí.
DISTRIBUCIÓN NORMAL Y SUS APLICACIONES
DISTRIBUCIONES DE PROBABILIDAD

Una distribución de probabilidad es una distribución teórica de frecuencia que describe


cómo se espera que varíen los resultados.

Una distribución de frecuencia es un listado de las frecuencias observadas de todos los


resultados de un experimento que, en realidad se ha presentado cuando se llevó a cabo el
experimento; en cambio, una distribución de probabilidad es un listado de las
probabilidades de todos los resultados posibles que podrían presentarse si se efectuara el
experimento.

Las distribuciones de probabilidad se clasifican en DISCRETAS o CONTINUAS. En una


distribución discreta de probabilidad la variable o variables en estudio asumen únicamente
un número limitado de valores. Por el contrario en una distribución continua de probabilidad,
las variables en estudio pueden asumir cualquier valor dentro de un intervalo dado.

La distribución continua de probabilidad más importante de toda la estadística es la


Distribución Normal.
LA DISTRIBUCIÓN NORMAL

La distribución normal es una distribución teórica de frecuencia que se caracteriza por ser
un tipo de curva uniforme y simétrica cuya forma es similar a la de una campana. No
importa cuáles sean los valores de la media y la desviación estándar para una distribución
normal de probabilidad, el área total bajo la curva será de 1.00, por lo cual podemos
considerar que las áreas bajo la curva son probabilidades. En términos matemáticos es
verdad que:

1. Aproximadamente 68% de todos los valores en una población distribuida


normalmente se encuentran dentro de una desviación estándar a la izquierda y
derecha de la media.

2. Aproximadamente 95.5% de todos los valores en una población distribuida


normalmente se encuentran dentro de dos desviaciones estándar a la izquierda y
derecha de la media.

3. Aproximadamente 99.7% de todos los valores en una población distribuida


normalmente se encuentran dentro de tres desviaciones estándar a la izquierda y
derecha de la media.
CARACTERÍSTICAS DE LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL:

La distribución de probabilidad normal y su curva tiene las siguientes características:

1. La curva normal tiene forma de campana. La media, la moda y la mediana de la


distribución son iguales y se localizan en el centro de la distribución.

2. La distribución de probabilidad normal es simétrica alrededor de su media. Por o


tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad
después. El área total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja
de la media en cualquier dirección. Esto significa que la curva se acerca al eje
horizontal conforme se aleja de la media, pero nunca lo llega a tocar.

4. La función de la curva normal es la siguiente:

1 e(- ½)[(x-μ)/s]²
F(x) =
2πσ

Donde π = 3.14159 y e = 2.71828


LA FAMILIA DE LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL

Cuando se habla de la distribución normal, realmente se está hablando de una familia de


curvas. Como se puede apreciar en la función de la curva normal, la curva depende de dos
variables además de la variable independiente x, tales como la media (μ), y la desviación
estándar (σ). Por lo tanto se tendrán curvas diferentes para funciones con desviación
estándar diferente aún cuando sus medias fuesen iguales, como se muestra enseguida.

Curvas normales con media igual y desviación estándar diferente.


Si por el contrario, las curvas tienen desviación estándar igual y la media es diferente, las
curvas serán idénticas pero centradas en diferente posición en el eje horizontal.

Curvas normales con desviación estándar igual y media diferente

Si las curvas tienen la media diferente y también la desviación estándar diferente, aparte de
estar centradas en diferentes lugares del eje x, tendrá formas diferentes.

Curvas normales con media diferente y desviación estándar diferente


LA DISTRIBUCIÓN NORMAL ESTÁNDAR

El área bajo la curva normal y sobre el eje x es igual a la probabilidad de que la variable
aleatoria x tome un valor dentro de cierto intervalo. Para medir esta área es necesario
calcular la integral de la función de la curva normal para un intervalo de valores. Para evitar
la dificultad de resolver integrales es necesario tabular las áreas que corresponden a cada
valor de x. Como el número de distribuciones normales es ilimitado sería una tarea sin fin
intentar establecer tablas para cada combinación de μ y. σ. Afortunadamente, un miembro
de la familia de las distribuciones normales puede ser usado en todos los problemas donde
la distribución normal es aplicable, esta es la distribución normal con media cero y
desviación estándar 1, la cual es llamada distribución normal estándar.
Cada distribución normal deberá estandarizarse, es decir, transformarse a una distribución
normal estándar, utilizando un valor Z, o variable aleatoria estándar.

Valor Z. Distancia entre un valor seleccionado, denominado X, y la


media de la distribución, en unidades de una desviación estándar.

Fórmula para calcular un valor Z:

μ
Z= X -
σ
Gracias a esta fórmula podemos transformar cualquier distribución normal a la distribución
normal estándar.
ÁREAS BAJO LA CURVA NORMAL

Si se quiere saber la probabilidad de que la variable aleatoria tome valores dentro de


determinado rango, se necesitaría calcular el área bajo la curva, resolviendo la integral de
la función para ese rango de valores.

Una característica que tiene cualquier distribución normal es que el área bajo la curva, que
representa la probabilidad de que la variable aleatoria tome ciertos valores, se distribuye en
la misma proporción.

Para facilitar los cálculos se tabularon las áreas bajo la curva normal que se encuentran a la
derecha de algunos de los valores Z, de esta forma ya no es necesario resolver integrales,
solo se necesita transformar la distribución normal de interés en una distribución normal
estándar mediante la fórmula, y el área a la derecha del valor Z será el mismo que el área a
la derecha de X.
Ejemplo:

Los coeficientes intelectuales de 600 aspirantes de cierta universidad se distribuyen


aproximadamente de forma normal con una media de 115 y una desviación estándar de 12.
Si se selecciona un aspirante al azar, encuentre la probabilidad de que: Tenga un
coeficiente mayor de 120.

Solución:

Hay una distribución normal con media 115 y desviación estándar de 12 y queremos saber
cual es la probabilidad de que x sea mayor de 120, es decir, cuanto mide el área a la
derecha del 120.

Lo primero es transformar esta distribución normal en una distribución normal estándar (con
media cero y desviación estándar 1), para lo cual hay que cambiar el valor de x por un valor
Z con la fórmula.

X-µ 120 – 115


z= = = 0.41
σ 12
La distribución ya transformada queda así:

Se busca el valor del área a la derecha del valor Z en la tabla de áreas bajo la curva
normal, la unidad y el primer decimal se buscan en la primer columna, y el segundo decimal
en el primer renglón, donde se cruzan renglón y columna es el valor del área entre la media
y el valor z. En este ejemplo:

Z 1
0.4 .1591

Y como el área a la derecha del valor z es el área que buscamos, entonces a .5 le restamos
.1591 lo que nos da .3409 y este es el resultado, es decir, la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es .3409
APLICACIONES DE LA DISTRIBUCIÓN NORMAL

Con el empleo de la distribución normal podemos:

1. Comparar valores provenientes de diferentes distribuciones.

2. Interpretar un valor contra su propia distribución.

3. Calcular el porcentaje de casos que hay en cualquier intervalo de interés.


TEORÍA DE LA ESTIMACIÓN

Podemos hacer dos tipos de estimaciones respecto a una población: una estimación
puntual o una estimación por intervalo.

La estimación puntual es un número que sirve para estimar un parámetro desconocido de


una población. La estimación puntual es a menudo insuficiente, puesto que o se acierta o
se equivoca.

La estimación por intervalo es una gama de valores que sirven para estimar el parámetro
de una población. Indica el error de la estimación en dos formas: por la amplitud de su
intervalo y por la probabilidad de que el verdadero parámetro de la población se encuentre
dentro de él.
Parámetro, es el nombre que recibe cualquier característica de una población; la media,
desviación estándar o varianza de una población son parámetros.

Estadístico o estimador, es el nombre que recibe cualquier característica de una muestra;


la media, desviación estándar o varianza de una muestra son estimadores o estadísticos.

Todo estadístico muestral se usa para estimar un parámetro de la población y recibe el


nombre de estimador, es decir, el estimador es un estadístico muestral con el cual se
estima un parámetro de la población.

Cuando observamos un valor específico de nuestro estimador, lo llamamos estimación. En


otras palabras, la estimación es un valor específico observado de un estadístico.
Obtenemos una estimación tomando una muestra y calculando el valor que en ella asume
nuestro estimador.
Podemos evaluar la calidad de un estadístico como estimador aplicando cuatro criterios:

Insesgamiento. Un estadístico es un estimador insesgado si, en promedio, tiende a asumir


valores que se hallan arriba del parámetro de la población que está siendo estimado en el
mismo grado y con la misma frecuencia con que tiende a asumir valores que se hallan por
debajo del parámetro que está siendo estimado.

Eficiencia. La eficiencia de un estimador está referida al tamaño de su error estándar como


estadístico. Si comparamos dos estadísticos de una muestra del mismo tamaño y tratamos
de decidir cuál es el estimador más eficiente, seleccionamos a aquél cuyo error estándar
sea menor.

Congruencia. Un estadístico es un estimador congruente del parámetro de una población


si, al aumentar el tamaño de la muestra, se logra una mayor seguridad de que el valor del
estadístico se acerca mucho al valor del parámetro de la población. Si un estimador es
congruente, se vuelve más confiable en las muestras grandes.

Suficiencia. Un estimador es suficiente si utiliza la información contenida en la muestra, al


punto que ningún otro estimador podría extraer de esta última más información referente al
parámetro de la población que va a ser estimado.
ESTIMACIÓN DE UNA MEDIA POBLACIONAL
A TRAVÉS DE UNA MEDIA MUESTRAL
-CONCEPTO GENERALES-

Distribución muestral de medias. Es la distribución que se genera con infinidad de


medias muestrales provenientes de una misma población. Es decir, es la distribución de
probabilidad de todas las medias posibles de las muestras obtenidas de una misma
población. La distribución muestral de medias tiene tres características básicas:

a) Su forma se aproxima a una Curva Normal.

b) El valor de su media (la media de las medias) es igual al de la media de la población


de donde fueron extraídas las muestras.

c) Su desviación estándar (error estándar de la media) es, generalmente, menor a la


desviación estándar de la población de donde fueron extraídas las muestras.
Error estándar de la media. Es la desviación estándar de la distribución muestral de
medias y mide el grado en que esperamos que las medias de las diferentes muestras
varíen alrededor de la media de la población debido al error de muestreo. El error estándar
indica no sólo el tamaño del error accidental que se ha cometido en el proceso de
muestreo, sino además la exactitud que alcanzaremos si usamos un estadístico muestral
para estimar un parámetro poblacional.

El error estándar de la media se obtiene a través de la siguiente fórmula:

σ x = σN
Donde:

σx = Error estándar de la media.


σ = Desviación estándar de la población.

N = Tamaño de la muestra.
Nota: Cuando se desconoce la desviación estándar de la población, se puede estimar a
través de la desviación estándar de la muestra que se este utilizando.
Nivel de confianza. En estadística, la probabilidad que asociamos a una estimación de
intervalo se llama nivel de confianza; e indica, la confianza que tenemos de que la
estimación por intervalo comprenda el parámetro de la población. En una estimación, los
niveles de confianza que más se utilizan son 95 y 99%; pero podemos usar cualquier otro.

Intervalo de confianza. Es el intervalo donde con cierta seguridad se encuentra el valor del
parámetro poblacional que se desea estimar.

Como estimar una media poblacional a través de una media muestral

Para estimar una media poblacional a través de una media muestral se construye un
intervalo de confianza empleando el siguiente procedimiento:

X + Z σx
ESTIMACIÓN DE UNA PROPORCIÓN POBLACIONAL A
TRAVÉS DE UNA PROPORCIÓN MUESTRAL
-CONCEPTO GENERALES-

Distribución muestral de proporciones. Es la distribución que se genera con infinidad de


proporciones muestrales provenientes de una misma población. Es decir, es la distribución
de probabilidad de todas las proporciones posibles de las muestras obtenidas de una
misma población. La distribución muestral de proporciones tiene tres características
básicas:

a) Su forma se aproxima a una Curva Normal.

b) El valor de su media (la media de las proporciones) es igual al de la proporción


poblacional de donde fueron extraídas las muestras.

c) Su desviación estándar (error estándar de la proporción) es, generalmente, menor a


la desviación estándar de la población de donde fueron extraídas las muestras.
d) Error estándar de la proporción. Es la desviación estándar de la distribución
muestral de proporciones y mide el grado en que esperamos que las proporciones de
las diferentes muestras varíen alrededor de la proporción poblacional debido al error
de muestreo. El error estándar indica no sólo el tamaño del error accidental que se ha
cometido en el proceso de muestreo, sino además la exactitud que alcanzaremos si
usamos un estadístico muestral para estimar un parámetro poblacional.

El error estándar de la proporción se obtiene a través de la siguiente fórmula:

P (100-P)
σp = N

Donde:

σp = Error estándar de la proporción.


P = Proporción muestral en porcentaje.
N = Tamaño de la muestra.
Como estimar una proporción poblacional a través de una proporción muestral

Para estimar una proporción poblacional a través de una proporción muestral se construye
un intervalo de confianza empleando el siguiente procedimiento:

P + Z σp

También podría gustarte