Está en la página 1de 21

División de Ciencias Sociales y

Humanidades
Maestría en Desarrollo y Planeación de la
Educación

Seminario

Estadística aplicada

Tema:
Capítulo 7 Muestreo y distribuciones
muestrales

Maestra: Edith Ariza Gómez

Presentan
María Isabel Pérez Ornelas
Armando Tapia Chávez
México, D.F. a 24 de enero de 2011

1
Muestreo y distribuciones muestrales

Contenido

Introducción

7.1 El problema de muestreo en Electronics Associates

7.2 Muestreo aleatorio simple


Muestreo para poblaciones finitas
Muestreo para poblaciones infinitas

7.3 Estimación puntual

7.4 Introducción a las distribuciones muestrales

7.5 Distribuciones muestrales de x


Valor esperado de x
Desviación estándar de x
Teorema de límite central
Valor práctico de la distribución muestral de x
Relación entre el tamaño de la muestra y la distribución muestral de x

7.6 Distribución muestral de p


Valor esperado de p
Desviación estándar de p
Forma de la distribución muestral de p
Valor práctico de la distribución muestral de p

7.7 Propiedades de los estimadores puntuales


Insesgadez
Eficiencia
Consistencia

7.8 Otros métodos de muestreo


Muestreo aleatorio estratificado
Muestreo por conglomerados
Muestreo sistemático
Muestreo por conveniencia
Muestreo por juicio

Referencias consultadas

2
Introducción

El presente trabajo tiene el propósito de ubicar la importancia del muestreo y


distribuciones en estadística aplicada. Para ello se recurre tanto a conceptos centrales
recuperados del libro Estadística para administración y economía y de otros referentes
bibliográficos para complementar aspectos conceptuales y de procedimiento.
A manera de apertura del capítulo muestreo y distribuciones muestrales
En la estadística inferencial se requiere información acerca de grupos grandes de
elementos (individuales, empresas, votantes, etc.), pero por cuestiones de tiempo, costo,
entre otros aspectos, solamente se puede recolectar datos de una pequeña parte de este
grupo, a lo que llamamos muestra, por lo tanto, para inferir información estadística es
importante tener claros dos aspectos importantes:
- Población que es el conjunto de todos los elementos de interés en un estudio
determinado, y
- Muestra que es un subconjunto de la población.
Por lo anterior, se tiene que la inferencia estadística tiene como propósito construir
estimaciones y pruebas de hipótesis acerca de las características de una población por
medio de la información obtenida en una muestra.
Se puede emplear el muestreo y los resultados de una muestra para obtener estimaciones
de las características de una población. Es importante tener en cuenta que los resultados
de la muestra sólo dan estimaciones de los valores de las características de la población.
Con lo métodos adecuados de muestreo, los resultados muestrales darán “buenas”
estimaciones de las características de la población.
Una buena muestra reproduce las características de interés que existen en la población de
la manera más cercana posible. Esta muestra será representativa, en el sentido de que cada
unidad muestreada representará las características de una cantidad conocida de unidades
en la población.

Definiciones para precisar el concepto de una buena muestra:

- Unidad de observación. Es el objeto sobre el cual se realiza una medición. Esta es la


unidad básica de observación, a veces llamada elemento.

- Población objetivo. Es la colección completa de observación que deseamos


estudiar. La definición de la población es una parte importante, y con frecuencia
difícil, del estudio. Por ejemplo, en una encuesta escolar ¿la población objetivo
deberían ser todos los alumnos que pueden votar?

3
- Muestra. Es una fracción o subconjunto de cualquier tamaño de la población de la
cual proviene. Las muestras se escogen por diversos procedimientos (sean
apropiados o no) para realizar las observaciones o recogida de datos. El método de
muestreo aplicado y el tamaño de la muestra que se decida, determinan su grado de
representatividad.

- Población muestreada. Es la colección de todas las unidades de observación


posibles que podrían extraerse en una muestra, es la población de donde se extrae
la muestra.

- Unidad de muestreo. Es la unidad donde se realiza la muestra. Por ejemplo,


podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de esto, las familias
sirven como las unidades de muestreo y las unidades de observación son los
individuos que viven en una familia.

Según Sharon Lohr,1 existen tres justificaciones principales para el uso del muestreo,
las cuales se apuntan a continuación:
- El muestreo puede proporcionar información confiable con costos mucho menores
que los de un censo. Con las muestras probabilísticas se puede cuantificar el error
de muestreo a partir de una encuesta. En algunos casos, una unidad de
observación debe ser destruida para ser observada, como cuando una galleta debe
pulverizarse para determinar el contenido de grasa.
- Los datos se pueden reunir más rápido, de modo que las estimaciones se pueden
publicar de una manera programada.
- Las estimaciones basadas en las encuestas y sus respectivas muestras son, con
frecuencia, más precisas que las basadas en un censo pues los investigadores
pueden tener más cuidado al reunir los datos. Un censo completo necesita, por lo
regular, de una gran organización administrativa e implica a muchas personas en
la recolección de datos.

7.1 El problema de muestreo en Electronics Associates


Para dar un seguimiento a lo que plantea el libro base del Seminario de Estadística
Aplicada, se considera importante, recuperar los ejemplos que en éste se desarrollan,
además de complementarlos.
Para dar cuenta de la importancia de la muestra en un estudio estadístico es importante
conocer la población a la que se va a estudiar y las características que se desean
identificar, por ejemplo, en el caso de la empresa Elecronics Electronics Associates, Inc.
(EAI) el director de personal tiene que elaborar un perfil de 2500 gerentes que trabajan en
dicha empresa. Le interesa dos características a identificar: el sueldo anual promedio y la
proporción de gerentes que concluyeron un programa de adiestramiento de la empresa.
1
Lohr, Sharon, Muestreo: Diseño y análisis, México, Internacional Thomson Editores, 2000. Trad. de
Óscar Alfredo Palmas Velasco.
4
Para calcular la media poblacional y la desviación estándar de la población para los datos
anuales de salarios se recurre a las siguientes formulas:

Media poblacional µ= ∑xi (xi= x1+x2+xn)


N (Donde N es el símbolo para denotar la población)

Y
Desviación estándar poblacional σ =√ σ2
Desviación estándar
Es la raíz cuadrada positiva de la varianza.
s denota la desviación estándar muestral s=√s2 y
σ la desviación estándar poblacional σ =√ σ2
La desviación estándar se mide en las mismas unidades que los datos originales.

Donde

Media de la población: µ = 51 800 dólares2


Desviación estándar de la población: σ = 4000 dólares

Recordemos que para obtener la varianza que está basada en la diferencia entre el valor de
cada observación (xi) y la media, se recurre a la siguiente formula

σ2=∑( xi - µ)
N

Cuando los datos son de una población las elevaciones son al cuadrado y se denota
varianza poblacional y se denota con la letra griega σ2
A la diferencia entre cada valor xi y la media se le llama desviación estándar respecto de
la media. Para calcular la varianza, las desviaciones respecto a la media se elevan al
cuadrado.

Cuando se calcula una muestra lo que interesa es estimar la varianza poblacional σ2. La
suma de los cuadrados de las desviaciones respecto de la media se divide entre n- 1, en
lugar entre n, la varianza muestra que se obtiene constituye un estimador no sesgado de la
varianza poblacional.

2
Datos recuperados del capítulo 7. Muestreo y distribuciones muestrales en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, pp. 241- 283.

5
Varianza muestral: s2=∑( xi - )
n -1
En todo conjunto de datos, la suma de las desviaciones respecto de la media será siempre
igual a cero.

Para obtener la proporción de gerentes que terminaron el programa, se calcula la


proporción de la población que terminó el programa. De los 2500 gerentes 1500
terminaron el programa de capacitación, p representa la proporción de la población que
terminó el programa, entonces tenemos que p = 1500/2500 =0.60.

Con los estadísticos anteriores tenemos los parámetros de la población que se está
estudiando: la media del salario anual de la población (µ = 51 800), su desviación
estándar (σ = 4000) y la proporción que terminó el programa de adiestramiento (p= 0.60)
son parámetros de la población de los gerentes de EAI. Por lo anterior, se puede decir que
un parámetro es una característica numérica de una población.
Con lo anterior se demuestra que es común que la información de una muestra se pueda
usar para elaborar estimaciones de los parámetros poblacionales de interés.

7.2 Muestreo aleatorio simple


Se puede usar varios métodos para seleccionar una muestra a partir de una población; uno
del os métodos más comunes es el muestreo aleatorio simple. La definición de este
método y el proceso de seleccionar una muestra aleatoria simple siempre dependen de si
la población es finitia o infinita.

Muestreo para poblaciones finitias


Una muestra aleatoria simple de tamaño n, de una población finita de tamaño N, se define
como sigue:

Una muestra aleatoria simple de tamaño n, de una población finita de tamaño N, es una
muestra seleccionada de tal manera que cada muestra posible de tamaño n tenga la misma
probabilidad de ser seleccionada.

Un procedimiento para identificar una muestra aleatoria simple a partir de una población
finita es seleccionar por uno los elementos que constituyen a la muestra, de tal modo que
cada uno de los elementos que aún queden en la población tengan la misma probabilidad
de ser seleccionados. Al muestrear n elementos en esa forma, se satisfará la definición de
una muestra aleatoria simple de una población finita.

Al realizar este proceso para la selección de una muestra aleatoria simple, es posible que
un número que haya sido usado se encuentre de nuevo, a este tipo de selección se le
conoce como muestreo con reemplazo. Cualquier número aleatorio que ya ha sido usado
se ignora se esta muestreando con reemplazo. Muestrear con reemplazo es una forma
6
válida de identificar una muestra aleatoria simple. Sin embargo el muestreo sin reemplazo
es el procedimiento de muestreo más usado.

Muestreo de una población infinita

En algunas situaciones la población o bien es infinita o tan grande que, para fines
prácticos, se considera infinita.

Una muestra aleatoria simple de una población infinita es una muestra seleccionada de
manera que se satisfagan las condiciones siguientes:

1. Cada uno de los elementos seleccionados proviene de la población


2. Cada elemento se selecciona independientemente.
En poblaciones infinitas un procedimiento para la selección de una muestra debe de ser
concebido especialmente para cada situación, de manera que permita seleccionar los
elementos de manera independientemente y evitar así un sesgo en la selección que de
mayores probabilidades de selección a ciertos tipos de elementos.

Dichos sesgos se evitan haciendo que la selección de un elemento no influya en la


selección de cualquier otro elemento.

Las poblaciones infinitas suelen asociarse con un proceso que opera continuamente a lo
largo del tiempo. En tales casos un procedimiento de muestreo creativo garantiza que no
haya sesgos de selección y que los elementos de la muestra sean seleccionados en forma
independiente.

7.3 Estimación puntual


En la estimación puntual se usan los datos de la muestra para calcular un valor de un
estadístico de la muestra que sirva como estimación de un parámetro de población.
Se dice que:

es estimador puntual de la media población µ


s es el estimador puntual de la desviación estándar poblacional σ
es el estimador puntual de la proporción p poblacional.

Para estimar el valor de un parámetro de población se calcula una correspondiente


característica de la muestra, que se denomina estadístico de la muestra o media muestral.

A los valores numéricos obtenidos para ,so en una determinada muestra


se les llama estimaciones puntuales del parámetro.

Por ejemplo, si elegimos una muestra aleatoria de 30 gerentes para estimar la media de la
7
población µ y la desviación estándar de la población σ del salario anual para calcular los

estadísticos de la muestra que son la media de la muestra y la desviación estándar


de la muestra s.

Formulas
Media muestral
=∑xi (xi= x1+x2+xn) = 1554 420 = 51 814.00 dólares
n 30

Desviación estándar de la muestra


s=√ ∑(xi - ) 2=
√325 009 260 = 3347.72 dólares
n-1 29

Al calcular la proporción de gerentes que contestaron que Sí en la muestra, podemos


estimar la proporción de gerentes, en la población, que terminaron el programa de
adiestramiento gerencial. De los 30 gerentes de la muestra terminaron el adiestramiento
19.

La proporción de la muestra, representada por es

= 19 = 0.63
30

Este valor se usa como estimación de la proporción p de la población.

Las estimaciones puntuales no son exactamente iguales a los parámetros poblacionales


correspondientes, por lo que se tiene un error de muestreo que es el valor absoluto de la
diferencia entre una estimación puntual insesgada y el parámetro poblacional
correspondiente, es decir, es la diferencia entre la estimación puntual y el parámetro
poblacional, cuando el estimador puntual es insesgado. Para una media muestral, la

desviación estándar y la proporción muestrales, los errores de muestreo son │ - µ│,


│ s - σ│ y │ - p│
En una aplicación real de muestreo no se puede calcular de manera exacta el error de
muestreo porque no se conocerá el valor del parámetro poblacional.

7.4 Introducción a las distribuciones muestrales

8
Ahora suponga que el proceso de seleccionar una muestra aleatoria simple de 30
administradores se repite una y otra vez y que cada vez que se calculan los valores de

y de .

Si el proceso de seleccionar una muestra aleatoria simple se considera como un

experimento, la media muestral tiene una media o valor esperado, una desviación

estándar y una distribución de probabilidad. Como los distintos valores que toma son
resultados de distintas muestras aleatorias simples, a la distribución de probabilidad de

se le conoce como distribución muestral de . Conocer esta distribución muestral


y sus propiedades permitirá hacer declaraciones de probabilidad de que tan cerca está la

media muestral de la media poblacional

Como ocurre con , es una variable aleatoria. Si se tomara cada muestra posible de
tamaño de 30 y para cada muestra se calculara el valor de , la distribución de
probabilidad que se obtuviera sería la distribución muestra de

7.5. Distribuciones muestrales de


Uno de los estadísticos más comunes es usar la media de la muestra para hacer
inferencias acerca de una media de la población µ. El siguiente diagrama muestra el
proceso:

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística


para administración y economía. 10ª edición, México, CENGAGE Learning. P. 256

En cada repetición del proceso se puede anticipar la obtención de un valor distinto de la


9
media de la muestra . Entonces tenemos que la distribución muestral de
es la distribución de probabilidad de todos los valores posibles de la media de la muestra

se llama distribución muestral de la media de la muestra .

A continuación se describen las propiedades de la distribución muestral de : valor

esperado o media de , desviación estándar y la forma de distribución.

Valor esperado de

Distintas muestras aleatorias simples dan como resultado varios valores de la media de la

muestra . El valor esperado de es la media de todos los valores posibles

de que se pueden generar mediante las diversas muestras aleatorias simples.

Valor esperado de
E( )=µ
donde
E( ) = valor esperado de
µ = media de la población
Con muestreo aleatorio simple, el valor esperado o media de es igual a la media
de la población. Por ejemplo, el sueldo anual promedio de la población de gerentes es µ
51 800 dólares, entonces, la media de todas las posibles medias de la muestra son 51 8000
dólares.

Desviación estándar
Para la desviación estándar de la distribución normal de se usa la siguiente
notación:

= desviación estándar de la distribución muestral de


σ = desviación estándar de la población
n= tamaño de la muestra
N = tamaño de la población

Con muestreo aleatorio simple, la desviación estándar de depende de si la


población es finita o infinita. Las ecuaciones de la desviación estándar son:

10
Desviación estándar de
Población finita Población infinita

= N-n σ =σ
N -1 √n √n

La población finita requiere un factor de corrección para la población finita que es √(N-
n)/ (N-1). Cuando la población es grande y el tamaño de la muestra pequeño el factor de
corrección del a población finita es cercano a 1.

Una regla general para calcular la desviación estándar de es usar la ecuación:


√n
siempre que
1. La población sea infinita
2. La población sea finita y también el tamaño de la muestra sea menor o igual
que el 5% del tamaño de la población, n/N≤ 0.05

Para poblaciones finitas que contengan casos en que n/N > 0.05 se debe usar la ecuación
para Población finita.

Teorema del límite central


El paso final para identificar las características de la distribución muestral de es

determinar la forma de la distribución de probabilidad de .


Cuando no es conocida la distribución de la población se recurre al Teorema del límite
central, el cual señala que al seleccionar muestras aleatorias simples de tamaño n de una

población, la distribución muestral de la media muestral se puede aproximar con


una distribución de probabilidad normal, cuando el tamaño de la muestra es grande.

La distribución muestral de se puede aproximar mediante una distribución de


probabilidad normal siempre que el tamaño de la muestra sea grande. Se puede suponer
que la condición de muestra grande se cumple para muestras aleatorias simples de tamaño
30 o mayor.
Cuando en casos de muestreo se supone que la población tiene distribución normal, la

distribución muestral de tiene una distribución de probabilidad normal para

11
cualquier tamaño de la muestra.

La importancia del teorema se debe a que la media de una muestra aleatoria


procedente de cualquier distribución con varianza finita σ2 y media µ, se distribuye
aproximadamente como una variante normal de media µ y varianza σ2/n.3

Valor práctico de la distribución muestral de


La razón práctica de que interese la distribución muestral de es que se puede usar
para determinar información probabilística acerca del tamaño del error muestral.
Tomando el ejemplo de los gerentes de la empresa, si se quiere saber la probabilidad de
que la media de la muestra que se obtenga de una muestra aleatoria simple de 30 gerentes
esté dentro del intervalo de 500 dólares alrededor de la media poblacional. Si se quiere
saber sobre la probabilidad de que la media de la muestra esté entre 51300 y 52 300

dólares y si el valor de la media de la muestra de está en este intervalo, se


aproximará a 500 dólares de la media de la población. Para obtener esta información se
recurre a la siguiente formula

Z = x -µ
σ
Figura 7.7 Probabilidad de que una media muestral quede a 500 dólares o menos de la
media poblacional

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, pp. 275.

3
Mood, Alexander y Franklin Graybill, “Muestreo”, en Introducción a la teoría de la estadística, España,
Aguilar s a ediciones, 1978, p. 172.
12
Relación entre el tamaño de la muestra y la distribución
muestral de
Para la relación entre el tamaño de la muestra y la distribución muestral de ,

observe primero que E( ) = µ independientemente del tamaño de la muestra. La

media de todos los valores posibles de es igual a la media de la población, µ,


independientemente del tamaño de la muestra n. También se puede apreciar que el error

estándar de la media = σ /√n está relacionado con la raíz cuadrada del tamaño de
la muestra. Siempre que aumente el tamaño de la muestra disminuye el error estándar de

la media . Por ejemplo:

Figura 7.8 Comparación de las distribuciones muestrales de para muestras


aleatorias simples de n =30 y n =100 Gerentes de EAI.

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, p. 262.

7.6 Distribución muestral de

La proporción muestral es el estimador puntual de la proporción poblacional . la


fórmula para calcular la proporción muestral es:

13
La proporción muestral de es una variable aleatoria y su distribución de probabilidad
se conoce como distribución muestral de .

La distribución muestral de es la distribución de probabilidad de todos los posibles


valores de la proporción muestral de .

Para determinar qué tan cerca está la proporción muestral de de la proporción

poblacional , se necesita entender las propiedades de la distribución muestral de ; el


valor esperado de , la desviación estándar de y la forma de la distribución muestral
de .

Valor esperado de
El valor esperado de , la media de todos los posibles valores de , es igual a la

proporción poblacional de .

14
Desviación estándar de

Como en el caso de la desviación estándar de la desviación estándar de obedece a


si la población es finita o infinita. Las dos fórmulas para calcular la desviación estándar
de son:

Como en el caso de la media poblacional , la diferencia entre las expresiones para


una población finita y para una infinita es despreciable si el tamaño de la población finita
es grande en comparación con el tamaño de la muestra.

Es decir, si la población es finita y se usara . Pero

si la población es finita y entonces se deberá de usar el factor de


coerción para una probabilidad finita. También, a menos que se especifique otra cosa, en
este libro se supondrá que el tamaño de la población es grande en comparación al tamaño
de la muestra y por tanto, el factor de coerción para una población finita no será
necesario.

En el caso de proporciones se usa el error estándar de la proporción para

referirse a la desviación estándar de .

Forma de la distribución muestral de


Ahora que se conoce la media y la desviación estándar de la distribución muestral de ,
el último paso es determinar la forma de la distribución muestral. La proporción muestral

es . En una muestra aleatoria simple de población grande, el valor de es una


variable aleatoria binomial que indica el número de los elementos de la muestra que tiene
la característica de interés. Como es una constante, la probabilidad es la misma

probabilidad de , lo cual significa que la distribución muestral de también es una

distribución de probabilidad discreta y que la probabilidad de cada es la misma que

la probabilidad de .

15
Una distribución binomial se aproxima mediante una distribución normal siempre que el
tamaño de la muestra sea lo suficientemente grande para satisfacer las dos condiciones
siguientes.

Suponiendo que satisfagan estas dos condiciones, la distribución de probabilidad de

en la proporción muestral, puede aproximarse por medio de una distribución


normal. Y como es una constante, la distribución muestral de también se aproxima
mediante una distribución normal. Esta aproximación se formula como sigue:

La distribución muestral de se aproxima mediante una distribución normal siempre que

El valor práctico de la distribución muestral de es que permite obtener información


probabilística acerca de la diferencia entre proporción muestral y la proporción
poblacional.

Par lograr este comparativo entre estos dos valores de probabilidad, es necesario hacer
uso de lo que anteriormente estudiamos llamado valores de z, lo cuales se pueden calcular
haciendo uso de la siguiente fórmula.

xi - x
zi =
s
7.7 Propiedades de los estimadores puntuales
Para utilizar algún estadístico de muestra como estimador puntual, se debe comprobar si
tiene ciertas propiedades asociadas con los buenos estimadores puntuales: insesgadez,
eficiencia y consistencia.
Debido a que pueden emplearse diversos estadísticos de muestra como estimadores
puntuales de distintos primeros poblacionales, se usa la siguiente notación:
θ = parámetro poblacional de interés (letra griega, theta)
θ̂= estadístico de muestra o estimador puntual de θ (theta con sombrero)

La letra θ representa cualquier parámetro de la población: media poblacional, desviación

16
estándar poblacional, proporción poblacional.
La theta con sombrero θ̂representa el estadístico de la muestra correspondiente como la
media de la muestra, la desviación estándar de la muestra y la proporción muestral.

Insesgadez
El estimador insesgado del parámetro poblacional se da cuando el valor esperado del
estadístico de muestra es igual al parámetro poblacional que se estima.
El estadístico de muestra θ̂es un estimador insesgado del parámetro poblacional θ si

︢E (θ)̂ = θ
donde E (θ̂) = valor esperado del estadístico de muestra θ̂

Por ejemplo, sea x1, x2… una muestra aleatoria de una densidad cuya media es µ. En tal

caso E( )=µ; asimismo, E(x1)= µ, por tanto y x1 son estimadores insesgados


de µ.4

Figura 7.13 Ejemplos de estimadores puntuales insesgado y sesgado

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, p. 272.
4
Ejemplo tomado de Spiegel, Murray et al. Teoría y problemas de Probabilidad y Estadística, Colombia,
McGrawHill, 2003, p. 209.

17
Eficiencia
Se habla de eficiencia relativa cuando en un estimador puntual tiene menor desviación
estándar. Si las distribuciones muestrales de dos estadísticos tienen la misma media, el
estadístico con la varianza menor es el estimador más eficiente de la media, por ejemplo,
para una población normal, la distribución normal de la media y la mediana tiene la
misma media de la población, sin embargo, la varianza de la distribución muestral de
medias es más pequeña que la varianza muestral de medianas, entonces, la media provee
un estimador más eficiente que la mediana.

Figura 7. 14 Distribuciones muestrales de dos estimadores puntuales insesgados

Figura tomada de Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, p. 2723

En la figura se muestra que la desviación estándar de θ̂1 es menor que la θ̂2, los valores
de θ̂1 tienen mayor probabilidad de estar cerca del parámetro θ que los valores de θ̂2.

Consistencia
Un estimador puntual es consistente si sus valores tienden a acercarse al parámetro de
población conforme se incrementa el tamaño de la muestra, es decir, el estimador es
mejor cuando se basa en una muestra de de 20 observaciones que si se basa en dos.
La condición de consistencia establece que para muestras grandes θ̂n tiende a aproximarse
a θ, es decir, un tamaño grande de muestra tiende a proporcionar un mejor estimador
puntual que un tamaño pequeño.

Por ejemplo, para la media muestral , se demuestra que su desviación estándar es

18
= σ /√n. Como se relaciona con el tamaño de muestra, de tal manera que

las muestras mayores dan valores de , se llega a la conclusión de que un tamaño


de muestra mayor tiende a producir estimaciones puntuales más cercanas a la media de la

población µ, entonces la media de la muestra es un estimador consistente de la


media de la población µ, lo mismo sucede con la proporción muestral p.

7.8 Otros métodos de muestreo


Muestreo aleatorio estratificado
En el muestreo aleatorio estratificado los elementos de la población primero se dividen en
grupos, a los que se les llama estratos, de manera que cada elemento pertenezca a uno y
sólo un estrato. La base para la formación de los estratos, que pueden ser departamento,
edad, tipo de industria, etc., está a discreción de la persona que diseña la muestra. Sin
embargo, se obtienen mejores resultados cuando los elementos que forma un estrato son
lo más parecidos posible.

Una vez formados los estratos, se toma una muestra aleatoria simple de cada estrato.
Existen fórmulas para combinar los resultados de las muestras de los varios estratos en
una estimación del parámetro poblacional de interés. El valor aleatorio estratificado
depende de qué tan homogéneos sean los elementos dentro de cada estrato. Si los
elementos de un estrato son homogéneos, el estrato tendrá una varianza pequeña. Por
tanto, con muestras relativamente pequeñas de los estratos se obtienen buenas
estimaciones de las características de los estratos. Si los estratos son homogéneos, el
muestreo aleatorio estratificado, proporciona resultados tan precisos como los de un
muestreo aleatorio simple, pero con una muestra de tamaño total menor.

Muestreo por conglomerados


En el muestre o por conglomerados los elementos de la muestra primero se dividen en
grupos separados, llamados conglomerados. Cada elemento de la población pertenece a
uno y sólo a un conglomerado. Se toma una muestra aleatoria simple de los

19
conglomerados. La muestra está formada por todos los elementos dentro de cada uno de
los conglomerados que forman la muestra. El muestreo por conglomerados tiende a
proporcionar mejores resultados cuando los elementos dentro de conglomerados no son
semejantes. Lo ideal es que cada conglomerado sea una representación, a pequeña escala,
de la población. Si todos los conglomerados son semejantes en este aspecto, tomando en
la muestra un número pequeño de conglomerados se obtendrá una buena estimación de
los parámetros poblacionales.

Una de las principales aplicaciones del muestreo por conglomerados es el muestreo de


áreas en el que los conglomerados son las manzanas de una ciudad y otras áreas bien
definidas. El muestreo por conglomerados requiere, por lo general, tamaños de muestra
mayores que los requeridos en el muestreo aleatorio simple o en el muestreo aleatorio
estratificado.

Muestreo sistemático
Para ciertos muestreos, en especial en aquellos con poblaciones grandes, se necesita
mucho tiempo para tomar una muestra aleatoria simple. Una alternativa al muestreo
aleatorio simple es el muestreo sistemático. Por ejemplo, si se quiere una muestra de
tamaño de 50 de una población que tiene 500 elementos, se muestra uno de cada
5000/50= 100 elementos de la población, en este caso, un muestreo sistemático consiste
en forma aleatoria uno de los primeros elementos de la lista de la población. Los otros
elementos se identifican contando a partir del primer elemento de 100 elementos para
tomar el elemento que tenga la posición 100 en la lista de la población, a partir de este
elemento se cuentan otros 100 y así se continua.

Muestreo de conveniencia
El muestreo de conveniencia es una técnica de muestreo no probabilístico. Como el
nombre lo indica, la muestra se determina por conveniencia. Los elementos se incluyen en
la muestra sin que haya una probabilidad previamente especificada o conocida de que
sean incluidos en la muestra. Por ejemplo, un profesor que realiza una investigación en
una universidad puede usarse estudiantes voluntarios para que constituyan una muestra
¿la razón para elegirlos? Simple, los tienen al alcance y participarán como sujetos a un
costo bajo o sin costo.

Muestreo subjetivo
Otra técnica de muestreo no probabilístico es el muestreo subjetivo. En este método la
persona que más sabe sobre un asunto selecciona elementos de la población que considera
los más representativos de la población. Este método suele ser una manera relativamente
fácil de seleccionar un muestra.

Referencias consultadas
Anderson, David et al. “Muestreo y distribuciones muestrales”, en Estadística para
administración y economía. 10ª edición, México, CENGAGE Learning, pp. 241-
283.
Lohr, Sharon, Muestreo: Diseño y análisis, México, Internacional Thomson Editores,
20
2000. Trad. de Óscar Alfredo Palmas Velasco.
Mood, Alexander y Franklin Graybill, “Muestreo”, en Introducción a la teoría de la
estadística, España, Aguilar s a ediciones, 1978, p. 172.
Spiegel, Murray et al. Teoría y problemas de Probabilidad y Estadística, Colombia,
McGrawHill, 2003.

21

También podría gustarte