Está en la página 1de 11

Muestreo y Distribución De Muestreo.

Introducción al muestreo.
Es común que los compradores prueben una porción pequeña de queso antes de
comprar alguno; a partir del trocito, determinan el sabor de queso completo. Lo
mismo hace un químico cuando toma una muestra de whisky de una barrica,
determina que es de grado 90 e infiere que todo el whisky de esa barrica es de ese
grado. Si el químico examinara todo el whisky o los compradores probaran todo el
queso, no quedaría nada para vender. Probar todo el producto es innecesario y a
menudo, destructivo.
Para determinar las características del todo, tenemos que muestrear sólo una
porción. Algunas veces es posible y práctico examinar a cada persona o elemento
de la población que deseamos describir. Esta acción se conoce como
enumeración completa o censo.
Se recurre al muestreo cuando no es posible contar o medir todos los elementos
de la población, los especialistas en estadística usan la palabra población para
referirse no sólo a personas sino a todos los elementos que han sido escogidos para
su estudio, los especialistas en estadística emplean la palabra muestra para
describir una porción escogida de la población.
Estadísticas y parámetros.
Matemáticamente, podemos describir muestras y poblaciones al emplear
mediciones como la media, la mediana, la moda y la desviación estándar. Estos
términos describen las características de una muestra, se denominan estadísticas;
cuando describen las características de una población, se llaman parámetros.

Una estadística es una característica de una muestra y un parámetro es una


característica de una población.
Para ser consecuentes, los especialistas en estadística emplean literales latinas
minúsculas para representar estadísticas de muestra, y literales griegas o latinas
mayúsculas para representar parámetros de población.
Tipos de muestreo
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no
aleatorio o de juicio y el muestreo aleatorio o de probabilidad.
I. En el muestreo de Probabilidad, todos los elementos de la población tienen
la oportunidad de ser escogidos para la muestra.
II. En el muestreo de juicio, se emplea el conocimiento y la opinión personal
para identificar a los elementos de la población que deben incluirse en la
muestra. Una muestra seleccionada por muestreo de Juicio se basa en la
experiencia de alguien con la población. Algunas veces, una muestra de
juicio se usa como guía o muestra tentativa para decidir cómo tomar una
muestra aleatoria más adelante.
Muestras sesgadas.
El Congreso se encuentra en el debate sobre algunas leyes de control de armas. Se
le pide a usted que lleve a cabo una encuesta de opinión. Debido a que los
cazadores son los más afectados por las leyes de control de armas, va a una hostería
de cazadores para hacer las entrevistas. Después informa que, en una encuesta
realizada, cerca del 97% de quienes respondieron estaba a favor de derogar todas
las leyes de control de armas.

Una semana después el Congreso estudia otro proyecto de ley: “¿Debe darse a las
mujeres embarazadas trabajadoras una incapacidad por maternidad de un año con
salario completo para cuidar a sus bebés?” Como este asunto afecta más a las
mujeres, esta vez decide ir a los complejos de oficinas de la ciudad y entrevistar a
empleadas en edad de tener hijos. De nuevo informa que, en un sondeo realizado,
alrededor del 93% de quienes respondieron estaba a favor de la incapacidad de un
año por maternidad con pago completo.
En ambas situaciones se seleccionó una muestra sesgada al elegir a personas que
tienen un fuerte interés en el asunto. ¿Cómo se puede estar seguro de que los
entrevistadores que proporcionan la información no cometen el mismo error? La
respuesta es que no se puede, a menos que tengan una excelente reputación
respecto a la realización de sondeos estadísticamente exactos. Sin embargo, es
posible tomar en cuenta los riesgos derivados de no pedir más información o
investigar más la competencia de las compañías encuestadoras.
Muestreo aleatorio
En una muestra aleatoria o de probabilidad conocemos las posibilidades de que un
elemento de la población se incluya o no en la muestra. Comencemos a analizar
este proceso introduciendo cuatro métodos del muestreo aleatorio:
1. Muestreo aleatorio simple.
2. Muestreo sistemático.
3. Muestreo estratificado.
4. Muestreo de racimo.

Muestreo aleatorio simple.


El muestreo aleatorio simple selecciona muestras mediante métodos que permiten
que cada posible muestra tenga una igual probabilidad de ser seleccionada y que
cada elemento de la población total tenga una oportunidad igual de ser incluido en
la muestra. Una población infinita es aquella en la que es teóricamente imposible
observar todos los elementos.

Aunque muchas poblaciones parecen ser excesivamente grandes, no existe una


población realmente infinita de objetos físicos. Después de todo, con recursos y
tiempo ilimitados, podríamos enumerar cualquier población finita, incluso los
granos de arena de las costas estadounidenses. En términos prácticos, entonces,
utilizaremos el término población infinita cuando hablemos de una población que
no podría enumerarse en un periodo razonable de tiempo.

¿Cómo hacer un muestreo aleatorio? La forma más fácil de seleccionar una muestra
de manera aleatoria es mediante el uso de números aleatorios. Estos números
pueden generarse ya sea con una computadora programada para revolver números
o mediante una tabla de números aleatorios, que, propiamente, debería llamarse
tabla de dígitos aleatorios.

Muestreo sistemático.
En el muestreo sistemático, los elementos son seleccionados de la población
dentro de un intervalo uniforme que se mide con respecto al tiempo, al orden o al
espacio.

El muestreo sistemático difiere del muestreo aleatorio simple en que cada elemento
tiene igual oportunidad de ser seleccionado, pero cada muestra no tiene una
posibilidad igual de ser seleccionada.
En el muestreo sistemático existe el problema de introducir un error en el proceso
de muestreo. Pero el muestreo sistemático también tiene ventajas. Aun cuando este
tipo de muestreo puede ser inapropiado cuando los elementos entran en un patrón
secuencial, este método puede requerir menos tiempo y algunas veces tiene como
resultado un costo menor que el método de muestreo aleatorio simple.

Muestreo estratificado.
Para utilizar el muestreo estratificado, dividimos la población en grupos
relativamente homogéneos, llamados estratos. Después utilizamos uno de los dos
planteamientos: o bien seleccionamos aleatoriamente, en cada estrato, un numero
especifico de elementos correspondiente a la proporción del mismo en relación
con la población completa, o extraemos el mismo número de elementos del estrato
y después ponderamos los resultados considerando la proporción que el estrato
representa con respecto a la población total.

El muestreo estratificado resulta apropiado cuando la población ya está dividida


en grupos de diferentes tamaños y deseamos tomar en cuenta esta condición.

Muestreo de racimo.
En el muestreo de racimo dividimos la población en grupos o racimos y luego
seleccionamos una muestra aleatoria de estos racismos asumiendo que cada uno
de ellos es representativo de la población.

Un procedimiento de muestreo de racimo bien diseñado puede producir una


muestra, más precisa a un costo considerablemente menor que el de un muestreo
aleatorio simple. Usamos el muestreo de racimo cuando hay una variación
considerable dentro de un grupo, pero los grupos son esencialmente similares entre
sí.

Base de la inferencia estadística: el muestreo aleatorio simple.


El muestreo sistemático, el estratificado y el de racimo intentan aproximarse al
muestreo aleatorio simple. Todos han sido métodos desarrollados por su precisión,
su economía, o su factibilidad.
Esto es necesario porque los principios del muestreo aleatorio es la base de la
inferencia estadística, es decir, del proceso de hacer inferencias acerca de
poblaciones a partir de información contenida en muestras. Una vez que sean
desarrollados estos principios para el muestreo aleatorio simple, su extensión para
los otros métodos es bastante simple, aunque algo elaborado matemáticamente.

Diseño de experimentos
Planeación de experimentos
Si hemos de conducir experimentos que produzcan resultados significativos en
forma de conclusiones aprovechables, es de suma importancia la forma en que se
diseñen estos experimentos. La forma en que se conduce un muestreo es sólo una
parte del diseño total de un experimento.

De hecho, el diseño de experimentos es en sí mismo es tema de una gran cantidad


de libros, algunos de ellos realmente formidables tanto en alcance como en
volumen.

Fases del diseño experimental


I. Objetivo
II. Lo que se medirá
III.Qué tamaño de muestra
IV. Conducción del experimento
V. Análisis de los datos

Logro de mayor eficiencia en el diseño experimental.


Como vimos a partir de nuestro experimento de cuatro factores, se requirieron 16
pruebas para comparar todos los niveles con todos los factores. Si tuviéramos que
comparar las mismas dos baterías, pero esta vez con cinco niveles de temperatura,
cuatro mediciones de condiciones de motor y tres mediciones de condiciones del
cable de la batería, serían necesarias 2 5 4 3 = 120 pruebas para un experimento
factorial completo.

Por fortuna, los especialistas en estadística han podido ayudarnos a reducir el


número de pruebas en casos como éste.
Para ilustrar cómo funciona esto, imagine una compañía de productos de consumo
que desea probar en el mercado un nuevo dentífrico en cuatro ciudades, con cuatro
tipos de empaques y con cuatro pautas de publicidad.
En un caso así, un experimento factorial completo tomaría 4 4 4 = 64 pruebas. Sin
embargo, si hacemos una planeación inteligente, podemos llevarlo a cabo, en
realidad, con menos pruebas; 16, para ser preciso.

Introducción a las distribuciones de muestreo.


Una distribución de probabilidad de todas las medias posibles de las muestras es
una distribución de las medias de las muestras. Los especialistas en estadística la
conocen como distribución de muestreo de la media.
También es posible obtener una distribución de muestreo de una proporción.

Descripción de las distribuciones de muestreo.


Cualquier distribución de probabilidad (y, por tanto, cualquier distribución de
muestreo) puede ser descrita parcialmente por su media y su desviación estándar.

Concepto de error estándar.


En vez de decir “la desviación estándar de la distribución de las medias de la
muestra” para describir una distribución de medias de la muestra, los especialistas
en estadística se refieren al error estándar de la media. De manera similar, la
“desviación estándar de la distribución de las proporciones de la muestra” se
abrevia como error estándar de la proporción.

Un uso del error estándar.


Una escuela que capacita pilotos privados para su examen de instrumentos afirma:
“Nuestros egresados obtienen mejores calificaciones en el examen escrito de
instrumentos que los de otras escuelas.” Para el lector confiado, esto parece
perfectamente claro. Si desea tener una mejor calificación en su examen escrito de
instrumentos, entonces esta escuela es su mejor apuesta.

De hecho, sin embargo, siempre que usamos pruebas, tenemos que considerar el
error estándar.
Específicamente, necesitamos cierta medición de la precisión del instrumento de
prueba, generalmente representada por el error estándar. Esto nos diría qué tan
grande tendría que ser una diferencia en las calificaciones de una escuela para que
fuera estadísticamente significativa. Desafortunadamente, el anuncio no ofrecía
datos; sólo afirmaba que “nuestros egresados lo hacen mejor”.
Distribuciones de muestreo a detalle
Base conceptual para muestrear distribuciones
En cada ejemplo de distribuciones de muestreo de lo que resta de este capítulo,
utilizaremos la distribución de muestreo de la media. Podríamos estudiar las
distribuciones de muestreo de la mediana, del rango o de la proporción, pero nos
quedaremos con la media por la continuidad que añadirá a la explicación. Una vez
que usted desarrolle una comprensión de cómo tratar operacionalmente con la
distribución de muestreo de la media, podrá aplicarla a la distribución de cualquier
otra estadística de muestra.

Muestreo de poblaciones normales.


Supongamos ahora que extraemos muestras de una población normalmente
distribuida con una media de 100 y una desviación estándar de 25, y que
comenzamos por extraer muestras de cinco elementos cada una y calculamos sus
medias.

La primera media podría ser 95, la segunda 106, la tercera 101, etc. Obviamente,
habría igual oportunidad de que la media de muestra estuviera por encima de la
media de población de 100 como de que estuviera por debajo de ella. Debido a
que estamos promediando cinco elementos para obtener cada media de muestra,
se promediarían hacia abajo valores muy grandes de la muestra y hacia arriba
valores muy pequeños.

El razonamiento consistiría en que nos estaríamos extendiendo menos entre las


medias de muestra que entre los elementos individuales de la población original.
Esto es lo mismo que afirmar que el error estándar de la media, o la desviación
estándar de la distribución de muestreo, sería menor que la desviación estándar de
los elementos individuales en la población.

Ahora supongamos que aumenta el tamaño de muestra de 5 a 20. Esto no


cambiaría la desviación estándar de los elementos de la población original, pero
con muestras de 20, se incrementa el efecto de promediar en cada muestra y podría
esperarse, incluso, una dispersión menor entre las medias de la muestra.
La distribución de muestreo de una media de una población normalmente
distribuida demuestra las importantes propiedades resumidas.

Muestreo de poblaciones no normales.


En la sección anterior concluimos que cuando la población está distribuida
normalmente, la distribución de muestreo de la media también es normal. Sin
embargo, los responsables de tomar decisiones deben lidiar con muchas
poblaciones que no están distribuidas normalmente. ¿Cómo reacciona la
distribución de muestreo de la media cuando la población de la que se extraen las
muestras no es normal?

Consideremos: cinco propietarios de motocicletas y la duración de sus llantas.


Dado que están involucradas sólo cinco personas, la población es demasiado
pequeña para ser aproximada por una distribución normal. Tomaremos todas las
muestras posibles de los propietarios en grupos de tres, calcularemos las medias de
muestra (-x), las enumeraremos y calcularemos la media de la distribución de
muestreo (--x). Estos cálculos muestran que incluso en un caso en el que la
población no está normalmente distribuida x, la media de la distribución de
muestreo sigue siendo igual a la media de la población.

El teorema del límite central


I. Primero, la media de la distribución de muestreo de la media será igual a la
media de la población, sin importar el tamaño de la muestra, incluso si la
población no es normal.
II. Segundo, al incrementarse el tamaño de la muestra, la distribución de muestreo
de la media se acercará a la normalidad, sin importar la forma de la distribución
de la población.

Esta relación entre la forma de la distribución de la población y la forma de la


distribución de muestreo se denomina teorema del límite central.
El teorema del límite central es, tal vez, el más importante de toda la inferencia
estadística, pues asegura que la distribución de muestreo de la media se aproxima
a la normal al incrementarse el tamaño de la muestra.
La importancia del teorema del límite central es que nos permite usar estadísticas
de muestra para hacer inferencias con respecto a los parámetros de población, sin
saber sobre la forma de la distribución de frecuencia de esa población más que lo
que podamos obtener de la muestra. Una consideración operacional en el
muestreo: la relación entre el tamaño de muestra y el error estándar.
Antes, en este capítulo, vimos que el error estándar, es una medición de dispersión
de las medias de muestras alrededor de la media de población. Si la dispersión
disminuye, entonces los valores tomados por la media de la muestra tienden a
agruparse más cercanamente.
Podemos concebir esta relación así: al disminuir el error estándar, el valor de
cualquier media de muestra probablemente se acercará al valor de la media de
población. Los especialistas en estadística describen este fenómeno de otra manera:
al disminuir el error estándar, se incrementa la precisión con la que se puede usar
la media de muestra para estimar la media de población.

El multiplicador de población finita


Hasta este punto en nuestros análisis de las distribuciones de muestreo hemos
utilizado la ecuación para calcular el error estándar de la media:

Esta ecuación está diseñada para situaciones en las que la población


es infinita, o en las que tomamos muestras de una población finita
con reemplazo, es decir, después de que se ha muestreado cada
elemento, este se regresa a la población antes de elegir el siguiente elemento, de tal
manera que es posible que el mismo elemento sea elegido una vez más.
EJERCICIOS DE MUESTREO

1. Asuma que se tiene una población de 10,000 y se desea obtener una


muestra aleatoria de 20. Emplee los dígitos aleatorios de la tabla 6-3 para
seleccionar a 20 individuos de los 10,000. Proporcione una lista de los
elementos seleccionados con base a la tabla de dígitos aleatorios.
R/. Eligiendo los datos de la tercera columna y eligiendo los últimos cuatro dígitos
de los números de la misma, (en caso necesario tomando en cuenta para el resto
de las columnas):
0892 1652 2693 2913 3181 9348 4959
7695 7712 8136 9659 2526 6988 1781
7652 8559 2204 4339 6299 3397

2. Un estudio del Senado sobre el asunto de la autonomía del distrito de


Columbia implicó entrevistar a 2,000 personas de la población de la
ciudad con respecto a su opinión sobre varios aspectos relacionados con
esa autonomía. Washington, D.C. es una ciudad en la que muchas
secciones son pobres y muchas ricas, con muy pocas intermedias. Los
investigadores que llevaron a cabo el sondeo tenían razones para creer
que las opiniones expresadas en las diferentes respuestas dependían
fuertemente del ingreso. ¿Qué método era más adecuado, el muestreo
estratificado o el muestreo de racimo? De una explicación breve.
R/. El muestreo estratificado es más adecuado en este caso porque parece que hay
dos grupos muy diferentes, dentro de los cuales tal vez haya una menor variación
que de un grupo a otro. Resulta apropiado cuando la población ya está dividida en
grupos de diferentes tamaños y deseamos tomar en cuenta esta condición.

EJERCICIOS DE DISTRIBUCIÓN DE MUESTREO


3. A partir de una población de 125 artículos con media de 105 y desviación
estándar de 17, se eligieron 64 artículos.
N =125 µ=105 σ=17 n=64
1. ¿Cuál es el error estándar de la muestra?

R/. 1.4904

R/. 0.0428
4. Juanita Martínez, investigadora de la Colombian Cofee Corporation, está
interesada determinar la tasa de uso de café por hogar en Estados
Unidos. Ella cree que el consumo anual por hogar tiene distribución
normal con media µ desconocida y desviación estándar cercana a 1.25
libras.
a) Si Juanita toma una muestra de 36 hogares y registra su consumo de café
durante un año, ¿cuál es la probabilidad de que la media de la muestra se
aleje de la media de la población no más de media libra?

También podría gustarte