Está en la página 1de 5

CAPÍTULO 8

MÉTODOS Y DISTRIBUCIÓN DE MUESTREO


Introducción
En los capítulos del 1 al 4 se ha hecho énfasis en las técnicas empleadas para describir
datos. A fin de ilustrar estas técnicas, se organizaron en una distribución de frecuencias
los precios de los 80 vehículos vendidos el mes pasado en la empresa Whitner Pontiac,
y se calcularon las diferentes medidas de ubicación y de dispersión. Medidas como la
media y la desviación estándar fueron evaluadas para describir el precio de venta
representativo y la diversificación de los precios de venta. En estos capítulos el interés
fue describir la condición de los datos, es decir, describir algo que ya ha ocurrido.
En el Capítulo 5 se establecieron los fundamentos de la parte inferencial de la
Estadística con un repaso de los conceptos básicos de probabilidad. Recuérdese que el
objetivo en la inferencia estadística es determinar algo cerca de una población con base
en una muestra. La población es el grupo completo de individuos u objetos en estudio, y
la muestra es una parte o subgrupo de esa población. En el Capítulo 6 se analizaron en
forma extensa los conceptos de probabilidad describiendo tres distribuciones
probabilísticas discretas: la binomial, la hipergeométrica y la de Poisson. En el Capítulo
7 se presentó la del tipo normal, que es una distribución probabilística continuamente
ampliamente utilizada. Las distribuciones de probabilidades engloban todos los
resultados posibles de un experimento y la probabilidad asociada a cada resultado. Tales
distribuciones se usan para evaluar algo que podría ocurrir.
Este capítulo comenzará con el estudio del muestreo. Una muestra es un medio utilizado
para inferir algo acerca de una población mediante la selección de una parte de la
misma. Se analizarán métodos para escoger una muestra de una población. Después se
elaborará una distribución de las medias muestrales para comprender la forma en que
tales valores medios tienden a agruparse alrededor de la media poblacional y por qué
esta distribución se aproxima a la del tipo normal. Se establecerán los intervalos de
confianza, que definen una gama de valores dentro de la cual ocurrirá, probablemente,
el valor de la población. Finalmente, se definen fórmulas que determinan el número de
observaciones necesarias para diferentes situaciones de muestreo.
Muestreo de la población
En muchos casos, el muestreo es la única forma de determinar algo acerca de la
población. Algunas de las principales razones por las que ése es necesario son:
1. La naturaleza destructiva de ciertas pruebas. Si los catavinos de Sutter Home
Winery, en California, tuvieran que beber todo el vino para evaluar la vendimia,
consumirían toda la producción y no quedaría producto disponible para la venta.
En el área de la producción industrial, las placas de acero, el alambre y los
productos similares, frecuentemente deben tener determinada resistencia mínima
a la tensión. Para asegurar que el producto cumpla con el estándar mínimo, se
selecciona una muestra relativamente pequeña. Cada pieza es estirada hasta que
se rompe y se registra el esfuerzo de ruptura. Obviamente si todo el alambre o
todas las placas se sometieran a pruebas de resistencia a la tensión no quedaría
ningún producto para su venta o uso. Por esta misma razón, la empresa Kodak
sólo selecciona una muestra de película fotográfica para determinar la calidad de
la producción total, y la compañía Burpee sólo prueba la germinación de unas
cuantas semillas antes de la temporada de siembra.
2. La imposibilidad física de revisar todos los integrantes de la población. Las
poblaciones de peces, aves, serpientes, mosquitos y similares son grandes y
están en movimiento constante, los seres nacen y mueren. En vez de intentar
siquiera contar todos los patos de Canadá o la totalidad de peces en el lago Erie,
se hacen cálculos utilizando diversas técnicas: como contar todos los ánades de
un estanque seleccionado al azar, haciendo verificaciones con nasas, o
colocando rede en lugares predeterminados en el lago.
3. El costo de estudiar a todos los integrantes de una población
frecuentemente es prohibitivo. Las organizaciones para el escrutinio de la
opinión pública y pruebas a consumidores, como la Galluo Polls y la Marketing
Facts (en EUA), comúnmente entrevistas a menos de 2000 familias de las
aproximadamente 50 millones que hay en Estados Unidos. Una organización de
tipo panel para estudios de consumo cobra aproximadamente 40000 dólares por
enviar por correo muestras y tabular las respuestas, con la finalidad de probar un
producto (como cereal, perfume o alimento para gatos). La misma prueba de un
artículo utilizando a 50 millones de familias costaría aproximadamente 1000
millones de dólares.
4. Lo adecuado de los resultados de la muestra. Incluso si se contara con fondos,
es dudoso de la precisión adicional de una muestra de 100% - es decir, el estudio
de la población completa – resulte fundamental en la mayoría de los problemas.
Por ejemplo, el gobierno estadounidense emplea una muestra de tiendas de
comestibles dispersas en todo el territorio de ese país, para determinar el índice
mensual de precios de artículos alimenticios. Los costos de pan, frijol, leche y
otros productos importantes, se incluyen en el índice. Es poco probable que la
inclusión de todas las tiendas en cuestión en Estados Unidos afectará
significativamente en índice ya que los precios de la leche, pan y otros productos
básicos por lo general no varían en más de algunos centavos de una cadena de
tiendas a otra.
5. En ocasiones se necesitaría mucho tiempo para entrevistar a toda la
población. Una candidata a un puesto público puede desear evaluar las
probabilidades que la elijan. Sólo serían necesarios uno o dos días para
determinar una muestra de escrutinio utilizando al personal existente, y las
entrevistas de campo por parte de una organización especializada en escrutinios.
¡Si se empleara el mismo personal y entrevistadores, con trabajo los siete días a
la semana, se precisarían casi 200 años para entrar en contacto con toda la
población votante!
Incluso si pudiera contrastarse a un gran número de investigadores el costo de
comunicarse con todos los votantes probablemente no ameritaría tal gasto. Si la
candidata fuera muy popular, el escrutinio muestral podría indicar que tal vez recibiría
entre 79% y 81% del voto popular. No se justificaría el gasto adicional ni el tiempo para
averiguar que tal persona podrá recibir exactamente 80% de la votación.
Métodos de muestreo probabilístico

En general, hay dos tipos de muestras: las muestra: la muestra probabilística y la


muestra no probabilística. ¿Qué es una muestra de esa clase?

Muestra probabilística Muestra que se selecciona de modo que cada integrante de la


población en estudio tenga una probabilidad conocida (no igual a cero) de ser incluido
en la muestra.

Si se realiza un muestreo de probabilidad, cada integrante de la población tiene la


posibilidad de ser seleccionado. Al utilizar métodos no probabilísticos, no todos los
integrantes tienen probabilidad de ser incluidos en la muestra. En estos casos, los
resultados pueden estar sesgados, lo que significa que tales resultados de la muestra
pueden no ser representativos de la población. El muestreo por panel o por acción
directa son dos métodos no probabilísticos. Por ejemplo, un panel puede constar de
2000 madres de niños recién nacidos, o bien, de 2000 propietarios de gatos. Dicho
grupo se forma para solicitar las opiniones acerca de un nuevo alimento para gatos, o
respecto de un pañal desechable para bebé. La selección de los miembros del panel se
basa en el juicio de la persona que realiza la investigación y, por lo tanto, los resultados
de la muestra pueden no ser representativos de toda la población de propietarios de
gatos o de madres de recién nacidos (ya que no todos los primeros o todas las segundas
tienen la oportunidad de ser seleccionados). Los procedimientos estadísticos que se
emplean en este texto para evaluar los resultados muestrales se basan en el muestreo
probabilístico. En consecuencia, solo se analizarán los métodos del citado muestreo en
la siguiente sección.

No hay un método que sea el “mejor” para seleccionar una muestra probabilística de
una población de interés. El que se empleó para seleccionar una muestra de facturas de
un archivador, podría no ser el más apropiado para elegir una muestra nacional de
electores. Sin embargo, los métodos de muestreo probabilístico tienen un objetivo
similar: permitir que el azar determine los integrantes que se incluirán en la muestra.

Muestreo aleatorio simple


El tipo de muestreo utilizado es el que se denomina muestreo aleatorio simple.
Muestreo aleatorio simple Muestra seleccionada de manera que cada integrante de la
población tenga la misma probabilidad de quedar incluido.
Para ilustrar el muestreo aleatorio simple y la selección, supóngase que una población
consta de 845 empleados de una empresa industrial. Se seleccionará una muestra de 52
a partir de esta población. Una forma de asegurar que todos los trabajadores en la
población tengan la misma oportunidad de ser elegidos, es escribir primero el nombre
de cada uno en una papeleta y depositar en una caja todos los papeles. Después que se
han mezclado bien, se realiza la primera selección sacando una papeleta de la caja sin
mirarla. Este proceso se repite hasta que eligen 52, el tamaño de la muestra.
Un método más adecuado de seleccionar una muestra aleatoria es emplear el número de
identificación de cada empleado y una tabla de números aleatorios como la que se
presenta en el Apéndice E. Como su nombre lo indica, estos números han sido
generados por un proceso aleatorio (en este caso, por una computadora). Para cada
dígito de un número, la probabilidad de 0,1,2,…,9 es la misma. Así, la probabilidad de
que el empleado con número 011 sea elegido, es la misma que la del laborante 722, o el
383. Por lo tanto, quedan eliminados así los sesgos en el proceso de selección.

En la siguiente ilustración se muestra una parte de un cuadro de números aleatorios.


Para utilizar esta table a fin de seleccionar una muestra de los empleados, primero debe
elegirse un punto de inicio en la tabla. Cualquier punto de comienzo servirá. Supóngase
que la hora es 3:04. Podría uno ver la tercera columna, y después bajar al cuarto
conjunto de números. El resultado es 03759. Como sólo hay 845 empleados, se utilizará
los primeros tres dígitos de un número aleatorio de cinco cifras. De modo que 037 es el
número del primer empleado que será elemento de la muestra. A fin de continuar
seleccionando, se puede ir en cualquier dirección. Supóngase que se decide ir hacia la
derecha. Los primeros tres dígitos del número a la derecha de 13759 son 447, que es el
número de empleado que se escogerá como segundo elemento de la muestra. El tercer
número de tres dígitos también a la derecha es 961. No se puede usar el 961 porque
solamente hay 845 empleados. Se continúa en la misma dirección u se selecciona al
empleado 784 después al 189 y así sucesivamente. Otra forma de seleccionar el punto
de inicio es cerrando los ojos y fijando con el dedo un número de tabla.

En 18 depósitos de pertrechos y repuestos del ejércitos de Estados Unidos, hay 186 810
artículos diferentes de abastecimiento militar, como neumáticos, tuercas, pernos, bandas
para tanques y cadenas para llantas. En cada almacén hay naves, y en cada nave existen
compartimientos. Por ejemplo, en la bodega número 17 se guardan partes de vehículos.
En la nave 260, compartimiento 2, se encuentran los cigüeñales de Jeep. Y en la misma
nave 260, compartimiento 3, están los tapones de radiador para tales vehículos.
El problema fue seleccionar al azar un compartimiento de un depósito y contar todos los
artículos que había en él. Este conteo físico se comparó con el conteo que indicaban los
registros realizados por computadora respecto de las existencias disponibles. Así, en
esencia el problema era el de un inventario físico que implicaba métodos de muestreo.
El objetivo del proyecto de investigación fue determinar que tan precisos eran los
registros de computadora.
Para asegurarse de que cada compartimiento tuviera la misma probabilidad de ser
seleccionado se utilizó una tabla de números aleatorios para elegir el almacén, la nave y
el compartimiento.
Si se hubieran seleccionado la bodega 5, la nave 455 y el compartimiento 6, un revisor
se dirigiría a ese lugar y contaría el número de artículos en tal sitio.
¿Por qué se utilizó un método tan tardado para seleccionar los compartimientos que
fueron muestreados? La alternativa hubiera sido dejar que los revisores contarán los
artículos en los sitios que desearán. Sin duda habrían eludido contar los artículos en los
compartimientos que contenían partes pesadas o grasosas. Y, probablemente, hubieran
evitado también los ubicados a más de 6 metros de altura sobre el piso del depósito. La
omisión de los objetos en tales compartimientos para este proyecto de investigación
acerca de un inventario físico habría producido sesgamiento en los resultados. Es decir,
su omisión daría una imagen falsa acerca de la exactitud de los registros de
computadora.

Muestreo Aleatorio Sistemático


El procedimiento de muestreo aleatorio simple puede ser difícil de utilizar en algunos
casos de investigación. Por ejemplo, supóngase que la población de interés consta de
2000 facturas colocadas en gavetas de archivo. Para obtener una muestra aleatoria,
simple, primero se necesitaría numerar dichos elementos del 0000 al 1999. Usando una
tabla de números aleatorios, una muestra de -por ejemplo- 100 números, se tendría que
seleccionar. Habría que localizar en las gavetas una factura que correspondiera a cada
uno de estos 100 números. Esto sería una prolongada tarea. En su lugar puede
seleccionarse una muestra aleatoria sistemática, seleccionando simplemente un
elemento de cada 20 de los que se encuentran en el archivo. La primera factura se
elegiría utilizando un proceso al azar o fortuito, por ejemplo, una tabla de números
aleatorios. Si se selecciona el elemento número 10 como el punto de inicio, la muestra
constaría de las facturas números 10, 30, 50, 70, etc. Ya que en el primer elemento se
eligen al azar todas las facturas tienen la misma probabilidad de ser seleccionadas para
la muestra. Así que se tiene una muestra probabilística.
Muestra aleatoria sistemática Los integrantes o elementos de la población se ordenan
en alguna forma -por ejemplo, alfabéticamente- en un archivo según la fecha en que se
reciben, o por algún otro método. Se seleccionan al azar un punto de partida, y después
se elige para la muestra cada k-ésimo elemento de la población.

También podría gustarte