Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística en acción
Los métodos de muestreo aleatorio y sin sesgos son muy importantes para realizar
inferencias estadísticas válidas. En 1936 se efectuó un sondeo de opinión para predecir
el resultado de la carrera presidencial entre Franklin Roosevelt y Alfred Landon. Se
enviaron diez millones de papeletas en forma de postales retornables gratuitas a
domicilios tomados de directorios telefónicos y registros de automóviles. Se contestó
una alta proporción de papeletas, con 59% en favor de Landon y 41% de Roosevelt. El
día de la elección, Roosevelt ganó con 61% de los votos. Landon obtuvo 39%. Sin duda,
a mediados de la década de 1930, la gente que tenía teléfono y automóvil no era
representativa de los votantes estadounidenses.
Para seleccionar el primer recibo emplee el muestreo aleatorio simple. Por ejemplo,
seleccione un número de la tabla de números aleatorios entre 1 y k, en este caso, 20. Suponga
que el número aleatorio resultó ser 18. Entonces, a partir del recibo 18, se seleccionará cada
vigésimo recibo (18, 38, 58, etc.) como muestra.
Antes de aplicar el muestreo aleatorio sistemático, debe observar con cuidado el orden físico
de la población. Cuando el orden físico se relaciona con la característica de la población, no
debe aplicar el muestreo aleatorio sistemático. Por ejemplo, si los recibos se archivan en
orden creciente de ventas, el muestreo aleatorio sistemático no garantiza una muestra
aleatoria. Debe aplicar otros métodos de muestreo.
Por ejemplo, puede estudiar los gastos en publicidad de las 352 empresas más grandes de
Estados Unidos. Suponga que el objetivo del estudio consiste en determinar si las empresas
con altos rendimientos sobre el capital (una medida de rentabilidad) gastan en publicidad la
mayor parte del dinero ganado que las empresas con un registro de bajo rendimiento o déficit.
Para asegurar que la muestra sea una representación imparcial de las 352 empresas, éstas se
deben agrupar de acuerdo con su rendimiento porcentual sobre el capital. La tabla 8-1 incluye
los estratos y las frecuencias relativas. Si aplicara el muestreo aleatorio simple, observe que
las empresas del tercero y cuarto estratos tienen una probabilidad alta de que se les seleccione
(0.87), mientras que las empresas de los demás estratos tienen menos (0.13). Podría no
seleccionar ninguna de las empresas que aparecen en los estratos 1 o 5 sencilla mente por
azar. No obstante, el muestreo aleatorio estratificado garantizará que por lo menos una
empresa de los estratos 1 o 5 aparezca en la muestra. Considere una selección de 50
compañías para llevar a cabo un estudio minucioso. Entonces se seleccionará de forma
aleatoria 1 (0.02 × 50) empresas del estrato 1; 5 (0.10 × 50), del estrato 2, etc. En este caso,
el número de empresas en cada estrato es proporcional a la frecuencia relativa del estrato en
la población. El muestreo estratificado ofrece la ventaja de que, en algunos casos, refleja con
mayor fidelidad las características de la población que el muestreo aleatorio simple o el
muestreo aleatorio sistemático.
Suponga que desea determinar la opinión de los residentes de algún estado con referencia a
las políticas federales y estatales de protección ambiental. Seleccionar una muestra aleatoria
de residentes y ponerse en contacto con cada persona requeriría mucho tiempo y resultaría
muy costoso. Sería mejor aplicar el muestreo por conglomerados y subdividir el estado en
pequeñas unidades: condados o regiones. Con frecuencia se les conoce como unidades
primarias.
Suponga que dividió el estado en 12 unidades primarias, seleccionó al azar cuatro regiones,
2, 7, 4 y 12, y concentró su atención en estas unidades primarias. Usted puede tomar una
muestra aleatoria de los residentes de cada una de estas regiones y entrevistarse con ellos
(observe que se trata de una combinación de un muestreo por conglomerados y un muestreo
aleatorio simple).
Las muestras se emplean para determinar características de la población. Por ejemplo, con la
media de una muestra se calcula la media de la población. No obstante, como la muestra
forma parte o es una porción representativa de la población, es poco probable que su media
sea exactamente igual a la media poblacional. Asimismo, es poco probable que la desviación
estándar de la muestra sea exactamente igual a la desviación estándar de la población. Por lo
tanto, puede esperar una diferencia entre un estadístico de la muestra y el parámetro de la
población correspondiente. Esta diferencia recibe el nombre de error de muestreo.
ERROR DE MUESTREO
Diferencia entre el estadístico de una muestra y el parámetro de la población correspondiente.
Ejemplo
Revise el ejemplo anterior de la página 268, en el que estudió el número de habitaciones
rentadas en Foxtrot Inn, en Tryon, Carolina del Norte. La población se refiere al número de
habitaciones rentadas cada uno de los 30 días de junio de 2011. Determine la media de la
población. Utilice Excel u otro software de estadística para seleccionar tres muestras
aleatorias de cinco días. Calcule la media de cada muestra y compárela con la media
poblacional. ¿Cuál es el error de muestreo en cada caso?
Solución
Durante el mes se rentaron un total de 94 habitaciones. Por lo tanto, la media de las unidades
que se rentaron por noche es de 3.13. Ésta es la media de la población. Este valor se designa
con la letra griega μ.
La primera muestra aleatoria de cinco noches dio como resultado el siguiente número de
habitaciones rentadas: 4, 7, 4, 3 y 1. La media de esta muestra de cinco noches es de 3.8
habitaciones, que se representa como . La barra sobre la X recuerda que se trata de una
media muestral, y el subíndice 1 indica que se trata de la media de la primera muestra.
El error de muestreo es ( ).
En la tercera muestra aleatoria, la media fue de 1.8, y el error de muestro fue de −1.33.
Cada una de estas diferencias, 0.67, 0.27 y −1.33, representa el error de muestreo cometido
al calcular la media de la población. A veces estos errores son valores positivos, lo cual indica
que la media muestral sobreexcedió la media poblacional; otras veces son valores negativos,
lo cual indica que la media muestral resultó inferior a la media poblacional.
En este caso, con una población de 30 valores y muestras de 5 valores, existe una gran
cantidad de muestras posibles, 142 506, para ser exactos. Para calcular este valor se aplica la
fórmula de las combinaciones (5-10), de la página 174. Cada una de las 142 506 diferentes
muestras cuenta con las mismas posibilidades de que se le seleccione. Cada muestra puede
tener una media muestral diferente y, por consiguiente, un error de muestreo distinto. El valor
del error de muestreo se basa en el valor particular de las 142 506 muestras posibles
seleccionadas. Por consiguiente, los errores de muestreo son aleatorios y se presentan al azar.
Si determinara la suma de estos errores de muestreo en una gran cantidad de muestras, el
resultado se aproximaría mucho a cero. Sucede así porque la media de la muestra constituye
un estimador sin sesgo de la media de la población.
Las medias muestrales del ejemplo anterior varían de una muestra a la siguiente. La media
de la primera muestra de 5 días fue de 3.80 habitaciones, y la media de la segunda muestra
fue de 3.40 habitaciones. La media poblacional fue de 3.13 habitaciones. Si se organizan las
medias de todas las muestras posibles de 5 días en una distribución de probabilidad, el
resultado recibe el nombre de distribución muestral de la media.
Ejemplo
Tartus Industries cuenta con siete empleados de producción (a quienes se les considera la
población). En la tabla 8-2 se incluyen los ingresos por hora de cada uno de ellos.
TABLA 8-2: Ingresos por hora de empleados de producción en
Tartus Industries
Solución
He aquí las respuestas.
En la tabla 8-3 se ilustran las 21 medias muestrales de todas las muestras posibles de tamaño
2 que pueden tomarse de la población. Estas 21 muestras se utilizan para construir una
distribución de probabilidad, que es la distribución muestral de la media, la cual se resume
en la tabla 8-4.
En resumen, tome todas las posibles muestras aleatorias de una población y calcule un
estadístico muestral (la media de los ingresos percibidos) de cada una. Este ejemplo ilustra
las importantes relaciones entre la distribución poblacional y la distribución muestral de la
media:
Autoevaluación 8-3
Los tiempos de servicio de los ejecutivos que laboran en Standard Chemicals son los
siguientes:
b) Elabore una lista de todas las muestras posibles de 2 ejecutivos de la población y calcule
las medias.
f) A continuación se muestra una gráfica con los valores de la población. ¿Tienen los valores
de población una distribución normal (en forma de campana)?
g) ¿Comienza la distribución muestral de la media que se calculó en el inciso c) a indicar una
tendencia a adoptar forma de campana?
Ejercicios
5. Una población consta de los siguientes cuatro valores: 12, 12, 14 y 16.
7. Una población consta de los siguientes cinco valores: 12, 12, 14, 15 y 20.
9. El despacho de abogados Tybo and Associates consta de seis socios. En la siguiente tabla
se incluye el número de casos que en realidad atendió cada socio en los tribunales durante el
mes pasado.
a) ¿Cuántas muestras de 3 son posibles?
b) Enumere todas las muestras posibles de 3 y calcule el número medio de casos en cada
muestra.
d) En una gráfica similar a la 8-1, compare la dispersión en la población con la de las medias
muestrales.
10. Mid-Motors Ford tiene cinco vendedores. Los cinco representantes de ventas y el
número de automóviles que vendieron la semana pasada son los siguientes:
b) Enumere todas las muestras posibles de tamaño 2 y calcule la media en cada muestra.
Lind, Douglas A. Estadística aplicada a los negocios y la economía, 15th Edition. McGraw-
Hill Interamericana, 2012. VitalBook file.