Está en la página 1de 45

UNIVERSIDAD JOSE CARLOS MARIATEGUI

Pg. 101





MUESTREO

INTRODUCCION
El muestreo es parte integral de nuestra vida diaria. Lo realizamos cada vez que compramos un auto
nuevo, escuchamos un comercial en la televisin, vamos de vacaciones en verano, buscamos la atencin social
de un miembro del sexo opuesto o visitamos un nuevo restaurante. Por ejemplo, en las primeras semanas de la
estancia en el colegio o universidad donde leemos este texto, quizs hayamos ordenado una pizza de uno de
los establecimientos que las venden antes de encontrar la que corresponde a nuestros gustos y a nuestro
presupuesto. Con todo, puede haber una poblacin de expendios de pizza que no haya tenido la suerte de
figurar en la "muestra". 'De manera anloga, es posible que el da anterior en que comimos pizza en nuestro
restaurante favorito no nos haya parecido tan buena como siempre pues el cocinero estaba enfermo, con lo cual
qued invalidada la muestra del producto de ese establecimiento.

Dada la ndole de las muestras, no siempre son representativas. Es probable que en alguna ocasin el
lector haya improperios contra una marca de automvil o haya odo a alguien quejarse de ella. (El autor de este
libro conoce a un gerente de un taller de reparaciones que se niega terminantemente a recibir cheques de clien-
tes que poseen cierta marca de auto extranjero.) Lo mismo que los artculos producidos en forma masiva, las
muestras tampoco son perfectas pero forman parte indispensable de la funcin de la investigacin de mercados.
Este captulo se propone ayudar al lector a entender mejor los objetivos y procedimientos del muestreo en esa
funcin.
En nuestra exposicin sobre el muestreo aparecern una y otra vez los conceptos siguientes:

Poblacin: algunas veces llamada "universo", pero nosotros seremos un poco ms humildes en nuestra
descripcin. La poblacin es el total de elementos (por ejemplo, consumidores, jugadores de una liga,
fabricantes de cojinetes, contadores, universidades, miembros de asociaciones, propietarios de motocicletas,
etc.) sobre la cual queremos hacer una inferencia basndonos en la informacin relativa a la muestra.

Muestra: parte de la poblacin que seleccionamos, medimos y observamos.

Parmetro: caracterstica de la poblacin que nos interesa. El valor verdadero del parmetro no se conoce,
puesto que es lo que tratamos de descubrir mediante el procedimiento muestral.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 102

Estimacin: medicin, llamada tambin "estadstico", que resulta de la muestra escogida; es nuestra mejor
estimacin del verdadero valor de la caracterstica de la poblacin. Hay muchas probabilidades de que la
estimacin difiera del verdadero valor, segn el grado de presencia del error muestral y no muestral.

Error muestral: se debe a que hemos extrado una muestra en vez de un censo. Este error es inevitable en el
proceso de muestreo.

Error no muestral: a veces denominado "sesgo" o tendencia a un error direccional (estimacin hacia arriba o
hacia abajo del parmetro de la poblacin). Puede presentarse aun cuando no hayamos tomado una muestra
sino hayamos hecho un censo completo.

Exactitud: a veces denominada "precisin", representa la aproximacin ms cercana de nuestra muestra al
valor verdadero del parmetro de lq poblacin, expresndose a menudo como un intervalo; por ejemplo, $200
$15.

Confianza: es el grado de certidumbre que tenemos sobre la exactitud de la estimacin de la muestra. Existe un
nexo estrecho entre nuestro nivel de confianza y el grado de exactitud a que se refiere.

A lo largo del captulo nos concentraremos en un enfoque descriptivo y aplicado del muestreo; en los
apndices 4A y B trataremos de los conceptos estadsticos fundamentales y de hechos estadsticos y
derivaciones detalladas. Ello no significa que esos temas sean innecesarios o secundarios para nosotros. Segn
los conocimientos estadsticos de cada lector, es posible que uno desee leer o repasar los dos apndices antes
de iniciar el estudio de este captulo. El conocimiento de los contenidos del Apndice 4A (Conceptos estadsticos
bsicos) es indispensable; en cambio, se recomienda estar familiarizado con el Apndice 4B (Distribuciones
muestrales) a fin de que se aproveche al mximo este captulo. Esos temas estn en los apndices dados la
variabilidad propia de la formacin acadmica de los lectores en el campo de la estadstica, adems de que
ponerlos all facilita un flujo ms suave de la comunicacin a lo largo del captulo. He aqu los temas principales
que examinaremos al hablar del muestreo:

I. Muestra frente a censo
II. Procedimiento muestral.
III. Tipos de muestras.
IV. Muestras no probabilsticas.
V. Muestras probabilsticas
VI. Determinacin del tamao de la muestra
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 103

MUESTREO FRENTE A CENSO
El presidente de una gran distribuidora automotriz expres una vez su preocupacin al autor de este
libro respecto a la actuacin de la empresa ante los ojos de los clientes que utilizaban sus servicios. Por aquella
poca la retroalimentacin del servicio se compona principalmente de visitas de los clientes, de cartas de
agradecimiento y de quejas que le enviaban al presidente y espordicas respuestas a las tarjetas con la
inscripcin" Qu piensa usted del servicio?", que se encontraban en algn oscuro rincn de la instalacin.
Cuando se le aconsej que se pusiera en contacto con los clientes por telfono o correo y les formulara algunas
preguntas pertinentes, su reaccin fue que 1) dado el enorme nmero de clientes el costo sera exorbitante y que
2) quiz reaccionaran negativamente al ser llamados a su domicilio por el distribuidor, corriendo as el riesgo de
perder clientela. Aunque esta persona era un hombre de negocios muy prspero, desconoca los beneficios
potenciales que el muestreo ofrece en cuanto al mejoramiento del servicio.

En el caso anterior, el ejecutivo pensaba en el "censo" con la exclusin del muestreo. Si bien un censo
completo de la poblacin es lo ms aconsejable en algunas situaciones (por ejemplo, cuando la poblacin es
muy pequea o el costo del error resulta excesivo), esto no era evidentemente aplicable en esos casos. Por
ejemplo, si una poblacin est integrada por slo cinco fabricantes de un producto industrial, se requerir un
censo completo cada vez que esa poblacin sea sometida a un estudio de investigacin. No obstante, en el caso
del distribuidor, l pudo haber obtenido un conocimiento muy amplio sobre la clientela con la pequea inversin
que suponen los materiales necesarios para enviar y recibir de 200 a 300 cuestionarios.

Ventajas del muestreo
En comparacin con un censo completo de la poblacin, el muestreo tiene varias ventajas: primero, y
quiz la ms importante, es mucho menos caro. Pero si se realiza bien, aporta resultados que tienen la misma
precisin que el censo. Cuando reflexionamos sobre el hecho de que, en muchos casos, el tiempo requerido
para efectuar un censo completo ser tan largo que invalidar cualquier conclusin, la rapidez de la muestra
constituye otra ventaja importante. Imaginemos, por ejemplo, el tiempo que se tardara un fabricante en llevar a
cabo entrevistas personales con 50,000 clientes. Para cuando hubiera entrevistado al ltimo, lo ms seguro es
que el primero ya se encontrase en un asilo de ancianos.

Adems, como el ejecutivo de la distribuidora manifest, la medicin puede ser un proceso destructivo.
Tal "destruccin" se vuelve evidente cuando los inspectores de control de calidad prueban la duracin de focos
elctricos o la fuerza tensil de tubos de acero: el producto as probado queda inutilizado en el proceso. Sin
embargo, aunque ni los cuestionarios ni las entrevistas causan dao fsico, ocasionan un ligero efecto en las
actitudes del respondiente, en su conocimiento o comportamiento. Y por eso, si la misma persona es
muestreada otra vez, las circunstancias no sern iguales. En la mayor parte de los trabajos de investigacin,
conviene medir los cambios en la poblacin ms que inducirlos por medio del proceso de medicin. As, no
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 104

resultara informativo llamar por telfono a las mismas 100 personas cada semana y preguntarles si conocen
quin gan el Supertazn el ao anterior. Si quisiramos conocer el xito de una campaa en favor del consumo
de cierto producto, sin duda desearemos incluir diferentes (aunque semejantes) miembros de la poblacin en las
muestras peridicas.

Al examinar las ventajas del muestreo frente al censo, una consideracin sumamente importante es la
exactitud que se lograr con el dinero que va a gastarse. En vez de tratar intilmente de aprovechar al mximo el
presupuesto para realizar un censo o extraer una muestra del mayor tamao posible, es mucho ms
recomendable invertir los fondos en la obtencin de una muestra ms pequea y representativa que se mida con
ayuda de ms pocos entrevistadores o trabajadores de campo que estn mejor preparados. Recurdese que los
errores muestrales causados por preguntas mal redactadas o por entrevistadores inexpertos ocurrirn aun
cuando uno "muestree" la poblacin entera. La figura 4-1 ejemplifica cmo los errores no muestrales persisten a
medida que la muestra crece hasta convertirse en un censo.

Revisin del error muestral

Como se advierte en la figura 4-1, un censo no exhibir error muestral alguno. Pero en realidad no es
recomendable puesto que un estudio as casi siempre favorecer un mayor error total del que podra obtenerse
con una planeacin ms cuidadosa y contando con los mismos recursos. El siguiente enunciado puede ser
sorprendente pero no por ello deja de ser verdadero: Es posible obtener una muestra que resulte ms exacta
que un censo. Yeso puede conseguirse con slo abordar la investigacin tratando de evitar el error total y de
reducir cada uno de sus componentes en vez de solamente uno. Al mejorar la seleccin y capacitacin del
personal de campo, se logra a veces disminuir la cantidad de tendenciosidad (direccionalidad) debida a que los
respondientes distorsionan la verdad. El error por falta de respuestas puede atenuarse mediante incentivos
monetarios, seguimiento, obtencin de pruebas preliminares y otras estrategias (recurdese que no siempre los
que se abstienen de contestar se parecen a los que lo hacen).












UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 105

Asimismo, una seleccin cuidadosa de una muestra representativa ayudar a evitar el error por marco
de referencia, el cual proviene de una desigualdad entre la poblacin deseada y la muestra que se extrae. Todos
los errores no muestrales explicados hasta aqu son muy importantes para la exactitud de un estudio; los
expondremos por separado en los captulos posteriores. Pero por ahora no se olvide que el error muestral (en
comparacin con el no muestral) tiene la ventaja de estar sometido a estimacin estadstica mediante anlisis y
la reduccin por el sencillo mecanismo de un mayor tamao de la muestra. Como veremos luego, tales
caractersticas del error muestral se prestan a ciertos tipos de diseos muestrales, denominados muestras
probabilsticas.

EL PROCEDIMIENTO MUESTRAL
Suponiendo que se haya optado por tomar una muestra en lugar de hacer un censo completo de la
poblacin, podremos proceder en seguida a examinar los pasos que intervienen en el proceso de muestreo. Una
sntesis de ellos se da en la figura 4-2. En este apartado ofreceremos una breve descripcin de los pasos; en
otras secciones del presente captulo proporcionaremos una exposicin ms completa al respecto.

1. Determinar la poblacin y parmetros pertinentes. EI paso inicial en cualquier proceso de muestreo
consiste en seleccionar una poblacin ms adecuada y en identificar los parmetros de la poblacin que nos
interesan. As, quiz se quiera examinar una poblacin que consta de estudiantes del ltimo ao de universidad,
los propietarios de un automvil Chvrolet, los que tienen boletos para el mundial de ftbol de 1986, los votantes
registrados en un pas u otros grupos de personas o unidades acerca de los cuales queremos hacer
generalizaciones a partir de nuestros resultados muestrales. La delimitacin de la poblacin meta se basar
siempre en los objetivos del estudio que vaya a realizarse; Adems, la poblacin ha de estar bien definida si
queremos aplicar debidamente. el proceso de medicin en el campo. Por ejemplo, si nos interesa la poblacin de
conductores de vehculos en el estado de California, hay varias preguntas conexas que hemos de tener
presentes: nos interesan los que poseen una licencia de manejo de California o queremos incluir a turistas,
paseantes y otras personas que estn de paso en el estado? Debe entenderse por conductor todo aquel que
maneje cualquier vehculo a travs del estado sin importar la distancia que recorra, o bien nos interesan
nicamente los automviles manejados por personas que conducen ms de 3 000 millas al ao? De ser as,
ese recorrido se refiere al kilometraje hecho el ltimo ao o al que se espera hacer en el siguiente ao? Se
efecte un censo o se extraiga una muestra la poblacin debe definirse siempre atendiendo a lo que pueden
distinguir fcilmente los investigadores de campo encargados de la obtencin de las unidades muestrales.

Adems de identificar la poblacin, es preciso definir tambin los parmetros de la poblacin que
tratamos de medir. Tambin en este caso, la definicin de dichos parmetros ha de ser lo ms detallada posible.
Si bien las variables como "propiedad de una televisin de color" o "vacaciones en Florida el ao anterior" son
relativamente sencillas, hay otras (como "actitud ante la violencia de los deportes", "marca preferida de cerveza")
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 106

que requiere a veces una definicin ms precisa. Por ejemplo, "marca preferida de cerveza" puede significar la
marca que el respondiente prefiere tomar o bien la que consume con mayor frecuencia. Adems la marca
"favorita" puede depender de que el respondiente est departiendo en una taberna o asista a una fiesta. Dadas
las posibles interpretaciones errneas de la definicin de parmetros en varas etapas del proceso muestral, se
requieren planeacin cuidadosa y previsin, para evitar en lo posible una ruptura de la comunicacin. Muchas
definiciones de parmetros no son tan sencillas como parecen a primera vista.















2. Seleccionar el marco apropiado del muestreo. El marco de referencia debe representar a los miembros de
la poblacin, y el marco ideal es una lista completa de todos ellos. Por desgracia, rara vez se cuenta con ella y el
marco de referencia que se utiliza tiende a diferir un poco de la poblacin meta terica. Por ejemplo, un marco de
referencia de uso comn es el directorio telefnico, que muchos juzgan representativo de la poblacin general.
Es verdad que la mayora de las familias figuran en el directorio, pero hay varios problemas que hacen que este
marco muestral no sea perfecto. En primer lugar, algunas familias prefieren un nmero que no figure en el di-
rectorio telefnico., Y ello no plantear un problema, salvo que tienden a tener caractersticas distintas a las de
las familias cuyos nombres s estn incluidos en el directorio. Por ejemplo, las familias de ingresos mayores son
aquellas que no estn en el directorio, como las mujeres que viven solas. Un segundo problema, afn al anterior,
es que las familias sin residencia estable no estn bien representadas, pues algunas figuran en la lista sin que
tengan domicilio en la localidad, mientras que otras no sern incluidas en el directorio hasta la siguiente edicin.
Un tercer problema es que algunas familias tendrn varias entradas en el directorio y otras ni siquiera poseern
un telfono. Estas ltimas suelen percibir bajos ingresos o vivir en zonas rurales.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 107

Una trasgresin muy comn del concepto de marco muestral es la presentacin de programas
nocturnos de noticieros televisivos referentes a la opinin e ideas del "hombre de la calle". Con mucha frecuencia
esas entrevistas a peatones no son aleatorias absolutas, se realizan a medioda en una zona del centro. Pese a
ello se presentan como la voz del pueblo y el pblico las considera como tales. En situaciones as casi siempre
se escoge a oficinistas, personas que andan de compras y desempleados, ya que a esas horas no hay muchos
obreros, conductores de camiones ni amas de casa en las grandes ciudades. .Los errores de marco de
referencia son prcticamente ineludibles cada vez que tratamos de obtener una muestra en el mundo real de la
mercadotecnia y de los consumidores. Con todo, intentaremos reconocer las fuentes de esos errores y de
minimizarlos en lo posible.
3. Escoger entre el muestreo probabilstico y el no probabilstico. La diferencia entre ambas modalidades se
explicar con amplitud en la seccin siguiente. Pero por ahora conviene mencionar que el muestreo
probabilstico ofrece la ventaja de permitimos calcular el error muestral de la medicin, en tanto que el muestreo
no probabilstico, no la ofrece. En otras palabras, luego de hacer el muestreo probabilstico, estaremos en
condiciones de afirmar que "tenemos una seguridad del 95% de que entre dos tercios y dos cuartos de la
poblacin consideran que son sinnimos cierto producto y la buena calidad". Segn veremos en seguida, las
principales desventajas del muestreo no probabilstico son la imposibilidad de descubrir el error muestral y la
subjetividad introducida por el juicio del investigador al escoger la muestra.

4. Escoger el mtodo de muestreo que se utilizar. En esta etapa, hemos de decidir de qu manera
seleccionaremos a los integrantes de la muestra, es decir, exactamente cul procedimiento probabilstico o no
probabilstico aplicaremos. Las posibilidades se analizan ms detenidamente en la siguiente seccin y se
compendian en la figura 4-3.

5. Delimitar el tamao necesario de la muestra. Los dos mtodos principales con que se determina el tamao
de la muestra necesario para lograr cierto grado de exactitud son el tradicional y el bayesiano; ms adelante en
este captulo nos ocuparemos, sobre todo del mtodo tradicional. Adems, ms informacin sobre la delimitacin
de tamao de la muestra viene en el Apndice 4B.

6. Escoger la muestra y reunir informacin. En esta etapa, seguimos o delegamos las reglas de eleccin que
han sido establecidas previamente en el proceso. El empleo de los medios de obtencin de datos como las
entrevistas, los cuestionarios por correo, las encuestas telefnicas y la observacin es un tema que se aborda
ms adelante.

7. Validar la muestra. A fin de saber si la muestra que hemos escogido es una seccin transversal
representativa de la poblacin, quiz queramos comparar las caractersticas de ella con las que existen en la
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 108

poblacin de donde se extrajo. Tales comparaciones pueden fundarse en el censo u otros datos "ordinarios". Por
ejemplo, si el 45% de los clientes que compran a crdito en una tienda de departamentos tienen tambin una
tarjeta Carnet pero slo el 21% de nuestra muestra de esa poblacin posee esta tarjeta, la muestra no ser
entonces representativa de la poblacin de donde se obtuvo.














8. Analizar los datos y presentar los resultados. La etapa final del proceso de muestreo coincide ligeramente
con la validacin de la muestra, pues tal validacin exige adems un anlisis. Ms adelante hablaremos del
anlisis de datos y la presentacin de los resultados de la investigacin; por ahora conviene sealar que tanto el
procedimiento de muestreo como la forma de los datos han de ser compatibles con las tcnicas analticas que
van a aplicarse.

TIPOS DE MUESTRAS
Los diseos maestrales pueden clasificarse de diversas maneras; por ejemplo, en diseos fijos y
secuenciales, diseos probabilsticos y no probabilsticos, diseos por atributos y por variables.

Muestreo fijo y muestreo secuencial
Las muestras fijas suponen un tamao previamente establecido de la muestra, y todos los datos
muestrales se recaban antes de analizar los resultados. Por otra parte, en el muestreo secuencial el nmero de
unidades que van a muestrearse no se escoge de antemano sino que se determina por una regla de decisin.
Luego de tomar cada muestra, se decide si: a) continuar el muestreo o b) llegar a conclusiones y aplicar medidas
a partir d la informacin reunida hasta ese momento. El resultado del muestreo secuencial a menudo es una
combinacin de mayor exactitud y menor costo, pues en cada etapa se hacen ms observaciones en caso de
juzgarse insignificante su valor. Un problema del muestreo secuencial es la complejidad matemtica que lo ca-
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 109

racteriza. Por tal razn y porque casi siempre el muestreo es de tipo fijo, nos concentraremos en est mtodo.

Comparacin entre el muestreo probabilstico y el muestreo no probabilstico
Las muestras Probabilsticas exigen mtodos de seleccin en que los miembros de la muestra se
escogen aplicando un proceso aleatorio. Las caractersticas ms notables de esta clase de muestras consisten
en que cada miembro de la poblacin tiene alguna probabilidad conocida de figurar en ella. Cada integrante de la
poblacin puede no tener igual probabilidad de quedar incluido en la muestra, pero todos poseen una
probabilidad conocida de inclusin. No debemos confundir la aleatoriedad de la muestra probabilstica con el
azar o el enfoque sin direccin alguna, pues es muy rigurosa en el cumplimiento de las reglas de seleccin que
no admiten ni la subjetividad ni la arbitrariedad de juicio por parte del investigador.

Las muestras no probabilsticas, en cambio, no brindan la oportunidad de determinar la posibilidad de
que determinado elemento de la poblacin haya sido incluido en la muestra. Por tal razn, no podemos estar
seguros de que la muestra sea representativa de la poblacin. En comparacin con el rigor de las muestras pro-
babilsticas, las no probabilsticas se basan en el juicio del investigador y su representatividad depende de la
suerte y habilidad de l.

En teora, el muestreo probabilstico es la mejor de las dos posibilidades sealadas; adems ofrece la
ventaja tan importante de que, como cada unidad de la poblacin tiene una probabilidad conocida de figurar en
la muestra, podemos estimar objetivamente el grado de error. Esta ventaja incluye la oportunidad de determinar
matemticamente el tamao de la muestra sise desea cierto nivel de exactitud. Y gracias a ello podemos evaluar
la eficiencia relativa de las alternativas de muestreo que se aplican en cierta situacin. Aparte de las ventajas
anteriores; el muestreo de probabilidad requiere relativamente poco conocimiento deja poblacin: lo nico que se
necesita es poder identificar cada elemento de la poblacin y que sepamos cuntos hay en el interior de la
poblacin. Entre las principales desventajas se cuentan el mayor tiempo, costos ms altos y ms complejidad
que en los mtodos no probabilsticos. Adems, tal vez no queramos proyectar los resultados de la muestra con
un grado conocido de exactitud a la poblacin en general. Es posible que, como en el caso de un estudio
exploratorio, el investigador se conforme con familiarizarse con la poblacin y hasta puede estar interesado en
obtener una muestra seleccionada intencionalmente para que no represente a la poblacin.

Otra ventaja afn del muestreo no probabilstico consiste en que, contando con cierto presupuesto y
plazo, deberemos conseguir una muestra de mayor tamao del que sera posible con las tcnicas
probabilsticas. Y as quizs obtengamos una muestra no probabilstica que es ms representativa que la
muestra probabilstica ms pequea que habramos podido extraer. Una consideracin ms: el dinero que
ahorramos al utilizar esta clase de muestra nos proporcionara fondos para pagar cierta cantidad y reducir el error
no muestral, al ayudar a garantizar la cooperacin de los respondientes o sujetos. Pero, pese a las ventajas que
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 110

acabamos de enumerar, el muestreo no probabilstico suele ser inferior a causa de los problemas de represen-
tacin y generalizacin.

Distincin entre muestreo de atributos y muestreo de variables
El muestreo se clasifica asimismo atendiendo al tipo del parmetro de poblacin que estamos tratando
de estimar., Los parmetros se clasifican en atributos o variables. Un atributo es una caracterstica cualitativa o
descriptiva que un miembro de la poblacin posee o no posee. El muestreo de atributos generalmente se refiere
a la proporcin de la poblacin que tiene la caracterstica en estudio. Por ello, procuraremos utilizar la proporcin
muestral como una estimacin de la proporcin de la poblacin dotada del mismo atributo. He aqu algunos
ejemplos: poseer un televisor Philips, haber ido al cine la semana pasada, haber votado en la ltima eleccin
presidencial y otras caractersticas que pueden ser de inters para un estudio de investigacin de mercados.

El muestreo de variables trata de estimar una media de la poblacin y no una proporcin de ella. Por
ejemplo, un estudio tendr por objeto determinar los aos promedio de la educacin formal, la frecuencia conque
se compra un producto, la edad u otra medida aritmtica de la poblacin. Obsrvese que un determinado
parmetro de inters puede expresarse como una variable o atributo. Por ejemplo, la frecuencia de compra
puede expresarse en funcin de una variable (compras en el ao pasado) o en funcin de un atributo (0-4, 5-9,
10 o ms compras el ltimo ao). Segn veremos despus, la determinacin del tamao necesario de la muestra
para lograr cierto grado de exactitud depende de que con el muestreo queramos obtener una media (variable) o
una proporcin (atributo) del objeto de nuestra investigacin.

MUESTRAS NO PROBABILISTICAS
Segn hemos sealado, el muestreo no probabilstico puede describirse como "rpido y sucio" a causa
de su debilidad intrnseca frente al muestreo probabilstico.

Pero, en caso de que la situacin de investigacin sea de un tipo que resulte beneficiada con las
ventajas de menor tiempo y costo de una muestra probabilstica, conviene considerar la conveniencia de recurrir
a las tcnicas que se usan, en: 1) muestras basadas en la comodidad del investigador 2) muestras con fines
especiales, 3) muestras por cuotas y 4) muestras por juicio.

Muestra basada en la comodidad del investigador
"Porque se cuenta con ellas", es la expresin que mejor caracteriza esta clase de muestras, las cuales
se seleccionan atendiendo fundamentalmente a la comodidad del investigador. Todos hemos visto reportajes y
noticias de prensa en que un reportero pide a una muestra aleatoria" de transentes que digan lo que opinan de
la nueva moda, si estn en favor de la liberacin femenina o si apoyarn las nuevas leyes de proteccin al
ambiente. Los reportajes se acompaan a menudo de fotografas y de cuotas parciales atribuidas a cada
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 111

respondiente entrevistado. Sin duda tales reportajes tienen valor como noticias, pero su valor cientfico es
insignificante. Hay muchos otros ejemplos de esta modalidad de muestreo, algunas con mucha credibilidad
simplemente por el gran tamao de las muestras que acompaan la investigacin. Los programas en que los
radioescuchas telefonean al estudio son una forma de muestra basada en la comodidad del investigador; en
esos programas los oyentes dan su opinin sobre el tema del da a travs del telfono. Lo que muchas veces se
pierde aqu es que los respondientes son individuos auto seleccionados que tienen un inters ms vital en la
cuestin y ms tiempo libre para escuchar la radio y hablar por telfono; acaso pertenezcan a un tipo distinto de
personalidad que el resto de nosotros. Esas muestras no son representativas, y cualquier aumento en el tamao
de la muestra se centrar ms en una conclusin falsa.

Como el lector probablemente ya habr deducido, el muestre o de conveniencia no se recomiendan
mucho en los estudios, descriptivos, predictivos o causales, pues en ellos la posibilidad de proyectar a la
poblacin los hallazgos muestrales es de capital importancia. Pese a sus deficiencias y limitaciones, esta tcnica
es un instrumento til en la fase exploratoria del proyecto, fase en que las ideas y conocimientos son ms
importantes que la objetividad cientfica. Por ejemplo, en una etapa inicial del estudio de las opiniones de los
consumidores sobre el curso de manejo defensivo, el autor efectu entrevistas en grupos de enfoque con dos
muestras de esta clase tomadas de una firma a cerera de la localidad (un grupo que haba tomado el curso
cuando se imparti en la compaa y otro grupo que haba optado por no tomarlo). Si bien las muestras eran
evidentemente no representativas de los estudiantes nacionales y de los no estudiantes, ayudaron a elaborar
hiptesis, variables e ideas que resultaron extremadamente valiosas en fases posteriores de la investigacin.

Muestra seleccionada con fines especiales
Estas muestras son aquellas en que los miembros se escogen a fin de cumplir con criterios previamente
establecidos que se juzgan importantes. El investigador puede seleccionarlas aun cuando sepa que no son
representativas de la poblacin. As, un fabricante de juguetes llevar a cabo un estudio observacional en el cual
los nios, seleccionados por su tendencia a romper juguetes, juegan con los productos de la firma. De manera
anloga, el fabricante de una nueva calculadora de bolsillo someter el producto al examen de ingenieros y de
otros cientficos para conocer sus reacciones, antes de terminar el diseo de ella. Un candidato poltico, al
formular sus estrategias para la inminente campaa electoral, querr conocer las opiniones de los opositores de
su candidatura. Al efectuar las entrevistas exploratorias de grupo para conocer las opiniones del pblico sobre el
curso de manejo defensivo, el autor seleccion intencionalmente a miembros de un grupo que se haban
enterado del curso pero que no se haban inscrito en l cuando se les ofreci. Adems de ser una muestra
basada en la comodidad del investigador (porque su empleador tena una ubicacin accesible y la muestra era
fcil de extraer), se trata adems de una muestra tomada con fines especiales (porque se seleccion a los
miembros sobre la base de no ser representativos de la poblacin).

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 112

Muestra por cuotas
Esta tcnica es un sistema de gran uso que trata, por lo menos, de garantizar sistemticamente que la
muestra se parezca un poco a la poblacin. El paso inicial consiste en dividir la poblacin en categoras, luego
los miembros de la muestra se escogen segn las cuotas establecidas que hacen que la composicin de la
muestra sea proporcionalmente semejante a la de la poblacin respecto al nmero de miembros de esas
categoras. La categorizacin usada puede ser unidimensional (por ejemplo, por edades), bidimensional (por
ejemplo, por edades y sexo) o tridimensional (por ejemplo, por edad, sexo y escolaridad) o de ms dimensiones.
En la tabla 4-1 se ilustra cmo el muestreo por cuotas puede aplicarse a la extraccin de muestras de estu-
diantes en una universidad hipottica. Como se advierte en la tabla, cmo 1 400 (14%) de la poblacin
estudiantil total consta de alumnos de primer ao de sexo masculino, 14 (tambin 14%) de 100 miembros de la
muestra debern ser estudiantes de primer ao y de sexo masculino. En la prctica, la proporcin requerida de
los integrantes de una categora muestral generalmente exige un nmero entero de personas (digamos, 14.8).
En tal caso incluiremos a 15 personas en la categora y redondearemos las cifras hacia arriba o hacia abajo, de
modo que podamos cumplir con el requisito del tamao de la muestra.

Cuando se hace un estudio de muestreo por cuotas, los errores de seleccin influyen mucho en los
resultados. As, en la muestra descrita en la tabla 4-1, un entrevistador se colocar en una zona de mucho trfico
en la universidad y se resistir a detener a los estudiantes que llevan prisa (o sea los que se dirigen a un examen
final tienen menos probabilidades de ser entrevistados que los que caminan con mayor lentitud), que miden 1.80
m y que parecen enojados o que por alguna otra razn dan la impresin de no querer ser entrevistados. Otro
problema es que la clasificacin quiz no sea apropiada para el problema. Por ejemplo, si el estudio versa sobre
las actitudes ante sociedades y agrupaciones, posiblemente se desee establecer una tercera dimensin de
clasificacin que fije las cuotas adecuadas que exigen que cierto nmero de miembros de las muestras
pertenezcan a tales organizaciones.

Por razones de tiempo y costo, el muestreo por cuotas suele ser utilizado por los investigadores de la
opinin pblica, y en la creacin de paneles de consumidores. Pero no se olvide que la clasificacin de la
muestra en proporciones semejantes a las proporciones correspondientes de la poblacin no significa que la
muestra sea representativa. Aunque represente a la poblacin en esas caractersticas, quiz sea lamentable que
falten otras semejanzas.

Muestra de juicio
Este tipo de muestra es el que, ajuicio del investigador, representa a la poblacin. Una importante
distincin estriba en que no es que la muestra sea tpica, sino en que el investigador la considera como tal. Con
esta exposicin introductoria, se advertir que la eficacia de la muestra de juicio depende de la opinin del
investigador o experto que haya seleccionado los miembros. Con ello no queremos decir que la muestra no sea
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 113

representativa: puede haber casos en los cuales el juicio de un especialista en la materia producir una muestra
ms representativa que la que se hubiera conseguido aplicando un mtodo de muestreo probabilstico. Y esto
ocurre especialmente cuando los tamaos de la muestra son pequeos; por ejemplo, al seleccionar varias
ciudades para efectuar experimentos de mercadotecnia.

En algunos casos, el ms famoso de los cuales tuvo lugar en 1936, el empleo de una muestra de juicio
puede causarle profunda humillacin al investigador. En 1936, la revista Literary Digest efectu una encuesta
para; determinar al probable ganador de la eleccin presidencial en ese ao. El uso de una muestra de ms de 2
millones cre una fuerte conviccin de la supuesta veracidad de la encuesta y de la representatividad de sus
respondientes. La muestra de juicio incluy a los suscriptores de la revista, las listas del padrn electoral, los
directorios telefnicos y las listas del registro de automviles.










Como la muestra propenda (sin que por entonces lo supieran los investigadores) a incluir
preferentemente a los miembros ms ricos de la poblacin, la encuesta fue un fiasco en cuanto a la prediccin
de los resultados de le eleccin Indico que apenas 41% de los electores apoyaban al candidato del partido
demcrata, Franklin Roosevelt; pero el hecho fue que l gan 60% de los votos. Como veremos al hablar de la
delimitacin del tamao de la muestra, una muestra probabilstica bien seleccionada de 2 millones de personas
nos permitir tener (con una' confianza del 95%) un error muestral de menos de 0.1 de punto porcentual; en
cambio, la revista que hizo fallida encuesta tuvo un error total de 19 puntos porcentuales.

Tambin en este caso, como en todas las muestras no probabilsticas, es imposible asegurar que una
muestra de juicio ser representativa de la poblacin; tampoco podemos recurrir a tcnicas estadsticas para
determinar el tamao de la muestra que se requiere para lograr determinado grado de exactitud ni proyectar
estadsticamente los resultados en un nivel de confianza para el parmetro de la poblacin en estudio.

MUESTRAS PROBABILSTICAS
Como hemos recordado al lector ms de una vez, estas muestras son el nico tipo del que puede
conseguirse la promesa de exactitud mensurable y de ausencia de sesgo (direccionalidad) en el error muestral.
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 114

En la presente seccin examinaremos las siguientes tcnicas del muestreo probabilstica: 1) muestreo aleatorio
simple, 2) muestreo sistemtico, 3) muestreo estratificado, 4) muestreo de conglomerados, 5) muestreo de
reas, 6) muestreo polietrico (etapas mltiples).
Muestreo aleatorio simple
Es sin duda el tipo ms conocido de muestra probabilstica. Es especial porque cada miembro de la
poblacin tiene igual probabilidad de figurar en la muestra. En teora, su fundamento es muy sencillo: equivale a
extraer nombres de un sombrero o a escoger canicas de determinado color que se encuentran en una bolsa.
Pero profundicemos un poco ms en este concepto y veamos lo que sucede cuando hojeamos un
directorio telefnico con el objeto de conseguir una muestra aleatoria simple entre las listas de una ciudad
determinada. Naturalmente sera imprctico arrancar cada nombre del directorio, ponerlos todos dentro de una
urna y extraer el nmero que nos gustara incluir en la muestra. Por fortuna existe una alternativa cuando
queremos obtener una muestra aleatoria simple en tal poblacin. Como cabe suponer, la maniobra se facilita con
un dispositivo llamado tabla de nmeros aleatorios. Estas tablas normalmente son generadas por computadora,
pues el ser humano mostrar (cremoslo o no) mucha tendenciosidad en su manera de abordar, relativamente
primitiva, esta tarea. En una tabla de nmeros aleatorios, hay la misma probabilidad de que determinado dgito
sea 0, 1 o 2 y as sucesivamente. Las tablas se encuentran en varias fuentes, entre ellas las que se presentan
en el apndice estadstico al final de libro. La tabla 4-2 ofrece una parte de ella y servir de base a nuestro
ejemplo.
Supongamos que tenemos una lista del directorio telefnico tomado de un pueblo pequeo; para
explicar el ejemplo nos bastarn 12 telfonos. Esa lista viene en la tabla 4-3. A continuacin procederemos a
utilizar la tabla de nmeros aleatorios para generar una muestra de cinco personas extradas de la lista. El
procedimiento exacto que seguiremos puede aplicarse a listas ms largas y se sintetiza en la figura 4-4.
Como se seala en el diagrama de flujo, el primer paso consistir en asignar nmeros consecutivos a los
miembros de la poblacin. Los nmeros estn indicados a la izquierda de los nombres de los miembros de la
poblacin; quedan comprendidos entre 1 y 12. En seguida, comenzaremos en un lugar establecido de antemano
en la tabla de nmeros aleatorios; por ejemplo el tercer dgito hacia abajo de la primera columna. Por ser nuestra
poblacin de 12 un nmero de dos dgitos, usaremos los dos primeros dgitos en el tercer rengln de la labia 4-2
como el nmero aleatorio inicial. Esos dos dgitos son 70, por lo cual habremos rebasado el tamao de la
poblacin y tendremos que pasar al siguiente nmero aleatorio, que es 59. Y como este nmero tambin excede
a nuestra poblacin, pasaremos al siguiente: 04. Ya tenemos el primer miembro de la muestra, la seora Corts.






UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 115

Al recorrer hacia abajo la primera columna, nos encontramos con 77, 59 y 91, cifras demasiado grandes
y que por lo mismo deben ignorarse. El siguiente nmero, 12, se halla dentro del intervalo de tamao de nuestra
poblacin y pone al seor Valdez dentro de la muestra. Al terminar con la primera columna y descendiendo por
la segunda, el siguiente nmero aleatorio que no excede al tamao de la poblacin es 03, que hace al seor
Godnez el siguiente miembro de la muestra. Yendo ms hacia abajo por la segunda columna de la tabla, nos
topamos con ellO, nmero que incluye al Dr. Tllez en la muestra con los otros. Despus de omitir el 62 por ser
demasiado grande, llegamos al 04, que tambin debe pasarse por alto pues la seora Corts ya est entre los
miembros de la muestra. El resto de la segunda columna contiene nmeros aleatorios que rebasan el tamao de
la poblacin, lo mismo que los diez nmeros en la columna tres. Pacientemente pasamos a la columna 4 y
omitimos el 73, el 31 y el 14 antes de llegar al 11, que se encuentra dentro del tamao de la poblacin y que
hace que la seora Vrtiz quede incluida en la muestra para llegar al nmero deseado de cinco personas. El
tamao de nuestra poblacin, 12, es bastante pequeo para un nmero de dos dgitos, por lo cual es preciso que
omitamos siete de cada ocho nmeros aleatorios a fin de obtener la muestra. Si la poblacin hubiera
comprendido 99 miembros por ejemplo, no habramos tenido que omitir ningn nmero exceptuando los
repetidos.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 116

En sntesis, los siguientes nmeros aleatorios se utilizaron al determinar la cantidad de miembros de nuestra
muestra cinco:











Pese a ser el muestreo aleatorio simple la imagen de la simplicidad, no por eso deja de haber
problemas en su empleo. Tal vez la principal desventaja sea la necesidad de tener una lista completa de los
miembros de la poblacin. Si bien se cuenta con ella para el directorio telefnico de Smallville o Dow .Jones
Industrials, generalmente es difcil conseguir una lista completa o exacta de la mayor parte de las poblaciones.
Otro problema conexo es el costo de determinar el nmero de elementos de la muestra y recabar informacin a
partir de cada elemento. Por ejemplo, la muestra puede contener elementos que se hallan muy dispersos; por
tanto, para efectuar entrevistas personales se requieren fuertes erogaciones por concepto de viaje. Un tercer
problema consiste en que el muestreo aleatorio simple es menos eficiente (en sentido estadstico) que otras
tcnicas como la muestra aleatoria estratificada. Por ejemplo si el 30% de la poblacin est constituida por
graduados universitarios, es difcil que una muestra aleatoria simple contenga exactamente 300/0 de esa pobla-
cin. Si bien ese ser el porcentaje esperado, no ocurrir en una muestra aleatoria simple tpica. Y ello causar
problemas muy serios si los graduados difieren significativamente del resto de la poblacin respecto al parmetro
que est estudindose.

No obstante las dificultades anteriores, una muestra aleatoria simple resulta de gran utilidad cuando
muestreamos una poblacin pequea, para la cual se dispone de listas adecuadas y cuando la dispersin
geogrfica de los elementos muestrales no constituye un problema.

Muestren sistemtico
Este mtodo se parece mucho al anterior y es mucho ms fcil de aplicar. Bsicamente, consiste en
seleccionar un punto de partida aleatorio, escogiendo despus cada k-simo elemento en la lista. Por ejemplo, si
tenemos una lista de 5,000 nombres y queremos escoger una muestra aleatoria de 100 personas, primero
seleccionamos un nmero aleatorio comprendido entre 1 y 50, despus seleccionaremos a ese individuo ya cada
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 117

quincuagsima persona. Dado que la poblacin de 5,000 es 50 veces mayor que el tamao deseado de la
muestra, escogemos cada k-simo [donde k = (tamao de la poblacin) / (tamao de la muestra) o sea N/n)
persona despus del punto de partida aleatorio. Usamos ese punto para garantizar que cada miembro de la
poblacin tenga igual probabilidad de figurar en la muestra.

Entre otras variaciones de este esquema se cuenta la especificacin de las localizaciones de los
nombres en el directorio telefnico. Por ejemplo, si un listado de directorio contiene 50 pginas y queremos
extraer una muestra sistemtica de 100, optaremos por escoger simplemente la quinta persona hacia abajo en la
primera columna y la decimosegunda persona hacia arriba en la tercera columna de cada pgina. Aunque los
puristas afirman que la primera persona de la lisia no tiene probabilidades de ser escogida, nos valdremos de
esta tcnica para conseguir una muestra bastante representativa de la lista del directorio.

Otra aplicacin de muestreo sistemtico la encontramos en la entrevista personal que se realiza en la
calle; en ella un trabajo de campo puede evitar el peligro de la parcialidad personal con slo seleccionar a cada
vigsimo transente. Con ello se reduce el problema potencial de que no entrevista a los borrachos ni a los
peatones que llevan feroces mascotas, y tambin se evita el riesgo de rechazar el contacto con personas a las
que no nos gustara entrevistar. Tanto en este ejemplo como en el anterior, el muestreo sistemtico se limita a
describir una regla de seleccin mecnica que habr de seguir el investigador con objeto de aminorar la
posibilidad de que haya un sesgo de seleccin.

Cuando la poblacin se incluye en una lista y se escoge una muestra sistemtica que contenga a cada
k-simo individuo, el resultado puede ser ms representativo o menos representativo que una muestra aleatoria
simple de la misma poblacin. Por ejemplo, si la lisia de la poblacin se arregla en cierto orden relacionado con
el parmetro que nos interesa (por ejemplo, de las tiendas ms grandes a las ms pequeas), la muestra
sistemtica tiende a ser ms representativa de la poblacin que en el caso de un muestreo aleatorio simple. En
cambio, cuando hay variaciones peridicas en la lista (sobre todo cuando ocurren en un periodo igual a k), el
muestreo sistemtico suele ser menos representativo que una muestra aleatoria simple de la misma poblacin.
Ejemplos de ello se presentan si, por algn motivo, la k-sima casa visitada resulta ser un lote de esquina o si el
k-simo da de ventas siempre es mircoles. Aunque los problemas relacionados con las variaciones peridicas
en las listas de poblacin son poco frecuentes, hay que tenerlos presentes al pensar en la conveniencia de
valerse de una muestra sistemtica.

Muestreo estratificado
En esta modalidad, la poblacin se divide en categoras mutuamente excluyentes (no se traslapan) y
colectivamente exhaustivas (Iodos los miembros quedan incluidos). El fundamento del l11uestreo estratificado es
que las categoras pueden variar mucho entre s respecto al parmetro de inters y, pese a ello, exhibir una gran
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 118

semejanza dentro de cada categora. Para realizarlo hay que muestrear cada estrato o categora, como si fuesen
una poblacin independiente. En el interior de cada estrato, puede utilizarse una muestra aleatoria simple, el
muestreo sistemtico y otra tcnica de muestreo probabilstico para medir las caractersticas del subgrupo. En la
medida en que exista alguna relacin entre los es! ratos escogidos y el parmetro de la poblacin, la muestra
estratificada proporcionar una mejor estimacin del valor del parmetro. Por ejemplo, si furamos a emprender
un estudio de las actitudes ante la legalizacin de la mariguana, podramos querer estratificar la poblacin en
categoras de edad, puesto que es probable que los jvenes sean ms liberales respecto a esa sustancia y a las
limitaciones de su consumo. La estrategia fundamental de la muestra estratificada se parece al muestreo por
cuotas, pero se vale de las tcnicas de seleccin al escoger a los miembros muestrales de cada estrato.
Tambin aqu las ventajas de este mtodo dependen principalmente dentro de la existencia de estratos de la po-
blacin que difiere mucho en los parmetros que van a ser medidos. Por ejemplo en la figura 4-5, la mayor
homogeneidad de los estratos de la izquierda refleja el hecho de que el muestreo estratificado no ser ms
eficiente que una muestra aleatoria simple. Sin embargo, la diversidad de los estratos situados a la derecha de la
figura indica una situacin donde el muestreo estratificado ofrecer una estimacin ms satisfactoria del
parmetro de la poblacin, quiz aun con un tamao ms pequeo de la muestra global.

La superioridad del muestreo estratificado sobre el aleatorio simple depender de la relacin que haya
entre ellos y de la homogeneidad de cada uno. Adems de su complejidad y de su costo inherente, es
imprescindible que tengamos informacin previa sobre la poblacin para contar con una base que nos permita
estructurar el diseo de estratificacin. Por tales razones este mtodo no debe utilizarse automticamente en
lugar de una muestra aleatoria simple ni de una muestra sistemtica.

Al disear un estudio de investigacin que incluya al muestreo estratificado, es preciso atender a varias
cuestiones conexas. Estas se relacionan con los fundamentos y el nmero de estratos escogidos, y tambin con
el hecho de que los tamaos de la muestra de varios estratos deba ser proporcional o desproporcional a la
poblacin ms grande.

Bases de la estratificacin
Como en el caso de la muestra por cuotas, hay una o ms bases para la estratificacin de la poblacin.
Quiz queramos crear divisiones de estratos que se funden en la informacin disponible o en los juicios de
expertos sobre la pertinencia de las variables geogrficas, demogrficas, econmicas y otras variables con el
parmetro de la poblacin que estamos tratando de estimar. La estrategia general consiste en tener estratos
donde los miembros sean lo ms semejantes posible, pero que difieran al mximo de los integrantes de otros
estratos en cuanto al parmetro. Al escoger las bases de la estratificacin, los resultados de un estudio
exploratorio anterior, o los datosafines presentados en fuentes secundarias, pueden resultar de gran utilidad
como complemento de los estratos "de juicio" comnmente usados, mtodo en que el investigador tiene alguna
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 119

razn (no necesariamente infundada) para pensar que cierta tcnica de estratificacin le ser til.














Nmero de estratos
Las utilidades decrecientes suelen ocurrir en cuanto se intenta dividir la poblacin en un nmero grande
de estratos. En general, la misma estrategia se aplica al establecer las bases de la estratificacin, es decir, se
recomienda que no se tengan tantos estratos distintos que no haya mucha diferencia entre dos consecutivos
respecto al parmetro en cuestin. Desde llego, cuantos ms estratos se utilicen mayor homogeneidad habr
dentro de ellos; pero esto puede ocurrir a expensas de un costo exorbitante que no se compensa con la mayor
exactitud de la estimacin del parmetro de la poblacin.

Estratificacin proporcional frente a estratificacin desproporcional.
El tipo de muestreo estratificado que suele gustarnos a todos es el proporcional. En l, igual que en la
muestra por cuotas, la proporcin de la muestra que posee determinada caracterstica es la misma que la
proporcin de la poblacin que posee las mismas caractersticas. Por ejemplo, si 20% de la poblacin est
formada por graduados universitarios, el 20% de la muestra estratificada tambin lo estar.
Pero hay una alternativa frente a la estratificacin proporcional, la cual puede resultar ventajosa cuando la
variabilidad dentro de algn estrato sea mucho mayor o mucho menor que en los otros. A esta alternativa se le
llama muestreo estratificado.







UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 120





















desproporcional y tiene en cuenta que los miembros de un estrato particular no necesitan ser muestreados tan
ampliamente como un estrato en que el parmetro muestre mucha variabilidad. Por ejemplo, al efectuar un
trabajo sobre las actitudes hacia un seguro de vida a nivel nacional, quiz convenga muestrear a unas cuantas
personas mayores de 65 aos (pues suponemos que apoyen unnimemente la propuesta) y ms personas
procedentes de otros segmentos de la poblacin. La figura 4-6 ofrece un ejemplo en el cual el muestreo
estratificado desproporcionado debiera ser aplicado. En este caso, dada la relativa variabilidad de los tres
estratos, el estrato A podra muestrearse en una forma menos que desproporcional; en cambio, la proporcin de
la muestra proveniente del estrato e sera mayor que su representacin concreta de la poblacin. Debido a la
variabilidad mucho menor del estrato A, un tamao relativamente pequeo de la muestra basta para obtener una
estimacin exacta de su medio de subpoblacin o proporcin.

Desde el punto de vista de la eficiencia estadstica de estimar un parmetro con un mnimo error
muestral para determinado tamao total de la muestra, el muestreo desproporcional ofrece una ventaja pero
exige que conozcamos ms sobre las caractersticas de los estratos que estamos estudiando; es decir, hemos
de tener una idea no slo de su media relativa, sino tambin de su grado de variabilidad alrededor de las medias.

Muestreo por conglomerados
A diferencia de los diseos muestrales que hemos examinado hasta ahora, el muestreo por
conglomerados est fundamentalmente orientado a la seleccin de grupos y no de individuos dentro de la
poblacin. El primer paso consiste en dividir la poblacin en grupos que sean (como en el muestreo estratificado)
mutuamente excluyentes y colectivamente exhaustivos. Pero el siguiente paso es en el cual esta modalidad
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 121

presenta su dimensin tpica: una muestra aleatoria de los grupos se selecciona para un muestreo ulterior. En
este momento, los miembros concretos de la muestra se escogen con tcnicas probabilsticas del muestreo de
los grupos escogidos en el paso anterior. El procedimiento se sintetiza en la figura 4-7, en la cual la poblacin ha
sido clasificada en ocho estratos: de A a H. Despus los estratos se muestrean, mediante una tabla de nmeros
aleatorios u otros instrumentos probabilsticos, a fin de obtener una muestra de los grupos de estratos; por
ejemplo, A, e, E y H. Al concentrarse en esos estratos, el investigador har despus una muestra o censo de
cada uno (generalmente har lo primero por motivos de economa) para extraer la muestra total.

He aqu un ejemplo que aclarar mejor lo anterior. Supongamos que deseamos muestrear a los
empleados de una gran empresa de fabricacin con el propsito de averiguar su actitud ante ciertos paquetes
alternas de prestaciones que se ofrecern el siguiente ao. Un primer paso al utilizar el muestreo por
conglomerados pudiera ser enumerar los diversos departamentos en el seno de la empresa. Vendra luego una
seleccin aleatoria del muestreo de departamentos, lo cual a su vez nos llevara a muestrear a los empleados de
cada uno de los departamentos seleccionados o hacer un censo de ellos.

Pese a que el muestreo por conglomerados produce una muestra probabilstica, no es tan eficiente,
desde el punto de vista estadstico, como una muestra aleatoria simple del mismo tamao. Sin embargo,
generalmente requerir un costo menor a fin de contar con determinado tamao de la muestra, permitiendo as
obtener una muestra ms grande con cierta inversin. El muestreo por conglomerados es sumamente til
cuando es grande el costo de llegar a los miembros de la muestra en el campo.
















UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 122

Muestreo por rea
Es una forma del muestreo por conglomerados en el cual las reas geogrficas sirven de base para
determinar los estratos de la poblacin. Esos conglomerados geogrficos se describen en trminos de condados,
manzanas de ciudades u otras definiciones de zonas. Al extraer una muestra de rea de una ciudad en particular
para efectuar entrevistas personales, podramos dividir primero la ciudad en bloques, luego seleccionar aleatoria
mente un muestreo de las manzanas en esa lista. Haramos que el entrevistador visitara cada domicilio situado
en las manzanas escogidas. La figura 4-8 muestra los niveles comunes de detalle geogrfico de que se dispone
para utilizarse en la investigacin relativa al muestreo de rea. Informacin como la que se muestra se consigue
del U .S. Department of Commerce por medio del Bureau of the Census en Estados Unidos.


































UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 123

Uno de los problemas del muestreo de rea es que las personas que son similares respecto a
caractersticas demogrficas como ingresos y escolaridad tienden a vivir en el mismo barrio, lo cual merma la
eficiencia estadstica del mtodo en comparacin con una muestra aleatoria simple del mismo tamao. No
obstante, como en el caso de la muestra de conglomerados, el menor costo del tiempo y los viajes del
entrevistador permiten aumentar el tamao de la muestra, lo cual sirve para compensar esta posible prdida de
exactitud.

Muestreo polietpico (etapas mltiples)
Las muestras pueden ser de una sola etapa o de varias, segn el nmero de niveles en que se use el
procedimiento probabilstico de seleccin. Por ejemplo, al hablar del muestreo de rea en el estudio en que un
muestreo de manzanas de ciudad fue sometido a un censo, haba solamente una etapa: aquella en que
seleccionamos aleatoriamente un muestreo de manzanas a partir de la lista entera. Pero si quisiramos
muestrear las familias que habitan en las manzanas, tendramos entonces una muestra de dos etapas porque
aplicaramos procedimientos probabilsticos de seleccin en dos etapas distintas del proceso muestra!. En tal
caso, deberamos especificar las reglas exactas que habr de seguir el investigador de campo al seleccionar de
manera aleatoria cada manzana de la muestra.

Si se recurre a etapas mltiples (muestreo polietpico) y si se aplican los mtodos probabilsticos de
seleccin, el resultado final seguir siendo una muestra probabilstica; es decir, cada miembro de la poblacin
tiene una probabilidad conocida (o determinable) de figurar en la muestra definitiva. Los niveles que aparecen en
la figura 4-8 podran ser objeto de la seleccin de probabilidad en un estudio de muestreo de rea. Tendremos
un procedimiento muestral de cuatro etapas al pasar del rea estadstica metropolitana estndar (SMSA), a los
trayectos del censo, luego al agrupamiento por manzanas o distritos, despus a las manzanas y por ltimo a los
domicilios particulares.

El mtodo polietpico (de etapas mltiples), refleja la elegancia y riqueza de las posibilidades que
ofrece el muestreo por conglomerados y por reas, pues ayuda a convertir una poblacin para la cual no se
dispone de una lista prctica o fidedigna en una poblacin para la cual una lista pictrica (maa) resulta de
extremo valor. Y as sirve para aprovechar las ventajas del muestreo probabilstico en una situacin muestral que
de lo contrario parecera difcil o imposible de abordar.

DETERMINACIN (DELIMITACIN) DEL TAMAO DE LA MUESTRA
Siempre que trabajemos en el muestreo, hemos de contar con un plan preciso para delimitar el tamao
de la muestra que deseamos extraer de la poblacin para cumplir con los objetivos de la investigacin. Un error
muy comn consiste en pensar que una muestra debe ser grande para que realmente sea representativa de la
poblacin: se cree que por definicin una muestra de 2,000 no es tan buena como una de 2 millones. Con todo,
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 124

segn dijimos al referimos al fracaso de la encuesta de la revista Lilerary Digest en 1936, un tamao muestra de
2 millones quiz no suministre informacin adecuada sobre el parmetro en cuestin, pero s mermar en mucho
los fondos de la empresa que la paga. Como sealamos con anterioridad, nos concentraremos en el mtodo
tradicional conque se determina el tamao de la muestra, o sea en el establecimiento previo de cuntos
elementos se incluirn en ella. Adems, puntualizaremos otra vez que slo las muestras probabilsticas pueden
abordarse mediante las tcnicas de delimitacin del tamao de la muestra que sern expuestas aqu. Recur-
dese que las muestras no probabilsticas se prestan fcilmente al clculo del error muestra!. Al explicar la
determinacin del tamao de la muestra, no nos extenderemos demasiado en la descripcin de la diversas
tcnicas. Ms informacin bsica se halla en los apndices 4 A y B. Nuestro tratamiento de este tema incluir la
delimitacin del tamao de la muestra: 1) cuando se estima la media de la poblacin, 2) cuando se estima la
proporcin de la poblacin, 3) cuando la poblacin es finita, 4) cuando se aplican tcnicas del muestreo
estratificado y 5) cuando se utiliza el enfoque bayesiano en el proceso muestral.

Tamao de la muestra al estimar la media de la poblacin
Al prever el intervalo de con fianza resultante de una media muestral y la desviacin estndar, es
posible aplicar la distribucin normal a la delimitacin previa de la extensin del intervalo y del grado de
confianza que nos brindar. Lo que estamos haciendo es examinar la construccin real intervalo de confianza
antes de que efectuemos el estudio y determinemos la media muestral y la desviacin estndar.
La frmula con que se calcula el tamao necesario de la muestra para estimar la media de la poblacin es
n = Z
2
o
2

E
2

donde

n = tamao necesario de la muestra
Z = nmero de unidades de desviacin estndar en la distribucin normal que producir el nivel deseado de
confianza (obsrvese que para una confianza del 95%, Z = 1,96; para una confianza del 99%, Z = 2.58)
a = desviacin estndar de la poblacin (conocida o estimada a partir de estudios anteriores)
E = error, o diferencia mxima entre la media muestra y la media de la poblacin que estamos dispuestos a
aceptar en el nivel de confianza que hemos indicado

Por ejemplo, supongamos que queremos conocer el gasto anual promedio que una poblacin destina a
recreacin que estimamos (basndonos en trabajos anteriores) que la desviacin estndar de la poblacin es
aproximadamente de $300. Adems, nos gustara tener una certeza del 95% de que la media muestral se en-
cuentra dentro de $50 de la verdadera media de la poblacin. En este caso, Z = 1.96, a = $300, E = $50, y
aplicaremos la frmula precedente as:

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 125

N = (1.96)
2
(300)
2
= 139 personas que se incluir en la muestra.
(50)
2

La mayor dificultad al determinar eltamai10 de la muestra necesaria para estimar la media de la
poblacin consiste en calcular la desviacin estndar de la poblacin. Despus de todo, si tuviramos un
conocimiento completo sobre la poblacin, no habra necesidad de realizar una investigacin sobre sus
parmetros. Si no podemos confiar en los trabajos anteriores para calcular la desviacin estndar de la pobla-
cin, las alternativas incluyen el juicio o el empleo de estudios exploratorios con muestras pequei1as para
conocer su valor.

Si lo preferimos, podemos abordar este mismo tipo de problema desde el punto de vista del error
permisible relativo en vez del error absoluto. En este caso la desviacin estndar (a) y el error permisible (E) se
expresan en funcin de su porcentaje de la media verdadera de la poblacin (M). La ecuacin ms apropiada en
este caso se parece a la que acabamos de presentar y ser:





donde M = media de la poblacin, cuyo valor no importa aqu por quedar cancelado al aparecer tanto en
el numerador como en el denominador de la ecuacin.

Supongamos, por ejemplo, que queremos saber cunto gana el estudiante promedio al graduarse en la
universidad. Supongamos adems que hacemos una estimacin aproximada de que la desviacin estn dar de
la poblacin es de cerca del 4010 de la media de la poblacin y que queremos estar seguros en un 95% de que
nuestra media muestral se halla dentro del 10% de la media de la poblacin. Podramos aplicar la ecuacin
precedente a estas exigencias y obtener el tamao necesario:


Por tanto, si encuestamos a 62 graduados universitarios, tendremos una seguridad de 9510 de que la
media muestral se encontrar dentro del 10% del sueldo inicial de la media real de la poblacin que se grada
en dicha escuela.
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 126

Tamao de la muestra al estimar la proporcin de la poblacin
Determinar el tamao necesario de la muestra en este caso se parece en principio al procedimiento que
seguimos en la seccin anterior, salvo que ahora se trata de una proporcin y no de una media. La frmula
apropiada es:



donde

n = tamao necesario de la muestra
Z = nmero de unidades de desviacin estndar en la distribucin normal, que producir el grado deseado de
confianza (para una confianza del 95%, Z = 1.96; para una confianza del 99%, 7 = 2.58).
P = proporcin de la poblacin que posee la caracterstica de inters (si puede estimar la proporcin, hgalo y
utilcela como P; en caso contrario, sea conservador y use P = .5 en la frmula)
E = error, o mxima diferencia entre la proporcin muestral y la proporcin de la poblacin que estamos
dispuestos a aceptar en el nivel de confanza que hemos sealado.

Al aplicar esta frmula, primero hay que decidir si podemos estimar aproximadamente el valor de la
proporcin de la poblacin, P. En caso de que podamos decir con seguridad que esa proporcin difiere mucho
de .5 en una u otra direccin, estaremos en condiciones de obtener la precisin deseada con un tamao ms
pequeo (y menos caro) de la muestra. Como se aprecia en la frmula, el tamao ser proporcional al producto
de P(1 - P) y este producto es mayor cada vez que P = .5. Observa detenidamente los siguientes productos de
P(1 - P):






Como se advierte en la expresin anterior, el producto se vuelve muy pequeo cuando una proporcin
de la poblacin es sumamente pequea (por ejemplo, la proporcin de adolescentes de un pas que poseen un
auto deportivo) o demasiado amplia (como la proporcin de familias que ingieren leche en un pas industrializa-
do). As pues, si podemos acortar por lo menos el valor de la proporcin de la poblacin, ahorraremos dinero al
poder valemos de un tamao ms pequeo de la muestra. El procedimiento se compendia en la figura 4-9.


UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 127

He aqu un ejemplo que dilucidar lo anterior. Supongamos que queremos conocer la proporcin de la
poblacin de un pas que piensa que existen los OVNIS (objetos voladores no identificados) y que deseamos
tener una seguridad de 95% de que nuestra proporcin muestral se halla dentro de 3 puntos porcentuales de la
proporcin de la poblacin. Siguiendo el diagrama de flujo de la figura 4-9, primero decidimos si la proporcin
verdadera tender a ser mucho mayor o menor que .5. Poco sabemos sobre las opiniones del pblico referentes
a este tema, por lo cual adoptamos una posicin conservadora y usamos P = .5 en la frmula:




Nuestra muestra constar, pues, de 1068 personas (en realidad 1 067.1 redondeado 1 068 para
garantizar la exactitud que pretendemos en un nivel de 95%). Empleando la tabla 4-4 podremos precisar el
tamao de la muestra necesaria, sin necesidad de los clculos. Como se advierte en esa tabla, podemos ahorrar
mucho en el tamao de la muestra si logramos reducir el intervalo probable en que se halla la proporcin
verdadera. Por ejemplo, en caso de haber intentado medir la proporcin de amas de casa norteamericanas que
tienen cinta negra en karate, podramos haber supuesto una proporcin de .10 o menos y usado un tamao de la
muestra de apenas 385. En eI ejemplo relativo a los OVNIS no se justificara arriesgarnos a afirmar que la
proporcin no es .5. (En realidad, en una encuesta Gallup de 1978, 57% del pblico dijo que los platillos
voladores son reales; el 67% de la regin occidental comparti esa opinin. En 1966, slo 46% del pblico dijo
que eran reales).

Si tratamos de medir el valor de una proporcin de la poblacin pero ignoramos los resultados
probables, quiz queramos realizar una encuesta exploratoria con objeto de hacemos una idea aproximada de la
proporcin. En caso de que la proporcin resultante sea muy diferente de .5, planearemos para conseguir un
tamao menor en la fase principal del estudio. En la tabla 4-4 observa que los tamaos requeridos de la














UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 128







































muestra disminuyen de manera impresionante al desviarse de .5 la poblacin. Si la proporcin verdadera que
deseamos es menor que .10, estaremos quiz muestreando ms del doble de personas de las que necesitamos.
Ntese el 9 604 (n para P = .5) frente a 3 457 (n para P = .1) en el primer rengln de la tabla.

Muestreo cuando la poblacin es finita
Hasta ahora hemos supuesto que la muestra ser relativamente pequea en comparacin con la
poblacin total. El tamao ser el mismo sin importar si la poblacin est constituida por 50,000, 100,000 hasta
240 millones de miembros. Esta situacin caracteriza a la generalidad de los trabajos de investigacin en que
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 129

interviene el muestreo, y casi nunca hemos de preocupamos por el tamao de la poblacin.

Sin embargo, hay casos en que la muestra es 5% o ms de la poblacin; entonces hemos de modificar
ligeramente el procedimiento. Despus de todo si extraemos una muestra de 900 personas de una poblacin de
1 000, tendremos una muy buena idea de la media o proporcin de la poblacin. Dicho de otra manera, a medida
que el tamao de la muestra se acerca al de la poblacin, desaparece el error muestral y a la postre tendremos
un censo completo de la poblacin. El punto crtico de 5% no es ms que una regla prctica, pero suficiente en
casi todos los trabajos. En caso de duda, supondremos que la poblacin es finita y aplicaremos las siguientes
frmulas de correccin.

Tamao de la muestra al estimar la media de una poblacin finita




donde los otros trminos son los descritos con anterioridad y N = tamao de la poblacin.

Por ejemplo, en el problema referente a los gastos de recreacin que vimos en pginas anteriores,
supongamos que la poblacin constaba de apenas 2 000 personas. Al aplicar la frmula de la poblacin finita
obtenemos




Ntese que este decremento del tamao de la poblacin desde "muy grande" hasta 2,000 hizo que el
tamao requerido de la muestra disminuyera muy ligeramente, de 139 a 130 personas. De haber sido 200 el
tamao de la poblacin, una muestra de slo 82 se habra necesitado para conseguir el nivel de confianza y
exactitud que buscamos.

Tamao de la muestra al estimar la proporcin de una poblacin finita




Por ejemplo, en la encuesta sobre las personas que creen en la existencia de los OVNIS, supongamos
que la poblacin no haya sido muy numerosa sino que estuviera integrada apenas por 2 000 individuos.
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 130

Aplicando la frmula precedente, habramos extrado una muestra de 1 068 personas, o sea casi la
mitad de la poblacin. Al utilizar la frmula de la poblacin finita, obtendremos:





El decremento de una poblacin grande a otra de slo 2 000 hizo que el tamao requerido de la
muestra disminuyera de 1 068 a 696. De haber estudiado una poblacin de apenas 500 personas, el tamao
necesario hubiera disminuido todava ms: a 341.

Tamao de la muestra en el muestreo estratificado
Al recurrir a la tcnica del muestreo estratificado, debe tomarse una decisin sobre cuntas unidades
muestrales figurarn en cada estrato. Segn que la estratificacin sea proporcional o desproporcional, la
respuesta a esta pregunta ser diferente. No se olvide que el muestreo desproporcional se hace para aprovechar
las situaciones donde algunos estratos tienen menor variabilidad que otros.

Muestreo estratificado proporcional
En esta modalidad, los estratos se presentan igualmente en la muestra total y en la poblacin. Como
sucede con el muestreo por cuotas, si cierto estrato constituye el 20% de la poblacin, integrar ese porcentaje
en la muestra total.

Muestreo estratificado desproporcional
En esta variedad, podemos obtener el error muestral ms pequeo posible aplicando la siguiente
frmula de la asignacin ptima del tamao de la muestra total:









Por ejemplo, supngase que nos interesa saber cunto gasta anualmente en el mantenimiento de su
casa el propietario promedio en cierto pueblo. Supngase adems que hemos dividido la poblacin en tres
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 131

estratos, cada una con una estimacin de variabilidad dentro del estrato:






Si decidimos extraer una muestra de 200 personas de esta poblacin total de 10,000 aplicaremos la
frmula de la asignacin ptima del tamao de la muestra total as:












Ntese que el estrato A, 50% de la poblacin del pueblo, constituye apenas 25% (49 personas)
aproximadamente de la muestra total. Ello se debe a que el estrato A tena la mnima variacin interna y, por lo
mismo, no requera una submuestra tan grande para que su media pudiera ser estimada. De manera anloga, el
estrato e (apenas 20% de la poblacin) comprende el 39% de la muestra, en este caso a causa de su
grandsima variabilidad en comparacin con otros estratos.

Tamao de la muestra al aplicar el enfoque bayesiano al muestreo

Si bien rebasa los lmites de este libro dar una explicacin amplia sobre el enfoque bayesiano en la
delimitacin del tamao de la muestra, conviene sealar que est orientado a la toma de decisiones y que se
ocupa de los aspectos de costo Frente a valor de varios tamaos de la muestra. En otras palabras, del mismo
modo que hemos examinado el valor esperado de la informacin imperfecta en el apndice 2A, el encargado de
tomar una decisin con criterios bayesianos explorar el valor esperado de varias posibilidades del tamao de la
muestra que proporcionar el beneficio global ptimo en funcin de las ganancias y el costo de errores conexos
con la decisin para la cual se va a extraer una muestra.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 132

RESUMEN

El muestreo, actividad frecuente en nuestra vida cotidiana, es una tcnica central para el xito de
muchos trabajos de investigacin de mercados. Entre los conceptos bsicos relacionados con l figuran
la poblacin de estudio, la muestra, el parmetro de la poblacin que ser investigado, la estimacin
muestra del parmetro, errores muestrales y no muestrales, la exactitud y nivel de confianza que ofrece
la muestra.

El error muestral surge al tomar una muestra en vez de hacer un censo completo de la poblacin. Si se
aplica un mtodo adecuado de muestreo, el grado probable de error puede estimarse
matemticamente. El error muestral se reduce al aumentar nosotros el tamao de la muestra.

El error no muestral, o sesgo (direccionalidad), es una tendencia a un error direccional que existira si
efectuamos un censo completo de la poblacin. Dado el peligro constante de un error no muestral, es
muy posible que una muestra sea ms verdica que el censo. Ello obedece a una combinacin de
limitaciones de tiempo y recursos, as como a la capacidad de estimar con instrumentos estadsticos el
error mximo de una muestra grande y bien planeada utilizando para ello a trabajadores de campo.

Los diseos de las muestras se clasifican en fijos y secuencia les, probabilsticos y no probabilsticos,
de atributos y de variables. Las muestras fijas denotan un tamao previamente establecido de la
muestra, y todos los datos muestra les se recaban antes de analizar la informacin. En el muestreo
secuencial, el nmero de unidades muestreadas dependen de las reglas de decisin aplicadas durante
el proceso de muestreo.

Las muestras probabilsticas utilizan mtodos de seleccin en los cuales los miembros de la muestra se
escogen mediante un proceso aleatorio en que cada miembro de la poblacin tiene cierta probabilidad
de ser incluido. La muestra aleatoria simple, la muestra sistemtica y las muestras de conglomerados,
reas y de etapas mltiples pertenecen al tipo probabilstico. Este tipo de diseo se requiere si
queremos hacer una extrapolacin estadstica de nuestros hallazgos a la poblacin y estimar el grado
de error muestral que posiblemente sobrevenga.

Las muestras no prohabilsticas son las ms idnde8s en la investigacin exploratoria y en otras
circunstancias donde las generalizaciones estadsticas a la poblacin no se juzgan necesarias. Las
muestras basadas en la comodidad del experimentador, las que tienen fines especiales, las muestras
por cuotas y las de juicio pertenecen a esta categora.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 133


Tambin el muestreo puede clasificarse conforme al tipo de parmetro de la poblacin que se est
intentando estimar. El atributo es una caracterstica cualitativa o descriptiva que un miembro de la
poblacin posee o no posee, y un parmetro tpico es la proporcin de la poblacin. El muestreo de
variables se refiere al grado en que una caracterstica es poseda por los miembros de la poblacin; el
parmetro de inters casi siempre es la media de la poblacin.

Si conocemos el mximo error permisible y el grado de confianza que queremos tener al limitar a este
nivel el error, podremos aplicar frmulas ordinarias para calcular el tamao necesario de una muestra
probabils1ica que satisfaga nuestras exigencias. El tamao requerido de la muestra aumentar
considerablemente si el error permisible se vuelve ms pequeo, por ejemplo, para reducirlo a la mitad
es preciso multiplicar por 4 el tamao de la muestra.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 134

PREGUNTAS PARA REPASO

1. "Una muestra puede ser ms exacta que un censo". Dado que una muestra comprende tan slo una
fraccin de los miembros de la poblacin global, por qu es verdadera esa afirmacin?

2. Defina brevemente los trminos siguientes: poblacin, muestra, parmetro, estimacin, error muestral, error
no muestral, exactitud y confianza.

3. Cul es la principal ventaja que una muestra probabilstica tiene sobre el tipo no probabilstico? En que
circunstancias pudiramos preferir utilizar una muestra no probabilstica en vez de una muestra
probabilstica?

4. Un investigador quiere recurrir al muestreo sistemtico para entrevistar a las personas que salen de una
tienda de regalos. Cmo le aconsejara que debe actuar?

5. En qu circunstancias querr un investigador usar los siguientes tipos de muestras?
a. Muestra estratificada proporcional b. Muestra estratificada desproporcional.

6. Distinga entre el muestreo lijo y el secuencial. En general, cmo se lleva a cabo el segundo?.

7. Qu diferencia existe entre el muestreo de atributos y el de variables? Si nuestro objetivo es medir los
ingresos anuales de las familias, cmo podramos expresar uso?
a. Como una variable b. Como un atributo

8. Qu se entiende por "marco muestral" y por qu ese concepto es tan importante? Ofrece un ejemplo real
o hiipottico en que el marco no sea el indicado para el objetivo del estudio.

9. Un investigador desea determinar, con 5 puntos porcentuales, la proporcin de adolescentes
norteamericanos que reconocen una fotografa de Gene Autry. Una encuesta preliminar de un grupo muy
reducido revela que slo 2 personas de cada 10 reconocieron al famoso vaquero cantante. Suponiendo que
un nivel de confianza del 95% es satisfactorio:
a. Siendo conservadores, qu tamao de la muestra se requerir?
b. Utilizando los resultados de una encuesta anterior, qu tamao se necesitar?

10. En la pregunta precedente, qu tamaos de la muestra sern necesarios para a y b si la poblacin est
integrada por estudiantes de una universidad pequea con una inscripcin de 1 200?
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 135

11. En un estudio en que se estima una proporcin de la poblacin, el cliente ha decidido repentinamente que
quiere tener una precisin de 1 punto porcentual en lugar de tres. En qu grado aumentar el tamao
requerido de la muestra?.

12. Al determinar el tamao necesario de la muestra en un estudio, us usted P = .5' como estimacin para el
clculo y luego hizo un estudio encontrando una proporcin de la muestra de .37. Inicialmente deseaba no
rebasar los 3 puntos porcentuales de la verdadera proporcin de la poblacin. Si atendemos a estos resul-
tados, ser ahora el error probable mayor o menor que 3 puntos porcentuales? Por qu?

13. Una empresa de investigacin desea, con $5, determinar la cantidad promedio se. manal que los
residentes adultos de San Diego destinan a diversiones. Suponiendo una desviacin estndar de $15 y una
confianza deseada de 95% en el intervalo resultante, cuntas personas figurarn en la muestra?

14. En la pregunta 13, qu tamao de la muestra se necesitar si la poblacin se compone de 900 residentes
de Tobyhanna, Pennsylvania? Suponga que otros factores permanecen inalterados.

15. Qu es una muestra tomada con fines especiales y en qu circunstancias querr un investigador recurrir
a ella? D un ejemplo de tales circunstancias.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 136

Apndice 4A
CONCEPTOS FUNDAMENTALES DE LA ESTADISTICA

En este apndice repasaremos varios conceptos estadsticos que son indispensables para el
procedimiento muestral. Entre ellos se cuentan la media de la muestra, la proporcin de la muestra, la desviacin
estndar de muestra y la distribucin normal.

Media de la Muestra
La media de la muestra, a veces llamada tambin media aritmtica o promedio aritmtico, no es ms
que la suma de los valores observados de una muestra, divididos entre el nmero total de elementos de la
muestra. Por ejemplo, conociendo informacin sobre ventas:




la media de la muestra es 7.0 millones/4 = $1.75 millones.
La media de la muestra (X) es nuestra estimacin de la media de la poblacin (u) y se tiene cuando
recurrimos al muestreo de variables relativas a ingresos, edad, volumen de compras, ventas y otros parmetros
similares de la poblacin.

Proporcin de la muestra
La proporcin de la muestra describe el porcentaje (en realidad, el porcentaje dividido entre 100) de la
muestra que posee determinada caracterstica como la propiedad de una cortadora de pasto, por ejemplo. As, si
encuestamos a 100 personas y 65 reconocen la fotografa de Robert Redfrord nuestra proporcin de la muestra
(P) = .65 ser nuestra estimacin de la proporcin de la poblacin (p). La proporcin de la muestra es apropiada
en el muestreo de atributos y se calcula mediante la frmula




Desviacin estndar de una muestra
La desviacin estndar de un conjunto de datos representa la variabilidad de los datos muestrales y
constituye nuestra estimacin de la desviacin estndar de la poblacin. Es de gran utilidad en el procedimiento
de muestreo por su importante papel al permitimos utilizar la distribucin normal en forma de campana. He aqu
la Frmula conque se calcula la desviacin estndar (s) de un conjunto de datos maestrales:

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 137








Para ilustrar lo anterior pongamos un ejemplo. Si tenemos las siguientes ventas en un comercio al
detalle:














Distribucin normal
La distribucin normal es una curva de probabilidad estandarizada y en forma de campana; en ella las
reas bajo la curva representan la probabilidad de que ocurra una observacin dentro de los lmites del rea. El
punto central en la distribucin normal es la media, mientras que las distancias de la media se expresan en
funcin de las desviaciones estndar. Se cuenta con tablas oficiales que describen las reas exactas asociadas
con las diversas distancias de la desviacin estndar respecto a la media. Una de esas tablas viene en el
apndice de estadstica al final del libro. La figura 4A-I ejemplifica la forma de la curva y las reas
correspondientes a los mltiples de la desviacin estndar a la izquierda y a la derecha de la media. (Ntese que
Z representa el nmero de desviaciones estndar. Por tanto, si la desviacin estndar es igual a S, una distancia
de 10 ser Z = 2 unidades de desviacin estndar.) El rea total bajo la curva normal es 1.0 y, al rebasar Z = 3 o
Z = -3, el rea disminuye de manera abrupta.


UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 138













A continuacin se dan valores tiles de referencia para usarse en el muestreo estadstico:





As pues, el 68% de las observaciones ocurrir entre Z == - 1 Y Z == + 1, el 95% ocurrir entre Z = - 2 y
Z = + 2 y el 99.7% entre 7 = - 3 y Z = + 3. El intervalo del 95% es el que suele emplearse en la determinacin del
tamao de la muestra y el anlisis y proyeccin posteriores de los resultados muestrales a la poblacin. Dada la
gran difusin del nivel de confianza de 95%, conviene sealar que ste corresponde en realidad al rea
comprendida entre Z = -1.96 a Z = + 1.96, pero se redondea a 2 para simplificar las cosa en la figura 4A-I.

La tabla 2 del apndice de estadstica ofrece las reas bajo la curva normal que corresponden a los
diversos valores de Z. Puesto que la curva es simtrica (un Iado es la imagen de espejo del otro), en la labia se
indican tan slo las reas de un lado. Con ella podemos buscar el valor de 7 que nos interesa y luego encontrar
el valor en la tabla para determinar el rea comprendida entre la media y ese valor de Z. Por ejemplo, si
queremos encontrar el rea entre la media y el valor Z = .258, primero recorremos hacia abajo la primera
columna hasta el valor Z 2.5 y luego volveremos a la columna .08, donde encontraremos el rea .4951. As, a
partir de la media hasta Z = + 2.58, el rea de .4951, lo cual significa que desde Z = - 2.58 a Z = + 2.58, el rea
total a ambos lados de la media es 2(.4951), o sea aproximadamente 99% del rea total bajo la curva.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 139

Apndice 4B
DISTRIBUCIN MUESTRAL DE UNA
MEDIA O PROPORCIN'

En este apartado avanzamos un paso ms respecto a los conceptos estadsticos expuestos en el
Apndice 4A. Los lemas estudiados son: 1) una introduccin al concepto de distribuciones muestrales de la
media y la proporcin, 2) intervalos de confianza basados en las propiedades de las distribuciones muestrales y
3) la derivacin de las frmulas de determinacin del tamao de la muestra para estimar la media y la proporcin
de la poblacin.



Distribuciones muestrales: una introduccin
Si tomramos varias muestras de la misma poblacin, terminaramos obteniendo el mismo nmero de
estimaciones del parmetro de la poblacin que es el objetivo de nuestro estudio. As, 15 muestras diferentes de
una poblacin producirn hasta 15 medias o proporciones de la muestra. S extraemos muestras aleatorias de
esta poblacin, cuanto ms grande sea el tamao de la muestra ms estrechamente las medias o proporciones
se agruparn alrededor del valor verdadero del parmetro de la poblacin.

Distribucin muestra de la media
Es la distribucin de los valores posibles de la media de la muestra, conociendo la media de la
poblacin y la variabilidad y el tamao de la muestra. La distribucin muestra de la media en el caso de muestras
grandes (por ejemplo, n > 30) tendr una distribucin normal y se describe as:










Por ejemplo, su pngase que tenemos una poblacin con un ingreso promedio de $15,000 y una
desviacin estndar de $4 000, segn se advierte en la parle superior de la figura 4B -1. Si tomsemos muestras
de tamao 100 en esta poblacin, la media y el error estndar de la distribucin muestral ser
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 140







como se observa en la distribucin central de la figura 48-1. En otras palabras, al extraer varias veces muestras
de 100 en esta poblacin, la media promedio de la muestra ser $15,000 y el error estndar de las medias
muestrales ser de $400.

Si seleccionamos muestras ms grandes, digamos n = 400, en esta poblacin, terminaremos teniendo
una distribucin muestral con el mismo valor esperado ($15,000) pero con menor variabilidad; es decir, el error
estndar resultante de las medias muestras ser apenas 4 000/ 400 , o sea $200. Este conglomerado ms
estrecho alrededor de la poblacin se muestra en la parte inferior de la figura 48-1.

Basndonos en nuestro conocimiento de la distribucin normal, el 95% de las medias muestrales se
encontrarn dentro de 1.96 unidades de error estndar de la media de la poblacin. Dicho de otra manera, existe
un 95% de probabilidades de que la media de una muestra de tamao 400 se halle dentro de 1.96 ($200), o sea
$392 de la media de la poblacin.
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 141

Distribucin muestral de la proporcin
El principio fundamental de la distribucin muestral de una proporcin es el mismo del de la media
muestral; es decir, a medida que se toman muestras ms extensas, las proporciones de la muestra tienden a
presentar menor variabilidad ya acercarse ms a la proporcin de la poblacin. La distribucin muestral de una
proporcin de muestras aleatorias extradas de la poblacin ser una distribucin normal descrita por la
expresin
E(p) = P












Por ejemplo, si el 40% de cierta poblacin esta a favor de la medicina social y si extraemos una muestra
de 100 en ella, la distribucin muestral tendr.







Esta distribucin se ilustra en la figura 4B-2, junto con una comparacin de la distribucin muestral de la
proporcin si la poblacin tiene un tamao de 500 y no de 100. Como en el caso de la distribucin muestral de la
media, al crecer el tamao de la muestra disminuye la variabilidad de la distribucin muestra!. Si en este ejemplo
se utilizara el tamao 100 de la muestra, habr una probabilidad del 95% de que la proporcin de la muestra
oscile oscile .40 - 1.96(.049) y .40 1.96(0.49) o entre .304 y 496.
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 142


















Intervalos de confianza basados en las propiedades de las distribuciones muestrales.
Al analizar los resultados de un estudio de muestreo que ya se haya concluido, nos basaremos en el
intervalo de confianza para representar la exactitud de nuestra estimacin del parmetro de la poblacin.

Por ejemplo, si efectuamos un trabajo y medimos el nmero de horas que una poblacin de nios pasa
viendo la televisin cada semana y si obtenemos X = 20 horas y s (nuestra estimacin de o) = 5 horas, siendo n
= 100, tendremos una seguridad del 95% de que la media de la poblacin no rebasa el intervalo 20
1.96(5/ 100 ), o sea oscila entre 19.02 y 20.98 horas. Recurdese que ello se debe a que 95% del rea en la
curva normal se encuentra entre Z = - 1.96 y Z = +1.96 unidades de desviacin estndar.

Asimismo, si encuestramos a 400 adultos y descubriramos que 75% de ellos reconocen la fotografa
del antiguo mariscal de Campo Joe Namath, tendramos entonces un 95% de seguridad de que la proporcin de
la poblacin que identifica la fotografa se hallar en el intervalo (rango) descrito poro entre .665 y .835. Como en
el ejemplo de la fotografa anterior, la conclusin citada utiliza las reas conocidas debajo de la curva normal y
sus valores Z requeridos.




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 143

En general podemos afirmar que, segn el nivel de confianza que se busque, los siguientes enunciados
describen los intervalos de confianza de las medias y proporciones:


















Derivacin de las frmulas del tamao de la muestra para le media y la proporsicin
Al escoger el tamao de la muestra, en realidad estamos planeando con anticipacin el intervalo de
confianza que buscamos. Segn se ver en la exposicin siguiente, los intervalos son en realidad la base de la
cual se obtienen las frmulas de la determinacin del tamao de la muestra como las que se describieron en
este captulo.

Tamao de la muestra necesaria para estimar la media de la poblacin
En el presente captulo hemos analizado una situacin donde queremos conocer, dentro de $50, la
cantidad promedio que los miembros de cierta poblacin gastan en actividades recreativas anualmente. A partir
de los estudios precedentes, hemos estimado la derivacin estndar de la poblacin como $300 y hemos
decidido que nos gustara tener un 9570 de seguridad de que la muestra se halla dentro de $50 de la media de
la poblacin. Con esta informacin estamos en condiciones de identificar las variables siguientes:

x = media de la muestra (desconocida, pero ser el centro del intervalo de confianza).
o = estimacin de la desviacin estndar de la poblacin, $300.
E = error permisible que estamos dispuestos a aceptar, $50.
L = 1.96, pues nos gustara tener una confianza del 95% de que la media de la muestra se encuentra dentro de
$50 de la media de la poblacin.
n = tamao de la muestra (desconocido, pero lo calcularemos antes de emprender el estudio).
o
x
, error estndar de la distribucin muestral de la media de la muestra, X(o
x
todava se desconoce pero
depende del valor de n)
UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 144

Con la informacin aqu sealada podemos construir un intervalo de confianza del 95% para la media
de la poblacin, aunque todava ignoramos el tamao de la muestra que usaremos. El intervalo de confianza se
ejemplifica en la figura 4B-3. Con lo se advierte en ella, podemos describir la mitad de la anchura (o error
muestral) del intervalo de confianza en dos formas: 1) como $50, el mximo error que podemos admitir y 2)
como 1.96 veces el error estndar de la media. Puesto que esas dos cantidades representan la misma distancia
sobre la escala bajo la curva, podemos hacer que sean iguales y obtener




Resolviendo para 11, obtenemos las siguientes ecuaciones que describen el tamao necesario de la
muestra, el cual fue calculado antes como 139 personas:





Tamao de la muestra para estimar la proporcin de la poblacin
El mtodo con que se calcula el tamao necesario de la muestra para estimar la proporcin de la
poblacin se asemeja al que se emple con la media. Por ejemplo, en el captulo planteamos la posibilidad de
determinar la proporcin de la poblacin que piensa que existen QYNIS. Queramos tener una seguridad del
95% de que la proporcin de la muestra se halla dentro de 3 puntos porcentuales de la proporcin de la
poblacin. No queramos tratar de estimar esa proporcin, por 10 cual nos limitamos a seguir un procedimiento
conservador y usamos P = .S para conseguir el tamao deseado de la muestra. As pues, tenemos










UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 145

n = tamao necesario de la muestra (desconocido)
Z = 1.96, pues nos gustara tener una confianza del 95% de que la proporcin se halla dentro de 3 puntos
porcentuales de la proporcin de la poblacin.
P = proporcin de la poblacin que posee la caracterstica de inters (como optamos por no
estimarla, usaremos P = .5 en los clculos del tamao de la muestra).
E = error, o mxima diferencia entre la proporcin de la muestra y la de la poblacin que estamos dispuestos a
admitir en el intervalo de confianza que hemos indicado.

Con esta informacin podemos proceder a construir por anticipado el intervalo de confianza que ser el
fundamento para derivar la frmula del tamao de la muestra. El intervalo de confianza aparece en la figura 4B-4
y muestra que la distancia existente entre la proporcin de la muestra y el lmite superior de confianza del 95%
puede describirse de dos modos: 1) como .03, el error mximo que aceptaremos y 2) como 1.96 veces el error
estn dar de la proporcin de la muestra. Como en el caso de la media de la muestra, hacemos que estas
cantidades sean iguales y obtenemos




Resolviendo para n, obtenemos las siguientes ecuaciones que nos dan el tamao necesario de la muestra,
1068:

También podría gustarte