Está en la página 1de 36
Capitulo Seleccion de la muestra ere Oe eh beef" Jeo ——_ PROCESO DE INVESTIGACION ‘CUANTITATIVA Paso 7 Seleccionar una muestra aproplada para la investigacién * Defini los casos (patcpantes u otros sees. vivos objetos, fenémenas, sucesos 0 comin: _dades) sobre ios cuales se habran de recolec: ‘urls datos. + Delimita a poblacion * Elegir el método de seleccién dela muestra: [probabilstico 0 no probabilistic + Precisar el tamaro de le muestra requerido, + Apkcar el procedimiento de selecion. Obtener muestra. Sintesis OBJETIVOS DE Pld i PPA Al terminar este capitulo, el alumno ser capaz de: « Identticar los diferentes tipos de muestras en la investiga- cin cuantitativa, sus procedi- mientos de selecci6n, sus ‘aracterisicas, las situaciones len que es conveniente utilizar ‘cada uno y sus aplicaciones. + Enunciar los conceptos de muestra, poblacion y procedi- miento de seleccin de la muestra. * Determinar el tamanio adecuado de la muestra en distintas situaciones de investigacién. * Obtener muestras representa- tivas de la poblacién estudia- da cuando hay interés por ‘generalizar los resultados de ‘una investigacién aun tuniverso més amplio. Enel capitulo se analizan los conceptos de muestra, poblacién o universo, tamaiio de la muestra, representatividad de la muestra y procedimiento de seleccién. También se presenta una tipologia de muestras: probebilisticas y n0 probabilisticas. Se explica cémo definr alas unidades de andlisis (participantes, otros seres vives, objetos, sucesos © comunidades), de las cuales se habrén de recolectar los datos. Asimismo, en el capitulo se presenta cémo determinar el tamafio adecuado de una muestra cuando pretendemos generalizar los resultados a una poblaci6n, y cémo proceder para obtener la muestra, dependiendo del tipo de selecci6n elegido. 235 236 SEGUNDA PARTE El proceso dela investigacion cuantitativa éEn una investigacién siempre tenemos una muestra? No siempre, pero en la mayoria de las situaciones sf realizamos el estudio en una muestra. S6lo cuando queremos realizar un censo debemos incluir en el estudio a todos los sujetos 0 casos (personas, animales, plantas, objetos) del universo o la poblacién. Por ejemplo, los estudios mo- tivacionales en empresas suelen abarcar a todos sus empleados para evitar que los excluidos piensen que su opinién no se toma en cuenta, Las muestras se utilizan por economfa de tiempo y recursos, Lo primero: {sobre qué o quiénes se recolectaran datos? ‘Aqui el interés se centra en “qué o quiénes”, es decir, en los sujetos, objetos, sucesos o comuni- dades de estudio (las unidades de andlisis), lo cual depende del planteamiento de la investigacién. ‘Asi, en el caso de que el objetivo sea describir el uso que hacen Jos nifios de la television, lo mas factible seria interrogar a un Unidades de anilisis Se grupo de nifios, También serviria entrevistar a los padres de los__ les denomina también nifios. Escoger entre los nifios 0 sus padres, o ambos, dependeria #805 0 elementos. no sélo del objetivo de la investigaciGn, sino del disefio de la mis- ma, En el caso de la investigacién que hemos ejemplificado a lo largo del libro, donde el propé- sito bésico del estudio es describir la relacién nifio-television, se podria determinar que los sujetos seleccionados para el estudio fueran nifios que respondieran sobre sus conductas y per- cepciones relacionadas con este medio de comunicacién. En otro estudio de Greenberg, Ericson y Vlahos (1972), el objetivo de andlisis era investigar las discrepancias 0 semejanzas en las opiniones de madres e hijos 0 hijas con respecto al uso de latelevisién por parte de estos tiltimos. Aquila finalidad del estudio supuso la seleccion de mamds y nifios, para entrevistarlos por separado, correlacionando posteriormente la respuesta de cada par madre-hijo(a) Lo anterior quiza parezea muy obvio, pues los objetivos de los dos ejemplos mencionados son claros, En la practica esto no parece ser tan simple para muchos estudiantes, que en propuestas de investigacién y de tesis no logran una coherencia entre los objetivos de la investigacién y la unidad de andlisis de la misma. Algunos errores comunes se encuentran en la tabla 8.1. Por Io tanto, para seleccionar una muestra, lo primero que hay que hacer es definir la unidad de andlisis (personas, organizaciones, periédicos, comunidades, situaciones, eventos, etc). El sobre qué o quiénes se van a recolectar datos depende del planteamiento del problema a investi- gary de los alcances del estudio. Estas acciones nos llevardn al siguiente paso, que consiste en delimitar una poblacién. Muestra Subgrupo de la Para el proceso citantitativo la muestra es un subgrupo dela _—_poblacién del cual se poblacion de interés (sobre el cual se recolectardn datos, y que _recolectan los datos y tiene que definirse o delimitarse de antemano con precisiGn), éste debe ser representative deberd ser representativo de la poblacion. El investigador preten- 4° “icha poblacion: CAPETULO 8 Sslsocién de lamuestrs 237 de que los resultados encontrados en la muestra logren generalizarse o extrapolarse a la pobla- (en el sentido de la validez externa que se comenté al hablar de experimentos). El interés es que la muestra sea estadisticamente representativa, La esencia del muestreo cuantitativo podria esquematizarse como se presenta en la figura 8.1. Tabla 8.1 Quiénes van a ser medidos: errores y soluciones. Pregunta de investigacién Unidad de andlisis errénea Unidad de anilisis correcta <@Discriminan alas mujeres en ‘Mujeres que aparecen en los Mujeres y hombres que aparecen Jos amuncios de la television? anuncios de televisién. en los anuncios de televisién, Error: no hay grupo de para comparar si ambos son ‘comparacién. presentados con la misma frecuencia ¢ igualdad de papeles desempefiados y atributos. ¢Bstdn los obreros del érea Computar el miimero de conflictos Muestra de obreros que trabajan metropolitana de la ciudad sindicales registrados ¢n la en el drea metropolitana de de Guadalajara satisfechos Junta Local de Conciliacién y Guadalajara, cada uno de los ‘con su trabajo? Arbitraje del Ministerio del cuales contestard a las ‘Trabajo durante los iltimos preguntas de un cuestionario cinco afos. sobre satisfaccién laboral. Error: la pregunta propone indagar sobre actitudes individuales y esta unidad de andlisis denota datos agregados en una estadistica laboral y macrosocial, Hay problemas de Grupo de adolescentes, Grupo de padres e hijos. comunicacién entre padres aplicarles cuestionario. ‘A amas partes se les aplicara e hijos? Error: se procederia a describir el cuestionario. ‘inicamente cémo perviben los adolescentes la relacién con sus padres. ‘Qué seatimientos suelen Hombres cuyas parejas hayan Hombres y mujeres que hayan ‘acompafiar a las personas fallecido en un accidente perdido a su pareja en un aque han perdido automoviistico. accidente automovilistico en Tecientemente a su cényuge Error: no se cubre mas que al sun periodo de seis meses 0 en un accidente género masculino y debe menor. automovilistico? definirse qué se entiende por “recientemente”. ¢Cémoes la comunicacién que _—Pacientes de enfisema pulmonar _Pacientes de enfisema pulmonar tienen con sus médicos los ‘en estado terminal en estado terminal y sus pacientes de enfisema Error: la comunicacién es un médicos. ‘pulmonar en fase terminal? proceso entre dos actores: médicos y pacientes. (contintia) 238 SROUNDA PARTE £1 proceso de Ia investigacién cuantitativa Tabla 8.1 Quiénes van a ser medidos: errores y soluciones (continuacién) Pregunta de investigacin Unidad de andtisis errénea Unidad de andlisis correcta 2Qué tan arraigada se ~ Contadores piblicos y Personas fisicas (contribuyentes ‘encuentra la cultura fiscal de -contralores de las empresas ‘que no son empresas de todo los contribuyentes de del Departamento de Medellin. _tipo: profesionales Medellin? Error: gy el resto de los independientes, trabajadores, contribuyentes? ‘empleados, comerciantes, asesores, consultores) y representantes de empresas {contribuyentes morales). én qué grado se aplica 1 ‘Alumnos de las escuelas del ‘Modelos curriculares de las modelo constructivista en distrito escolar. ‘escuelas del distrito escolar las escuelas de un distrito Error: se obtendria una (anélisis de la documentacién escolar? respuesta incompleta ala disponible), directores y pregunta de investigacién y maestros de las escuelas es probable que muchos (eatrevistas), y eventos de alumnos ni siquiera sepan bien ensefianza-aprendizaje Jo que es el modelo (observacion de clases y constructivista dela educacién, _tareas eu cada escuela). ‘Objetivo central: Seleccionar casos representativs para la generalizacion, | Generalizar: = Caracteristicas = Hipstesis Con la finalidad de construir y/o probar teorias que expliquen la poblacién o fenémeno { Mediante una técnica adecuada Figura 8.1 Esencia del muestreo cuantitativo. éCémo se delimita una poblacién? Una vez que se ha definido cul sera la unidad de andlisis, se procede a delimitar la poblacién que va a ser estudiada y sobre la cual se pretende generalizar los resultados. Asi, una poblacién es el conjunto de todos los casos que concuerdan con una serie de especificaciones (Selltiz et al., 1980} Una deficiencia que se presenta en algunos trabajos de investigacién es que no describen lo suficiente las caracteristicas de la poblacién o consideran que la muestra la representa de mane- ra automética. Es comin que algunos estudios que sélo se basan en muestras de estudiantes CAPITULO 8 Seleccién dels muestra universitarios (porque es facil aplicar en ellos el instrumento de medicion, pues estan a la mano) hagan generalizaciones temerarias sobre j6venes que tal vez posean otras caracteristicas socia- les. Es preferible entonces establecer con claridad las caracteristicas de la poblacién, con la fi nalidad de delimitar cudles seran los pardmetros muestrales. Lo anterior puede ilustrarse con el ejemplo de la investigacién sobre el uso de la television por los nifios. Esté claro que en dicha investigacin la unidad de analisis son los nifios. Pero, ¢de qué poblacién se trata?, ede todos los niiios del mundo?, {de todos los nifios de la Repiblica Mexicana? Seria muy ambicioso y précticamente imposible referirnos a poblaciones tan grandes. Asi, en nuestro ejemplo, la poblacién se delimitaria con base en la figura 8.2. Esta definicion elimina, por lo tanto, a nifios mexicanos que no vivan en el area metropoli- tana de la ciudad de México, a los que no van a la escuela, a los que asisten a clases por la tarde (turno vespertino} y a los infantes més pequefios. Aunque, por otra parte, permite hacer una investigacién costeable, con cuestionarios que seran respondidos por nifios que ya saben escribir y con un control sobre la inclusién de nifios de todas las zonas de la metrépoli, al utilizar Ta ubicacion de las escuelas como puntos de referencia y de seleccién. En éste y otros casos, la delimitacién de las caracteristicas de la poblacién no sélo depende de los objetivos del estudio, sino de otras razones practicas. Un estudio no sera mejor por tener una poblacién més grande; la calidad de un trabajo investigativo estriba en delimitar claramente la poblacién con base en el planteamiento del problema. Las poblaciones deben situarse claramente en torno a sus caracteristicas de contenido, de lugar y en el tiempo. Por ejemplo, Peblacién 0 universo. Baptista (1983) en un estudio sobre los directivos de empresa en Conjunto de todos fos México y com base en las consideraciones teéricas del estudio que (arate coneucraan describe el comportamiento gerencial de los individuos y la rela- especificaciones. cién de éste con otras variables de tipo organizacional, procedié a definir la poblacién de la siguiente manera: ‘Nuestra poblacin comprende a todos aquellos directores generales de empresas industriales y comerciales que ‘en 1983 tienen un capital social superior a 30 millones de pesos, con ventas superiores a los 100 millones de pesos y/o con més de 300 personas empleadas, Limites de poblacién ‘Todos los nifos del rea ‘metropolitana de la ciudad de Mexico, que ccursen 4", 5° y6" de. primaria en escuelas privadas y pablicas del turno matutino, Figura 8.2. Ejemplo de delimitacién de la muestra. 239 240 SEGUNDA PARTE El proceso de la investigacién cuantitativa En este ejemplo se delimita claramente la poblacién, excluyendo a personas que no son di- rectores generales, a empresas que no pertenezcan al giro industrial y comercial. Se establece también, con base en criterios de capital y de recursos humanos, que se trata de empresas me- dianas y grandes. Por tiltimo, se indica que estos criterios operaron en 1983, en México. Al seleccionar la muestra debemos evitar tres errores que pueden presentarse: 1) no elegir a casos que deberian ser parte de la muestra (participantes que deberian estar y no fueron selec- cionados), 2) incluir a casos que no deberian estar porque no forman parte de la poblacién y 3) seleccionar casos que son verdaderamente inelegibles (Mertens, 2005). Por ejemplo, en una en- cuesta o survey sobre preferencias electorales entrevistar a individuos que son menores de edad y no pueden votar legalmente (no deben ser agregados a la muestra, pero sus respuestas se in- cluyeron, esto, evidentemente es un error). Asimismo, imaginemos que realizamos una investiga- cién para determinar el perfil de los clientes-miembros de una tienda departamental y generamos una serie de estadisticas sobre éstos en una muestra obtenida de la base de datos. Podria ocurrir que la base de datos no estuviera actualizada y varias personas ya no fueran clientes de la tien- da y, sin embargo, se eligieran para el estudio (por ejemplo, que algunas se hayan mudado a otra ciudad, otras hayan fallecido, unas més ya no utilizan su membresia y hasta hubiera personas que se hayan hecho clientes-miembros de la competencia). El primer paso para evitar tales errores es una adecuada delimitacién del universo 0 pobla- cidn, Los criterios que cada investigador cumpla dependen de sus objetivos de estudio, lo impor- tante es establecerlos de manera muy especifica. Toda investigacién debe ser transparente, asi como estar sujeta a critica y réplica, este ejercicio no es posible si al examinar los resultados el lector no puede referirlos a la poblacién utilizada en un estudio. éCémo seleccionar la muestra? Hasta este momento hemos visto que se debe definir cual sera la unidad de andlisis y cudles son las caracteristicas de la poblacidn. En este inciso hablaremos de la muestra, o mejor dicho de los. tipos de muestra, con la finalidad de poder elegir la més conveniente para un estudio, La muestra es, en esencia, un subgrupo de la poblacién. Digamos que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus caracteristicas al que lamamos pobla- cin, Esto se representa en la figura 8.3. Con frecuencia leemos y escuchamos hablar de muestra representativa, muestra al azar, muestra aleatoria, como si con los simples términos se pudiera dar més seriedad a los resultados. En realidad, pocas veces es posible medir a toda la poblacién, por Jo que obtenemos o seleccionamos una muestra y, desde Iuego, se pretende que este subconjunto sea tin reflejo fil del conjunto de la poblacién. Todas las muestras —bajo el enfoque cuantitati ‘vo— deben ser representativas; por lo tanto, el uso de este ténmino resulta por demés inttil, Los términos al azar y aleatorio denotan un tipo de procedimiento mecanico relacionado con la proba- bilidad y con la seleccién de elementos; pero no logran esclarecer tampoco el tipo de muestra y el procedimiento de muestreo, Hablemos entonces de estos conceptos en los siguientes apartados. Tipos de muestra Basicamente categorizam y las muestras probal las muestras en dos grandes ramas: Jas muestras no probabilisticas icas. En estas iiltimas todos los elementos de la poblacidn tienen la Muestra Figura 8.3 Representacién de una muestra como subgrupo. misma posibilidad de ser escogidos y se obtienen definiendo las caracteristicas de ia poblacién y el tamafio de la muestra, y por medio de una seleccidn aleatoria o mecénica de las unidades de andlisis. Imaginese el procedimiento para obtener el miimero pre- miado en un sorteo de loteria. Este niimero se va formando en el momento del sorteo. En las loterias tradicionales, a partir de las esferas con un digito que se extraen (después de revolverlas me- CAPHTULO 8 Seleccin delamuestrs = 241 Poblacion Elementos 0 unidades de analisis Muestra probabilistica Subgrupo de la poblacién en el que todos los, elementos de ésta tienen la misma postbilidad de ser elegidos. cAnicamente) hasta formar el mimero, de manera que todos los mimeros tienen la misma proba- bilidad de ser elegidos. En las muestras no probabilisticas, la eleccién de los elementos no depende de la probabi- lidad, sino de causas relacionadas con las caracteristicas de la investigacién o de quien hace la muestra, Aqui el procedimiento no es mecénico, ni con base en formulas de probabilidad, sino que depende del proceso de toma de decisiones de tna persona o de un grupo de personas y, desde Iuego, las muestras seleccionadas obedecen a otros criterios de investigacién. Elegit entre una muestra probabilistica 0 una no probabilistica depende de los objetivos del estudio, del esquema de investigacién y de Ta contribucién que se piensa hacer con ella. Para ilustrar lo anterior mencionaremos tres ejemplos que toman en cuenta dichas consideraciones. Muestra no probabitistica © ditigida Subgeupo de la poblacidn en la que la eleccién de los elemen- tos no depende de la probabitidad sino de las, caracteristicas de la Investigacion EJEMPLO Ex un primer ejemplo tenemos una investigacin sobre inmigrantes extranjeros en México (Baptista, 1988). El objetivo de la investigacion era documentar sus experiencias de viaje, de vida y de trabajo. Para cumplir dicho propésito se seleccioné una muestra no probabilistica de personas extranjeras que por diversas razones (econémicas, polticas, fortuitas) hubieran egado a México entre 1900 y 1960. Las personas se seleccionaron por medio de conocidos, 242 © SROUNDA PARTE Bi proceso de a inveatigacién cnantitativa de asilos y de referencias. De esta manera se entrevist6 a 40 inmigrantes con entrevistas semiestructuradas, que permitieron al participante hablar libremente sobre sus experien- cias. Comentario: En este caso es adecuada una muestra no probabilistica, pues se trata de un estudio con un disefio de investigacién exploratorio y un enfoque fundamentalmente cualita- tivo; es decir, no es concluyente, sino que su objetivo es documentar ciertas experiencias. Este tipo de estudio pretende generar datos e hipétesis que constituyan la materia prima para in- vestigaciones mas precisas. EJEMPLO Como segundo caso mencionaremos una investigacién hipotética en un pais, para saber cudn- tos nifios han sido vacunados y cudntos no, y las variables asociadas (nivel socioeconsmico, lugar donde viven, educacién) con esta conducta y sus motivaciones. Se haria una muestra probabilistica nacional de —digamos por ahora— 1 600 infantes, y de los datos obtenidos se tomarian decisiones para formular estrategias de vacunacién, asi como mensajes dirigidos a persuadir la pronta y oportuna vacunacién de los nifios. Comentario: Este tipo de estudio, donde se hace una asociacién entre variables y cuyos resultados servirdn de base para tomar decisiones politicas que afectardn a una poblacién, se ogra por medio de una investigacién por encuestas y, definitivamente, por medio de una muestra probabilistica, disefiada de tal manera que los datos lleguen a ser generalizados a la poblacién con una estimacién precisa del error que pudiera cometerse al realizar tales gene: ralizaciones. EJEMPLO Se diseiié un experimento para determinar si los contenidos violentos de la televisiOn generan conductas antisociales en los nifios. Para lograr tal objetivo se seleccionaria en un colegio a {60 nifios de cinco afios de edad, de igual nivel socioeconémico y nivel intelectual, y se asigna- rian aleatoriamente a dos grupos 0 condiciones. Asi, 30 nifios verian caricaturas prosociales y otros 30 observarian caricaturas muy violentas. Inmediatamente después de la exposicién a dichos contenidos, los infantes serfan observados en un contexto de grupo y se medirian sus conductas violentas y prosociales. Comentario: Esta es una muestra no probabilistica. Aunque se asignen los nifios de ma- nera aleatoria a las dos condiciones experimentales, para generalizar a la poblacién se nece- sitarian repetidos experimentos. Un estudio asi es valioso en cuanto a que el nivel causa-efecto es mas preciso al aislar otras variables; sin embargo, no es posible generalizar los datos a tados los nifios, sino a un grupo de nifios con las mencionadas caracteristicas. Se trata de una muestra dirigida y “cldsica” de un estudio de este tipo. La seleccién de la mues- tra no es al azar, aunque la asignacién de los nifios a los grupos silo es. —_——— CAPITULO 8 Seleccién da muestra '”” 4Cémo se selecciona una muestra probabilistica? Resumiremos diciendo que la eleccién entre la muestra probabilistica y la no probabilistica se determina con base en el planteamiento de! problema, las hipétesis, el disefio de investigacion y el alcance de sus contribuciones. Las muestras probabilisticas tienen muchas ventajas, quiz la principal sea que puede medirse el tamaiio del error en nuestras predicciones. Se dice incluso que el principal objetivo en el diseiio de una muestra probabilistica es reducir al minimo este error, al que se Je llama error estndar (Kish, 1995). Las muestras probabilisticas son esenciales en los disefios de investigaciGn transeccionales, tanto descriptivos como correlacionales-causales (las encuestas de opinién o surveys, por ejem- plo), donde se pretende hacer estimaciones de variables en la poblacién. Estas variables se miden y se analizan con pruebas estadisticas en una muestra, donde se presupone que ésta es probabi- Iistica y todos los elementos de la poblacién tienen nna misma probabilidad de ser elegidos. Las unidades o elementos muestrales tendrén valores muy parecidos a los de la poblacién, de mane- ta que las mediciones en el subconjunto nos daran estimados precisos de! conjunto mayor. La precisiGn de dichos estimados depende del error en el muestreo, que es posible calcular. Esto se representa en la figura 8.4, Hay ademés otros errores que dependen de la medicién, pero éstos serdn tratados en el si- giiente capitulo. Para hacer una muestra probabilistica es necesario entender los siguientes términos y sus definiciones La poblacién, a la que se le suele denominar como W, es un conjunto de elementos La muestra, a la que se le simboliza como n, es un subconjunto de la poblacién En una poblacién W (previamente delimitada por los objetivos de la investigacidn), nos interesa establecer valores de las caracteristicas de los elementos de V. Nos interesa conocer valores promedio en la poblacién, lo cual se expresa como: ¥ = al valor de una variable determinada (¥) que nos interesa conocer, digamos un promedio, ‘También nos interesa conocer: V = la varianza de la poblacién con respecto a determinadas variables (la varianza indica 1a variabilidad). Poblacén ve La generatzacion de as yan —- caractersticas 0 valores de teigge Hit a Satgeeat HTT ror de muestreo yey fiitet theete Figura 8.4 Esquema de la generalizacién de la muestra a la poblacién. 243 244 SEOUNDA PARTE Ei procoto de In investigacion cuantitativa Como los valores de la poblacién no se conocen, seleccionamos una muestra 2 ademés, a través de estimados en la muestra, inferimos valores de la poblacion (@ serd la estimacion del valor de ¥, el cual desconocemos). En la muestra, 7 es un estimado promedio que podemos determinar. Sabemos que en muestra estimacién habré una diferencia (Y ~ j = 7), es decir, un error, el cual dependerd del mimero de elementos muestreados. A dicho error se le conoce como error esténdar (se) se = la desviacidn estandar de la distribucién muestral y representa la fluctuacién de 7. (se)? = el error est4ndar al cuadrado, cuya formula nos servird para calcular la varianza (V) de la poblacién (N), asi como la varianza de la muestra (n) serd la expresién s”, varianza de la muestra, la cual podrd determinarse en términos de probabilidad donde 2 s =p(l-A). p= porcentaje estimado de la muestra, probabilidad de ocurrencia del fendmeno, la cual se estima sobre marcos de muestreo previos o se define, la certeza total siempre es igual a uno, las posibilidades a partir de esto son “p” de que si ocurra y “g” de que no ocurra (+= 1), De aqui se deriva 1 - p, Como se habrd podido observar, cuando hablamos de un término de la muestra se simboliza con una letra mintiscula (n, s, se). Si se trata de un término de la poblacién, se simboliza con una letra maytiscula (, S). Para una muestra probabilistica necesitamos principalmente dos cosas: determinar el tamafio de la muestra (n) y seleccionar los elementos muestrales, de manera que todos tengan la misma posibilidad de ser elegidos. Para lo primero, daremos una {érmula que contiene las expresiones ya descritas. Para lo segundo, requerimos un marco de seleccién adecuado y un procedimiento que permita la aleatoriedad en la seleccién. Hablaremos de ambas cosas en los siguientes apar- tados. El tamaiio de la muestra ‘Cuando se hace una muestra probabilistica, uno debe preguntarse: dado que una poblacién es de W, goudl es el menor niimero de unidades muestrales (personas, organizaciones, capitulos de telenovelas, etc.) que necesito para conformar una muestra (n) que me asegure un determinado nivel de error esténdar, digamos menor de 0.01? La respuesta a esta pregunta busca encontrar la probabilidad de ocurrencia de Y, asi como que mi estimado de j se acerque a ¥, el valor real de la poblaciGn. Si establecemos el error es- téndar y lo fijamos en 0.01, sugerimos que esta fluctuacién promedio de nuestro estimado 7 con respecto a los valores reales de la poblacién ¥ no sea > 0.01, es decir, que de 100 casos, 99 veces mi prediccién sea correcta y que el valor de J se site en un intervalo de confianza que comprenda el valor de Y. Resumiendo, para una determinada varianza (V) de Y, ,qué tan grande debe ser mi muestra? Ello se determina en dos pasos: CAPETULO 8 Seleccién de la muestra 1 nt = 5 = Tanato provisional dela muestra =varian de la moeste/arana dea pblacin 2, 1n=———— 1+n'N Pongamos el siguiente caso; en el ejemplo que ya habiamos mencionado en este capitulo, dclimitamos una poblacién para un estudio de directores generales, en el cual consideramos a “todos aquellos directores generales de empresas industriales y comerciales que, en 1983, tenian un capital social superior a 30 millones de pesos, con ventas superiores a los 100 millones de pesos y con més de 300 personas empleadas”, Con estas caracteristicas se precisé que la pobla- cién era de W = 1176 directores generales, ya que 1176 empresas reunian las mencionadas caracteristicas. {Cudl es entonces el mimero de directores generales (n) que se debe entrevistar, para tener un error estandar menor de 0.015, y dado que la poblacién total es de 1176? W = tamafio de la poblacin de 1 176 empresas. 7 = valor promedio de una variable = 1, un director general por empresa. se = error estandar = 0.015, determinado por nosotros V? = varianza de la poblacién al cuadrado. Su definicién se’: cuadrado del error estandar s* = varianza de la muestra expresada conto la probabilidad de ocurrencia de p= 09 n' = tamaiio de la muestra sin ajustar = 0 tamaiio de la muestra Si lo sustituimos, tenemos que: s* = p(1-p) = 0.9(1 - 0.9) = 0.09 (0.015)? = 0.000225 n= 0.09 0.000225 n=—t_ = ___400___ gog.5 1+ QM 1+ 00/1 176) n= 298 casos Es decir, para nuestra investigacién necesitaremos una muestra de 298 directores generales. Se trata del primer procedimiento para obtener la muestra probabilistica: determinar su ta- ‘majo con base en estimados de la poblacién. El segundo procedimiento estriba en cémo y de donde seleccionar a esos 298 sujetos. Si el estudiante prefiere, en lugar de aplicar f6rmulas, calcular de manera automética un ta- mafio de muestra aleatoria simple puede utilizar el programa Stats®, que se incluye en el CD anexo,’ el calculo lo realiza con tan sélo teclear cierta informacién. El programa nos solicita que ' Se corrige con otros datos, ajustindose si se conoce el tamaii de la peblacién N. *El tamatio de muestra obtenido por las formulas de este capitulo y el conseguido mediante ¢] Stats® puede variar ligeramen: 1, pero ambos tamafios se encuentran dentro de pardmetros aceptables y con un nivel adecuado de conflanza. 245 246 SEGUNDA PARTE. 2 proceso de Is investigacién cuantitativa determinemos el tamaiio del universo o la poblacién (aunque sea aproximado), sin olvidar que por encima de 99999 casos da lo mismo cualquier tamaiio del universo (un millén, 200 mil, 4 ¢°¢! pve devorminar et millones, etc.), por lo que si tecleamos un mimero mayor 299999 tamano de una muestra el programa nos pondrd esta cifta por omisién, pero si es menor _aleatoria simple y generar Ja respeta. numeros aleatorios para ‘También nos pide que definamos el error estandar (probabili- _seleccionar los casos de dad) y el nivel de siguficancia 0 margen de error, asf como el de‘ muesira de una base confianza (términos que se explican en el capitulo del proceso Cb lacicn, cuantitativo sobre andlisis de los datos). El programa automati- camente coloca ua nivel de 95% y 5% (confianza y error, respec: tivamente), que es el aceptado para ciencias sociales. Con sélo presionar 1 botén de “caleuar", se obtiene el tamaiio de muestra apropiado. Veamos el célculo hecho por Stats® con ejemplos. Stats® Programa incluido SSS EJEMPLO Problema de investigacién: Supongamos que el gobierno de un estado, provincia o departamento, ha emitido una ley que impide (prohibicién expresa) a las estaciones de radio transmitir comerciales que utilicen un lenguaje procaz (groserias, malas palabras). Dicho gobierno nos solicita analizar en qué me- dida los anumcios radiofénicos transmitidos en el estado utilizan en su contenido este lengua- je, digamos durante el jiltimo mes. Poblacion: Comerciales transmitidos por las estaciones radiofdnicas del estado durante el ultimo mes. Tamaiio de muestra (n): Lo primero es determinar o conocer WN (recordemos que significa poblacién o universo). En este caso WV = 20 000 (20 mil comerciales transmitidos). Lo segundo es establecer el error aceptable y el nivel de confianza (que suele ser de 1 0 5% en el caso del error, expresado en proporcién como 0.01 0 0.05, asi como de 95 y 99% en cuanto al nivel de confianza). Es decir, tener la seguridad de que nuestra muestra sea representativa de la poblacién con 95 0 99% de probabilidades a nuestro favor. En contra, con 5 0 1 por ciento. Tecleamos los datos que Stats® nos pide: ‘Tamaiio dela poblacién: 20 000 Error maximo aceptable: 5% Nivel de confianza: 95% De manera automética, el programa nos caloula el tamafio de muestra necesario o reque- rido: n = 376.9386 (cerrando 0 aproximando: 377), que es el mimero de comerciales radiofé- nicos que necesitamos para representar al universo de 20 000, con un error de 0.05 (5%) y un nivel de confianza de 95 por ciento. CAPITULO 8 Scleccin des muestra «== 247 ‘Si cambiamos el nivel de error tolerado y el nivel de confianza (0.01 0 1% de error y 99% de confianza, el tamafio de la muestra ser mucho mayor, en este caso de 6 488.53 comercia- les). El tamaiio de la muestra es sensible al error y nivel de confianza que definamos. A menor error y mayor nivel de confianza, mayor tamaiio de muestra requerido para representar a la poblacién o universo. EJEMPLO Problema de investigacion: Analizar la motivacién intrinseca que tienen los empleados de la cadena de restaurantes “Lucy y Laura Bunny”. Poblacién: N = 600 empleados (cocineros, meseros, ayudantes, eteétera) Tamaio de muestra: Con un error de 0.05 (5%) y un nivel de confianza de 95%, el tamatio requerido para que la muestra Sea representativa es de 234 empleados. Conforme disminuye e! tamaiio de la poblacién aumenta la proporcién de casos que nece- sitamos en la muestra. Con W = 4 500 (0.05 0 5% de error y 95% de nivel de confianza), la muestra seria de 354.02 casos (cerrando, 354) A las muestras de los ejemplos (obtenidas por la formula o por Stats®) se les conoce como muestras aleatorias simples (MAS). Su caracteristica esencial, como ya se mencion6, es que todos los casos del universo tienen al inicio la misma probabilidad de ser seleccionados. Muestra probabilistica estratificada En ocasiones e] interés del investigador es comparar sus resultados entre segmentos, grupos 0 nichos de la poblaci6n, porque asi lo sefiala el planteamiento del problema. Por ejemplo, efectuar comparaciones por género (entre hombres y mujeres), si la seleccidn de la muestra es aleatoria, tendremos unidades 0 elementos de ambos géneros, no hay problema, la muestra reflejard a la poblacién. Pero a veces, nos interesan grupos que constituyen minorias de la poblacién o universo y entonces si la muestra es aleatoria simple, resultard muy dificil determinar qué elementos o casos de tales grupos serdn selec- Muestra probabilistica cionados. Imaginemos que nos interesan personas de todas las estratificada Subgrupo religiones para contrastar ciertos datos, pero en la ciudad donde _en el que la poblacién se se efectuard el estudio la mayoria es —por ejemplo— predomi- divide en segmentos y se 5 A " selecciona una muestra nantemente catélica. Con MAS es casi seguro que no elijamos vedic, : ‘ei F oS para cada segmento. individuos de diversas religiones o sdlo unos cuantos. No podria- 248 ‘SBOUNDA PARTE Ri proceso do a investgacién cuantitatia mos efectuar las comparaciones. Quiz tengamos 300 catdlicos y dos o tres de otras religiones. Entonces es cuando preferimos obtener tuna muestra probabilistica estratficada (el nombre nos dice que ser probabilistica y que se considerarén segmentos o grupos de la poblacién, 0 lo que es igual: estratos). Bjemplos de estratos en la variable religin serian: catdlicos, protestantes, judios, mahome- tanos, budistas, etc. Y de la variable grado o nivel de estudios: infantil, primaria, secundaria, bachillerato, universidad (0 equivalente) y posgrado. El ejemplo anteriar de los directores generales de empresa corresponde a una muestra pro- babilistica simple. Determinamos en este caso que el tamaiio de la muestra seria de n = 298 di- rectivos, Pero supongamos que la situacién se complica y que debemos estratificar esta n con la finalidad de que los elementos muestrales 0 las unidades de andlisis posean un determinado atributo. En nuestro ejemplo, este atributo podria ser el giro de la empresa. Bs decir, cuando no basta que cada uno de los elementos muestrales tengan la misma probabilidad de ser escogidos, sino que ademés es necesario estratificar la muestra en relacidn con estratos o categorias que se presentan en la poblacién, y que ademds son relevantes para los objetivos del estudio, se disefia una muestra probabilistica estratificada. Lo que aqui se hace es dividir a la poblacién en subpo- blaciones o estratos, y se selecciona una muestra para cada estrato. Laestratificacién aumenta la precision de la muestra ¢ implica el uso deliberado de diferentes tamaiios de muestra para cada estrato, a fin de lograr reducir la varianza de cada unidad de la media muestral (Kish, 1995). En su libro de muestreo, Kish afirma que, en tin mimero determi- nado de elementos muestrales n = S nh, 1a varianza de la media muestra 7 puede reducirse al minimo, si el tamaio de la muestra para cada estrato es proporcional a la desviacién estdndar dentro del estrato. Esto es, =f. Eh = oy sh En donde la muestra n serd igual a la suma de los elementos muestrales nh. Es decir, el ta- maiio de ny la varianza de J pueden minimizarse, si calculamos “submuestras” proporcionales a Ja desviacion estandar de cada estrato. Esto es: nh fh= th = bsh En donde nh y Nh son muestra y poblacin de cada estrato, y sh es la desviacién estindar de cada elemento en un determinado estrato, Entonces tenemos que: Siguiendo con nuestro ejemplo de los directores de empresa, la poblacién es de 1176 direc- tores de empresa y el tamaiio de muestra es n = 298. ,Qué muestra necesitaremos para cada estrato? 298 = a, = 0.2534 = sh = N 1176 CAPITULO 8 Sclecciéa delamuestra == 249 De manera que el total de la subpoblacién se multiplicara por esta fraccién constante para obtener el tamafio de la muestra para el estrato. Al sustituirse, tenemos que: (Wh) (fh) = mh (véase tabla 8.2) Tabla 8.2. Muestra probabilistica estratificada de directores de empresa Total Estrato Directores generales () = 0.2534 Por giro de empresa del giro Wh (fh) = nh 1 Extractive y sidenirgico 53 2 Metal mecénicas 109 3 ‘Alimentos, bebidas y tabaco ais 4 Papel y artes grificas 87 5 ‘Textiles 98 6 Eléctricas y electréinicas 110 7 . Automotriz 81 8 Quimico farmacéutica 221 9 Otras empresas de transformacién 151 10 Comerciales . 51 N=1176 Por ejemplo: Wh = 53 directores de empresas extractivas corresponden a la poblacién total de este giro. fh = 0.2534 ¢s la fraccién constante. mh = 13 es el mimero redondeado de directores de empresa del giro extractivo y siderirgico que tendré que entrevistarse. > Puente: Industridata, 1982. Se just al terer gio por décimas Muestreo probabilistico por racimos En algunos casos, en que el investigador se ve limitado por recur- , sos financieros, por tiempo, por distancias geogréficas 0 por una Racimos er engines. combinacién de éstos y otros obstéculos, se recurre al muestreo Jo. por racimos 0 clusters. En este tipo de muestreo se reducen costas, tiempo y energia, al considerar que muchas veces las unidades de andlisis se encuentran encapsuladas o encerradas en determinados lugares fisicos 0 eogréficos, a los que se denomina racimos. Para dar algunos ejemplos tenemos la tabla 8.3. En la primera columna se encuentran unidades de andlisis que frecuentemente vamos a estudiar, En la segunda, sugerimos posibles racimos donde se encuentran dichos elementos. 250 SEQUEDA PARTE Ei proceso de la invostigucién cuantitativa Tabla 8.3 Ejemplo de racimos 0 clusters Unidad de anilisis Posibles racimos Adolescentes ‘Preparatorias Obreros Industrias Amas de casa Mercados Nifios Colegios ‘Muestrear por racimos implica diferenciar entre la unidad de - andlisis y la unidad muestral. La unidad de andlisis indica quiénes a se cabaune en van a ser medidos, o sea, los participantes o casos a quienes en Ef que las unidades de Ultima instancia vamos a aplicar el instramento de medicién. La anélisis se encuentran unidad muestral (en este tipo de muestra) se refiere al racimo por _ encapsuladas en determi- medio del cual se logra el acceso a la unidad de andlisis. El mues- "dos lugares fisicos. treo por racimos supone una seleccién en dos etapas, ambas con procedimientos probabilisticos. En la primera, se seleccionan los racimos, siguiendo los pasos ya seiialados de una muestra probabilistica simple o estratificada. En la segunda, y dentro de estos racimos, se selecciona a los sujetos u objetos que van a medir- se. Para ello se hace una seleceién que asegure que todos los elementos del racimo tienen la misma probabilidad de ser elegidos. A continuacién daremos un ejemplo que comprenda varios de los procedimientos descritos hasta ahora y que ilustra la manera como frecuentemente se hace una muestra probabilistica en varias etapas. EJEMPLO 3Cémo hacer una muestra probabilistica estratificada y por racimos? Problema de investigacin: Una estacidn de radio local necesita saber con precisién, con la finalidad de planear sus es- trategias, cOmo utilizan la radio los adultos de una ciudad de 2 500 000 habitantes. Es decir, qué tanto radio escuchan, a qué horas, qué contenidos prefieren y sus opiniones con respecto a los programas noticiosos. Procedimientos: Se diseiiara un cuestionaric que indague estas dreas sobre el uso de la radio. Los cuestiona- ios se aplicaran por entrevistadores a una muestra de sujetos adultos. Poblacién: Todos aquellos sujetos hombres o mujeres de més de 21 aiios de edad, y que vivan en una casa o un departamento propio o rentado de la cindad. CAPITULO 8 Seloccén delamuestrs 251 Disetio por racimos: Los directivos de la estacién de radio desconocen el mimero total de personas con las carac- teristicas sefialadas. Sin embargo, nos piden que disefiemos una muestra que abarque a todos los sujetos adultos de la cindad, adultos por edad cronolégica y por ser jefes de familia, es decir, se excluye a los adultos dependientes. Se recurre entonces a la estrategia de seleccionar racimos y se considera el uso de un ‘mapa actualizado de la ciudad, el cual indica que en dicha ciudad hay 5 000 cnadras. Las cuadras se utilizarén como racimos, es decir, como unidades muestrales, a partir de las cuales obtendremos en iltima instancia a nuestros sujetos adultos. Lo primero entonces es determi- nar: Zcudntas cuadras necesitaremos muestrear, de una poblacién total de 5 000 cuadras, si queremos que nuestro error esténdar sea no mayor de 0.015 y con una probabilidad de ocu- rrencia de 50 por ciento? 2 ‘Tenemos entonces que n’ z para una muestra probabilistica simple. spa .5(1 — 0.5) = 0.25 nt = 5 = POD orror estdndar = 2511 — 05) = 025 Vv (0.015) 0.000225 m=111111 " 1b. =—*_ = __ 22" _ _ opp 0902 1+n'/N’ 1+ 1111.11/5000 n= 909 Necesitaremos una muestra de 909 cuadras para estimar los valores de la poblacién con una probabilidad de error menor a 0.015. ‘Sabemos que la poblacién N = 5 000 cuadras est dividida por estudios previos de acuer- do con cuatro estratos socioeconémicos, que categorizan esa poblacién segiin el ingreso mensual promedio de sus habitantes, de manera que se distribuyen como sigue: ESTRATO NOM. DE CUADRAS 1 270 2 1940 3 2.000 4 790 T= 5000 2Cémo distribuiremos los 909 elementos muestrales de n, para optimizar la muestra, de acuerdo con la distribucién de la poblacién en los cuatro estratos sociveconémicos? Estratificacion de la muestra: Sfh= 7 = ksh a N 28 - onsite fh= 3065 252 SEGUNDA PARTE El proceso dela investigacin cuantitativa, ESTRATO = NUM.DECUADRAS fh = 0.1818 mht 1 270 (0.1818) 49 2 1940 (0.1818) 353 3 2.000 (0.1818) 364 4 790 (0.1818) 143 N=5000 909 * Se ajusté el iltimo valor a la baja (redondec), para cuadrar el ejemplo, recordemos que som sujetos y no se pueden ‘ragmentar. En principio tenemos que de 5 000 cuadras se seleccionaran 49 del estrato uno, 353 del estrato dos, 364 del estrato tres, y 143 del estrato 4. Esta seleccién comprende la seleccién de los racimos, los cuales se pueden numerar y elegir aleatoriamente hasta completar el niimero de cada estrato. En una diltima etapa, se seleccionan los participantes dentro de cada racimo. Este procedimiento también se hace de manera aleatoria, hasta lograr un mimero de personas (unidades de andlisis) determinados en cada racimo. A continuacién descubriremos dicho procedimiento. NUMERO DE HOGARES TOTAL DE PARTICIPANTES EN HOGARES ESTRATO Nh CUADRAS oh CADA CUADRA POR ESTRATO 1 270 49 20 980 2 1.940 353 20 7060 3 2.000 364 20 7 280 4 790. 143 20 2 860 N= 5000 909 18180 éCémo se lleva a cabo el procedimiento de seleccién de la muestra? Cuando iniciamos nuestra exposicién sobre la muestra probabilistica, seiialamos que los tipos de muestra dependen de dos cosas: del tamaiio de la muestra y del procedimiento de seleccion. De lo primero hemos hablado con todo detalle, de lo segundo trataremos ahora. Se determina el tamaiio de la muestra n, pero ;cémo seleccionar los elementos muestrales? Se precisa el mti- mero de racimos necesario y gcémo se seleccionan los sujetos dentro de cada racimo? Hasta el ‘momento s6lo hemos dicho que los elementos se eligen de manera aleatoria, pero goémo se hace esto? Las unidades de andlisis 0 los elementos muestrales se eligen siempre aleatoriamente para aseguramos de que cada elemento tenga la misma probabilidad de ser elegido. Se utilizan tres procedimientos de seleccién: CAPITULO 8 Selecién de a muestra Témbola ‘Muy simple y no muy répido, consiste en numerar todos los elementos muestrales del uno al niimero n. Hacer fichas 0 papeles, uno por cada elemento, revolverlos en una caja, e ir sacando rn mimero de fichas, segiin el tamafio de la muestra. Los ntimeros elegidos al azar conformarén Ja muestra. Asi, en la tabla 8.2, tenemos que, de una poblacién W = 53 empresas extractivas y siderirgi- cas, se necesita una muestra n = 13 de directivos generales de tales empresas. En una lista se numeran cada una de estas empresas. En fichas aparte se sortea cada uno de los 53 niimeros, hasta obtener los 13 necesarios (pueden ser las 13 primeras fichas que se extraigan). Los niime- ros obtenidos se verifican con los nombres y las direcciones de nuestra lista, para precisar los que serén participantes del estudio. Nuimeros random o numeros aleatorios EL uso de mimeros random no significa la seleccién azarosa o fortuita, sino la utilizacién de una tabla de mimeros que implica un mecanismo de probabilidad muy bien disefiado, Los nimeros, random de la Corporacién Rand fueron generados con una especie de ruleta electronica. Existe una tabla de un millén de digitos, publicada por esta corporacién, cuyas partes se encuentran en los apéndices de muchos libros de estadistica, incluido el que esta leyendo (ver tabla de mimeros aleatorios en el apéndice 4 del CD anexo). Son como lo muestra la tabla 8.4. Tabla 8.4 Ndmeros aleatorios 0 random 26g04 «29273-«=«79811 «45610 «22879 -«72538«—« 70157 «17683 «67042 $2846, 90720 9621548537 9475618124 §~—89051 2799088513. 3594367200 85027 3020776180 4141648521 «15720 90258 «(95598 = 1082293074 09362 «49674 «65953 9670220772 «= 12069 «49001-08913.» «12510 64800 64590 4104-16770 7923782158 «04553 «9300018585 72279 «(01916 06432 0852566864 2050792817 «3980098820» «18120 © 81800 68005, 2101 60119-95836 88049 «8931282716. 34705-12705 «58424 © 69700 19337 9698360321 «62194 08STA 81896 00300-75024 © 6622010404 75277 47880 O7952_—=«35832««165S 2715S 95189 0040006649 53040 59535 75885 «31648 «8820263809 «40911 «7813826376 «6041 «(97201 76310 79385 «8463927804 «= 48889 8007064680 ©9310» 04232 84008 12805 «65754 «96887 «670608413. © «31883. «79233 «99603 © 6898080233 32242 7380748321673. 40637 «= 1410255550 89002 «805034642 i622 84706 «6027413252 78974—«U078L_=«=««43629 «36223 «(3604275492 75362 «83633-25620 «24828 «50345 40653 © 8563942613. « «40242 «43160 34703 934582051 5343737178719 « 71858 «11230-26076 «44018 01556 58503-36828 = BS0S3. 39025 «16688 )= 9524 «1885 S911 13098 22211 B6AGB_ 7620516663 «30489 1840053155 92087 63042-«««90827 01534-70128 M4111 7706599358 2844368135 6160655241 (O1867 00647 «32348 $6009 40051 00440 «1080558160 62235 «| «BOMSS 73005 97021 23763 «184165056 9528392232 86695 7860979666. R574 25469 © 63708««78718 «= 35014 «40387 «15921 $8080 03936-«««15953 59658 40337 «48522, «11418 0009041779 5449008623 4900265431 «11390 33401 986BS_«92536=51626 85787 «47841 «(95787 ~—«70139« 42383 «44187 44764 1498616642 19429 01960-22833 800559851 47350 «70337 ‘Fuente: Rand Corporation. 253

También podría gustarte