Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Poblacion y Muestra PDF
Poblacion y Muestra PDF
Capítulo 8:
MUESTEO Y
ALEATORIZACIÓN
MUESTEO Y ALEATORIZACIÓN
Imagínense las muchas situaciones en las cuales se quiere conocer algo acerca de la gente, de los
evento, de las cosas. Para conocer algo acerca de la gente, por ejemplo, se toman algunas personas
conocidas – o desconocidas—y se estudian. Después del “estudio “ se llega a ciertas conclusiones,
a menudo sobre la gente en general. Detrás de la sabiduría popular se puede encontrar algo de
método. Las observaciones basadas en el sentido común acerca de las características de la gente, de
sus motivos y de su comportamiento se derivan, en su mayor parte, de observaciones y experiencias
con relativamente pocas personas. Se hacen afirmaciones como: “la gente en este tiempo no tiene
un sentido de los valores morales”; “los políticos son corruptos”; “ los alumnos de escuelas pública
no están aprendiendo las habilidades académicas básicas.”
Las bases para hacer tales afirmaciones es simple. La gente, en su mayoría a través de su
limitada experiencia, llega a ciertas conclusiones sobre otras personas y sobre su ambiente. Para
llegar a tales conclusiones, deben muestrear las “experiencias” de otras personas. De hecho, ellos
hacen muestras relativamente pequeñas de todas las experiencias posibles. El término
“experiencias” en este texto tiene que tomarse en un sentido amplio. Puede significar experiencia
directa con otras personas – por ejemplo, una interacción directa con alemanes o judíos, o pueden
significar experiencia indirecta: escuchar algo acerca de los alemanes o judíos de sus amigos,
conocidos, padres u otras personas. El hecho de que esta experiencia sea directa o indirecta, sin
embargo, no nos interesa en este nivel del análisis. Supóngase que toda la experiencia sea
directa. Un individual creerá que “conoce” algo acerca de los judíos y dirá que “sabe” que los
judíos son gregarios, porque él ha tenido una experiencia directa con algunos de ellos. Puede
incluso decir: “algunos de mis mejores amigos son judíos y yo sé que...”La idea aquí es que sus
conclusiones están basadas en una muestra de judíos o en una muestra de comportamientos de
judíos, o en ambos. El nunca podrá “conocer” a todos los judíos; debe depender, en el último
análisis, en las muestra. Desde luego que todo el conocimiento del mundo está basado en muestras,
casi todas inadecuadas.
124 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO
El muestreo es tomar una porción de una población o universo como representativa de dicha
población o universo. Esta definición no dice que la muestra tomada – o seleccionada, como dicen
los investigadores--- es representativa. Más bien dice que se tome una porción de la población y se
considere representativa. Cuando un administrador escolar visita algunos salones de clase de su
sistema escolar “para obtener una idea del sistema”, está muestreando algunas clases de todas las
clases de todas las clases del sistema escolar. Probablemente suponga que si visita “al azar”, por
ejemplo de ocho a diez clases de un total de 40, obtendrá una idea clara de la calidad de la
enseñanza que se lleva a cabo en el sistema, o puede visitar dos o tres veces la clase de un solo
maestro para muestrear sus técnicas de enseñanza. El está ahora muestreando los comportamientos,
en este caso los asociados con la enseñanza, del universo de todos los comportamientos posibles del
maestro. Tal muestreo es necesario y legítimo.
El muestreo aleatorio es ese método de seleccionar una porción (o muestra) de una población o
universo que permite que cada miembro de la población o universo tenga la misma oportunidad de
ser seleccionado. Esta definición tiene la virtud de poder ser entendida con facilidad. Por
desgracia, no es totalmente satisfactoria porque es limitada. Una mejor definición es: el muestreo
aleatorio es el método de elegir una porción (o muestra) de una población o universo que permite
que todas las muestras de un tamaño fijo n tengan la misma probabilidad de ser seleccionadas.1 Esta
definición es general y por lo tanto más satisfactoria que la definición propuesta antes.
Definase un universo a ser estudiado, como todos los alumnos de cuarto grado en un sistema
escolar X. Supóngase que hay 200 alumnos, los cuales conforman la población (o universo). Se
selecciona uno de los alumnos al azar de la población total. La probabilidad de ser seleccionado es
de 1/200, si el procedimiento de selección es al azar. Se seleccionan otros alumnos de la misma
forma. Supóngase que después de seleccionar a un alumno, este es egresado (o el símbolo que se le
asignó) a la población. Así, la probabilidad de seleccionar a un segundo alumno es también de
1/200 (si no es regresado a la población, entonces la probabilidad de los alumnos que faltan es,
desde luego, de 1/199. Esto se llama muestreo sin reemplazo. Cuando los elementos muestreados
son regresados a la población después de ser seleccionados, el procedimiento se llama muestreo con
reemplazo).
Supóngase que de la población de los 200 alumnos del cuarto grado en el sistema escolar X se
decide seleccionar una muestra aleatoria de 50 niños. Esto quiere decir si la muestra es al azar, que
todas las muestras posibles de 50 alumnos tienen la misma probabilidad de ser seleccionadas – un
número muy grande de posibles muestras. Para hacer estas ideas un poco más comprensibles,
supóngase que una población consiste en cuatro niños, a, b, c, y d, y se selecciona una muestra
aleatoria de dos niños. Entonces, la lista de todas las posibilidades o espacio de la muestra es: (a,b),
(a,c) (a,d), (b,c), (b,d), (c,d). Hay seis posibilidades. Si la muestra de dos seleccionada al azar,
entonces su probabilidad es de 1/6, ya que cada uno de los pares tiene la misma probabilidad de ser
seleccionado. Este tipo de razonamiento es necesario para resolver muchos problemas de
investigación, pero es usual limitarse a adoptar la idea más simple asociada con la primera
definición. La primera definición, entonces, es un caso especial de la segunda definición general ---
el caso especial en el cal n = 1.
1
W. Feller, An Introduction to Probability Theory and Its Applications, 2ª. Ed. , New York: Wiley, 1957,
p. 29
MUESTREO Y ALEATORIZACIÓN 125
Por desgracia, no es posible jamás estar seguros de que una muestra aleatoria es representativa
de la población de la cual fue seleccionada. Recuérdese que cualquier muestra particular del
tamaño n tiene la misma probabilidad de ser seleccionada que cualquier otra muestra del mismo
tamaño. Por lo tanto, una muestra particular puede no ser representativa de nada. Se debe saber
qué significa “representativa”. Ordinariamente, “representativo” significa que es algo típico de la
población, esto es, que ejemplifica las características de la población. Desde el punto de vista de la
investigación, “representativo” debe ser definido en términos más precisos, aunque es a menudo
difícil de precisar. Es necesario preguntar: ¿de qué características se está hablando? Por lo tanto, en
investigación una “muestra representativa” significa que la muestra tiene aproximadamente las
características de la población relevante para la investigación de que se trate. Si el sexo y el nivel
socioeconómico son variables (características) relevantes para la investigación, una muestra
representativa tendrá aproximadamente la misma proporción de hombres y mujeres y de individuos
de clase media y de clase baja como la población en general. Cuando se selecciona una muestra al
azar, se espera que ésta sea representativa, es decir, que las características relevantes de la población
estarán presentes en la muestra, en casi la misma forma en que están presentes en la población. Sin
embargo, nunca se puede estar seguro; no hay ninguna garantía.
En lo que uno se basa es en el hecho, como Stilson señala, de que las características típicas
(“característico”) de una población son aquéllas más frecuentes y por lo tanto más probables de
estar presentes en cualquier muestra aleatoria.2 Cuando el muestreo es aleatorio, la variabilidad del
muestreo es predictible. Se vio en el capítulo 7, por ejemplo, que si se lanzan dos dados varias
veces, la probabilidad de que salga un 7 es mayor que la probabilidad de obtener un 12. (Véase
cuadro 7-1).
Una muestra seleccionada al azar no es sesgada en el sentido de que ningún miembro de la
población tiene más oportunidad de ser seleccionado que cualquier otro. Se tiene aquí una
democracia en la cual todos los miembros son iguales ante el cuerpo de selección. En lugar de usar
monedas o dados, úsese un ejemplo de investigación para ilustrar este problema. Supóngase que se
tiene una población de 100 niños. Los niños difieren en inteligencia, una variable relevante para
esta investigación. Se quiere conocer la inteligencia media de la población, pero por alguna razón
sólo se puede obtener una muestra de 30 de los 100 niños. Si se selecciona una muestra
aleatoriamente, hay un gran número de posibles muestras de 30 niños. Las muestras tienen la
misma probabilidad de ser seleccionadas. Las medias de la mayor parte de las muestras será
relativamente parecida a la media de la población. Pocas de ellas no serán parecidas. La
probabilidad de seleccionar una muestra con una media cercana a la media de la población,
entonces, es mayor que la probabilidad de seleccionar una muestra con la media no tan cercana a la
medida de la población – si el muestreo ha sido aleatorio.
Sin embargo, si no se selecciona una muestra al azar, algún factor o factores desconocidos nos
pueden predisponer a seleccionar una muestra sesgada, en este caso quizás una de las muestras con
una media no tan cercana a la de la población. La inteligencia media de esta muestra será una
estimación sesgada de la media de la población. Si se conociera a los 100 niños, se podría
inconscientemente seleccionar a los más inteligentes. No es tanto que uno haría eso, sino que el
método permitiría hacerlo. Los métodos aleatorios de selección no permiten que los propios sesgos
2
D. Stilson Probability and Statostocs in Psychological Research and Theory. San Francisco Holden –
Day 1966, p. 35
126 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO
ALEATORIEDAD
3
Véase J. Kemeny, A Philosopher Looks al Science, New York: Van Nostrand Reinhold, 1959, p-39.
4
Ibid., pp. 68-75.
MUESTREO Y ALEATORIZACIÓN 127
cara o cruz, pero si se lanza la moneda al aire 1000 veces, se puede predecir, con considerable
exactitud, el total de veces de caras y cruces.
Para dar al lector una idea de aleatoriedad y muestras aleatoria, se hará una demostración
utilizando una tabla de números aleatorios. Esta tabla contiene números generados mecánicamente
de manera que no hay un orden perceptible ni un sistema en ellos. Se dijo antes que si los eventos
son aleatorios no se pueden predecir, pero ahora se hará la predicción de la naturaleza general de los
resultados de un experimento. Se han seleccionado, de una tabla de dígitos aleatorios, 10 muestras
de 10 dígitos cada una. Como los números son aleatorios, cada muestra “debería” ser representativa
del universo de dígitos. El universo puede ser definido de varias formas. Aquí se ha definido como
un conjunto completo de dígitos en la tabla de números aleatorios de la Corporación Reand. 5
Ahora se selecciona muestras de la tabla. Las medias de las 10 muestras serán, desde luego,
diferentes, aunque deberían fluctuar dentro de un rango relativamente restringido, con la mayor
parte de ellas muy cercanas a la media de los 100 números y a la media teórica de la población total
de números aleatorios. La cantidad de números pares en cada muestra de 10 debería ser
aproximadamente igual a la cantidad de números nones – aunque de nuevo habrá fluctuaciones
algunas de ellas quizás extremas, pero en su mayor parte serán modestas. Las muestras son
presentadas en el cuadro 8-1.
Las medias de las muestras se presentan debajo de cada una de ellas. La media de U, media teórica
de toda la población de números aleatorios de la Corporación Rand, (0,1,2,3,4,5,6,7,8,9), es 4.5. La
media de los 100 números que puede ser considerada una muestra de U, es 4.56. Esta es, desde
luego, muy cercana a la media de U. Se puede observar que las medias de las 10 muestras varían
alrededor de 4.5,
5
La fuente de donde se tomaron estos números aleatorios fue: Rand Corporation, A Million Random Digits
with 100000 Normal Deviates. Nueva York: Free Press, 1955. Esta es una extensa tabla de números
aleatoros constituida cuidadosamente. Sin embargo, hay muchas más tablas de este tipo, que son los
suficientemente buenas para propósitos prácticos. Los textos modernos de estadística tienen tales tablas. El
Apéndice C al final de este libro contiene una tabla de 4000 números aleatorios generados por computadora
128 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO
siendo 2.4 la más baja, y 5.7 la más alta. Sólo dos de dichas medias difieren de 4.5 en más de
1. Una prueba estadística (más adelante se analizará la razón de tales pruebas) muestra que las 10
medias no difieren significativamente entre sí, (la expresión “no difieren significativamente entre
sí” significa que las diferencias no son más grandes que las diferencias que ocurrirían por
azar). Mediante otra prueba estadística, nueve de esas medias son “buenas” estimaciones de la
media de la población de 4.5 y sólo una (2.4) no lo es.
De la misma manera, si se elige una muestra de seres humanos, el número de hombres y mujeres
de la muestra debería estar aproximadamente en proporción a los números de hombres y mujeres de
la población --- si el muestreo es aleatorio y las muestras son lo suficientemente grandes. Si se
mide la inteligencia de una muestra y la media de la calificación de inteligencia es de 100, entonces
la media de la muestra debería estar cerca de 100. Desde luego, se debe tener en mente la
posibilidad de selección de una muestra desviada, por ejemplo la muestra con una media de 80 o
menos, o 120 o más. Las muestras desviadas ocurren, pero es poco probable que ocurran. La razón
es similar a la de las demostraciones del volado con la moneda. Si se lanza al aire una moneda tres
veces, es menos probable que se obtengan tres caras o tres cruces águilas que dos caras soles y una
cruz o dos cruces y una cruz, porque U = (HHH, HHT, HTT, THH, TTH, TTT). Hay sólo un punto
con HHH y uno con TTT, mientras que hay tres puntos con dos H y tres con dos T.
ALEATORIZACIÓN
Supóngase que un investigador desea probar la hipótesis de que el consejo ayuda a los alumnos
con bajo rendimiento. El quiere seleccionar dos grupos de alumnos con bajo rendimiento, uno de
ellos será aconsejado y el otro no. Por supuesto también desea que los dos grupos sean iguales en
otras variables independientes que pudieran tener un posible efecto en el rendimiento. Una forma
de hacer esto es asignar a los niños aleatoriamente a ambos grupos a través de, por ejemplo, un
volado con una moneda para cada niño y colocando al niño en un grupo si el resultado del volado es
cara y al otro grupo si el resultado es cruz. (Nótese que si él tuviera tres grupos experimentales,
probablemente no usaría el volado; podría utilizar un dado.) El investigador puede emplear una
tabla de números aleatorios y asignar a los niños como sigue: si se obtiene un número non, asigna al
niño a un grupo y se obtiene uno par, asigna al niño a otro grupo. Ahora puede suponer que los
grupos son aproximadamente iguales en todas las posibles variables independientes. Entre más
grande sea el grupo, más segura es la suposición que se hace. Sin embargo, así como no hay una
garantía de no seleccionar una muestra desviada, como se comentó antes, tampoco hay una garantía
de que los grupos sean iguales o incluso aproximadamente iguales
6
La naturaleza de tales pruebas estadísticas, así como las razones que las fundamentan, serán explicadas con
detalles en la Parte cuatro. El estudiante, a este nivel, no debería estar muy preocupado si no domina
completamente las ideas estadísticas expresadas aquí. En realidad, uno de los propósitos de este capítulo es
presentar algunos de los elementos básicos de tales ideas.
MUESTREO Y ALEATORIZACIÓN 129
en todas las posibles variables independientes. Sin embargo, se puede decir que un investigador ha
empleado la aleatorización para igualar sus grupos o, como se dijo, para controlar las influencias
sobre la variable dependiente de otras variables que no son las variables independientes
manipuladas.
Un experimento “ideal” es aquel en el cual todos los factores o variables que probablemente
pueden afectar el resultado experimental son controlados. Si se conocieran todos los factores, en
primer lugar, y se pudieran controlar, en segundo lugar, sería posible tener un experimento ideal,
pero el caso triste es que uno nunca puede conocer todas las variables pertinentes ni controlarlas
aunque no las conozca. Sin embargo, la aleatorización ayuda.
La aleatorización es la asignación de miembros de un universo a los tratamientos experimentales
de manera que, para cualquier asignación a un tratamiento, cada miembro el universo tenga una
probabilidad igual de ser elegido para dicha asignación. El propósito básico de la asignación
aleatoria, como se indicó antes, es colocar sujetos (objetos, grupos) a tratamientos de tal forma que
los individuos con diferentes características sean colocados aproximadamente igual entre los
tratamientos a fin de que las variables diferentes a las variables independientes, que podrían afectar
la variable dependiente, tenga efectos “iguales “ en diferentes tratamientos.7 No hay garantía de que
este deseable nivel será alcanzado, pero es más probable que sea alcanzado con la aleatorización
que con otro método. La idea de la aleatorización parece haber sido descubierta o inventada por Sir
Ronald Fisher, quien de hecho revolucionó el pensamiento y los métodos estadísticos y
experimentales usando las ideas de aleatorización como parte de sus herramientas. 8 De cualquier
forma, la aleatorización, y lo que puede llamarse principio de aleatorización, es uno de los grandes
logros de nuestro tiempo. No es posible despreciar la importancia de las medidas prácticas e ideas
derivadas de la aleatorización para mejorar la experimentación y la inferencia.
La aleatorización puede quizá se clarificada en dos o tres formas: enunciando el principio de
aleatorización, describiendo cómo se utiliza en la práctica y demostrando cómo trabaja con objetos
y números. La importancia de esta idea amerita el análisis de las tres.
El principio de aleatorización puede ser enunciado de la siguiente forma: Puesto que en los
procedimientos aleatorios, cada miembros de una población tiene igual oportunidad de ser
seleccionado, los miembros con ciertas características distintivas masculino o femenino, alta o baja
inteligencia, conservador o liberal, etcétera probablemente serán, si son seleccionados, sacados a la
larga por la selección de otros miembros de la población con cantidades o calidades de las
características equilibradoras. Se puede decir que éste en un principio práctico de lo que suele suce-
7
La aleatorización también tiene una razón y un propósito estadísticos. Si la asignación aleatoria ha sido
empleada entonces es posible distinguir entre la varianza sistemática o experimental y la varianza del
error. Las variables sesgadas llamadas por Hays variables “latosas”—son distribuidas a los grupos
experimentales de acuerdo con el azar. Wendel, en una carta a Science (1978,199,p 368), dice que “los
errores sesgados se convierten en errores aleatorios”. Wendel también dice que la función de “igualación” es
secundaria a la función estadística. Hablando en términos estrictos, las pruebas de significancia estadística
que serán analizadas más adelante lógicamente dependen de la asignación aleatoria. Sin ésta, las pruebas de
significancia estadística perderán su fundamento lógico (véase el siguiente pie de página).
8
Véase R. A. Fisher, The Design of Experiments. New York: Hafner, 1951, Cap. II. Este capítulo empieza
con la famosa dama de Fisher, la cual dijo que probando una taza de té ella podría decir si la leche o el té se
puso primero en la taza. Fisher emplea este ejemplo para ilustrar la necesidad e importancia de la
aleatorización. Este capítulo es un fino planteamiento de las condiciones físicas y estadísticas de los
experimentos.
130 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO
der no se puede decir que es una ley de la naturaleza. Es una simple afirmación de lo que sucede
con frecuencia cuando se utilizan procedimientos aleatorios.
Se dice que los sujetos son asignados al azar a los grupos experimentales, en tanto que los
tratamientos experimentales son asignados al azar a los grupos. Por ejemplo, en el caso
mencionado antes sobre un experimento para probar la efectividad del consejo sobre el
rendimientos, los sujetos pueden ser asignados a dos grupos al azar por medio de los números
aleatorios o lanzando al aire una moneda. Cuando los sujetos han sigo asignados, los grupos
pueden ser designados aleatoriamente como experimental y control empleando un procedimiento
similar. Se encontrarán diversos ejemplos de aleatorización a medida que se vaya avanzando.
9
congressional Quaarterly, 1981 (39), pp 920 (no. 121) y 1156 (no. 162).
10
Hewlett- Packard HP-67. Hewlett- Packard HP-67/HP-97: Star pac I, pp. 04-01-04-05. Este programa está
basado en un método descrito en: D. E. Knuth, The Art of Computer Programming, vol. 2. Reading, Mass.:
Addison- Wesley, 1971. En este capítulo, se han utilizado tres diferentes métodos de generas números seudo-
aleatorios (como se les llama con más propiedad): seleccionarlos de una tabla de números aleatorios,
generarlos con una calculadora de bolsillo programable, y producirlos en una computadora grande.
MUESTREO Y ALEATORIZACIÓN 131
Cuadro 8-2- Frecuencias obtenidas y esperadas del partido político (Republicano) en muestras
aleatorias de 20 senadores ª estadounidenses.
Grupos TOTAL
I II III
Obtenida 10 10 10 30
Esperada b 10.60 10.60 10.60 31.80
Desviación 60 60 .60 1.80
ª se manifiesta sólo la mayor de las dos esperanzas de la contienda Republicano-
Demócrata, la republicana (53).
b Las frecuencias esperadas se calcularon de la manera siguiente: 20 x .53 =
10.69. Asimismo, el total es calculado: 60 x .53 = 31.80.
el sentido de que tienen igual número de senadores republicanos y, desde luego, de demócratas.11
Recuérdese que aquí se está haciendo una demostración del muestreo aleatorio y aleatorización,
pero en especial de aleatorización . Por lo tanto, se hace la pregunta de si la asignación aleatoria de
los senadores a los tres grupos ha originado la “igualación” de los grupos en todas las
características. Por supuesto, nunca se podrán probar todas las características; sólo se pueden
probar las disponibles. En este caso sólo se tienen la afiliación al partido político, que ya se probó,
y los votos sobre las propuestas: programas de ayuda para el cuidado de los niños (Propuesta 162) y
reducciones en los beneficios de seguridad social (Propuesta 121). ¿Comó funcionó la asignación
aleatoria con los votos de las dos preguntas? Los resultados se presentan en la tabla 8-3. La
votación original de los 98 senadores en la Propuesta 162. Fue de 46 sí y 52 no. Estos votos totales
produjeron frecuencias esperadas de sí en el grupo total de 46/98 = .47, o 47%. Se espera, por lo
tanto, 20 x .47 = 9.40, o 9 en número redondos en cada grupo experimental. La votación original de
los 97 senadores en la Propuesta 121 fue de 49 sí o 51% (49/97 = .51). Las frecuencias de sí
esperadas por grupo son, entonces, 20 x .51 = 10.20, o 10 en números redondos. Las frecuencias
obtenidas y esperadas, y las desviaciones de las expectativas para los tres grupos de 20 senadores y
para la muestra total de 60 en la Propuesta 121, se presentan también en el cuadro 8-3.
Cuadro 8-3. Frecuencias obtenidas y esperadas de votos a favor de las emisiones 162 y 121
en grupos aleatorios de senadores
Grupos
I II III Total
162 121 162 121 162 121 162 121
Obtenida 8 11 10 10 11 9 29 30
Esperadaª 9 10 9 10 9 10 28 31
Desviación 1 1 1 0 2 1 1 1
ª Las frecuencias esperadas se calcularon para el Grupo I, emisión 162, como sigue: hubo 46
votos afirmativos de un total de 98, o 46/98 = .47; 20 x .47 = 9.40, o redondeado, 9. Para el
grupo total, el cálculo es: 60 x .47 = 28.20, o redondeado, 28.
11
Obtener 10 republicanos – y, por supuesto, 10 demócratas – en cada grupo experimental es poco usual,
pero este es el tipo de resultados “poco usuales” que en ocasiones sucede con el muestreo aleatorio.
132 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO
Es obvio que las desviaciones de las expectativas debidas al azar son todas muy
pequeñas. Evidentemente, los tres grupos son más o menos “iguales” en el sentido de que la
incidencia de los votos en las dos propuestas es casi la misma en cada uno de los grupos. Las
desviaciones de las expectativas de los votos sí (y desde luego de los votos no) debidas al azar son
pequeñas. Como se puede ver, entonces, la aleatorización ha sido “exitosa”.12 Se puede ahora
proceder a realizar el experimento pensando que los tres grupos son “iguales”. Desde luego que
podrían no serlo, pero las probabilidad de que esto suceda son muy bajas. Como se puede ver, el
procedimiento suele funcionar bien. 13 La evaluación de las características de los senadores de los
tres grupos mostró que los grupos eran muy “iguales” en cuanto a la preferencia política y en cuanto
a los votos sí (y no) en las dos propuestas. Así, se puede tener una gran confianza en que si los
grupos son desiguales respecto a las actitudes hacia la prohibición de las pruebas nucleares, las
diferencias probablemente se deban a la manipulación experimental y no a las diferencias previas en
las características de los grupos.
TAMAÑO DE LA MUESTRA
Una regla general y fácil que se enseña a los estudiantes de investigación es: utilice una muestra
tan grande como sea posible. Siempre que se calcula una media, un porcentaje u otro estadístico de
una muestra, se estima un valor de la población. Una pregunta que se debe de hacer es: ¿qué tanto
error es probable que haya en los estadísticos calculados de las muestras de diferentes tamaños? La
curva de la figura 8-1 expresa de manera muy general las relaciones entre el tamaño de la muestra y
el error, visto éste como una desviación de los valores de la población. La curva dice que entre más
pequeña sea la muestra, más grande será el error, y entre más grande sea la muestra, más pequeño
será el error.
Considérese el siguiente, aunque extremo, ejemplo. Las calificaciones totales en lectura y
matemáticas de 327 niños del sexto grado de Eugene, Oregon, en el Metropolitan Achievement Test
(administrado en 1978), junto con el sexo de los alumnos, fueron proporcionadas al autor de este
libro. 14 De esta “población”, 10 muestras de dos alumnos cada uno fueron seleccionadas
aleatoriamente.15 Las calificaciones de estas muestras y sus medias son presentadas en el cuadro 8-
4. También se presentan allí las desviaciones de las medias de las medias de la población.
12
Obtener 10 republicanos – y, por supuesto, 10 demócratas – en cada grupo experimental es poco usual, pero
este es el tipo de resultados “poco usuales” que en ocasiones sucede con el muestreo aleatorio. Esta
demostración puede también ser interpretada como un problema de muestreo aleatorio. Se podría preguntar,
por ejemplo, si las tres muestras de 20 sujetos cada una y la muestra total de 60 son representativas. ¿Reflejan
ellas con exactitud las características de la población de 100 senadores? Por ejemplo, reflejan las muestras las
proporciones de republicanos y demócratas en el senado ? Las proporciones en las muestras fueron .50 y
.50. Las proporciones reales son .53 y .47. Aunque hay una desviación del 3% en las muestras, las
desviaciones están dentro de las expectativas debidas al azar. Se puede decir, por lo tanto, que las muestras
son representativas con respecto a la membresía a un partido político. El mismo razonamiento se aplica a las
muestras y a los votos en las dos propuestas
13
No menos experto que Feller, sin embargo, escribe: “En el muestreo de poblaciones humanas, los
estadísticos encuentran considerables y a menudo impredecibles dificultades, y la amarga experiencia ha
demostrado que es difícil obtener, incluso, una imagen cruda de aleatoriedad”. Feller, op. Cit., p. 29.
14
Estos datos fueron puestos generosamente a disposición por el Dr. Larry Barbey y el Dr. Charles Stephens,
directores de investigación del Distrito Escolar 4-J, Eugene, Oregon. El autor agradece al Dr. Barber, al
Dr. Stehens y al Distrito Escolar 4-J de Eugene la ayuda proporcionada.
15
La selección aleatoria de estas muestras y de otras que pronto serán descritas se realizó en una computadora
grande con un programa para generar números aleatorios entre 1 y 327.
MUESTREO Y ALEATORIZACIÓN 133
Grande
Error
Pequeña
Pequeña Grande
Tamaño de la muestra
Figura 8-1
Cuadro 8-4. Muestras (n =2) de puntuaciones de lectura y matemáticas de 327 niños de sexto
grado, medias de las muestras y desviaciones de las medias de la muestra de la media de
la población ª
Lectura
83 88 88 61 83 82 62 37 74 66
80 60 83 86 67 83 67 84 74 73
Media 81.5 74.0 85.5 73.5 75.0 82.5 64.5 60.5 74.0 69.5
Desv. 12.3 4.83 16.3 4.33 5.83 13.3 - - 4.83 .33
3 3 3 4.67 8.67
Media total (20) = 74.05
Media de la población (327) = 69.17
Matemáticas
110 91 102 69 91 108 56 36 71 50
100 63 95 108 57 88 93 79 62 87
Media 105. 77.0 98.5 88.5 74.0 98.0 59.5 57.5 66.5 68.5
0
Desv. 27.8 -.15 21.3 11.3 - 20.8 - - - -
5 5 5 3.15 5 17.6 19.6 10.6 8.65
5 5 5
Media total (20) = 80.80
Media de la población (327) = 77.15
ªEstos datos y los de la tabla 8-5 están reproducidos con la autorización del Dr. Larry Barber,
Director de Investigación, School District 4-J, Eugene, Oregon.
En lectura las medias, van de 60.5 a 88.5, y en matemáticas van de 57.5 a 105.0. Las dos medias
totales (calculadas de las 20 calificaciones en lectura y las 20 calificaciones en lectura y las 20
calificaciones en matemáticas) son 74.05 y 80.80. Las medias de estas pequeña muestras varían de
modo de modo considerable. Las medias de la población (N = 327) en lectura y aritmética fueron
69.17 y 77.15 a 16.33. Las desviaciones de las medias en lectura tienen un rango bastante grande:
de –8.67 a 16.33. Las desviaciones en matemáticas tienen un rango de –19.65 a 27.85. Con
muestras tan pequeñas como éstas, no se puede depender de ninguna de las medias calculadas de las
20 calificación, aunque ambas tengan un sesgo hacia arriba
134 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO
Cuadro 8-5. Medias y desviaciones de las medias de la población de cuatro muestras de lecturas y
cuatro de matemática, n =20, muestra total, n = 80 y población, N =327, datos de Eugene ª
16
La selección aleatoria de estas muestras y de otras que pronto serán descritas se realizó en una computadora
grande con un programa para generar números aleatorios entre 1 y 327.
MUESTREO Y ALEATORIZACIÓN 135
CLASES DE MUESTRAS
10 es 6, entonces los elementos subsecuentes son 16, 26, 36, etcétera. El estudiante que se adentre
más en el área de investigación debe, por supuesto, tener mayores conocimientos acerca de estos
métodos y consultar una o más de las excelentes referencias sobre el tema.17
La aleatoriedad, la aleatorización y el muestreo aleatorio están entre las grandes ideas de la
ciencia, como se indicó antes. En tanto que es posible hacer investigación sin usar las ideas de
aleatoriedad, es difícil concebir como pueda tener la investigación confiabilidad y validez, al menos
en muchos aspectos de la investigación científica del comportamiento. Las nociones modernas del
diseño de investigación, muestreo e inferencia, por ejemplo, son literalmente inconcebibles sin la
idea de aleatoriedad. Una de las paradojas más famosas es que a través de la aleatoriedad, o
“desorden”, se es capaz de lograr un control sobre las a menudo incontrolables complejidades de los
fenómenos psicológicos, sociológicos y educativos. En pocas palabras se impone orden a través de
explotar el comportamiento conocido de los conjuntos de eventos aleatorios. Uno está siempre
atemorizado por lo que se puede llamar la belleza estructural de la probabilidad, el muestreo y la
teoría del diseño, y por su gran utilidad en la solución de problemas difíciles de diseño y planeación
de investigación y el análisis e interpretación de datos.
Antes de dejar este tema, es necesario regresar a un punto de vista de aleatoriedad mencionado
antes. Para un ser sabio no hay aleatoriedad. Por definición, tal ser “conocería” la ocurrencia de
todos los eventos con una certidumbre absoluta. 18 Como Poicare señaló, apostar con un ser de
estas características sería un fracaso. En realidad no sería una apuesta. Si una moneda fuera
lanzada al aire 10 veces, él predeciría cara o cruz con una obsoluta certidumbre y una completa
exactitud. Si se tiraran los dados sobre la mesa, él conocería infaliblemente los resultados. Incluso
sería capaz de predecir cada uno de los números en una tabla de números aleatorios y, desde luego,
no tendría necesidad de hacer investigación o ciencia. Lo que parece que se está diciendo aquí es
que aleatoriedad es sinónimo de ignorancia. Si uno conociera como el ser sabio, todas las causas o
eventos que producen los fenómenos, no habría aleatoriedad. La belleza de esto, como ya se dijo,
es que esta “ignorancia” es utilizada y convertida en conocimiento. La manera como esto se hace
deberá ser cada vez más evidente a medida que se avance en el estudio.
Se recomienda una diversidad de experimentos con fenómenos al azar: juegos con monedas,
dados, cartas, ruletas y tablas de números aleatorios. Tales juegos, enfocados en forma adecuada
pueden ayudarlo a aprender mucho acerca de las nociones fundamentales de investiga-
17
Una clara exposición de los diferentes tipos de muestro se encuentra en : F. Stepman y McCarthy,
Sampling Opinions. New Yord: Wiley, 1963 (1958), cap. 3. Una excelente descripción de los principios
generales del muestreo, con ejemplos y fórmulas para estimaciones, es: G. Snedecor y W. Cochran,
Statistical Methods, 5ª. Ed. Ames, Iowa: Iowa State University Press, 1967, cap. 17. Aunque los principios
y métodos de este libro, que es una autoridad en el área, están orientados a la biología y la agricultura, pueden
ser aplicados fácilmente a las disciplinas del comportamiento. Otra referencia muy autorizada en este tema
es: L. Kish, “Selection of the Sample”, en L. Festinger y D. Katz, eds., Research Methods in the Behavioral
Sciences. New York: Holt, Rinehart and Wiston, 1953, pp. 175-239. Sobre el muestreo y la estimación,
véase D. Warwick y C. Lininger, The Sample Survey: Theory and Practice. New York: MacGraw-Hill,
1975, cap. 4.
18
Para un elocuente análisis de este tema, véase el ensayo de Poincaré sovre el azar: H. Poincaré, Science
and Meted. New York: Dover, 1952, pp. 64-90.
MUESTREO Y ALEATORIZACIÓN 137
ción científica moderna, estadística, probabilidad y, desde luego, aleatoriedad. Resuelva los
problemas descritos en las preguntas que a continuación se presentan. No se desanime por la
aparente laboriosidad de los ejercicios de esta sección y del resto del libro. Es evidentemente
necesario y, por supuesto, valioso en ocasiones seguir la rutina que implican ciertos
problemas. Después de trabajar en los problemas que aquí se presentan, diseñe algunos para usted
mismo. Si puede diseñar problemas interesantes, es probable que haya entendido el material.
1.De la tabla de números aleatorios selecciones 50, del 0 al 9 (emplee los números aleatorios del
apéndice C si desea). Lístelos en columnas de 10
a) Cuente el total de números nones y el total de números pares. ¿Qué números esperaría
obtener por azar? Compare los totales obtenidos con los totales esperados.
b) Cuente el total de números 0,1,2,3,4. Asimismo, cuente 5,6,7,9. ¿Cuántos del primer grupo
obtendría usted? ¿Cuántos del segundo? Compare lo que obtuvo con las expectativas debidas
al azar. ¿Hay mucha diferencia entre los dos?
c) Cuente los números pares y nones en cada grupo de 10. ¿Hay una gran diferencia entre los
totales y lo esperado con base en el azar?
d) Sume las columnas de los cinco grupos de 10 números. Divida cada suma entre 10 (sólo
mueva el punto decimal un lugar a la izquierda). ¿Qué esperaría usted obtener como media
de cada grupo si sólo el azar estuviera “operando””? ¿Qué obtuvo usted? Sume las cinco
sumas y divida el total entre 50. ¿Es muy cercana esta media a las expectativas debidas al
azar? (Pista: para obtener las expectativas debidas al azar, recuérdense los límites de la
población).
2. Este es un ejercicio y demostración de clase. Asigne de manera arbitraria números a todos
los miembros de la clase, de 1 a N siendo N el número total de miembros de la clase. Tome una
tabla de números aleatorios y empiece con cualquier página. Pida a un estudiante que, con un lápiz
y con lo ojos cerrados, señale la página de la tabla. Empezando con el número que el lápiz indica,
elija n números de dos dígitos entre 1 y N (ignore los números mayores a N y los repetidos) a través
de, por ejemplo recorrer cada columna (o cualquier otra forma especificada). El numerador de la
fracción n/N es n; dicha fracción es decidida por el tamaño de la clase. Si N = 30, por ejemplo, sea
n=10. Repita el proceso dos veces en diferentes páginas de la tabla de números aleatorios. Ahora
tiene tres grupos iguales (si N no es divisible entre 3, deje una o dos personas al azar). Escriba los
números aleatorios en el pizarrón en los tres grupos. Pida a cada miembro de la clase que diga en
voz alta su estatura en centímetros. Escriba estos valores en el pizarrón separados de los números,
pero en los mismos tres grupo. Sume los tres conjuntos de números en cada uno de los conjuntos en
el pizarrón, los números aleatorios y las estaturas. Calcule las medidas de los seis conjuntos de
números. También calcule las medias de los conjuntos totales.
a) ¿Qué tan cercanas están las medias en cada uno de los conjuntos de números? ¿Qué tan
cercanas están las medias de los grupos de la media del grupo total?
b) Cuente los números de los hombres y mujeres en cada uno de los grupos. ¿Están distribuidos
equitativamente los sexos entre los tres grupos?
c) Analice esta demostración ¿Cuál cree usted que sea el significado de ésta para la
investigación?
3. En el capítulo 6, se sugirió que el estudiante generara 20 conjuntos de 100 números aleatorios
y calculara las medias y varianzas. Si usted lo hizo, utilice los números y estadísticas en este
ejercicio. De lo contrario, use los números y estadísticas del Apéndice C que se encuentra al final
del libro.
a) ¿Qué tan cercanas a la media de la población están las medias de las 20 muestras?
¿Hay alguna media que se “desvíe”? (Usted puede juzgar esto calculando las desviación
estándar de las medias, y sumando y restando dos desviaciones estándares de la media total).