Está en la página 1de 17

UNIVERSIDAD NACIONAL ABIERTA

DIRECCIÓN DE INVESTIGACIONES Y POSTGRADO


MAESTRÍA EN EDUCACIÓN ABIERTA Y A DISTANCIA
Epistemología e Investigación
Unidad Curricular: Metodología de la Investigación II

Capítulo 8:
MUESTEO Y
ALEATORIZACIÓN

Kerlinger, F. (1988). Investigación del


Comportamiento. Segunda Edición. México:
Editorial McGraw-Hill.
(compilación con fines instruccionales)
Capítulo 8

MUESTEO Y ALEATORIZACIÓN

Imagínense las muchas situaciones en las cuales se quiere conocer algo acerca de la gente, de los
evento, de las cosas. Para conocer algo acerca de la gente, por ejemplo, se toman algunas personas
conocidas – o desconocidas—y se estudian. Después del “estudio “ se llega a ciertas conclusiones,
a menudo sobre la gente en general. Detrás de la sabiduría popular se puede encontrar algo de
método. Las observaciones basadas en el sentido común acerca de las características de la gente, de
sus motivos y de su comportamiento se derivan, en su mayor parte, de observaciones y experiencias
con relativamente pocas personas. Se hacen afirmaciones como: “la gente en este tiempo no tiene
un sentido de los valores morales”; “los políticos son corruptos”; “ los alumnos de escuelas pública
no están aprendiendo las habilidades académicas básicas.”
Las bases para hacer tales afirmaciones es simple. La gente, en su mayoría a través de su
limitada experiencia, llega a ciertas conclusiones sobre otras personas y sobre su ambiente. Para
llegar a tales conclusiones, deben muestrear las “experiencias” de otras personas. De hecho, ellos
hacen muestras relativamente pequeñas de todas las experiencias posibles. El término
“experiencias” en este texto tiene que tomarse en un sentido amplio. Puede significar experiencia
directa con otras personas – por ejemplo, una interacción directa con alemanes o judíos, o pueden
significar experiencia indirecta: escuchar algo acerca de los alemanes o judíos de sus amigos,
conocidos, padres u otras personas. El hecho de que esta experiencia sea directa o indirecta, sin
embargo, no nos interesa en este nivel del análisis. Supóngase que toda la experiencia sea
directa. Un individual creerá que “conoce” algo acerca de los judíos y dirá que “sabe” que los
judíos son gregarios, porque él ha tenido una experiencia directa con algunos de ellos. Puede
incluso decir: “algunos de mis mejores amigos son judíos y yo sé que...”La idea aquí es que sus
conclusiones están basadas en una muestra de judíos o en una muestra de comportamientos de
judíos, o en ambos. El nunca podrá “conocer” a todos los judíos; debe depender, en el último
análisis, en las muestra. Desde luego que todo el conocimiento del mundo está basado en muestras,
casi todas inadecuadas.
124 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO

MUESTREO, MUESTREO ALEATORIO Y REPRESENTATIVO

El muestreo es tomar una porción de una población o universo como representativa de dicha
población o universo. Esta definición no dice que la muestra tomada – o seleccionada, como dicen
los investigadores--- es representativa. Más bien dice que se tome una porción de la población y se
considere representativa. Cuando un administrador escolar visita algunos salones de clase de su
sistema escolar “para obtener una idea del sistema”, está muestreando algunas clases de todas las
clases de todas las clases del sistema escolar. Probablemente suponga que si visita “al azar”, por
ejemplo de ocho a diez clases de un total de 40, obtendrá una idea clara de la calidad de la
enseñanza que se lleva a cabo en el sistema, o puede visitar dos o tres veces la clase de un solo
maestro para muestrear sus técnicas de enseñanza. El está ahora muestreando los comportamientos,
en este caso los asociados con la enseñanza, del universo de todos los comportamientos posibles del
maestro. Tal muestreo es necesario y legítimo.
El muestreo aleatorio es ese método de seleccionar una porción (o muestra) de una población o
universo que permite que cada miembro de la población o universo tenga la misma oportunidad de
ser seleccionado. Esta definición tiene la virtud de poder ser entendida con facilidad. Por
desgracia, no es totalmente satisfactoria porque es limitada. Una mejor definición es: el muestreo
aleatorio es el método de elegir una porción (o muestra) de una población o universo que permite
que todas las muestras de un tamaño fijo n tengan la misma probabilidad de ser seleccionadas.1 Esta
definición es general y por lo tanto más satisfactoria que la definición propuesta antes.
Definase un universo a ser estudiado, como todos los alumnos de cuarto grado en un sistema
escolar X. Supóngase que hay 200 alumnos, los cuales conforman la población (o universo). Se
selecciona uno de los alumnos al azar de la población total. La probabilidad de ser seleccionado es
de 1/200, si el procedimiento de selección es al azar. Se seleccionan otros alumnos de la misma
forma. Supóngase que después de seleccionar a un alumno, este es egresado (o el símbolo que se le
asignó) a la población. Así, la probabilidad de seleccionar a un segundo alumno es también de
1/200 (si no es regresado a la población, entonces la probabilidad de los alumnos que faltan es,
desde luego, de 1/199. Esto se llama muestreo sin reemplazo. Cuando los elementos muestreados
son regresados a la población después de ser seleccionados, el procedimiento se llama muestreo con
reemplazo).
Supóngase que de la población de los 200 alumnos del cuarto grado en el sistema escolar X se
decide seleccionar una muestra aleatoria de 50 niños. Esto quiere decir si la muestra es al azar, que
todas las muestras posibles de 50 alumnos tienen la misma probabilidad de ser seleccionadas – un
número muy grande de posibles muestras. Para hacer estas ideas un poco más comprensibles,
supóngase que una población consiste en cuatro niños, a, b, c, y d, y se selecciona una muestra
aleatoria de dos niños. Entonces, la lista de todas las posibilidades o espacio de la muestra es: (a,b),
(a,c) (a,d), (b,c), (b,d), (c,d). Hay seis posibilidades. Si la muestra de dos seleccionada al azar,
entonces su probabilidad es de 1/6, ya que cada uno de los pares tiene la misma probabilidad de ser
seleccionado. Este tipo de razonamiento es necesario para resolver muchos problemas de
investigación, pero es usual limitarse a adoptar la idea más simple asociada con la primera
definición. La primera definición, entonces, es un caso especial de la segunda definición general ---
el caso especial en el cal n = 1.

1
W. Feller, An Introduction to Probability Theory and Its Applications, 2ª. Ed. , New York: Wiley, 1957,
p. 29
MUESTREO Y ALEATORIZACIÓN 125

Por desgracia, no es posible jamás estar seguros de que una muestra aleatoria es representativa
de la población de la cual fue seleccionada. Recuérdese que cualquier muestra particular del
tamaño n tiene la misma probabilidad de ser seleccionada que cualquier otra muestra del mismo
tamaño. Por lo tanto, una muestra particular puede no ser representativa de nada. Se debe saber
qué significa “representativa”. Ordinariamente, “representativo” significa que es algo típico de la
población, esto es, que ejemplifica las características de la población. Desde el punto de vista de la
investigación, “representativo” debe ser definido en términos más precisos, aunque es a menudo
difícil de precisar. Es necesario preguntar: ¿de qué características se está hablando? Por lo tanto, en
investigación una “muestra representativa” significa que la muestra tiene aproximadamente las
características de la población relevante para la investigación de que se trate. Si el sexo y el nivel
socioeconómico son variables (características) relevantes para la investigación, una muestra
representativa tendrá aproximadamente la misma proporción de hombres y mujeres y de individuos
de clase media y de clase baja como la población en general. Cuando se selecciona una muestra al
azar, se espera que ésta sea representativa, es decir, que las características relevantes de la población
estarán presentes en la muestra, en casi la misma forma en que están presentes en la población. Sin
embargo, nunca se puede estar seguro; no hay ninguna garantía.
En lo que uno se basa es en el hecho, como Stilson señala, de que las características típicas
(“característico”) de una población son aquéllas más frecuentes y por lo tanto más probables de
estar presentes en cualquier muestra aleatoria.2 Cuando el muestreo es aleatorio, la variabilidad del
muestreo es predictible. Se vio en el capítulo 7, por ejemplo, que si se lanzan dos dados varias
veces, la probabilidad de que salga un 7 es mayor que la probabilidad de obtener un 12. (Véase
cuadro 7-1).
Una muestra seleccionada al azar no es sesgada en el sentido de que ningún miembro de la
población tiene más oportunidad de ser seleccionado que cualquier otro. Se tiene aquí una
democracia en la cual todos los miembros son iguales ante el cuerpo de selección. En lugar de usar
monedas o dados, úsese un ejemplo de investigación para ilustrar este problema. Supóngase que se
tiene una población de 100 niños. Los niños difieren en inteligencia, una variable relevante para
esta investigación. Se quiere conocer la inteligencia media de la población, pero por alguna razón
sólo se puede obtener una muestra de 30 de los 100 niños. Si se selecciona una muestra
aleatoriamente, hay un gran número de posibles muestras de 30 niños. Las muestras tienen la
misma probabilidad de ser seleccionadas. Las medias de la mayor parte de las muestras será
relativamente parecida a la media de la población. Pocas de ellas no serán parecidas. La
probabilidad de seleccionar una muestra con una media cercana a la media de la población,
entonces, es mayor que la probabilidad de seleccionar una muestra con la media no tan cercana a la
medida de la población – si el muestreo ha sido aleatorio.
Sin embargo, si no se selecciona una muestra al azar, algún factor o factores desconocidos nos
pueden predisponer a seleccionar una muestra sesgada, en este caso quizás una de las muestras con
una media no tan cercana a la de la población. La inteligencia media de esta muestra será una
estimación sesgada de la media de la población. Si se conociera a los 100 niños, se podría
inconscientemente seleccionar a los más inteligentes. No es tanto que uno haría eso, sino que el
método permitiría hacerlo. Los métodos aleatorios de selección no permiten que los propios sesgos

2
D. Stilson Probability and Statostocs in Psychological Research and Theory. San Francisco Holden –
Day 1966, p. 35
126 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO

u hacerlo otros factores sistemáticos de selección operen. El procedimiento es objetivo, ya que es


ajeno a los propios sesgos y predilecciones.
El lector puede estar experimentando un sentido de inconformidad vaga y perturbadora. Si no se
puede estar seguro de que las muestras aleatorias son representativas, ¿cómo se puede tener
confianza en los resultados de la investigación y en su aplicabilidad a las poblaciones de donde se
seleccionaron las muestras? ¿Por qué no seleccionar sistemáticamente las muestras, de manera que
sean representativas? La respuesta es compleja. Primero –(y de nuevo), no se puede estar
seguro. Segundo, en las muestras aleatorias son más probables de incluir las características típicas
de la población si son frecuentes en ésta. En la investigación real, se seleccionan muestras
aleatorias cuando se puede, se espera y se supone que las muestras son representativas. Uno
aprende a vivir con incertidumbre, pero trata reducirla siempre que se puede—así como se hace en
la vida diaria, pero más sistemáticamente y con considerable conocimiento y experiencia respecto al
muestreo y a los resultados aleatorios. Por fortuna, la falta de certidumbre no impide que la
investigación funcione.

ALEATORIEDAD

La noción de aleatoriedad es el centro de los métodos probabilísticos modernos en las ciencias


naturales y del comportamiento pero es difícil definir “aleatorio” o “azar”. La noción del
diccionario de casual, accidental, sin objetivo ni dirección, no ayuda mucho. De hecho, los
científicos son muy sistemáticos acerca de la aleatoriedad; seleccionan cuidadosamente muestras
aleatorias y planean procedimientos aleatorios.
Se puede adoptar la posición de que nada sucede al azar, que para todo evento hay una causa. La
única razón que esta posición puede sustentar, de utilizar la palabra “aleatorio” es que los seres
humanos no conocen lo suficiente. Para la sabiduría nada es aleatorio. Supóngase que un ser con
mucha sabiduría tiene un periódico con un extenso conocimiento. Este es un periódico gigantesco
en el cual cada evento es narrado hasta el último detalle – para mañana, el día siguiente y el
siguiente, y así indefinidamente – y está cuidadosamente incluido.3 No hay nada desconocido y,
desde luego, no hay nada de aleatoriedad. La aleatoriedad es ignorancia desde este punto de vista.
De acuerdo con este argumento, la aleatoriedad ha sido definida en una forma poco usual. Se dice
que los eventos son aleatorios si sus resultados no se pueden predecir. Por ejemplo, no hay una
forma conocida de ganar un volado con una moneda. Cuando no hay un sistema para jugar un
juego que asegure el ganarlo (o perderlo), entonces los resultados y los eventos del juego son
aleatorios. Dicho formalmente, aleatoriedad significa que no hay una ley conocida, capaz de ser
expresada en un lenguaje coherente, que correctamente describa o explique los eventos y sus
resultados de manera correcta. 4 En otras palabras, cuando los eventos son aleatorios, no se pueden
predecir en forma individual. Es extraño decir, sin embargo, que se pueden predecir en forma
individual. Es extraño decir, sin embargo, que se pueden predecir con mucho éxito en
conjunto. Esto es, se puede predecir el resultado de un gran número de eventos. No se puede
predecir si una moneda lanzada al aire va a ser

3
Véase J. Kemeny, A Philosopher Looks al Science, New York: Van Nostrand Reinhold, 1959, p-39.
4
Ibid., pp. 68-75.
MUESTREO Y ALEATORIZACIÓN 127

cara o cruz, pero si se lanza la moneda al aire 1000 veces, se puede predecir, con considerable
exactitud, el total de veces de caras y cruces.

Un ejemplo de muestreo aleatorio

Para dar al lector una idea de aleatoriedad y muestras aleatoria, se hará una demostración
utilizando una tabla de números aleatorios. Esta tabla contiene números generados mecánicamente
de manera que no hay un orden perceptible ni un sistema en ellos. Se dijo antes que si los eventos
son aleatorios no se pueden predecir, pero ahora se hará la predicción de la naturaleza general de los
resultados de un experimento. Se han seleccionado, de una tabla de dígitos aleatorios, 10 muestras
de 10 dígitos cada una. Como los números son aleatorios, cada muestra “debería” ser representativa
del universo de dígitos. El universo puede ser definido de varias formas. Aquí se ha definido como
un conjunto completo de dígitos en la tabla de números aleatorios de la Corporación Reand. 5
Ahora se selecciona muestras de la tabla. Las medias de las 10 muestras serán, desde luego,
diferentes, aunque deberían fluctuar dentro de un rango relativamente restringido, con la mayor
parte de ellas muy cercanas a la media de los 100 números y a la media teórica de la población total
de números aleatorios. La cantidad de números pares en cada muestra de 10 debería ser
aproximadamente igual a la cantidad de números nones – aunque de nuevo habrá fluctuaciones
algunas de ellas quizás extremas, pero en su mayor parte serán modestas. Las muestras son
presentadas en el cuadro 8-1.

Cuadro 8.1 . Diez muestras de números aleatorios


1 2 3 4 5 6 7 8 9 10
9 0 8 0 4 6 0 7 7 8
7 2 7 4 9 4 7 8 7 7
6 2 8 1 9 3 6 0 3 9
7 9 9 1 6 4 9 4 7 7
3 3 1 1 4 1 0 3 9 4
8 9 2 1 3 9 6 7 7 3
4 8 3 0 9 2 7 2 3 2
1 4 3 0 0 2 6 9 7 5
3 1 8 8 4 5 2 1 0 3
2 1 4 8 9 2 9 3 0 1
Med 5.0 3.9 5.3 2.4 5.7 3.8 5.2 4.4 5.0 4.9 Media tolal =
ia 4.56

Las medias de las muestras se presentan debajo de cada una de ellas. La media de U, media teórica
de toda la población de números aleatorios de la Corporación Rand, (0,1,2,3,4,5,6,7,8,9), es 4.5. La
media de los 100 números que puede ser considerada una muestra de U, es 4.56. Esta es, desde
luego, muy cercana a la media de U. Se puede observar que las medias de las 10 muestras varían
alrededor de 4.5,

5
La fuente de donde se tomaron estos números aleatorios fue: Rand Corporation, A Million Random Digits
with 100000 Normal Deviates. Nueva York: Free Press, 1955. Esta es una extensa tabla de números
aleatoros constituida cuidadosamente. Sin embargo, hay muchas más tablas de este tipo, que son los
suficientemente buenas para propósitos prácticos. Los textos modernos de estadística tienen tales tablas. El
Apéndice C al final de este libro contiene una tabla de 4000 números aleatorios generados por computadora
128 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO

siendo 2.4 la más baja, y 5.7 la más alta. Sólo dos de dichas medias difieren de 4.5 en más de
1. Una prueba estadística (más adelante se analizará la razón de tales pruebas) muestra que las 10
medias no difieren significativamente entre sí, (la expresión “no difieren significativamente entre
sí” significa que las diferencias no son más grandes que las diferencias que ocurrirían por
azar). Mediante otra prueba estadística, nueve de esas medias son “buenas” estimaciones de la
media de la población de 4.5 y sólo una (2.4) no lo es.

Cambiando el problema de muestreo, se puede definir el universo en términos de números pares


y nones. Supóngase que en el universo hay cantidad igual de dichos números. En la muestra de
100 números, debería haber aproximadamente 50 números pares y 50 nones. Sin embargo, en
realidad hay 54 números nones y 46 pares. Una prueba estadística muestra que la desviación de 4
para los números nones y de 4 para los pares no se aparta en forma significativa de lo que se espera
del azar. 6

De la misma manera, si se elige una muestra de seres humanos, el número de hombres y mujeres
de la muestra debería estar aproximadamente en proporción a los números de hombres y mujeres de
la población --- si el muestreo es aleatorio y las muestras son lo suficientemente grandes. Si se
mide la inteligencia de una muestra y la media de la calificación de inteligencia es de 100, entonces
la media de la muestra debería estar cerca de 100. Desde luego, se debe tener en mente la
posibilidad de selección de una muestra desviada, por ejemplo la muestra con una media de 80 o
menos, o 120 o más. Las muestras desviadas ocurren, pero es poco probable que ocurran. La razón
es similar a la de las demostraciones del volado con la moneda. Si se lanza al aire una moneda tres
veces, es menos probable que se obtengan tres caras o tres cruces águilas que dos caras soles y una
cruz o dos cruces y una cruz, porque U = (HHH, HHT, HTT, THH, TTH, TTT). Hay sólo un punto
con HHH y uno con TTT, mientras que hay tres puntos con dos H y tres con dos T.

ALEATORIZACIÓN

Supóngase que un investigador desea probar la hipótesis de que el consejo ayuda a los alumnos
con bajo rendimiento. El quiere seleccionar dos grupos de alumnos con bajo rendimiento, uno de
ellos será aconsejado y el otro no. Por supuesto también desea que los dos grupos sean iguales en
otras variables independientes que pudieran tener un posible efecto en el rendimiento. Una forma
de hacer esto es asignar a los niños aleatoriamente a ambos grupos a través de, por ejemplo, un
volado con una moneda para cada niño y colocando al niño en un grupo si el resultado del volado es
cara y al otro grupo si el resultado es cruz. (Nótese que si él tuviera tres grupos experimentales,
probablemente no usaría el volado; podría utilizar un dado.) El investigador puede emplear una
tabla de números aleatorios y asignar a los niños como sigue: si se obtiene un número non, asigna al
niño a un grupo y se obtiene uno par, asigna al niño a otro grupo. Ahora puede suponer que los
grupos son aproximadamente iguales en todas las posibles variables independientes. Entre más
grande sea el grupo, más segura es la suposición que se hace. Sin embargo, así como no hay una
garantía de no seleccionar una muestra desviada, como se comentó antes, tampoco hay una garantía
de que los grupos sean iguales o incluso aproximadamente iguales

6
La naturaleza de tales pruebas estadísticas, así como las razones que las fundamentan, serán explicadas con
detalles en la Parte cuatro. El estudiante, a este nivel, no debería estar muy preocupado si no domina
completamente las ideas estadísticas expresadas aquí. En realidad, uno de los propósitos de este capítulo es
presentar algunos de los elementos básicos de tales ideas.
MUESTREO Y ALEATORIZACIÓN 129

en todas las posibles variables independientes. Sin embargo, se puede decir que un investigador ha
empleado la aleatorización para igualar sus grupos o, como se dijo, para controlar las influencias
sobre la variable dependiente de otras variables que no son las variables independientes
manipuladas.
Un experimento “ideal” es aquel en el cual todos los factores o variables que probablemente
pueden afectar el resultado experimental son controlados. Si se conocieran todos los factores, en
primer lugar, y se pudieran controlar, en segundo lugar, sería posible tener un experimento ideal,
pero el caso triste es que uno nunca puede conocer todas las variables pertinentes ni controlarlas
aunque no las conozca. Sin embargo, la aleatorización ayuda.
La aleatorización es la asignación de miembros de un universo a los tratamientos experimentales
de manera que, para cualquier asignación a un tratamiento, cada miembro el universo tenga una
probabilidad igual de ser elegido para dicha asignación. El propósito básico de la asignación
aleatoria, como se indicó antes, es colocar sujetos (objetos, grupos) a tratamientos de tal forma que
los individuos con diferentes características sean colocados aproximadamente igual entre los
tratamientos a fin de que las variables diferentes a las variables independientes, que podrían afectar
la variable dependiente, tenga efectos “iguales “ en diferentes tratamientos.7 No hay garantía de que
este deseable nivel será alcanzado, pero es más probable que sea alcanzado con la aleatorización
que con otro método. La idea de la aleatorización parece haber sido descubierta o inventada por Sir
Ronald Fisher, quien de hecho revolucionó el pensamiento y los métodos estadísticos y
experimentales usando las ideas de aleatorización como parte de sus herramientas. 8 De cualquier
forma, la aleatorización, y lo que puede llamarse principio de aleatorización, es uno de los grandes
logros de nuestro tiempo. No es posible despreciar la importancia de las medidas prácticas e ideas
derivadas de la aleatorización para mejorar la experimentación y la inferencia.
La aleatorización puede quizá se clarificada en dos o tres formas: enunciando el principio de
aleatorización, describiendo cómo se utiliza en la práctica y demostrando cómo trabaja con objetos
y números. La importancia de esta idea amerita el análisis de las tres.
El principio de aleatorización puede ser enunciado de la siguiente forma: Puesto que en los
procedimientos aleatorios, cada miembros de una población tiene igual oportunidad de ser
seleccionado, los miembros con ciertas características distintivas masculino o femenino, alta o baja
inteligencia, conservador o liberal, etcétera probablemente serán, si son seleccionados, sacados a la
larga por la selección de otros miembros de la población con cantidades o calidades de las
características equilibradoras. Se puede decir que éste en un principio práctico de lo que suele suce-

7
La aleatorización también tiene una razón y un propósito estadísticos. Si la asignación aleatoria ha sido
empleada entonces es posible distinguir entre la varianza sistemática o experimental y la varianza del
error. Las variables sesgadas llamadas por Hays variables “latosas”—son distribuidas a los grupos
experimentales de acuerdo con el azar. Wendel, en una carta a Science (1978,199,p 368), dice que “los
errores sesgados se convierten en errores aleatorios”. Wendel también dice que la función de “igualación” es
secundaria a la función estadística. Hablando en términos estrictos, las pruebas de significancia estadística
que serán analizadas más adelante lógicamente dependen de la asignación aleatoria. Sin ésta, las pruebas de
significancia estadística perderán su fundamento lógico (véase el siguiente pie de página).
8
Véase R. A. Fisher, The Design of Experiments. New York: Hafner, 1951, Cap. II. Este capítulo empieza
con la famosa dama de Fisher, la cual dijo que probando una taza de té ella podría decir si la leche o el té se
puso primero en la taza. Fisher emplea este ejemplo para ilustrar la necesidad e importancia de la
aleatorización. Este capítulo es un fino planteamiento de las condiciones físicas y estadísticas de los
experimentos.
130 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO

der no se puede decir que es una ley de la naturaleza. Es una simple afirmación de lo que sucede
con frecuencia cuando se utilizan procedimientos aleatorios.
Se dice que los sujetos son asignados al azar a los grupos experimentales, en tanto que los
tratamientos experimentales son asignados al azar a los grupos. Por ejemplo, en el caso
mencionado antes sobre un experimento para probar la efectividad del consejo sobre el
rendimientos, los sujetos pueden ser asignados a dos grupos al azar por medio de los números
aleatorios o lanzando al aire una moneda. Cuando los sujetos han sigo asignados, los grupos
pueden ser designados aleatoriamente como experimental y control empleando un procedimiento
similar. Se encontrarán diversos ejemplos de aleatorización a medida que se vaya avanzando.

Demostración de una aleatorización senatorial

Para mostrar cómo, si no es por qué, trabaja el principio de aleatorización, se hizo un


experimentos de muestreo y diseño. Se tiene una población de 100 miembros del Senado de
Estados Unidos de Norteamérica, de donde se puede seleccionar una muestra. En esta población
(en 1981), hay 53 republicanos y 47 demócratas. Se han seleccionado dos votos importantes, uno
sobre los programas de ayuda a los niños (Propuesta 162) y a otras personas, y el otro sobre un
propuesta de reducción de los beneficios de seguridad social (Propuesta 121). 9 Mientras que estos
votos son importantes pues cada uno de ellos refleja propuestas presidenciales, con un No en la 162
y un Sí en la 121 indicando un apoyo al presidente, aquí se ignora la sustancia y el tratamiento de
los votos reales, o más aún, a los senadores que votaron, como poblaciones de donde se seleccionó
la muestra.
Se pretende, en este ejemplo, realizar un experimento usando tres grupos con 20 senadores en
cada uno. La naturaleza del experimento no es tan relevante aquí, pero éste quiere probar la eficacia
de la película sobre los horrores de una guerra nuclear en cambiar las actitudes de los senadores
hacia la prohibición de pruebas nucleares. Se quiere que los tres grupos de senadores sean más o
menos iguales en todas las características posibles. Por medio de una computadora- calculadora
programable, se generaron números aleatorios entre 1 y 100. 10Los primeros 60 números
seleccionados, con números no repetidos (muestreo sin reemplazo), fueron colocados en grupos de
20 cada uno. La afiliación al partido político: 1 = republicano, 0 = demócrata, y los votos de los
senadores en las dos propuestas: 1 = sí y 0 = no, fueron observadas en cada uno de los grupos.
¿Qué tan “iguales” son los grupos? En la población total de 100 senadores, 53 son republicanos y
47 demócratas, o 53% y 47%. En la muestra total de 60 hay 30 republicanos y 30 demócratas, o
50% de cada partido, una diferencia de 3% de las expectativas de 53% y de 47%. Las frecuencias
obtenidas y esperadas de los republicanos en los tres grupos y en la muestra total se presentan en el
cuadro 8-2. Las desviaciones de lo esperado son obviamente pequeñas. Los tres grupos son
“iguales” en

9
congressional Quaarterly, 1981 (39), pp 920 (no. 121) y 1156 (no. 162).
10
Hewlett- Packard HP-67. Hewlett- Packard HP-67/HP-97: Star pac I, pp. 04-01-04-05. Este programa está
basado en un método descrito en: D. E. Knuth, The Art of Computer Programming, vol. 2. Reading, Mass.:
Addison- Wesley, 1971. En este capítulo, se han utilizado tres diferentes métodos de generas números seudo-
aleatorios (como se les llama con más propiedad): seleccionarlos de una tabla de números aleatorios,
generarlos con una calculadora de bolsillo programable, y producirlos en una computadora grande.
MUESTREO Y ALEATORIZACIÓN 131

Cuadro 8-2- Frecuencias obtenidas y esperadas del partido político (Republicano) en muestras
aleatorias de 20 senadores ª estadounidenses.

Grupos TOTAL
I II III
Obtenida 10 10 10 30
Esperada b 10.60 10.60 10.60 31.80
Desviación 60 60 .60 1.80
ª se manifiesta sólo la mayor de las dos esperanzas de la contienda Republicano-
Demócrata, la republicana (53).
b Las frecuencias esperadas se calcularon de la manera siguiente: 20 x .53 =
10.69. Asimismo, el total es calculado: 60 x .53 = 31.80.

el sentido de que tienen igual número de senadores republicanos y, desde luego, de demócratas.11
Recuérdese que aquí se está haciendo una demostración del muestreo aleatorio y aleatorización,
pero en especial de aleatorización . Por lo tanto, se hace la pregunta de si la asignación aleatoria de
los senadores a los tres grupos ha originado la “igualación” de los grupos en todas las
características. Por supuesto, nunca se podrán probar todas las características; sólo se pueden
probar las disponibles. En este caso sólo se tienen la afiliación al partido político, que ya se probó,
y los votos sobre las propuestas: programas de ayuda para el cuidado de los niños (Propuesta 162) y
reducciones en los beneficios de seguridad social (Propuesta 121). ¿Comó funcionó la asignación
aleatoria con los votos de las dos preguntas? Los resultados se presentan en la tabla 8-3. La
votación original de los 98 senadores en la Propuesta 162. Fue de 46 sí y 52 no. Estos votos totales
produjeron frecuencias esperadas de sí en el grupo total de 46/98 = .47, o 47%. Se espera, por lo
tanto, 20 x .47 = 9.40, o 9 en número redondos en cada grupo experimental. La votación original de
los 97 senadores en la Propuesta 121 fue de 49 sí o 51% (49/97 = .51). Las frecuencias de sí
esperadas por grupo son, entonces, 20 x .51 = 10.20, o 10 en números redondos. Las frecuencias
obtenidas y esperadas, y las desviaciones de las expectativas para los tres grupos de 20 senadores y
para la muestra total de 60 en la Propuesta 121, se presentan también en el cuadro 8-3.

Cuadro 8-3. Frecuencias obtenidas y esperadas de votos a favor de las emisiones 162 y 121
en grupos aleatorios de senadores

Grupos
I II III Total
162 121 162 121 162 121 162 121
Obtenida 8 11 10 10 11 9 29 30
Esperadaª 9 10 9 10 9 10 28 31
Desviación 1 1 1 0 2 1 1 1
ª Las frecuencias esperadas se calcularon para el Grupo I, emisión 162, como sigue: hubo 46
votos afirmativos de un total de 98, o 46/98 = .47; 20 x .47 = 9.40, o redondeado, 9. Para el
grupo total, el cálculo es: 60 x .47 = 28.20, o redondeado, 28.

11
Obtener 10 republicanos – y, por supuesto, 10 demócratas – en cada grupo experimental es poco usual,
pero este es el tipo de resultados “poco usuales” que en ocasiones sucede con el muestreo aleatorio.
132 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO

Es obvio que las desviaciones de las expectativas debidas al azar son todas muy
pequeñas. Evidentemente, los tres grupos son más o menos “iguales” en el sentido de que la
incidencia de los votos en las dos propuestas es casi la misma en cada uno de los grupos. Las
desviaciones de las expectativas de los votos sí (y desde luego de los votos no) debidas al azar son
pequeñas. Como se puede ver, entonces, la aleatorización ha sido “exitosa”.12 Se puede ahora
proceder a realizar el experimento pensando que los tres grupos son “iguales”. Desde luego que
podrían no serlo, pero las probabilidad de que esto suceda son muy bajas. Como se puede ver, el
procedimiento suele funcionar bien. 13 La evaluación de las características de los senadores de los
tres grupos mostró que los grupos eran muy “iguales” en cuanto a la preferencia política y en cuanto
a los votos sí (y no) en las dos propuestas. Así, se puede tener una gran confianza en que si los
grupos son desiguales respecto a las actitudes hacia la prohibición de las pruebas nucleares, las
diferencias probablemente se deban a la manipulación experimental y no a las diferencias previas en
las características de los grupos.

TAMAÑO DE LA MUESTRA

Una regla general y fácil que se enseña a los estudiantes de investigación es: utilice una muestra
tan grande como sea posible. Siempre que se calcula una media, un porcentaje u otro estadístico de
una muestra, se estima un valor de la población. Una pregunta que se debe de hacer es: ¿qué tanto
error es probable que haya en los estadísticos calculados de las muestras de diferentes tamaños? La
curva de la figura 8-1 expresa de manera muy general las relaciones entre el tamaño de la muestra y
el error, visto éste como una desviación de los valores de la población. La curva dice que entre más
pequeña sea la muestra, más grande será el error, y entre más grande sea la muestra, más pequeño
será el error.
Considérese el siguiente, aunque extremo, ejemplo. Las calificaciones totales en lectura y
matemáticas de 327 niños del sexto grado de Eugene, Oregon, en el Metropolitan Achievement Test
(administrado en 1978), junto con el sexo de los alumnos, fueron proporcionadas al autor de este
libro. 14 De esta “población”, 10 muestras de dos alumnos cada uno fueron seleccionadas
aleatoriamente.15 Las calificaciones de estas muestras y sus medias son presentadas en el cuadro 8-
4. También se presentan allí las desviaciones de las medias de las medias de la población.

12
Obtener 10 republicanos – y, por supuesto, 10 demócratas – en cada grupo experimental es poco usual, pero
este es el tipo de resultados “poco usuales” que en ocasiones sucede con el muestreo aleatorio. Esta
demostración puede también ser interpretada como un problema de muestreo aleatorio. Se podría preguntar,
por ejemplo, si las tres muestras de 20 sujetos cada una y la muestra total de 60 son representativas. ¿Reflejan
ellas con exactitud las características de la población de 100 senadores? Por ejemplo, reflejan las muestras las
proporciones de republicanos y demócratas en el senado ? Las proporciones en las muestras fueron .50 y
.50. Las proporciones reales son .53 y .47. Aunque hay una desviación del 3% en las muestras, las
desviaciones están dentro de las expectativas debidas al azar. Se puede decir, por lo tanto, que las muestras
son representativas con respecto a la membresía a un partido político. El mismo razonamiento se aplica a las
muestras y a los votos en las dos propuestas
13
No menos experto que Feller, sin embargo, escribe: “En el muestreo de poblaciones humanas, los
estadísticos encuentran considerables y a menudo impredecibles dificultades, y la amarga experiencia ha
demostrado que es difícil obtener, incluso, una imagen cruda de aleatoriedad”. Feller, op. Cit., p. 29.
14
Estos datos fueron puestos generosamente a disposición por el Dr. Larry Barbey y el Dr. Charles Stephens,
directores de investigación del Distrito Escolar 4-J, Eugene, Oregon. El autor agradece al Dr. Barber, al
Dr. Stehens y al Distrito Escolar 4-J de Eugene la ayuda proporcionada.
15
La selección aleatoria de estas muestras y de otras que pronto serán descritas se realizó en una computadora
grande con un programa para generar números aleatorios entre 1 y 327.
MUESTREO Y ALEATORIZACIÓN 133

Grande

Error

Pequeña

Pequeña Grande
Tamaño de la muestra
Figura 8-1

Cuadro 8-4. Muestras (n =2) de puntuaciones de lectura y matemáticas de 327 niños de sexto
grado, medias de las muestras y desviaciones de las medias de la muestra de la media de
la población ª

Lectura
83 88 88 61 83 82 62 37 74 66
80 60 83 86 67 83 67 84 74 73
Media 81.5 74.0 85.5 73.5 75.0 82.5 64.5 60.5 74.0 69.5
Desv. 12.3 4.83 16.3 4.33 5.83 13.3 - - 4.83 .33
3 3 3 4.67 8.67
Media total (20) = 74.05
Media de la población (327) = 69.17
Matemáticas
110 91 102 69 91 108 56 36 71 50
100 63 95 108 57 88 93 79 62 87
Media 105. 77.0 98.5 88.5 74.0 98.0 59.5 57.5 66.5 68.5
0
Desv. 27.8 -.15 21.3 11.3 - 20.8 - - - -
5 5 5 3.15 5 17.6 19.6 10.6 8.65
5 5 5
Media total (20) = 80.80
Media de la población (327) = 77.15

ªEstos datos y los de la tabla 8-5 están reproducidos con la autorización del Dr. Larry Barber,
Director de Investigación, School District 4-J, Eugene, Oregon.
En lectura las medias, van de 60.5 a 88.5, y en matemáticas van de 57.5 a 105.0. Las dos medias
totales (calculadas de las 20 calificaciones en lectura y las 20 calificaciones en lectura y las 20
calificaciones en matemáticas) son 74.05 y 80.80. Las medias de estas pequeña muestras varían de
modo de modo considerable. Las medias de la población (N = 327) en lectura y aritmética fueron
69.17 y 77.15 a 16.33. Las desviaciones de las medias en lectura tienen un rango bastante grande:
de –8.67 a 16.33. Las desviaciones en matemáticas tienen un rango de –19.65 a 27.85. Con
muestras tan pequeñas como éstas, no se puede depender de ninguna de las medias calculadas de las
20 calificación, aunque ambas tengan un sesgo hacia arriba
134 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO

Cuadro 8-5. Medias y desviaciones de las medias de la población de cuatro muestras de lecturas y
cuatro de matemática, n =20, muestra total, n = 80 y población, N =327, datos de Eugene ª

Muestras (n = 20) Total (n


=80) Población (N = 327)
Lectura 70.65 74.05 67.80 67.15 69.9 69.17
1
Desv. 1.48 4.88 -1.37 -2.02 .74
Matemátic 78.35 78.70 75.60 76.9 77.15
as 75.15 5
Desv. -2.00 1.20 -1.55 -1.55 -.20
ª véase la nota de pie de la tabla 8-4.

Se seleccionaron de la población cuatro muestras aleatorias más de 20 calificaciones en lectura y


20 calificaciones en matemáticas. Las desviaciones (Desv.) de cada una de las medias de las
muestras de 20 de las medias de la población también son presentadas en la tabla, así como las
medias de la muestra de 80 y de la población total. Las desviaciones en lectura tienen un rango de –
2.02 a 4.88 y las desviaciones en matemáticas, de –2.00 a1.55. La media de las 80 calificaciones en
lectura es 69.91 y la de las 327 calificaciones en lectura es 69.17. Las medias comparables en
matemáticas son 76.95 (n = 80) y 77.15 (N = 327). Es evidente que estas medias son mejores
estimaciones de las medias de la población.
Ahora es posible hacer algunas conclusiones. Primero, teniendo otras cosas iguales, los
estadísticos calculados a partir de muestras grandes son más exactos que los calculados de muestras
pequeñas. Un vistazo a las desviaciones de los cuadros 8-4 y 8-5 mostrará que las medias de 20 se
desvían menos de la media de la población que las medias de las muestras de 2. Además, las
medias de las muestras de 80 se desvían muy poco de las medias de la población (.74 y -.20).
Ahora debe ser muy claro por qué el principio de investigación y muestreo es utilizar muestras
grandes.16 Las muestras grandes son empleadas no porque los números grandes sean buenos en sí y
para sí, sino a fin de dar al principio de aleatorización, o simplemente aleatoriedad, una oportunidad
de “trabajar”, hablando un poco antropomórficamente. Con muestras pequeñas, la probabilidad de
seleccionar muestras desviadas es mayor que con muestras grandes. Por ejemplo, en una muestra
aleatoria de 20 senadores seleccionada hace algunos años, los primeros 10 (de 20) eran
demócratas. Obtener 10 demócratas seguidos es muy poco usual, pero puede ser y a veces
sucede. Si se hubiera decidido hacer un experimento con sólo dos grupos de 10 cada uno, y uno de
los grupos fuera el que tuviera los 10 demócratas y el otro tuviera demócratas y republicanos, los
resultados podrían haber estado seriamente sesgados, sobre todo si el experimento está relacionado
con preferencias políticas o actitudes sociales. Con grandes grupos, por ejemplo 30 o más, hay
poco peligro.

16
La selección aleatoria de estas muestras y de otras que pronto serán descritas se realizó en una computadora
grande con un programa para generar números aleatorios entre 1 y 327.
MUESTREO Y ALEATORIZACIÓN 135

CLASES DE MUESTRAS

Hasta ahora, el análisis de muestreo se ha centrado en el muestreo aleatorio simple, El propósito


es ayudar al estudiante a entender los principios fundamentales; así, se destaca la idea del muestreo
aleatorio simple, la cual sostiene mucho del pensamiento y procedimiento de la investigación
moderna. Sin embargo, el estudiante debe darse cuenta de que el muestreo aleatorio no es la única
clase de muestreo que se emplea en la investigación del comportamiento. En realidad, es
relativamente poco común, al menos para describir las características de las poblaciones y las
relaciones entre dichas características. Sin embargo, constituye el modelo en el cual todo el
muestreo científico descansa.
Las otras clases de muestreo pueden clasificarse ampliamente en muestras probabilísticas y no
probabilísticas ( y otras formas mixtas). Las muestras probabilísticas utilizan alguna forma de
muestreo aleatorio en una o más de sus etapas. Las muestras no probabilísticas no emplean el
muestreo aleatorio; por ello, les faltan las virtudes que se han analizado antes. Sin embargo son a
menudo necesarias e inevitables. Sus debilidades pueden ser reducidas a través del conocimiento,
la experiencia y el cuidado en la selección de muestras y mediante la repetición de estudios en
diferentes muestras.
Una de las formas del muestreo no probabilístico es el muestreo por cuota, en el cual el
conocimiento de los estratos de la población – sexo, raza, región, entre otras- es usado para
seleccionar los miembros de la muestra que son representativos, “típicos” y acordes con ciertos
propósitos de investigación. El muestreo por cuota deriva su nombre de la práctica de asignar
cuotas, o proporciones de clases de personas, a entrevistadores. Tal muestreo ha sido muy utilizado
en las encuestas de opiniones. Otro tipo de muestreo no probabilístico es el muestreo intencional,
que se caracteriza por el uso de juicios y por un esfuerzo deliberado de obtener muestras
representativas, incluyendo áreas o grupos supuestamente típicos de la muestra. El llamado
muestreo “accidental”, el más débil de todos, es también el más frecuente. En efecto, uno toma las
muestras que se tienen a la mano: grupos de alumnos del último año de preparatoria, grupos de
estudiantes del segundo año de la universidad, un grupo de la asociación de padres de familia y así
por el estilo. Sin embargo, esta práctica es difícil de sostener. Aunque, si se emplea con cuidado y
conocimiento de lo que se hace, este muestreo no es tan malo como se dice. El consejo más
conveniente parece ser: evitar las muestras accidentales a menos que no se puedan obtener otras (las
muestras aleatorias suelen ser muy caras, y en general, muy difíciles de realizar) y, si se utilizan, es
necesario adoptar una actitud crítica al analizar e interpretar los datos.
El muestreo probabilístico incluye una variedad de formas. Las más generales son el muestreo
estratificado y el de grupos. En el muestreo estratificado, la población es dividida en estratos, por
ejemplo como hombres y mujeres, negros y blancos, etc. De donde se seleccionan muestras
aleatorias. El muestreo de grupos, el más recurrido de los métodos en las encuestas, es el muestreo
aleatorio sucesivo de unidades, o conjuntos y subconjuntos. En la investigación educativa, por
ejemplo, los distritos escolares de un estado o de un condado pueden ser muestreados
aleatoriamente, después las escuelas, luego los grupos de clase y por último los alumnos. Otro tipo
de muestreo probabilístico si así le puede llamar es el muestreo sistemático. En este tipo de
muestreo, el primer elemento de la muestra es elegido aleatoriamente de los números 1 a k, y los
elementos subsecuentes son elegidos a cada k-ésimo intervalo. Por ejemplo, si el elemento
aleatoriamente seleccionado de los elementos 1 al
136 PROBABILIDAD, ALEATORIZACIÓN Y MUESTREO

10 es 6, entonces los elementos subsecuentes son 16, 26, 36, etcétera. El estudiante que se adentre
más en el área de investigación debe, por supuesto, tener mayores conocimientos acerca de estos
métodos y consultar una o más de las excelentes referencias sobre el tema.17
La aleatoriedad, la aleatorización y el muestreo aleatorio están entre las grandes ideas de la
ciencia, como se indicó antes. En tanto que es posible hacer investigación sin usar las ideas de
aleatoriedad, es difícil concebir como pueda tener la investigación confiabilidad y validez, al menos
en muchos aspectos de la investigación científica del comportamiento. Las nociones modernas del
diseño de investigación, muestreo e inferencia, por ejemplo, son literalmente inconcebibles sin la
idea de aleatoriedad. Una de las paradojas más famosas es que a través de la aleatoriedad, o
“desorden”, se es capaz de lograr un control sobre las a menudo incontrolables complejidades de los
fenómenos psicológicos, sociológicos y educativos. En pocas palabras se impone orden a través de
explotar el comportamiento conocido de los conjuntos de eventos aleatorios. Uno está siempre
atemorizado por lo que se puede llamar la belleza estructural de la probabilidad, el muestreo y la
teoría del diseño, y por su gran utilidad en la solución de problemas difíciles de diseño y planeación
de investigación y el análisis e interpretación de datos.
Antes de dejar este tema, es necesario regresar a un punto de vista de aleatoriedad mencionado
antes. Para un ser sabio no hay aleatoriedad. Por definición, tal ser “conocería” la ocurrencia de
todos los eventos con una certidumbre absoluta. 18 Como Poicare señaló, apostar con un ser de
estas características sería un fracaso. En realidad no sería una apuesta. Si una moneda fuera
lanzada al aire 10 veces, él predeciría cara o cruz con una obsoluta certidumbre y una completa
exactitud. Si se tiraran los dados sobre la mesa, él conocería infaliblemente los resultados. Incluso
sería capaz de predecir cada uno de los números en una tabla de números aleatorios y, desde luego,
no tendría necesidad de hacer investigación o ciencia. Lo que parece que se está diciendo aquí es
que aleatoriedad es sinónimo de ignorancia. Si uno conociera como el ser sabio, todas las causas o
eventos que producen los fenómenos, no habría aleatoriedad. La belleza de esto, como ya se dijo,
es que esta “ignorancia” es utilizada y convertida en conocimiento. La manera como esto se hace
deberá ser cada vez más evidente a medida que se avance en el estudio.

Sugerencia para estudio

Se recomienda una diversidad de experimentos con fenómenos al azar: juegos con monedas,
dados, cartas, ruletas y tablas de números aleatorios. Tales juegos, enfocados en forma adecuada
pueden ayudarlo a aprender mucho acerca de las nociones fundamentales de investiga-

17
Una clara exposición de los diferentes tipos de muestro se encuentra en : F. Stepman y McCarthy,
Sampling Opinions. New Yord: Wiley, 1963 (1958), cap. 3. Una excelente descripción de los principios
generales del muestreo, con ejemplos y fórmulas para estimaciones, es: G. Snedecor y W. Cochran,
Statistical Methods, 5ª. Ed. Ames, Iowa: Iowa State University Press, 1967, cap. 17. Aunque los principios
y métodos de este libro, que es una autoridad en el área, están orientados a la biología y la agricultura, pueden
ser aplicados fácilmente a las disciplinas del comportamiento. Otra referencia muy autorizada en este tema
es: L. Kish, “Selection of the Sample”, en L. Festinger y D. Katz, eds., Research Methods in the Behavioral
Sciences. New York: Holt, Rinehart and Wiston, 1953, pp. 175-239. Sobre el muestreo y la estimación,
véase D. Warwick y C. Lininger, The Sample Survey: Theory and Practice. New York: MacGraw-Hill,
1975, cap. 4.
18
Para un elocuente análisis de este tema, véase el ensayo de Poincaré sovre el azar: H. Poincaré, Science
and Meted. New York: Dover, 1952, pp. 64-90.
MUESTREO Y ALEATORIZACIÓN 137

ción científica moderna, estadística, probabilidad y, desde luego, aleatoriedad. Resuelva los
problemas descritos en las preguntas que a continuación se presentan. No se desanime por la
aparente laboriosidad de los ejercicios de esta sección y del resto del libro. Es evidentemente
necesario y, por supuesto, valioso en ocasiones seguir la rutina que implican ciertos
problemas. Después de trabajar en los problemas que aquí se presentan, diseñe algunos para usted
mismo. Si puede diseñar problemas interesantes, es probable que haya entendido el material.
1.De la tabla de números aleatorios selecciones 50, del 0 al 9 (emplee los números aleatorios del
apéndice C si desea). Lístelos en columnas de 10
a) Cuente el total de números nones y el total de números pares. ¿Qué números esperaría
obtener por azar? Compare los totales obtenidos con los totales esperados.
b) Cuente el total de números 0,1,2,3,4. Asimismo, cuente 5,6,7,9. ¿Cuántos del primer grupo
obtendría usted? ¿Cuántos del segundo? Compare lo que obtuvo con las expectativas debidas
al azar. ¿Hay mucha diferencia entre los dos?
c) Cuente los números pares y nones en cada grupo de 10. ¿Hay una gran diferencia entre los
totales y lo esperado con base en el azar?
d) Sume las columnas de los cinco grupos de 10 números. Divida cada suma entre 10 (sólo
mueva el punto decimal un lugar a la izquierda). ¿Qué esperaría usted obtener como media
de cada grupo si sólo el azar estuviera “operando””? ¿Qué obtuvo usted? Sume las cinco
sumas y divida el total entre 50. ¿Es muy cercana esta media a las expectativas debidas al
azar? (Pista: para obtener las expectativas debidas al azar, recuérdense los límites de la
población).
2. Este es un ejercicio y demostración de clase. Asigne de manera arbitraria números a todos
los miembros de la clase, de 1 a N siendo N el número total de miembros de la clase. Tome una
tabla de números aleatorios y empiece con cualquier página. Pida a un estudiante que, con un lápiz
y con lo ojos cerrados, señale la página de la tabla. Empezando con el número que el lápiz indica,
elija n números de dos dígitos entre 1 y N (ignore los números mayores a N y los repetidos) a través
de, por ejemplo recorrer cada columna (o cualquier otra forma especificada). El numerador de la
fracción n/N es n; dicha fracción es decidida por el tamaño de la clase. Si N = 30, por ejemplo, sea
n=10. Repita el proceso dos veces en diferentes páginas de la tabla de números aleatorios. Ahora
tiene tres grupos iguales (si N no es divisible entre 3, deje una o dos personas al azar). Escriba los
números aleatorios en el pizarrón en los tres grupos. Pida a cada miembro de la clase que diga en
voz alta su estatura en centímetros. Escriba estos valores en el pizarrón separados de los números,
pero en los mismos tres grupo. Sume los tres conjuntos de números en cada uno de los conjuntos en
el pizarrón, los números aleatorios y las estaturas. Calcule las medidas de los seis conjuntos de
números. También calcule las medias de los conjuntos totales.
a) ¿Qué tan cercanas están las medias en cada uno de los conjuntos de números? ¿Qué tan
cercanas están las medias de los grupos de la media del grupo total?
b) Cuente los números de los hombres y mujeres en cada uno de los grupos. ¿Están distribuidos
equitativamente los sexos entre los tres grupos?
c) Analice esta demostración ¿Cuál cree usted que sea el significado de ésta para la
investigación?
3. En el capítulo 6, se sugirió que el estudiante generara 20 conjuntos de 100 números aleatorios
y calculara las medias y varianzas. Si usted lo hizo, utilice los números y estadísticas en este
ejercicio. De lo contrario, use los números y estadísticas del Apéndice C que se encuentra al final
del libro.
a) ¿Qué tan cercanas a la media de la población están las medias de las 20 muestras?
¿Hay alguna media que se “desvíe”? (Usted puede juzgar esto calculando las desviación
estándar de las medias, y sumando y restando dos desviaciones estándares de la media total).

También podría gustarte