2 MOD 1 CURSO 2 Introducción Investigación Educativa 24-11-15

UNIVERSIDAD MARTIN LUTERO
UN MINISTERIO DE LAS ASAMBLEAS DE DIOS
Doctorado Profesional en
Educación
Managua, Noviembre 2015.

Introducción a la Investigación y Evaluación Educativa.
El texto “Introducción a la Investigación y Evaluación Educativa”,

tomado de la Universidad de San Carlos de Guatemala, es considerado
de interés para el Curso 2: “Seminario de Tesis Doctoral I”.
Universidad de San Carlos de Guatemala. 2

INDICE
PRESENTACIÓN ...............................................................................................................................8
PREFACIO ........................................................................................................................................8
MODULO 1 ....................................................................................................................................10
1. UN BOSQUEJO DE LA INVESTIGACIÓN .................................................................................10
1.1. La adquisición de la información. .................................................................................10
1.2. Un Método Científico ...................................................................................................11
1.3. La Investigación Científica y la Investigación Artística .................................................13
1.4. ¿Qué es la Investigación Educativa? ............................................................................14
1.5. Los Tipos de Investigación Educativa ...........................................................................14
1.6. La Investigación Educativa en Latinoamérica...............................................................18
Test de selección múltiple 1.......................................................................................................23
Ejercicio 1 ...................................................................................................................................24
MODULO 2 ....................................................................................................................................27
ELPLAN DE INVESTIGACIÓN ...........................................................................................................27
2.1 El Propósito de un Plan de Investigación .................................................................................27
2.2 Un Esquema de un Plan de Investigación ................................................................................28
2.3 Los Pasos del Esquema del Plan de Investigación....................................................................28
MODULO 3 ....................................................................................................................................35
EL ROBLEMA DE INVESTIGACIÓN .................................................................................................35
3.1 ¿Qué es un Problema de Investigación? ..................................................................................35
3.2 Las Fuentes de los Problemas de Investigación .......................................................................36
3.3 El Planteamiento de un Problema de Investigación ................................................................37
Bibliografía 3 ..................................................................................................................................39
Test de selección múltiple 3...........................................................................................................40
Ejercicio 3 .......................................................................................................................................40
Aplicación 3 ....................................................................................................................................41
MODULO4 .....................................................................................................................................43
LAS HIPOTESIS Y LAS VARIABLESDEINVESTIGACIÓN.....................................................................43
4.1Las Hipótesis de Investigación .................................................................................................43

4.2Las Hipótesis Nulas ...................................................................................................................44

4.3Las Variables Independientes y Dependientes..........................................................................45
4.4 La Variables Moderadoras ......................................................................................................46
4.5 Las Variables de Control...........................................................................................................47
4.6 Las Variables Extrañas ..............................................................................................................48
4.7 Definiciones Operacionales de las Variables ...........................................................................48
Bibliografía 4 ..................................................................................................................................50
Test de Selección Múltiple 4 ..........................................................................................................51
Ejercicio 4 .......................................................................................................................................52
MODULO 5 ....................................................................................................................................54
EVALUACIÓN CRÍTICA DE LA INVESTIGACIÓN...............................................................................54
5.1 Una Pauta de Evaluación para Informes de Investigación .......................................................54
5.2 El Sesgo en la Investigación......................................................................................................55
5.3 Los Efectos Hawthorne, John Henry y Pigmaleón....................................................................57
5.4 La Contaminación .............................................................................................................58
Bibliografía 5 ..................................................................................................................................60
Test de Selección Múltiple 5 ................................................................................................60
Ejercicio 5 ...................................................................................................................................61
MODULO 6 ....................................................................................................................................63
EL MUESTREO ...............................................................................................................................63
6.1 Intro ducción a los Conceptos de Població n y Muestra ........................................63
6.2 La Muestra Aleato ria Simple .........................................................................................66
6.3 Otras Muestras Probabilísticas ....................................................................................67
6.4 Las Muestras No P robabilísticas ..................................................................................71
6.5 El Uso de Voluntarios ...................................................................................................72
6.6 El Tamaño de una Muestra ............................................................................................73
Bibliografía 6 .............................................................................................................................75
Ejercicio 6 .......................................................................................................................................77
Aplicación 6 ....................................................................................................................................78
MODULO 7 ....................................................................................................................................79
EL USO DE TEST ............................................................................................................................79

7.1 Las Características de un Buen Test ...........................................................................79

7.2 La Confiabilidad ........................................................................................................................81
7.3 La Validez ..............................................................................................................................83
7.4 Los Tests Estandarizados..........................................................................................................84
7.5 Los Tests Basados en Criterios ......................................................................................87
7.6 La Selección y Adm inistració n de Tests ......................................................................87
7.7 El Desarrollo de un Test de Rendimiento .................................................................88
7.8 El Desarrollo de un Test de Actitudes .......................................................................91
Bibliografía 7 .............................................................................................................................95
Ejercicio 7 ......................................................................................................................................97
MODULO 8 .................................................................................................................................98
8.1 El Uso de la Estadística en la Investigación Educativa .............................................................98
8.2 Los Tipos de Datos .................................................................................................................100
8.3 La Presentación de Datos.......................................................................................................102
8.4 Las Medidas de Tendencia Central ........................................................................................109
8.5 Las Medidas de Variabilidad ..................................................................................................111
8.6 La Distribución (Curva) Normal ..............................................................................................112
8.7 La Correlación ........................................................................................................................115
8.8 Los Tests de Significación Estadística .....................................................................................119
8.9 El Test-t .................................................................................................................................123
8.10 El Análisis de Varianza (ANOVA............................................................................................124
8.11 El Ji Cuadrado ...................................................................................................................126
8.12 Otros Tests de Significación .................................................................................................127
Bibliografía 8 ................................................................................................................................129
Test de Selección Multiple 8 ........................................................................................................129
Ejercicio 8 .....................................................................................................................................132
M O D U L O 9 ..............................................................................................................................136
LAS INVESTIGACIONES DE TIPO ENCUESTA .................................................................................137
9 . 1 Los P ropósitos y Tipos d e la Inves tigación d e Tipo E nc ues ta ........................................137
9 . 2 E l U s o d e C u e s t i o n a r i o s ...........................................................................................138
9 . 3 L a E n t r e v i s t a P e r s o n a l ..............................................................................................145

9 . 4 E l C u e s t i o n a r i o versus l a E n t r e v i s t a ...................................................................146
9.5 Las Entrevistas por Teléfono ..................................................................................................148
Bibliografía 9 ...........................................................................................................................150
Test de Selección Múltiple 9 ..............................................................................................150
Ejercicio 9 .....................................................................................................................................152
MODULO 10 .............................................................................................................................154
LA INVESTIGACIÓN POR INDAGACIÓN .............................................................................154
NATURALISTICA .......................................................................................................................154
10.1 Las Carac terísticas de la Indagación Naturalística ...........................................154
10.2 Los Tipos de Investigación Naturalística ..............................................................154
10.3 La Recabación de Datos .................................................................................................158
10.4 El Entrenamiento de Observadores ............................................................................161
10.5 La Investigación Participativa ..................................................................................162
Bibliografía 10 .........................................................................................................................163
Test de Selección Múltiple 10 ............................................................................................164
Ejercicio 10 ...............................................................................................................................165
Aplicació n 10 ...........................................................................................................................165
MODULO 11 ...............................................................................................................................166
LA INVESTIGACIÓN EXPERIMENTAL ........................................................................................166
11.1 Las Características de la Investigación Experimental ..........................................................166
1 1 . 2 Las Amenazas a la Validez Experimental ....................................................................166
11.3 Los Diseños Pre-Experimentales ....................................................................................168
11.4 Los Diseños Experimentales ...........................................................................................170
11.5 Los Diseños Cuasiexperimentales .................................................................................172
11.6 Los Diseños No Experimentales: Estudios Correlaciónales y Comparativos Causales ........174
BIBLIOGRAFIA 11 ..........................................................................................................................178
Test de Selección Múltiple 11 ......................................................................................................178
Ejercicio 11 ...................................................................................................................................180
Aplicación 11 ................................................................................................................................180
MODULO 12 .................................................................................................................................181
12.1 ¿Qué es la Investigación Evaluativa? ...................................................................................181
12.2 Las Diferencias entre la Investigación y la Evaluación .........................................................181

12.3 Los Criterios para Juzgar la Evaluación Educativa ................................................................182

12.4 Los Objetos de Evaluación ...................................................................................................184
12.5 Los Modelos o Tipos de Evaluación .....................................................................................186
Bibliografia 12 ..............................................................................................................................189
Test de Selección múltiple 12 ......................................................................................................189
Aplicació n 12 ...........................................................................................................................191
MODULO 13 ..............................................................................................................................192
EL INFORME DE UNA INVESTIGACIÓN O EVALUACIÓN EDUCATIVA ........................192
13.1 El Propósito de Elaborar un Informe ...................................................................................192
13.2 Los Tipos de Info rme ...................................................................................................192
13.3 Esquema de un Informe .............................................................................................194
13.4 La Escritura a Máquina del Informe .......................................................................198
Bibliografía 13 .........................................................................................................................201
Test de Selección Múltiple 13 ............................................................................................201
APÉNDICE A .................................................................................................................................203
APÉNDICE B ..............................................................................................................................204
GLOSARIO ..................................................................................................................................204

PRESENTACIÓN
El Instituto de Investigaciones y Mejoramiento Educativo de la Universidad de San Carlos de

Guatemala se complace en presentar a la comunidad universitaria una nueva publicación, esta
vez sobre investigación y evaluación educativa, dentro de la colección MANUALES
UNIVERSITARIOS que está formada por las series: "Investigación" y "Educación"; representando
dos líneas paralelas en los temas a tratar, pues recae el énfasis en la investigación educativa, o
bien, en el campo de las ciencias de la educación.
El trabajo denominado' INTRODUCCIÓN A LA INVESTIGACIÓN Y EVALUACIÓN EDUCATIVA, trata

la temática mencionada de una manera didáctica, a través de 13 módulos con su
correspondiente bibliografía.
Patrick B. Scott, su autor, posee un doctorado en Educación Matemática de la Universidad de

Columbia, en Nueva York, Estados Unidos de América. Actualmente es catedrático de la
Facultad de Educación en la Universidad de Nuevo México; en Guatemala ha trabajado en
varias oportunidades para el Ministerio de Educación y para el Programa de Maestría en
Docencia Superior de la Facultad de Humanidades de la Universidad de San Carlos.
Esperamos que esta publicación contribuya a satisfacer una necesidad bibliográfica sentida en
el medio. Asimismo, este trabajo constituye un esfuerzo serio del autor, luego de una etapa de
maduración, en la que se conjugan el conocimiento y la experiencia académicos hasta plasmar
un texto útil, claro y completo.
María Reinhardt M.
PREFACIO
Este libro, ha sido escrito para la persona que tenga interés en los conceptos y los métodos de
la investigación y la evaluación educativas. Se le ha dado énfasis a la aplicación de dichos
métodos y conceptos en Latinoamérica. Debe ser de utilidad para los cursos que se ofrecen en
las carreras de Pedagogía y Ciencias de la Educación que ofrecen las universidades y en las
escuelas normales, a la vez que en sesiones de capacitación que imparten los ministerios de
educación.
La elaboración de un texto de investigación educativa que se aplique a Latinoamérica presenta

varios desafíos. Uno de ellos es que no hay uniformidad a través de toda la región en cuanto al
uso de la terminología técnica. El glosario que se ha incluido tal vez ayudará a remediar un poco
esta situación. El enfoque del texto es muy semejante al que tiene la mayoría de los textos de
investigación educativa que se han publicado en los Estados Unidos. No obstante, en este caso
se ha tenido el propósito consiente de adaptar los conceptos, las técnicas y los ejemplos a la
realidad de los países latinoamericanos.
Cada capítulo contiene, en primer término, un desarrollo de la materia correspondiente,
seguido de una bibliografía, de un test de selección múltiple, y por último, una sección de
ejercicios.
La necesidad de desarrollar un texto de esta naturaleza surgió durante el transcurso de un

proyecto conjunto con el Ministerio de Educación de Guatemala, la Agencia de Desarrollo
Internacional (AID) y la Universidad de Nuevo México. Los borradores del texto se utilizaron en
un curso que fue dictado a tres grupos de funcionarios del Ministerio de Educación de
Guatemala. Posteriormente, se usaron como material complementario para un curso de
Métodos de la Investigación Educativa que, para estudiantes latinoamericanos de la Maestría,
se ofrece en español en la Universidad de Nuevo México, bajo los auspicios de los Programas
latinoamericanos de Educación (LAPE).
Son muchas las personas que han facilitado la elaboración de este texto. Primeramente,
quisiera agradecer a mi esposa Lilleth y nuestros hijos por la paciencia que han tenido durante
las largas horas que ha tomado su redacción. La oportunidad de iniciar el trabajo se presentó
gracias al apoyo del Dr. Ronald Blood, Director de los Programas Latinoamericanos de
Educación (LAPE); y del Dr. Jon Facey, Asesor Principal del proyecto Mejoramiento de la
Administración de la educación en Guatemala.
Un número plural de personas han colaborado en la corrección y la modificación del texto.

Muchos de los funcionarios del Ministerio de Educación de Guatemala que asistieron a los
cursos iníciales y los estudiantes de la Maestría de LAPE tuvieron a bien brindar sus sugerencias
muy acertadas. Ibrandy Hernández ofreció su valiosa colaboración en la elaboración del
Glosario. El autor desea expresar su agradecimiento a Silvia Nájera, a Rosa Elena A. de Leyba y a
Elida Anes, cuya, cuidadosa y eficiente labor fue un factor decisivo en la revisión del material, y
a Josefina Antillón y María Reinhardt por su interés y empeño en la publicación de esta edición.

MODULO 1
1. UN BOSQUEJO DE LA INVESTIGACIÓN
1.1. La adquisición de la información.

Existen varias maneras de adquirir información o conocimientos las que pueden dividirse en
tres categorías:
1. Confiar en la autoridad, la tradición, la intuición o la experiencia personal;
2. usar el razonamiento deductivo o inductivo;
3. aplicar el método científico.
La experiencia personal es tal vez la fuente de información más usada. Así, se cree algo porque
ha, pasado varias veces. Por ejemplo, un profesor puede creer que un alumno no tiene mucha
habilidad porque siempre tiene mucha habilidad porque siempre reprueba.
Autoridad, Tradición Intuición y Experiencia Personal
A veces, la autoridad, la tradición, la intuición y la experiencia personal sirven muy bien aún en
los que haceres científicos. Sin embargo, tienen muchas limitaciones. Si se confía en la
autoridad, se acepta algo porque supone que una fuente es fidedigna. Por ejemplo, se cuenta
una historia acerca de Aristóteles en la que se muestra cómo la autoridad puede fallar. Dicen
que cuando joven, Aristóteles encontró un insecto. Siendo un joven curioso y ávido por adquirir
información contó las patitas del insecto y notó que tenía cinco. Pocos años después llegó a ser
un sabio muy conocido, es decir, una autoridad. Indicó a sus seguidores que los insectos tienen
cinco patitas y esto fue aceptado. Si se confía en la tradición como fuente de conocimientos, se
acepta algo como verdadero porque siempre ha sido aceptado. Por siglos se aceptó que la
tierra era plana y el sol giraba alrededor de la tierra. Muchos métodos de enseñanza se aceptan
por tradición. La intuición se define generalmente como la adquisición directa de
conocimientos sin el uso de razonamiento e inferencia. Puede definirse también como la
aceptación de lo que parece obvio. Algunos axiomas matemáticos no se pueden inferir y se
aceptan a través de la intuición como obvios. Algunas verdades informales como el hecho de
que "algo no puede ser rojo y a la misma vez verde" se aceptan aplicando la intuición.
El Razonamiento Deductivo e Inductivo
Como se puede ver, el uso de la autoridad, la tradición, la intuición y la experiencia _personal

no siempre dan resultados confiables y válidos. El ser humano entonces ha desarrollado varias
técnicas más sistemáticas para mejorar la calidad dejas explicaciones dejos fenómenos que se
observan en Grecia, posiblemente Aristóteles, y luego en Inglaterra Francis Bacon,
desarrollaron sistemas de razonamiento que servían como base del método científico.
El método deductivo fue desarrollado en Grecia y muchos lo atribuyeron a Aristóteles. Este

proporciona un proceso de razonamiento lógico para obtener "verdades". Con el razonamiento
deductivo se parte de una premisa mayor (una verdad evidente por sí misma) y a través de una
premisa menor (un caso particular relacionado con la premisa mayor) se llega a una conclusión.
En otras palabras, el método deductivo es una manera de llegar a conclusiones particulares

partiendo de generalizaciones.
Como ejemplos de silogismos aristotélicos considere los siguientes:

 Todos los niños son buenos(premisos mayores)
 Juanito es un niño (premisa menor)
 Juanito es bueno (conclusión)
 Cada Ministerio de Educación tiene un departamento de investigación(premisa mayor)
 Guatemala tiene un Ministerio de Educación(premisa menor)
 El Ministerio de Educación de Guatemala tiene un departamento de investigación
(conclusión).
Por supuesto que el método deductivo depende de la veracidad de la premisa mayor. Aunque
proporciona una manera de verificar la validez de una conclusión particular, esa validez se basa
en la veracidad de la premisa mayor. El partir de premisas falsas o incompletas, basadas en
dogmas antiguos o en autoridades no confiables, puede conducir a errores.
En el siglo dieciséis, Bacon desarrolló un método sistemático de pensamiento llamado

inductivo, que puede considerarse como lo opuesto al deductivo. Se parte de casos particulares
para llegar a conclusiones generales. Es decir, las generalizaciones se basan en las
observaciones. Por ejemplo:
Todos los niños que he conocido son buenos, por lo tanto todos los niños son buenos.
Cada Ministerio de Educación que he observado tiene un departamento de investigación

educativa, entonces todos los Ministerios de Educación en el mundo tienen un departamento
de investigación educativa.
El problema que surge con el método inductivo es la enumeración incompleta de los hechos.
Pueden existir excepciones no observadas que invaliden la conclusión general.
1.2. Un Método Científico
Se puede decir que un método científico surgió durante el siglo diecinueve cuando Charles
Darwin combinó el uso de la inducción y la deducción. De este modo es posible.
1) Usar la inducción para generar hipótesis (especulaciones acerca de la relación entre dos
o más variables
2) Estudiar deductivamente la implicaciones de las hipótesis para comprobar su validez y
3) Generalizar los resultados inductivamente.
Por ejemplo, después de observar, estudiar y considerar varias teorías, un investigador puede
inducir que es más probable que un profesor adopte innovaciones auriculares si éstas resultan
concordar con sus creencias que si las mismas no concuerdan. Es decir, el investigador puede
afirmar la hipótesis de que la consistencia con un sistema de creencias se relacionan
positivamente con la ejecución de un curriculum.

Luego, tiene que aplicar el razonamiento deductivo para identificar una forma que, permita la
comprobación de la hipótesis. Puede suceder que el Ministerio de Educación vaya a introducir
un curriculum nuevo. Al estudiar las guías del nuevo curriculum, el investigador, nota que se
basan en creencias sobre la motivación personal de los alumnos, el investigador puede deducir
que si su hipótesis es correcta, entonces los profesores con creencias acordes con aquellas del
nuevo curriculum van a rendir en mayor medida en_ cuanto a la aplicación del mismo, que los
profesores cuyas creencias no estén de acuerdo con aquéllas del nuevo curriculum.
Para generalizar los resultarlos inductivamente, el investigador tendrá que recabar datos para
comprobar su hipótesis. Deberá aplicar instrumentos para medir creencias de los profesores y
su ejecución del curriculum. Una manera de proceder sería identificar un grupo de profesores
que hayan obtenido puntajes altos en la medida de creencias, y otro grupo que haya obtenido
puntajes bajos, y luego comparar las medias de los dos grupos en la medida de ejecución del
curriculum. Si la hipótesis es correcta, el grupo que obtuvo puntaje alto en las creencias, deberá
tener un puntaje más alto en la ejecución del curriculum.
Este procedimiento, un método científico, proporciona una forma de comprobar

empíricamente una hipótesis. Sin embargo, el investigador tiene que proceder con cuidado. Es
posible que existan otras explicaciones para que haya obtenido esos resultados en su
investigación. Tal vez en este caso el investigador se haya equivocado en su análisis de las
creencias subyacentes del curriculum. Quizás las medidas que aplicaron no miden lo que
pretenden medir. Si otro investigador duplica la investigación, tal vez vaya a tener resultados
distintos, debido a errores del investigador o al uso de médicas y métodos distintos.
Este esquema de tres etapas explica bien, cómo un método científico se desarrolló una
combinación del razonamiento inductivo pero no especifica todos los pasos que hay que tomar
al realizar una investigación. John Dewey, el famoso educador norteamericano, sugirió cinco
pasos para que resulte un proceso científico:
1) Identificación y definición del problema.
2) Formulación de una hipótesis.
3) Recabación, organización y análisis de los datos.
4) Formulación de conclusiones.
5) Verificación, rechazo o modificación de la hipótesis por la prueba de sus consecuencias
en una situación específica.
Charles Hopkins (1980, pp. 14-16) indicó como los siete pasos de un proceso científico los
siguientes:
1) Una dificultad percibida: una duda, una barrera, un obstáculo, una experiencia que
causa la perplejidad.
2) Identificación de un problema: dar un enfoque a la dificultad que se siente.
3) Información: la búsqueda de una respuesta dentro del conocimiento actual.
4) Hipótesis: una posible explicación que se compruebe.
5) Observación: a través de un diseño para recabar, organizar y analizar datos pertinentes.
6) Conclusión: aceptar, rechazar o modificar la hipótesis.

7) Replicación: recomprobación con datos nuevos aplicando el mismo diseño.
1.3. La Investigación Científica y la Investigación Artística
Se debe mencionar que la anterior es una introducción a un método, pero no al método

científico. Este método es objetivo, empírico y viene de la tradición positiva de la filosofía. El
positivismo en su sentido amplio, se refiere a cualquier sistema que permite solamente el uso
de los datos obtenidos de la experiencia y excluye las especulaciones metafísicas. La
investigación educativa ha sido en su mayoría de origen positivista. Recientemente, algunos
académicos han sugerido que los métodos más subjetivos como son los estudios de casos, las
etnografías y algunos métodos de la investigación histórica, tienen un rol que desempeñar
sobre todo cuando se desea extender la experiencia. Elliot Eisner. (1981, pp.5-9) ha llamado a
los métodos más, subjetivos, investigación artística.
La Tabla 1.3.1 representa algunas de las diferencias entre la investigación científica la artística.
Tabla 1.3.1
Diferencias entre la Investigación Científica y la Artística
Método Científico Método Artístico
1. Reglas y constructos definidos 1. Formas de representación que son artísticas y
operacionalmente. personales: lenguaje visual, auditivo, discursivo.
2. Métodos de indagación evaluados por el

2. Métodos de indagación evaluados por grado al cual la visión personal del autor informa y
criterios de validez, confiabilidad y la posibilidad de persuade.
generalizar los resultados.
3. Participación con empatía en las experiencias
3. Análisis objetivo de las conductas humanas de los individuos.
observables.
4. Inferencia de un caso individual a toda"
4. Inferencia de una muestra a una población. una población.
5. Formatos individuales para comunicar el

5. Formatos estandarizados de informes para sentido: el estilo del informe depende del público.
comunicar la objetividad.
6. Un informe selectivo dando énfasis especial
6. Un informe de los hechos objetivos sin sesgo. (licencia artística).
7. Los propósitos principales son el predecir y

7. Los propósitos principales son la predicción y entender.
el control.
8. Las percepciones propias del investigador son
8. Métodos estandarizados y objetivos la fuente principal para obtener los datos.
para la recabación de los datos.
9. Las emociones desempeñan un rol importante
en el conocer.
9. Neutralidad emocional. 10. El fin principal es lo significativo.
10. El fin principal es la verdad.

Es posible decir que realmente ambos métodos, el científico y el artístico, tienen algo con qué
contribuir en la búsqueda de conocimientos sobre la educación. El método artístico puede
servir en "áreas nuevas donde no existen investigaciones previas o donde métodos más
objetivos no resultan, es decir para la investigación exploratoria. Se puede aplicar los
conocimientos logrados con métodos artísticos para proponer hipótesis que se comprueben
con métodos positivistas.
1.4. ¿Qué es la Investigación Educativa?
En general, la investigación puede definirse como un proceso sistemático para responder a

algunas preguntas. La investigación educativa es un proceso sistemático para responder a
preguntas relacionadas con la educación. Kline (1980, p. 1-10) ha dado una definición más
amplia al respecto: "Definimos la investigación y evaluación educativa como el análisis
sistemático de fenómenos educativos, con el propósito de describir, explicar las causas y los
efectos de, y/o entender los factores que abarcan o predicen el acontecimiento de un suceso
educativo específico".
En general los pasos básicos del proceso sistemático son:

1) Formular pregunta(s). Es decir, plantear un problema.
2) Formular hipótesis u objetivos.
3) Diseñar un estudio.
4) Analizar los resultados.
5) Sacar conclusiones.
Es necesario insistir en la cuestión de un proceso "sistemático" porque así es más probable que
se obtengan resultados y se llegue a conclusiones que sean válidas y que puedan duplicarse.
Aunque el proceso de investigación es sistemático en su concepción abstracta y esa concepción

debe guiar al investigador en gran parte de su labor, esto no quiere decir que el proceso sea
siempre formal y que el investigador no pueda usar su intuición. La imaginación, las
corazonadas, y los sueños del investigador tienen que combinarse con los métodos sistemáticos
para que sus labores florezcan.
1.5. Los Tipos de Investigación Educativa
Kline (1980, pp. 1-20 - 1-31) probablemente ha sugerido uno de los esquemas de clasificación
de investigación educativa más completos que existe. La Tabla 1.5.1 presenta el esquema de
clasificación de Kline. En la página 5 aparece una explicación de los componentes de los cuatro
sistemas del esquema.
La Clasificación según el propósito
El debate sobre la distinción y la importancia relativa de la investigación básica y la

investigación aplicada ha durado muchos años. La definición de la evaluación como un tipo de
investigación es más reciente.

La Investigación Básica. La investigación básica tiene como fin el desarrollo de la teoría; para
ello es necesario descubrir o comprobar generalizaciones y principios, y a la vez contribuir al
crecimiento del conocimiento fundamental. El desarrollo de la teoría obliga al investigador a
considerar las estructuras y los procesos fundamentales y a tratar de comprenderlos. Algunos
denominan la investigación básica como la investigación pura, la investigación fundamental o la
investigación teórica.
La Investigación Aplicada. La investigación aplicada, si se realiza fielmente, tiene muchas de las
características de la investigación básica. Sin embargo, su propósito es más inmediato y se
relaciona con el mejoramiento de un proceso o un producto. Por lo tanto se comprueban los
conceptos teóricos en situaciones reales. Como ya se mencionó, tiene un propósito más
inmediato que la investigación básica, pero siempre conlleva la intención de generalizar los
resultados a otras situaciones. Aunque el propósito principal de la investigación aplicada es
proporcionar resultados de utilidad práctica para educadores, en vez de ser el desarrollo de
teorías, dichos resultados prácticos suelen influenciar el desarrollo de teorías.
Tabla 1.5.1
Los Cuatro Sistemas para Clasificar La Investigación Educativa (Kline, 1980, p. 1-31)
Propósito Método Nivel de

Tipo de Datos
Explicación
Básica Histórica Descriptiva. Cuantitativa
Aplicada Tipo Encuesta Asociativa Cualitativa
Evaluativa Experimental Causal
Indagación
Naturalística
Evaluación
Costo/Beneficio o
Costo/Efectividad
Encuesta-Experimento
Objetivos de un programa específico de educación. No se preocupa en obtener resultados que
puedan generalizarse. En vez de buscar conclusiones, la investigación evaluativa conduce más
bien a la toma de decisiones.
La Investigación de Acción. La investigación de acción es un término que no se presenta

específicamente dentro del esquema de Kline. Puede considerarse como un tipo de
investigación evaluativa que un profesor puede utilizar para comprobar la eficacia de su
programa y los métodos que emplea dentro de su propia aula.
La Clasificación según Método
Existen varias maneras de clasificar los métodos de la investigación educativa. El sistema de

Kline es uno de los más completos.
La Investigación Histórica. La investigación histórica es un proceso sistemático para estudiar

documentos y otras fuentes de información para responder a preguntas sobre la significación

del pasado. El estudio de una reforma educativa en un país, o la influencia de un movimiento
pedagógico, son ejemplos de la investigación histórica. La investigación histórica puede
contribuir a que haya una comprensión de los hallazgos y errores del pasado, y por lo tanto,
hasta cierto punto que se explique el porqué de una situación actual y las posibles tendencias
del futuro. Las fuentes de datos que se usan en la investigación histórica pueden ser primarias o
secundarias. Las fuentes primarias de datos son los documentos y testimonios orales de las
personas que participaron en los sucesos históricos, y los restos y las reliquias de la época. Las
fuentes secundarias son los informes de personas que han estudiado las fuentes primarias.
Cuando sea posible, un investigador debe usar fuentes primarias. Además, el investigador tiene
que someter los datos de las fuentes a una crítica interna para establecer su autenticidad y a
una crítica externa para valorar su mérito y exactitud. Aunque en este documento no se dedica
un módulo completo a la investigación histórica, los métodos del análisis de documentos que se
presentan en el Módulo 10 pueden ser útiles.
La Investigación de Tipo Encuesta. Los cuestionarios y las entrevistas son los instrumentos
principales de la investigación de tipo encuesta. Sirven para recabar datos semejantes sobre
grupos de individuos. Si el grupo de individuos es toda una población, a la encuesta se le
denomina censo. No obstante, es más común seleccionar una parte de la población, a la cual se
le llama muestra. Si la investigación de tipo encuesta dura años y si los datos se recogen
periódicamente, es un estudio longitudinal. Si los datos son recabados sólo una vez, éste es un
estudio transversal. A veces las encuestas no ofrecen nada más que información descriptiva, y a
veces se usan para averiguar algo sobre la relación entre variables. En el Módulo 6 se presenta
información sobre la selección de muestras y el Módulo 9 se trata de otras técnicas de la
investigación de tipo encuesta.
La Investigación Experimental. Con la investigación experimental es posible inferir posibles

relaciones de causa y efecto al comparar los resultados de uno o más grupos que hayan
recibido un tratamiento especial, con uno o más grupos de control que no hayan recibido tal
tratamiento. Por ejemplo, si aleatoriamente se seleccionan dos clases y si aleatoriamente se
asigna una para recibir un curriculum nuevo de matemática mientras la otra recibe el
curriculum tradicional, con mediciones apropiadas antes y después de recibir los currículum, es
posible inferir algo sobre el efecto causado por el nuevo curriculum. Existen varios niveles de
diseños experimentales. Los diseños experimentales propiamente dichos requieren que se
empleen controles rigurosos que son difíciles de lograr fuera de un laboratorio, pero que
permiten más seguridad en las inferencias sobre causa y efecto. Los diseños
cuasiexperimentales son menos seguros en cuanto a la certeza de la inferencia, pero también
son menos rigurosos en cuanto al control experimental. El diseño más débil es el ex post facto,
el cual se realiza después de que los sucesos en los que el investigador tiene interés ya han
pasado. En el Módulo 11 se ofrecen algunos detalles sobre la investigación experimental.
La Investigación por Indagación Naturalística. El estudio de personas en sus ambientes

naturales distingue a la investigación por indagación Naturalística, de otros métodos. La
observación, la entrevista informal y el análisis de documentos son las técnicas de la

investigación por indagación Naturalística. Un ejemplo sería un investigador dentro del aula con
el profesor y los alumnos registrando observaciones sobre el comportamiento. Algunas
sugerencias para la realización de una investigación por indagación Naturalística se presentan
en el Módulo 10.
La Investigación Evaluativa. Ya se mencionó que la investigación evaluativa tiene un propósito

distinto de los que tienen otros tipos de investigación. En vez de interesarse en conclusiones
sobre teorías o prácticas educativas, tiene como fin la toma de decisiones sobre programas o
prácticas educativas. En realidad se puede insistir en que la investigación evaluativa (la
evaluación educativa) no tiene su propia metodología. Se pueden utilizar todas las técnicas
sistemáticas de la investigación de tipo encuesta, experimental, y por indagación para recabar
información que facilite la toma de decisiones. La evaluación formativa es el estudio de una
actividad que, mientras se está desarrollando, proporciona información para mejorar los logros
de dicha actividad. La evaluación sumativa se realiza después de que un programa o producto
termina con el fin de evaluar su eficacia. En el Módulo 12 se presentan algunos de los modelos
de evaluación educativa.
La Evaluación de Costo/Beneficio y de Costo Efectividad. Cuando hay interés en comparar los

costos de los insumos de un proyecto con los beneficios de los productos, se puede realizar una
evaluación de costo/beneficio. La comparación de los costos para obtener una licenciatura, con
los sueldos de los licenciados y los que no tienen una licenciatura es un ejemplo de una
evaluación de costo beneficio. Una evaluación de costo/efectividad compara los costos
directamente con el costo de varios métodos para lograr las metas de un proyecto. Por
ejemplo, en vez de comparar los sueldos de licenciados y no licenciados, una evaluación de
costo/efectividad compararía el costo de un programa universitario tradicional con un
programa universitario por correspondencia (o con otra alternativa). Ambos métodos pueden
considerarse como formas especiales de la evaluación sumativa. El lector que tenga interés en
estudiar la evaluación de costo/beneficio puede consultar a Schiefelbein (1974). Mayor
información sobre la evaluación de costo/efectividad se encuentra en Blair y Pozas (1979).
La Investigación de Tipo Encuesta-Experimento. Si se combinan los métodos precisos del

muestreo de las encuestas con el control cuidadoso de un experimento, se tiene lo que Kline
(1980, p. 1-28) denominó como una investigación de tipo encuesta experimento. La
combinación del muestreo y los controles experimentales es la única manera de distinguir la
investigación de tipo encuesta experimento, pues no tiene una metodología propia. Por lo
tanto, no es necesario presentarla en un módulo aparte.
La Clasificación según el Nivel de Explicación. El nivel descriptivo ofrece información que

pretende describir un fenómeno o situación, sin tratar de identificar sus posibles causas. A un
nivel de explicación más alto, la investigación asociativa identifica relaciones entre dos o más
variables sin indicar qué variable(s) es (son) la(s) causa(s) y cuál(es) es (son) el (los) efecto(s). En
el nivel de causalidad sí se infieren las relaciones de causa y efecto. Las investigaciones del nivel
asociativo y causal también pueden proporcionar información descriptiva.

En general, las investigaciones de tipo encuesta y por indagación naturalística proporcionan

información del nivel descriptivo o asociativo, mientras que la investigación experimental
funciona al nivel causa Las evaluaciones formativas suelen ser del nivel descriptivo, pero la
evaluación sumativa pretende llegar por lo menos al nivel asociativo, si no al nivel causal.
La Clasificación según el Tipo de Datos. En la investigación social y educativa ha existido una

tendencia de usar solamente datos cuantitativos, es decir datos numéricos. Actualmente
también se hace énfasis en la recabación y el análisis de datos cualitativos, es decir, de palabras
y reacciones no verbales. Así se puede tener una visión más amplia de la interacción de los
muchos factores de las situaciones humanas. La desventaja del uso de datos cualitativos es la
dificultad de organizados, analizarlos e interpretarlos. De todos modos, una investigación
completa tal vez deba incluir ambos tipos de datos.
1.6. La Investigación Educativa en Latinoamérica
Tal vez la persona que más haya estudiado la situación de la investigación educativa en
Latinoamérica sea el chileno Ernesto Schiefelbein (1980a, 1980b, 1982). Schiefelbein ha
señalado el crecimiento de la investigación educativa durante la década de los años setenta. A
continuación, se indican algunos de los factores más notables en dicho crecimiento.
1) Latinoamérica ha experimentado un incremento en el número de informes publicados y

de revistas que publican tales informes. La Tabla 1.6.1 presenta las características de
dieciocho de las revistas educativas de mayor importancia en Latinoamérica. Se debe
notar que doce de esas revistas aparecieron después de 1970.
2) Muchos latinoamericanos han recibido becas para hacer estudios de postgrado en
Norteamérica y Europa, los cuales incluyen métodos de investigación y evaluación.
Varios países han desarrollado programas de maestría en las facultades de educación de
algunas universidades que ofrecen estudios en investigación y evaluación. También se
han ofrecido muchos seminarios y otros cursos.
3) El desarrollo de la Red Latinoamericana de Documentación en Educación (REDUC) y
varias otras redes educativas ha sido importante. REDUC, a través de los centros que
participan en la red (ver Tabla 1.6.2), reúne y procesa documentos acerca de la edu-
cación en Latinoamérica. Tiene disponibles microfichas de los documentos a un costo
relativamente bajo. Resúmenes de los documentos Resúmenes Analíticos en
Educación (RAE).
4) Varias reuniones y conferencias sobre investigación y evaluación educativa a nivel
nacional y regional han tenido una influencia importante. Entre las reuniones más
importantes se encuentran la Conferencia sobre la Experiencia Educativa en
Latinoamérica (Buenos Aires, 1970), el Congreso Internacional de Educación (México,
1978), y Seminario '80 (Santiago, 1980).
5) Se han desarrollado varios centros de investigación y evaluación educativa. Algunos de
los más importantes se indican en la Tabla 1.6.2. Algunos centros se ubican dentro de
ministerios de educación o universidades. Otros tienen carácter privado y suelen buscar
el respaldo financiero de agencias internacionales.

6) Por supuesto, el número de profesionales que se dedican a la investigación ha crecido

mucho. En 1965 se encontraban menos de veinte trabajando en tres o cuatro centros.
Actualmente existe por lo menos diez veces esa cantidad.
7) Varias agencias internacionales; tales como la Fundación Ford, la OEA, UNESCO y USAID;
han ofrecido respaldo financiero a las actividades ya mencionadas.
8) Ha habido algunos intentos de describir las características y de proponer prioridades de
la investigación educativa en Latinoamérica. Schiefelbein (1980a) ha sugerido que
muchos investigadores tienen la misma meta: diseñar formas nuevas de proveer una
educación para los niños en desventaja social. Señaló que muchos investigadores
latinoamericanos hacen énfasis en el lenguaje local y las raíces históricas como fuentes
de experiencias educativas. También indicó que existe mucho interés en la investigación
participativa en que las personas afectadas por la investigación participan como
"miembros del equipo de investigación".
Tabla 1.6.1
Características de las Revistas Educativas de Latinoamérica
Fecha de
Revista Tópico País
Comienzo
Boletín CINTEFOR Educación Uruguay 1965
Revista de Educación Educación Chile 1967
Construcción
CONESCAL México 1965
Escolar
Cuadernos FundaciónChagas InvestigaciónEducativa Brasil 1971
Educación e Sociedades Educación Brasil 1978
Educación de Adultos Educación Chile 1978
Educación Hoy Educación Colombia 1971
Ciencias
Ensayos ECIEL Brasil 1976
Sociales
Ciencias
Estudios Sociológicos Chile 1973
Sociales
Fórum Educacional Educación Brasil 1976
La Educación Educación EE.UU. 1956
Resúmenes Analíticos Educación Chile 1972
Revista Brasileira deEstudios
Educación Brasil 1915
Pedagógicos
Revista de la EducaciónSuperior Educación México 1972
Revista Latinoamericana de
InvestigaciónEducativa México 1971
Estudios Educativos
Revista Paraguaya de Sociología Ciencias Sociales Paraguay 1963
Tecnología Educativa Educación Venezuela 1973

Universidades (UDUAL) EducaciónSuperior México 1961

Investigación y Educación Educación Guatemala 1984
INRED Educación Chile 1985
El Centro de Estudios Educativos (CEE) publicó Perspectivas de la Educación en América Latina

como testimonio del Congreso Internacional de Educación. En ese documento se destacó la
inquietud de muchos investigadores latinoamericanos con respecto a la justicia social.
Asimismo se señalaron las limitaciones financieras con que se enfrenta la investigación
educativa en Latinoamérica, la necesidad de fijar prioridades de investigación, y la dificultad de
tener prioridades generales para toda la región debido a las diferencias entre los países.
Cariola (1979), el director del Centro de la Investigación y Desarrollo de la Educación (CIDE) de

Chile, indicó algunas de las características de la investigación educativa en Latinoamérica: La
investigación educacional en América Latina no posee un espacio social propio. No es una
casualidad el que surja en la región diversos intentos por llegar a enfoques de investigación
acción, que pretenden insertar la investigación en el seno mismo de programas educativos
vinculados a sectores populares. La relación entre investigación y política se da en forma
inmediata, sin mediaciones. Es frecuente que el investigador… deba comprometerse en la
difusión e implementación de sus proposiciones.
García y Ochoa (1979) analizaron “los 1064 documentos Resúmenes Analíticos en Educación
(RAE) aparecidos entre octubre de 1972 y octubre de 1977”. Entre sus conclusiones más
importantes se encuentran las siguientes: aunque la mayoría de los documentos procedían de
instituciones nacionales, un 29º/o de los documentos eran de unidades extranjeras o de
organismos internacionales-, instituciones privadas proporcionaron un 18.5º/o de los
documentos. Hubo relativamente muchas investigaciones relacionadas con el nivel
universitario y pocas relacionadas con la educación preescolar, primaria, rural, especial y
privada. Los trabajos sobre los profesores y el contenido de la enseñanza eran escasos. La
investigación de tipo encuesta predominó.

Tabla 1.6.2
Centros de REDUC

Bibliografía
Ardón, Víctor. La Ciencia y el Método Científico al Servicio de la Investigación, Guatemala:

Editorial Universitaria, 1982.
Best, John W. Cómo Investigaren Educación, Madrid: Ediciones Morata, 1974.
Blair, Philip y Pozas, César. “Análisis de Costo-Efectividad en Apoyo a la Planificación: Un
Estudio de Casos de la Educación Secundaria Común en Lima”, Planeamiento de la Educación
III, Lima: OEA y Ministerio de Educación, 1979,pp. 153-163.
Borg, Walter R. y Gall, Meredith D. Educational Reserarch: And Introduction, New York:
Longman, 1983.
Carióla, Patricio. “Discurso del Lic. Patricio Carióla”, en Centro de Estudios Educativos (CEE),
Perspectivas de la Educación En América Latina, México: autor, 1979. Centro de Estudios
Educativos (CEE). Perspectivas de la Educación en América Latina, México: autor, 1979.
Chew, Germán y Bolaños, Yolanda. Lecturas sobre Teoría Investigativa, Guatemala: Instituto de
Investigación Educativa y Consultora en Educación, 1982.
De Landsheere, Gilbert. La Investigación Pedagógica, Buenos Aires: Editorial Estrada, 1971.
Eisner, Elliot. “On the Difference Between Scientific and Artistic Approachesto Qualitative
Research”, Educational Researcher, vol. 10, no. 4, 1981, pp. 5-9.
García Huidobro, J.E. y Ochoa, Jorge. ‘Tendencias de la Investigación en Educación en América
Latina”, en Perspectivas de la Educación en América Latina, México, autor, 1979.
Goode, William J. y Hatt, Paul K. Métodos de Investigación Social, México: Trillas, 1967.
Hopkins, Charles D. Understanding Educational Research, Columbus, Ohio: Merrill, 1980.
Kline, David. Planning Education for Development: Volume III Research Methods For
Educational Planning, Harvard University: Center for Studies in Education and Development,
1980.
Latapí, Pablo. “Reflexiones sobre el ‘éxito’ de la Investigación Educativa”, Revista del Centro
de Estudios Educativos, vol. VII, no. 4, 1977, pp. 59-68.
Leedy, Paul D. Practical Research: Planning and Design, New York: MacMillan, 1974.
Pérez Álvarez, Felipe. Las Investigaciones Exploratorias y Descriptivas en Tas Ciencias de la
Educación, Buenos Aires: Librería del Colegio, 1978.
Schiefelbein, Ernesto. Educational Networks in Latin America: Their Role in the Production,
Diffusion and Use of Educational Knowledge, Ottawa: International Development Research
Center, 1982ª.
Schiefelbein, Ernesto. “La Red Latinoamericana de Documentación en Educación”, Revista
Latinoamericana de Estudios Educativos, vol. XII, no. 4, 1982b, pp. 89-105.
Schiefelbein, Ernesto. “Research Trends in Latin America Seminario 80”Prospect vol. Xll no. 3,
1981, pp. 368-371.

Tuckman, Bruce W. Conducting national New York: Brace Jovanich, 1978.
Test de selección múltiple 1
Para cada uno de los siguientes ítems subraye la respuesta más apropiada.
1. El uso del castigo corporal para mantener la disciplina en el aula probablemente
proviene de una de las siguientes fuentes de información; indique cuál.
a) Autoridad.
b) Tradición.
c) Intuición.
d) Razonamiento deductivo.
2. “Todos los hombres son buenos; Juan es un hombre; por lo tanto Juan es bueno” es un
ejemplo de una de las siguientes fuentes de conocimiento, señálela.
a) Razonamiento inductivo.
b) Autoridad.
c) Razonamiento deductivo.
d) Método científico.
3. “Todos los pájaros que he visto pueden volar, por lo tanto todos los pájaros vuelan” es
un ejemplo de una de las siguientes fuentes de conocimiento, señalada.
a) Razonamiento deductivo
b) Autoridad
c) Razonamiento inductivo
d) Método científico
4. De los siguientes científicos ¿quién conocido como el primero que combinó la deducción
y la inducción para crear un método científico.
a) Darwin
b) Bacon
c) Aristóteles
d) Dewey
5. ¿Cuál de los siguientes enunciados constituye una de las principales dificultades del
razonamiento inductivo?
a) Depende de la veracidad de la premisa mayor.
b) No permite el juicio humano
c) Parte de la observación de un solo caso
d) Pueden existir excepciones no observadas que invaliden la conclusión general

6. La investigación que se preocupa de comprenderlas estructuras y los procesos

fundamentales es la investigación.
a) De acción
b) Aplicada
c) Evaluativa
d) Básica
7. Una característica de la investigación evaluativa es que.

a) Conduce a la toma de decisiones
b) b) Pretende resolver problemas prácticos
c) No se preocupa de obtener resultados que puedan generalizar se
d) Todas las respuestas anteriores son correctas
8. ¿Cuál de los siguientes métodos de investigación educativa suele tener más control?
a) L a investigación histórica
b) La investigación de tipo encuesta
c) L a investigación experimental
d) La investigación por indagación naturalística
9. ¿Cuál de los siguientes métodos de investigación educativa suele tener más control?
a) La investigación de tipo encuesta
b) L a investigación experimental
c) La investigación por indagación Naturalística
10. Una ventaja de la investigación empleando datos cualitativos es que
a) Ofrece una visión muy amplia de la interacción de los muchos factores humanos
b) Es fácil de organizar, de analizar y de interpretar tales datos
c) Es fácil de llegar al nivel causal
Ejercicio 1
1. Indique dos aspectos de la educación en su país donde la fuente principal de información

sea la autoridad.
2. Indique dos aspectos de la educación en su país donde la fuente principal de información

sea la tradición.”
3. Redacte dos silogismos aristotélicos que sean lógicamente válidos.
4. Redacte dos silogismos que sean falsos. Indique la naturaleza de las falacias.
5. Dé dos ejemplos de razonamiento inductivo válido.
6. Dé dos ejemplos del razonamiento inductivo falso. Indique la naturaleza de las falacias.
7. Demuestre cómo las cinco etapas de Dewey pueden ayudar en la resolución de un
problema. Use uno de los siguientes ejemplos, o elija su propio problema:

a) La mayoría de los alumnos han reprobado una prueba.

b) La mayoría de los profesores llegan tarde para dictar sus clases.
8. Enumere las preguntas, dudas e inquietudes que tenga sobre los métodos y herramientas
de la investigación y evaluación educativa (y su realización en su país). Incluya
consideraciones generales (por ejemplo ¿cómo se realizan las investigaciones
experimentales?) y puntos específicos (por ejemplo ¿qué significa el valor p?).
9. Haga una lista de:
a) Los problemas educativos que desea estudiar,
b) La información que desea tener acerca de cuestiones educativas y
c) Las inquietudes que desea explorar.
Pueden ser asuntos generales (por ejemplo ¿cómo puede financiarse la educación primaria
rural?) o bien, específicos (por ejemplo ¿qué tipo de yeso debe usar un profesor de
matemáticas del tercer año básico en el Colegio Gran Pelota?). Luego, se consideran la
factibilidad y la importancia de lo que se selecciona. Ahora es conveniente que plantee
cualquier problema, la falta de información o la inquietud que le interese.
10. Si tiene la intención de realizar una investigación es importante que conozca los
recursos y las experiencias ya existentes. Este ejercicio tiene como fin la recolección de
nombres de instituciones, de personas, y los recursos bibliográficos relacionados con la
investigación educativa en su país.
a) Enumere los nombres y las direcciones de los institutos y agencias (nacionales e
internacionales) que tienen que vea con la investigación y la evaluación en su país. Si los
conoce, indique los nombres de las personas encargadas de la; investigaciones de esas
instituciones.
b) Repita el ejercicio anterior, esta vez indicando los centros de documentación y las
bibliotecas que contienen informes acerca de trabajos de investigación.
c) Enumere los nombres de las personas que realizan investigaciones y evaluaciones
educativas en su país. Indique las instituciones en las cuales ellos trabajan.
d) Enumere las revistas y los boletines que se editan en su país, las cuales posiblemente
presenten investigaciones educacionales
11. El gobierno decide invertir una cierta cantidad de dinero para mejorar las destrezas de
estudio de los alumnos en las escuelas secundarias oficiales. Algunas personas prefieren invertir
todo el dinero en el desarrollo de materiales y programas modelo, y en la capacitación docente.
Otro grupo desea invertir un 15º/o de los fondos en la realización de investigaciones sobre
destrezas de estudio. ¿Cómo defendería Ud. El uso del 15º/o para realizar la investigación?
12. Lea los cuatro estudios (adaptados de Kline, 1980, pp. 1-39 – 1-40) que aparecen a
continuación. Clasifique cada estudio según cada uno de los 4 sistemas de Kline. Explique cada
clasificación.
Estudio 1. Se seleccionaron ocho pueblos al azar para que recibieran una de dos estrategias
educativas con el propósito de influir en su adopción de innovaciones de agricultura, salud y
educación social. Cuatro pueblos participaron en “foros de radio” y cuatro participaron en
“grupos de lectura” durante el mismo período. Se recabaron datos sobre las características
socioeconómicas de los participantes, y el uso real y las actitudes hacia las innovaciones antes
del comienzo de las actividades educativas y al haberse concluido un año después. También se

recabaron datos de otros seis pueblos semejantes a los ocho experimentales, pero que no
participaron en las actividades educativas. Se usaron los resultados para comprobar las
hipótesis sobre la adopción de innovaciones.
Estudio 2. Se realizó un estudio para determinar el efecto que tuvo en las actitudes y en los
conocimientos de alumnos de educación primaria y secundaria la introducción de un curriculum
nuevo sobre población, vida familiar y ecología. De 26 escuelas se sacó una muestra aleatoria
de 631 alumnos para que participaran en el estudio. Se recabaron datos al inicio y al final del
año escolar para determinar el cambio en las actitudes y en los conocimientos de los alumnos
con relación a los tópicos del nuevo curriculum. El nuevo curriculum se aplicó con 1856
alumnos. Otros 1775 tomaron los tests sin recibir el nuevo curriculum. Los resultados se usaron
para revisar el curriculum y para determinar la medida en que el curriculum tuvo un impacto o
logro sus objetivos.
Estudio 3. Se realizó un estudio para determinar en qué forma la organización burocrática y los
conflictos culturales afectan a los alumnos de una escuela secundaria. El investigador
permaneció en la escuela por varias semanas observando la conducta de los alumnos y del
personal y también examinó los documentos relacionados con la organización y la estructura de
la escuela.
Estudio 4. Se realizó un estudio en Indonesia con 109 familias, en las cuales por lo menos uno
de los hijos asistía a una escuela religiosa. Las familias se escogieron al azar. Se recabó
información sobre las características socioeconómicas de las familias y la demanda de
escolarización a través de entrevistas. La demanda se midió en términos de la intención de
continuar mandando al hijo a la escuela, del número de hijos de edad escolar que no asistieron
a una escuela, del promedio de años de escolaridad de los hijos, de la demanda de escuelas
seglares versus escuelas religiosas y de la demanda de escuelas vocacionales versus escuelas
académicas. Se hizo un análisis para determinar las características que predicen la demanda
escolar de una familia.

MODULO 2
ELPLAN DE INVESTIGACIÓN
2.1 El Propósito de un Plan de Investigación

Muchas veces se hace la analogía entre un plan (o proyecto) de investigación y los dibujos y
otros planos de los arquitectos. Los planos arquitectónicos se hacen antes de construir un
edificio y un plan o modelo de la investigación debe hacerse antes de realizar una
investigación. Los planos arquitectónicos suelen irse modificando durante la construcción de
un edificio. Así, a un plan de investigación se le van haciendo ajustes durante la investigación
debido a la realidad que se va encontrando, y a las posibles mejoras que se vayan notando.
Borg y Gall (1983, p. 85) sugirieron que existen tres requisitos previos que hay que cumplir
antes de elaborar un plan de investigación:
1. La identificación tentativa de un problema de investigación,
2. La lectura de una cantidad sustancial de literatura relacionada con investigaciones o
teorías que tienen que ver con el problema,
3. Buenos conocimientos básicos acerca del proceso de investigación educativa.
Es de suponer que muchos lectores en este momento no llenen ninguno de estos requisitos
previos. De todos modos, se presentará en este módulo un esquema para un plan de
investigación que pueda servir como una guía mientras se vayan obteniendo las destrezas y
los conocimientos necesarios.
Existen muchas razones para elaborar un plan de investigación antes de realizar una in-
vestigación. Dicho plan sirve para organizar y aclarar las ideas y comunicárselas a otros. Así es
mucho más fácil evaluar lo que se pretende hacer. También, facilita dar enfoque a los
detalles que sean de una importancia crítica. El investigador mismo puede refinar y mejorar
sus planes y someterlos al juicio de sus colegas y de otros expertos. Tal crítica positiva puede
ayudar a evitar muchos errores y frustraciones. Además, si la investigación se lleva a cabo, es
posible evitar fallas de la memoria al tener un plan escrito con todos los pasos bien
bosquejados.
Chávez Zepeda (1983, p. 7) indicó la situación lamentable en que se ven los investigadores
que no preparan un plan de investigación, cuando escribió lo siguiente:
Es frecuente que algunas personas que hacen investigación, inicien su trabajo y una vez
recolectados los datos, se presentan ante un estadístico o un programador para solicitarle
que "haga algo" con estos datos. Este es un gravísimo error, que ha traído muchos fracasos,
pérdida de tiempo y esfuerzos desperdiciados.
Muchas veces se exige oficialmente elaboración de planes de investigación. Los estudia tes
universitarios generalmente tienen que presentar un plan de investigación para su
aprobación por un comité de catedráticos antes de realizar una tesis o disertación. Muchas
investigaciones extensas requieren el respaldo financiero de alguna agencia que suele
requerir que se cuente con un plan.

2.2 Un Esquema de un Plan de Investigación
Existen muchos esquemas de planes de investigación. Algunas instituciones y agencias exigen

un esquema en particular. A continuación, se incluyen los elementos que se encuentran en la
mayor parte de los esquemas de investigación educativa. De todos modos, cualquiera que se
quiera el esquema, es necesario redactarlo en forma clara, teniendo presente que no se trata
de una producción literaria. Es decir, hay que expresar las ideas y los procedimientos en un
estilo preciso y conciso, evitando cualquier extravagancia verbal.
El plan debe empezar con el título de la investigación. Si todo marcha como se ha planificado,
dicho título debe ser el mismo que lleve el informe final. El título debe indicar las variables
que se van a estudiar, la relación entre las variables, y la población que se va a considerar.
A continuación, se presenta un esquema de planes de investigación. En la siguiente sección
hay una breve explicación de cada paso del esquema y una indicación del módulo en el que
se encuentran más detalles sobre cada paso.
I. El Marco Conceptual
A. Los Antecedentes del Problema
B. La Importancia del Problema
C. El Planteamiento del Problema
D. El Alcance y los Límites del Problema
II. El Marco/ Teórico (Los Supuestos)
III. El Marco Metodológico
A. Las Hipótesis o los Objetivos
B. Las Variables (y sus definiciones operacionales)
C. Los Sujetos
D. Los Instrumentos
E. El Diseño de Investigación
F. El Análisis Estadístico
IV. El Marco Operativo
A. La Recabación y el Tratamiento de Datos
B. El Estudio Piloto
C. Los Recursos que se Requieren
D. El Esquema de Tiempo (Cronograma)
E. Un Bosquejo del Informe Final
F. La Bibliografía Preliminar
2.3 Los Pasos del Esquema del Plan de Investigación
A. Los Antecedentes del Problema. En esta sección es necesario indicar de dónde surgió
el problema. Es una buena idea citar a expertos que han sugerido investigaciones
relacionadas con el problema. Es más apropiado presentar un resumen más completo de la
literatura relacionada con el problema como parte del marco teórico. Un resumen acabado

de la literatura suele encontrarse en el informe final. De todos modos, deben presentarse
algunas citas de estudios anteriores referentes al tema, indicando en qué forma sus métodos
y resultados se relacionan con el presente estudio.
B. La Importancia del Problema. Esta parte, a veces, se incluye en los antecedentes y por
lo menos debe relacionarse con ellos. Debe justificarse el valor que tiene estudiar el
problema. ¿Cómo va a contribuir a acrecentar los conocimientos educativos? ¿Cómo va a
contribuir a un mejoramiento de la docencia? Hopkins (1980, p. 194) indicó que la
significación educativa de un problema puede radicar en una o más de las características
siguientes:
1) Practicable. Una relación estrecha entre el problema de investigación y un
problema práctico da apoyo a un estudio.
2) Generalizable. Un estudio que puede generalizarse a varias poblaciones es
más aceptable que uno que tiene un ámbito más limitado.
3) Oportuno. Un estudio relacionado con un problema social que tenga la
importancia del momento tiene una buena acogida.
4) Teórico. Es fácil justificar un estudio que va a analizar un conjunto de hechos
y a crear el entendimiento de una nueva teoría.
5) Erudición. Un estudio puede justificarse porque aporta nuevas maneras de
abordar procedimientos de investigación.
C. El Planteamiento del Problema. Después de haber; introducido los antecedentes y

expresado la importancia del problema en términos generales, es necesario exponer en
forma clara y precisa el problema propiamente dicho. Generalmente se hace en forma
interrogativa. En el Módulo 3 se ofrece un tratamiento detallado sobre el problema de
investigación.
D. El Alcance y los Límites del Problema. Aunque definición del problema debe ser muy
clara y precisa, debe ser concisa también y por lo tanto es necesario especificar el alcance de
la investigación. ¿Qué aspectos del problema van a incluirse y cuáles van a quedar fuera del
tratamiento? Los límites se refieren a las restricciones impuestas sobre las posibilidades de
generalizar los resultados a otras poblaciones y a las posibles amenazas' sobre la validez y
confiabilidad del estudio. Dos de las limitaciones más comunes Que tienen las investigaciones
son el tamaño de la muestra y la duración del estudio.
II. El Marco Teórico
Se tratan los supuestos que acepta el investigador en el marco teórico. Cada problema
conlleva ciertos supuestos subyacentes. Una lista de supuestos establece las premisas o los
postulados en que el estudio se basa. Es posible presentar un resumen de la literatura
relacionado con el problema para establecer el marco teórico. La presentación del marco
teórico debe conducir a las hipótesis del estudio.

A. Las Hipótesis o los Objetivos. Una hipótesis es una conjetura acerca de la relación
entre las variables del problema de investigación; una posible respuesta al problema que se
somete a una comprobación. A veces en las investigaciones descriptivas se plantean
objetivos en vez de hipótesis. Se ofrece más información sobre la formulación de hipótesis en
el Módulo 4.
B. Las Variables. El problema pregunta si existe una relación entre dos o más variables y
la hipótesis sugiere la posible naturaleza de esa relación. En esta sección es necesario
identificar precisamente cuáles son las variables de la investigación y de qué tipo son
(independiente, dependiente, moderadora, dé control o extraña). También es conveniente
tratar de dar una definición operacional de las variables. Una definición operativa se basa en
las características observables de lo que se define.
C. Los Sujetos.Generalmente un investigador no trabaja con una población completa

sino con una muestra, o, en el caso de estudios de caso, un individuo. Hay que in dicar la
naturaleza de la población y de la muestra y los métodos utilizados para sacar dicha muestra.
En investigaciones experimentales en las que se aplican los test de significación, la selección
de la muestra es crucial. En esta sección es aconsejable mencionar las posibilidades y
restricciones en la generalización de los resultados. En el Módulo 6 se encuentra una
discusión más detallada acerca del muestreo.
D. Los Instrumentos. Una razón para especificar los instrumentos que se van a usar es
para asegurarse de que existen instrumentos adecuados para medir las variables del estudio.
Dependiendo de las variables, los instrumentos que se requieren pueden ser test
psicológicos, pruebas de rendimiento, cuestionarios, guías de entrevistas u otros tipos de
medidas. A veces se usan instrumentos estandarizados. En tales casos, deben presentarse los
datos que indican la validez y la confiabilidad de dichos instrumentos. Si resulta necesario
que el investigador elabore un instrumento adecuado, una tabla de especificaciones puede
indicar la naturaleza y la posible validez del instrumento. El Módulo 7 se ha dedicado a la
presentación de varios instrumentos de investigación.
E. El Diseño de Investigación. Es aconsejable describir un diseño de investigación

tentativo que pueda servir para comprobar las hipótesis. Algunos investigadores no hacen un
esfuerzo adecuado para diseñar sus investigaciones sino hasta cuando ya es demasiado
tarde. Los Módulos 9 al 12 contienen explicaciones y ejemplos de varios diseños.
F. El Análisis Estadístico. Es conveniente especificar el tipo de análisis estadístico que se

pretende aplicar a las variables. Si se usa un test de significación debe indicarse y según
muchos expertos, especificarse el nivel de significación que se ha adoptado. En el Módulo 8
se discuten algunos métodos para el análisis estadístico de los datos.
IV. El Marco Operativo

A. La Recabación y el Tratamiento de los Datos.En el marco metodológico se presentó
el método de análisis estadístico que se empleará. En el marco operativo hay que especificar
cómo se lleva a cabo el análisis estadístico de los datos. Debe presentarse un plan de

tabulación, aún si la misma se va a hacer en una computadora, o a mano, o en
una forma combinada. En caso de que se use una computadora, hay que indicar los
programas ya elaborados que se vayan a usar, o indicar cómo se van a elaborar los mismos.
B. El Estudio Piloto. En realidad, parece que no se usan mucho los estudios de tipo
piloto. Es una pena porque pueden ser muy útiles. Al decidir si un estudio piloto debe
llevarse a cabo o no, es necesario entender sus propósitos y características. Un estudio piloto
es un ensayo de los procedimientos que se van a usar en una investigación, utilizando muy
pocos sujetos. A veces se hace para determinar si vale la pena o no realizar la investigación
completa. Si se realiza con cuidado, puede dar indicaciones de cambios que son necesarios.
Otras posibles razones para llevar a cabo un estudio piloto Son
1. para refinar las hipótesis,
2. para probarlos procedimientos estadísticos,
3. para encontrar y, por lo tanto, reducir los posibles errores de tratamiento,
4. para solicitar la opinión de los sujetos con respecto a varios procedimientos,
y
5. para probar instrumentos y luego seleccionar los más adecuados.
C. Los Recursos que se Requieren. Si se trata de un plan que solicita un respaldo

financiero, esta sección tiene gran importancia. Es preciso indicar los antecedentes de los
investigadores, el apoyo institucional con que cuentan y detalles sobre el personal por
contrato que se necesite y el costo aproximado de sus servicios. Hay que estimar los costos
de los servicios y materiales que se vayan a necesitar; tales como gastos de correspondencia,
teléfonos, impresión, fotocopias, arrendamiento o compra de equipos, transportes y viáticos,
libros y otros recursos bibliográficos y varios útiles de oficina.
Si se trata de una investigación en la cual el investigador tiene que correr con todos los
gastos, tal vez sea aún más importante averiguar los recursos que se requieren y Cerciorarse
de su disponibilidad.
D. Esquema del tiempo
Un esquema de tiempo puede facilitar la eficiente y oportuna finalización de una
investigación. Mediante el mismo, el investigador puede planificar una distribución adecuada
de su tiempo y energía. Generalmente, un simple calendario puede servir, aunque también
se usan algunos sistemas de planificación más formales, como por ejemplo un PERT.
E. Un Bosquejo del Informe Final.
El Bosquejo del informe final no debe confundirse con el bosquejo del plan. Debe ser una
visión* de cómo será el informe final. Tal vez las primeras secciones de un informe final sean
muy parecidas al bosquejo del plan, pero en el informe final también hay secciones donde se
presentan los resultados, las conclusiones y las recomendaciones.
F. La Bibliografía Preliminar. La bibliografía preliminar debe incluir las fuentes que el
investigador ya haya identificado, de modo que cualquier persona que revise el plan pueda
sugerir otras fuentes bibliográficas importantes que tengan relación con el problema.
2.4 Consideraciones Éticas y de R elaciones humanas

La realización de investigaciones educativas generalmente lleva responsabilidades éticas y
presenta desafíos de relaciones humanas que a veces no aparecen explícitamente en el plan.
Los sujetos tienen el derecho de no participar o de no continuar participando en una

investigación. A fin de garantizar la participación y la cooperación de los sujetos y de las
autoridades correspondientes, el investigador tiene que mantener buenas relaciones
humanas.
La responsabilidad ética principal de un investigador es no lastimar a ningún sujeto. Tiene
que preocuparse no solamente de daños físicos, sino también por lesiones mentales. El
investigador debe valorar la dignidad y el mérito del individuo y minimizar cualquier riesgo
que él pueda correr. Aunque se hacen consideraciones éticas con cualquier tipo de
investigación, es más necesario con investigaciones experimentales, que exigen la
"manipulación" y el "control" de los sujetos. Cuando sea posible, el investigador debe
solicitar un permiso escrito de los sujetos, o de sus padres si son menores. También es
importante informarles sobre la naturaleza del estudio. Si acaso, por motivos de control no
es aconsejable indicarles todos los detalles del estudio; el investigador debe mencionar
que después de haber recabado los datos les va a proporcionar información más completa
sobre los propósitos y procedimientos del estudio.
El investigador tiene la responsabilidad ética de mantener la estricta confidencialidad de toda

la información que ha recabado. La identidad individual de los sujetos debe permanecer en
secreto. Personas ajenas a la investigación no deben tener acceso a los datos originales. Los
sujetos tienen el derecho de saber quién va a tener acceso a los datos. Para manejar los
datos es mejor reemplazar los nombres por códigos numéricos.
Muchas investigaciones educativas requieren la cooperación y permiso de los adminis-
tradores y los docentes. La consecución y el mantenimiento de tal cooperación implican que
se establezcan y se mantengan buenas relaciones humanas. Hay que planificar bien el
estudio y explicarlo adecuadamente a las autoridades correspondientes. El plan debe
minimizar cualquier amenaza a la integridad de la institución que se pretende estudiar. Si el
estudio se realiza dentro de una escuela u otra institución, el investigador debe tener
cuidado de ocasionar solamente las más mínimas molestias e inconveniencias.
Otro asunto que tiene algo que ver con la ética y las relaciones humanas es la
responsabilidad que tiene el investigador de dar un informe de los resultados y las
conclusiones a la comunidad donde se realiza la investigación. En muchas partes del mundo
hay comunidades que ya no quieren participar en investigaciones porque en el pasado varios
investigadores han llegado, han realizado un estudio con la cooperación de muchas personas
y han desaparecido sin dejar rastro. El investigador siempre debe comportarse sincera y
profesionalmente.

Bibliografía 2
Best, John W. Cómo Investigar en Educación, Madrid: Ediciones Morata, 1974.
Borg, Walter R. y Gall, Meredith D. Educational Research: An Introduction, New York:

Longman, 1983.
Chávez Zepeda, Juan José. La Investigación Científica en el Area Psicobio social, Guatemala:
Instituto de Investigaciones y Mejoramiento Educativo de la Universidad de San Carlos, 1983.
Gay, L.R. Educational Research: Competencies for Analysis and Application; Colum-bus, Ohio-.
Charles E. Merril Publishing; 1981.
Hopkins, Charles D. Understanding Educational Research, Columbus, Ohio: Merril, Í980.
Pardinas, Felipe. Metodología y Técnicas de Investigación en Ciencias Sociales, México: Siglo

XXI, 1970.
Pérez Álvarez, Felipe. Las Investigaciones Exploratorias y Descriptivas en las Ciencias de la
Test de Selección Múltiple 2
Para cada uno de los siguientes ítems subraya la respuesta apropiada

1. Un plan de investigación
a) Se realiza antes de identificar el problema
b) Se ajusta durante la investigación
c) Se realiza antes de lee mucha de la literatura
2. Un plan de investigación debe elaborarse antes de realizarla investigación a fin de
a) Organizar ideas
b) Someterlo al juicio de expertos
c) Facilitar el enfoque de los detalles importantes
3. El titulo de un plan de investigación debe indicar
a) L a población que se va a considerar
b) Las variables que se van a estudiar
c) La relación entre las variables
d) Todas las respuestas son correctas
4. El marco teórico de un estudio está relacionado con
a) Las conclusiones
b) Los presupuestos
c) El problema
d) El análisis estadístico de los datos

5. Un estudio piloto,
a) Siempre es necesario
b) Usa las mismas muestras que se han usado en el estudio propiamente dicho
c) Requiere de hipótesis distintas a las del estudio mismo
d) Puede ayudar a mejorar la validez del estudio
6. La responsabilidad ética principal de un investigador
a) Esconder el propósito del estudio
b) Tratar los sujetos como amistades personales
c) Tener cuidado de no lastimara ningún sujeto
a) Todas las respuestas anteriores son correctas
7. Para asegurarla confidencialidad de los datos el investigador debe
a) Usar códigos en vez de los nombres mismos mientras que maneja los datos
b) Evitar que personas ajenas tengan acceso a los datos
c) Indicara los sujetos quienes tienen acceso a los datos
Ejercicio 2
Como se menciona anteriormente existen muchos esquemas distintos de proyectos de
investigación. Busque un texto de investigación que tenga un esquema de proyectos y
compárelo con el esquema que se presenta en este módulo.

MODULO 3
EL ROBLEMA DE INVESTIGACIÓN
3.1 ¿Qué es un Problema de Investigación?
La investigación educativa parte de las dudas que surgen en la mente del investigador. Puede
ser que las perciba de una forma muy vaga. Así comienza un proceso de refinamiento para
llegar a un problema que sea manejable. Si el problema de investigación se define
adecuadamente, se facilita todo el proceso de la investigación.
Leedy (1974, p. 48) insistió en que para ser considerado como un problema de investigación un
planteamiento o pregunta, tendría que incluir (o por lo menos implicar) el hecho de la
interpretación de datos. Kline (1980, p. II-6) indicó que una de las características principales de
los problemas de investigación educativa es que surgen en un contexto en el cual se pueden
experimentar los fenómenos (sucesos, actividades, resultados) ya sea objetiva o
subjetivamente, con medidas confiables y válidas. Tener medidas de los fenómenos
experimentados implica la interpretación de datos.
Las tres dificultades principales que surgen en la definición de los problemas de investigación
son:
1. No mencionar el hecho de la interpretación de datos
2. Tratar de asuntos no observables/medibles
3. Elegir un problema demasiado amplio y ambicioso.
Generalmente, las preguntas que pueden contestarse con un simple "sí" o 'no' no sirven como
problemas de investigación. Resulta que tales preguntas suelen ser indicaciones •• superficiales
de asuntos más profundos. Por ejemplo, consideremos lo siguiente, "¿Es válida la instrucción
personalizada?" Lo importante realmente no es si vale la pena o no. Si se obtienen buenos
resultados vale la pena; si no se encuentran buenos resultados, entonces no vale la pena. El
problema de investigación que está involucrado en el asunto del valor de la instrucción
personalizada es "¿Cuál es su valor?", o si no tiene valor entonces, "¿Por qué no tiene valor?".
Cada una de estas dos preguntas implica la interpretación de datos.
La investigación empírica no sirve para estudiar muchos temas importantes de la filosofía y la

teología que resultan ser interesantes pero no observables ni medibles. Los fenómenos
metafísicos y sobrenaturales suelen estar en esa categoría. Afortunadamente existen formas de
observar y medir muchos de los fenómenos educativos importantes.
Muchas veces los principiantes en la investigación educativa y aún los más experimentados
tratan de atacar un problema que resulta ser demasiado amplio y ambicioso. Esto tal vez tenga
que ver con una falta de comprensión de la complejidad de la investigación educativa y con el
deseo de aportar algo bastante significativo al avance de la educación. "La influencia de la
personalidad en el rendimiento académico" es un problema muy interesante e importante,
pero demasiado amplio para llevar a cabo un primer intento en la investigación educativa.
3.2 Las Fuentes de los Problemas de Investigación
Aunque existen posibles problemas de investigación en todas partes, la identificación de uno

que sea el más apropiado no es siempre una tarea fácil. En general los problemas de
investigación surgen de los intereses y las experiencias personales del investigador. Al partir de
sus intereses, un investigador puede definir un problema que sea manejable. Una manera de
empezar, es redactar una lista de las áreas que a uno le interesan. En la búsqueda de problemas
se puede mantener esta lista de posibles problemas.
Aunque muchos problemas surgen de la experiencia que se tiene en la práctica educativa, en la
teoría también pueden encontrarse problemas importantes. Una teoría puede definirse como
la serie de conocimientos organizados que usa supuestos y principios aceptados para explicar
fenómenos específicos. Existen teorías de aprendizaje, instrucción, conducta, personalidad,
interacción de grupos v medición que pueden servir como la base de investigaciones
educativas.
Otra estrategia recomendable es iniciar un programa de lectura intensivo de acuerdo a los

intereses personales. Las visitas a bibliotecas y a centros de documentación son im-
prescindibles. Los índices, tésanos y tesauros pueden ayudar a encontrar temas de interés.
Cada informe de investigación debe incluir recomendaciones para otras investigaciones y una
lista de referencias que puedan aportar nuevas ideas.
Durante la lectura de informes de investigaciones ya realizadas, es posible que encontremos

una que se desee duplicar ("replicar"). Best (1978, p. 343) ha indicado que "la 'replicación',
fusión de las palabras repetición y duplicación, es repetir deliberadamente un estudio previo
bajo diferentes condiciones de tiempo, lugar o situación socioeconómica." Borg y Gall (1983,
pp.80-82) han sugerido que por lo menos hay cuatro razones para realizar replicaciones de
investigaciones:
1) Para comprobar nuevamente los resultados de estudios importantes.
2) Para comprobar los resultados de investigaciones con poblaciones distintas.
3) Para averiguar las tendencias y los cambios a través del tiempo.
4) Para comprobar los resultados importantes usando metodologías distintas.
En el caso de Latinoamérica existe la posibilidad de replicar estudios importantes que han sido
realizados en otros países latinoamericanos o en otras regiones del mundo. Tales replicaciones
pueden contribuir a la adecuación de métodos y materiales ya comprobados en otra parte. La
replicación también aporta mucho al juicio que se emita sobre la validez de un estudio.
Tal vez una de las mejores formas de encontrar un problema de investigación es colaborar con
un grupo de colegas o trabajar bajo la dirección de un investigador con experiencia. Para un
principiante, la oportunidad de involucrarse en un proyecto grande que dirija un conocido

investigador puede ser una experiencia muy valiosa. Incluso en el campo de psicología al nivel
del postgrado; hay muchas universidades donde los trabajos de investigación realizados bajo la
dirección de un catedrático investigador, comprenden casi 1 totalidad del programa. De todos
modos cualquier investigador puede consultar con personas que trabajan en el campo de la
educación para averiguar los problemas que ello han identificado.
Pardinas (1970, p. 143) especificó otra; fuente de problemas de investigación: Serendipiti. La
expresión no tiene traducción al español y "significa la acción de descubrir problemas o
conocimientos valiosos que en el curso de una investigación no eran buscados". Es decir, hay
muchos nuevos problemas que surgen por casualidad durante el curso de una investigación
definida. Así puede suceder que, al estudiar el rendimiento de los alumnos con un determinado
método, el investigador observa diferencias entre las actitudes de ellos y planifica realizar una
investigación relacionada con esas actitudes. Igual que, una investigadora que estudiaba la
influencia del hogar y de la comunidad en el rendimiento escolar de los niños y notó algo
especial en el estado psicológico de las madres de familia. Luego, diseñó un estudio para
averiguar la naturaleza y las causas de tal estado. De cualquier forma, es importante señalar
que los problemas que surgen en una investigación no deben distraer al investigador hasta el
punto de que la investigación original no se lleve a cabo.
3.3 El Planteamiento de un Problema de Investigación
Muchos autores han considerado cuáles deben ser las características del planteamiento de un
problema de investigación. Algunas de dichas características son.-
1) Por supuesto, que emplee una forma gramatical que sea correcta, clara, concisa
completa;
2) Que generalmente se enuncia en forma de una pregunta-,
3) Que sea lo suficientemente limitado para poder ser manejado dentro de los recursos
disponibles, pero con un valor teórico y lo práctico;
4) Que pida algo acerca de la relación entre dos o más variables-,
5) Que permita la comprobación empírica, es decir, que se utilicen la recabación e
interpretación de datos;
6) Que no se exprese en una forma que permita dar un simple "sí" o "no" como respuesta;
7) Que no necesite que se adopta una posición moral o ética;
8) que generalmente se relacione con las teorías actuales y con los estudios que ya se
hayan realizado-,
9) Que se relacione con la(s) hipótesis que se sigue(n).
El hecho de tener una forma interrogativa que relaciona dos variables implica algo como lo
siguiente: "¿Cuál es la relación entre A y B?" La manipulación de por lo menos una variable para
determinar su efecto en otra variable, excluye a los problemas puramente descriptivos. Por
ejemplo, "¿Cuántos alumnos en un colegio dado aprueban un curso de física?" no requiere la
relación de variables, mientras que ' ¿En un colegio dado, cuál es la relación entre aprobar el
curso de física y el hecho de. Tener una calculadora?", sí reúne las características de un
problema de investigación. Esto no quiere decir que los problemas descriptivos no sean

importantes, ni que no deban considerarse. Simplemente significa que no todos los autores
consideran que dichos problemas pueden ser considerados como problemas de investigación.
Siempre que sea posible, es deseable investigar problemas que cumplan con todas las
características señaladas. A veces es necesario hacer estudios netamente descriptivos antes de
formular estudios donde se consideren las relaciones entre variables.
A continuación se presentan algunos ejemplos de problemas de investigación educativa que

deben tener las características mencionadas.
* ¿Cuál es la relación entre el estado nutricional de un niño y su rendimiento escolar?
* ¿Aprenden más los niños cuando los profesores tienen títulos universitarios?
* ¿Existe una relación entre la clase socioeconómica y el rendimiento escolar?
* ¿Cuál es la diferencia entre la actitud de los niños y la de las niñas hacia la matemática?
* ¿Qué relación tiene el entusiasmo de los maestros con el rendimiento de los alumnos?
* ¿Los alumnos aprenden a leer mejor con un programa que enfatiza la fonética o con
experiencias de lenguaje?
* ¿Existe acaso una relación entre el medio cultural y la deserción escolar?
* ¿Qué influencia tienen sobre el rendimiento académico de los alumnos las opiniones de
los maestros acerca de la habilidad académica de los primeros?
* ¿Qué relación hay entre los conocimientos administrativos de un director de escuela y lo
que opinan los profesores sobre su eficiencia?

Bibliografía 3

Borg, Walter R. y Gali, Meredith D. Educational Research: An Introduction, New York: Longman,
1983.
Hernández, Pablo. Introducción a la Investigación Educativa, San José, Costa Rica: Centro
Multinacional de Investigación Educativa, 1978.
Hopkins, Charles D. Under standing Educational Research, Columbus, Ohio: Merril, 1980.
Kline, David. Planning Education for Development: Volume III Research Methods for
1980.
Leedy, Paul D. Practical Research: Planning and Design, New York: MacMillan,1974.
Pardinas,. Felipe. Metodología y Técnicas de Investigación en Ciencias Sociales, México: Siglo

XXI, 1970.

Educación, Buenos Aires:Libreríal Colegio, 1978.
Tuckman, Tuckman Bruce W. Conducting Educational Research, New York: Harcourt Brace
Jovanovich, 1978.
Van Dalen, Deobold. Manual de Técnicas de la Investigación Educacional, México: Pai Whitney,
Frederick L. Elementos de Investidos, 1971. Barcelona: Omega, 1970.

Test de selección múltiple 3
1. ¿Cuál de los siguientes enunciados constituye una de las principales fallas de muchos de
los problemas que se plantean en la investigación educativa?
a) No se expresan en forma interrogativa
b) La población mencionada no existe
c) Se abarca un ámbito demasiado amplio
d) No incluyen definiciones operacionales
2. Un problema de investigación puede surgir de

a) La experiencia del investigador
b) La lectura de informes de investigación
c) D e las teorías existentes
d) No incluyen definiciones
3. El planteamiento de un problema de investigación debe por lo menos implicar

a) Una de las respuestas de un simple “sí “o “no”
b) Los valores personales del investigador
c) La interpretación de datos
4. ¿Cuál de los siguientes enunciados constituye una razón para replicar una
investigación?
a) Averiguar las tendencias y los cambios a través del tiempo

b) Comprobarlos resultados de investigaciones con poblaciones distintas
c) Comprobar los resultados importantes usando metodologías distintas
5. ¿Cuál de las siguientes sugerencias debe aplicarse en el planteamiento de un problema

investigación?
a) Enunciarlo en forma interrogativa
b) Enunciarlo en forma declarativa
c) Abarcar un tema amplio
Ejercicio 3
1. Evalúe cada uno de los siguientes problemas con respecto a las características que apa-
recen en la sección 3.3. El cuadro que se presenta después de los ejemplos debe facilitar la
evaluación
a) Nutrición y aprendizaje
b) El curriculum de la enseñanza básica
c) El efecto de la matemática moderna en la escuela secundario
d) ¿Cómo se puede impartir la enseñanza del curso de castellano de modo que se
elimine el problema de retraso en lectura a nivel secundario?
e) ¿Cuáles procedimientos pueden implementarse para reducir a un. mínimo la

deserción escolar?
f) ¿Cuáles son los tipos de orientación que funcionan mejor con alumnos de las
escuelas primarias?
g) ¿Cuál es el efecto que tiene la práctica de estimar el área de rectángulos y
cuadrados sobre los puntajes obtenidos por los alumnos en un test que requiere
que se estime el área de circunferencias?
h) ¿Difieren las actitudes con respecto a los derechos de las mujeres, entre las
estudiantes universitarias?
SI N0
1. ¿Es una oración completa?
2. Releerlo cuidadosamente ¿Dice exactamente lo que se desea decir sin
ambigüedad?
3. ¿Está libre de errores gramaticales?
4. ¿Está concisa y a la misma vez clara?
5. ¿Está en la forma interrogativa? __
6. ¿Está suficientemente delimitado? -
7. ¿Tiene un valor práctico o teórico?--
8. ¿Pide algo acerca de la relación entre dos o más variables?
9. ¿Contiene alguna(s) palabra(s) que impliquen la recabación e interpretación de
dato____-
10. ¿Necesita algo más que un simple "sí" o "no" como respuesta final?
11. ¿Es posible evitar la adopción de una posición moral o ética?
2. Vuelva a formular los problemas anteriores tratando de eliminar las fallas que se en-
contraron.
3. Redacte cinco problemas que tengan las características presentadas en la sección 3.3,
utilizando tal vez el esquema presentado en No. 1 .puede redactarlo es preciso evaluar las
características ya estudiadas. Para facilitar la evaluación se presenta una lista de preguntas
a continuación.
Aplicación 3
Ahora se pretende definir bien un problema que sirva para llevar a cabo una investigación
que se realizará más adelante en el curso. Se seguirá un proceso a fin de perfeccionar los
intereses y las dudas para llegar a un problema que sea manejable, a la vez que sea signi-
ficativo. Se presenta una estructura para efectuar dicho perfeccionamiento. Si Ud. prefiere
usar otra manera para perfeccionar el problema, favor de conversarlo con el profesor.

1. . El área general en que tiene principal interés:
2. El área secundaria en que tiene interés particular:
3. Las preguntas, dudas e inquietudes que se. Tienen con respecto al área secundaria
a) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
b) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
c) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
d) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
4. Ahora hay que plantear con mucho cuidado el problema que se desea investigar.
Después de redactarlo es preciso evaluar la característica ya estudiadas. Para
facilitar la evaluación se presenta una lista de preguntas a continuación
------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------
SI NO
1. ¿Es una oración completa?--- ----
2. Releerlo cuidadosamente. ¿Dice exactamente lo que se desea decir sin ambigüedad?---

- -----
3. ¿Está libre de errores gramaticales?---- -----
4. ¿Está concisa y a la misma vez clara? ----------
5. ¿Está en la forma interrogativa? ---------
6. ¿Está suficientemente delimitado?---- ------
7. ¿Tiene un valor práctico o teórico? ---------
8. ¿Pide algo acerca de la relación entre dos o más variables? ----
9. ¿Contiene alguna(s) palabra(s) que datos? ------------
10. ¿Necesita algo más que un simple "sí" o " n o " como respuesta Fin--------
11. ¿Es posible evitar la adopción de una posición moral o ética? ----------
5. Si encontró necesario responder " n o " a cualquiera de los puntos en torno a la
evaluación, tendrá que redactar el problema de nuevo o justificar lo que puede
haber sido una falla.
------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------
6. Subraye la (s) palabra (s) del problema que implica la interpretación de datos.

MODULO4
LAS HIPOTESIS Y LAS VARIABLESDEINVESTIGACIÓN
4.1Las Hipótesis de Investigación
Generalmente cuando una persona confronta un problema trata de- adivinar, sugerir o
especular una respuesta. Esta respuesta sugerida se llama hipótesis. Otra manera de
conceptualizar este tipo de respuesta es considerarlo como una especulación, o conjetura,
sobre las diferencias, las relaciones y las causas. Por ejemplo, si una máquina de escribir
eléctrica no funciona, debido a que se tienen conocimientos de la causa y el efecto de la
electricidad, se puede formular la hipótesis que la máquina no está enchufada. Si resulta
que sí está enchufada, se puede formular otra hipótesis por el estilo de: la corriente está
cortada. Si comprobamos que sí hay corriente, tal vez formulemos la hipótesis que el
interruptor no funciona o que el motor se ha quemado. Así, seguimos formulando
hipótesis y comprobándolas hasta resolver el problema.
Es indudable que los problemas educativos son mucho más complejos que el asunto de la
máquina de escribir, pues generalmente involucran a seres humanos. Sin embargo, el pro-
ceso de formular y comprobar hipótesis, y luego aceptarlas, modificarlas o rechazarlas, es
muy parecido.
Cabe señalar la diferencia entre un objetivo y una hipótesis. Un objetivo de investigación
indica lo que el investigador pretende lograr en vez de lo que imagina que sean las
relaciones entre variables. A veces, en las investigaciones descriptivas se especifican los
objetivos en vez de las hipótesis. Por ejemplo, una encuesta de los deseos de los
profesores universitarios de hacer estudios de postgrado, puede comprobar una hipótesis
semejante a la que sigue: "No existen diferencias significativas entre los deseos de los
profesores universitarios de varias facultades de hacer estudios de postgrado". En este
tipo de estudio también se puede
Compartir de la afirmación de objetivos tales como: "Los objetivos de esta investigación
son:
1. estudiar los deseos que tengan los profesores universitarios de las distintas
facultades de hacer estudios de postgrado,
2. y si se encuentran diferencias, tratar de identificar los factores que influyen en las
diferencias observadas."
Otra posible confusión que es preciso evitar es la que hay entre una hipótesis y una ob-
servación. Una observación se refiere a lo que se ha encontrado. Si un investigador nota
que la mayoría de los alumnos de una escuela son indígenas, esto es una observación. Tal
vez de esas observaciones se va a inducir una hipótesis informal sobre las dificultades que
los alumnos tienen con un curriculum en español. Es decir, se va a especular algo sobre la
relación que puede haber entre las características étnicas y el manejo del lenguaje.
Después de comprobar esta hipótesis específica, con más observaciones, tal vez se llegue a
una hipótesis más general sobre la relación entre el lenguaje y el aprendizaje.
Una hipótesis de investigación debe tener ciertas características:

1) Al igual que el problema, la hipótesis debe estar expresada en una forma no
ambigua, concisa y gramaticalmente correcta.
2) En contraste con el problema, debe estar redactada en una forma afirmativa.
3) Debe ofrecer una conjetura sobre la relación entre dos o más variables.
4) Debe estar enunciada de modo que pueda ser comprobable, es decir, que pueda
encontrarse que probablemente sea verdadera o falsa.
5) Debe existir evidencia de la teoría existente o una relación con ella, implicando que
vale la pena tratar de comprobarla.
De los problemas que aparecen en la sección 3.3 se pueden derivar hipótesis como las
siguientes:
* El estado nutricional de un niño y su rendimiento académico se relacionan
positivamente. Variable independiente: el estado nutricional
* Los alumnos aprenden más de los profesores que tienen títulos universitarios.
* Existe una relación positiva entre la ciase socioeconómica y el rendimiento escolar
* Los niños tienen actitudes hacia las matemáticas que son mejores de las que tienen
las niñas
* Los alumnos aprenden más de profesores entusiastas.
* El método de experiencia de lenguaje es más eficaz que el método que fonética.
4.2Las Hipótesis Nulas
Existen dos formas principales de hipótesis: la forma direccional y la forma nula. La forma
direccional se llama también hipótesis de investigación o de trabajo. Las hipótesis que se
mostraron en la sección anterior tienen la forma direccional. Generalmente, el
investigador usa la forma direccional para expresar lo que espera lograr mediante su in-
vestigación.
Las hipótesis nulas también se llaman hipótesis estadísticas. Las hipótesis nulas indican
que no existe una diferencia significativa entre las variables. Se presentan cuando son
necesarias en el test estadístico que se aplica. Vale la pena enfatizar que las hipótesis nulas
generalmente no expresan la mejor conjetura del investigador sobre la relación entre las
variables. Al principio parece que no tuviera sentido expresar una hipótesis nula que
afirma que no hay una relación cuando el investigador cree que sí la hay. Para evitar esta
dificultad algunos investigadores afirman una hipótesis de investigación que expresa lo
que esperan lograr mediante la investigación y luego, si es necesario, una hipótesis nula en
unión del test estadístico que van a usar.
Algunos autores insisten en que una hipótesis nula no es simplemente una afirmación que
hace negativa una hipótesis positiva de investigación. Por ejemplo, del problema "¿Qué
relación tiene el entusiasmo de los maestros con el rendimiento de los alumnos?" se
desarrolló la hipótesis de investigación: "Los alumnos aprenden más de los profesores
entusiastas.' La hipótesis nula en este caso podría ser: "No existe una diferencia
significativa entre el rendimiento de los alumnos que tienen profesores entusiastas y los
que tienen profesores no entusiastas." La hipótesis expresada en forma negativa que
indica que "los alumnos no aprenden más de profesores entusiastas" no es precisamente
una hipótesis nula.

4.3Las Variables Independientes y Dependientes
Una variable puede definirse como cualquier condición o característica que puede tomar
más de un valor y por lo tanto está sujeta a la medición. Las variables de una investigación
son muy importantes porque se miden y se relacionan para determinar las causas y los
efectos, o las asociaciones. Algunos investigadores reconocen hasta diez o más tipos de
variables, mientras que otros mencionan solamente dos. Tal vez sea posible transigir e
identificar cinco tipos de variables: independientes, dependientes, moderadoras, de
control y extrañas.
Las variables independientes

Tuckman (1978, pp. 58-59) definió una variable independiente como "ese factor medido,
manipulado, o seleccionado por el investigador para determinar una relación con un
fenómeno observado." En cierto sentido es el insumo del investigador en la investigación.
Tal vez, un investigador manipule la cantidad de tareas que se les asignan a varios grupos
de alumnos para averiguar el efecto de la cantidad de tareas sobre el rendimiento de los
alumnos. En este caso, la cantidad de tareas es la variable independiente. Se llama
independiente porque el investigador sólo se interesa en el efecto que tiene y no se inte-
resa en lo que dicha variable afecta. Otro nombre con el cual se designa una variable
independiente es el tratamiento experimental.
Las Variables Dependientes
La variable dependiente casi siempre se define en términos de la variable independiente.

Por ejemplo, Best (1978, p. 116) indicó que "las variables dependientes son la; condiciones
o características que aparecen desaparecen, o cambian; según el experimentador
introduce, remueve o cambia las variables independientes." Tuckman (1978, p. 59) definió
a una variable dependiente como "ese factor que se observa o se mide para determinar el
efecto de la variable independiente." En el ejemplo de la cantidad de tareas y el
rendimiento, el rendimiento es la variable dependiente. Es decir, el rendimiento es lo que
se supone que va a cambiar debido a la cantidad de tareas. Se llama dependiente porque
depende de la variable independiente. Si la variable independiente se considera como el
insumo o tratamiento, la variable dependiente puede considerarse definió a una variable
dependiente como "ese factor que se observa o se mide para determinar el efecto de la
variable independiente" En el ejemplo de la cantidad de tareas y el rendimiento, el
rendimiento es la variable dependiente. Es decir, el rendimiento es lo que se supone que
va a cambiar debido a la cantidad de tareas. Se llama dependiente porque depende de la
variable independiente. Si la variable independiente se considera como el insumo o
tratamiento, la variable dependiente puede considerarse como el producto o la respuesta.
Quizás una consideración de las variables que contienen algunas de las hipótesis que
aparecen en la sección 4.1 ayude a aclarar la diferencia entre las variables independientes
y las dependientes.
* El estado nutricional de un niño y su rendimiento académico se relacionan
positivamente.
Variable independiente: el estado nutricional.

Variable dependiente: el rendimiento académico.
* Los alumnos aprenden más de los profesores que tienen títulos universitarios.
Variable independiente: tener o no un título universitario.
Variable dependiente: el aprendizaje de los alumnos.
* Existe una relación positiva entre clase socioeconómica y el rendimiento escolar.
Variable independiente: la clase socioeconómica.
Variable dependiente: el rendimiento escolar.
* Los niños tienen actitudes hacia las matemáticas que son mejores que las que
tienen las niñas.
Variable independiente: niño versus niña. '
Variable dependiente: las actitudes hacia las matemáticas.
Cabe señalar que, en las investigaciones no experimentales, tales como son las
descriptivas y las de correlación, las situaciones son muy complejas. Por eso, en muchas
investigaciones las variables independientes suelen llamarse variables predictoras y las
variables dependientes se denominan variables de criterio.
4.4 La Variables Moderadoras

Muchas veces, el investigador reconoce otra variable, además de la variable
independiente, que tal vez, influya en la variable dependiente. Tal variable suele
llamarse variable moderadora porque modera el efecto de la variable independiente. En
un sentido, es un tipo especial o secundario de variable independiente. Tal vez, al
realizar un estudio del efecto que la cantidad de tareas tiene sobre el rendimiento de los
alumnos, el investigador pueda sospechar que la cantidad de tareas incrementa el
rendimiento de las alumnas pero no así el de los alumnos. Es decir, el factor sexo
modera la relación entre la variable independiente y la variable dependiente. Por lo
tanto, es necesario medirlo. Tal medida se hace generalmente a través de un análisis de
varianza (ANOVA) o un análisis de regresión.
Otro ejemplo de una variable moderadora se encuentra en el caso del investigador que
estudia el efecto de dos métodos de enseñanza en el rendimiento de los alumnos. Si al
investigador le parece que la preferencia que en cuanto al método tiene el profesor
también influye en el rendimiento, entonces la preferencia en cuanto al método es una
variable moderadora.
La Figura 4.4.1 muestra la incidencia de la variable moderadora en este caso.
Figura 4.4.1
Relación entre 2 métodos de enseñanza y el rendimiento, moderada por la preferencia

que el profesor tiene por un método
------------- Preferencia por Método 1
_______ Preferencia por método2

Método 1 Método 2
La investigación educativa generalmente se realiza en situaciones muy complejas. Por eso,
en muchas investigaciones se recomienda incluir por lo menos una variable moderadora.
De este modo, puede entenderse mejor la relación entre la variable independiente y la
variable dependiente. Se requiere mucha sofisticación de parte del investigador para
identificar la(s) variable(s) moderadora(s) apropiada) y aplicar un análisis estadístico
adecuado para medirla (s).
A continuación, se presentan más ejemplos de variables moderadoras:
* El rendimiento de los alumnos se incrementa con la instrucción por computadora,
pero el de los alumnos con un bajo cociente intelectual se incrementa aún más.
Variable independiente: instrucción por computadora versus instrucción
tradicional.
Variable moderadora: inteligencia. Variable dependiente: rendimiento.
* El rendimiento académico y la inteligencia están más relacionados entre los
alumnos de lo que están entre las alumnas.
Variable independiente: o el rendimiento o la inteligencia pueda considerarse
como la variable independiente y la otra como la variable dependiente. Variable
moderadora: el sexo.
* En las organizaciones nuevas; los administradores innovadores son más eficientes
mientras que, en organizaciones ya establecidas, los administradores
conservadores son más eficientes. Variable moderadora: Es opcional si se considera
a las organizaciones recién fundadas versus las ya establecidas, o al administrador
innovador versus el conservador como la variable moderadora y la otra como
variable independiente. Variable dependiente: eficiencia administrativa.
4.5 Las Variables de Control
A veces, en lugar de tratar de medir como variable moderadora algunos factores que
pueden influir en la variable dependiente, el investigador trata de cancelar o neutralizar el
efecto que tales factores puedan tener con la relación entre la variable independiente y la
variable dependiente. Tales factores, cancelados o neutralizados, se llaman variables de
control.
* La inteligencia y el rendimiento se correlacionan entre los varones
Variable independiente: o la inteligencia o el rendimiento
Variable de control: sexo
* Entre los niños de la clase baja mejor rendimiento académico en áreas
urbanas que en las áreas rurales Variable independiente: urbana versus
rural. Variable dependiente: rendimiento; rendimiento Variable de
control: clase social.
* El rendimiento académico de los niños de la clase baja mejora más de lo
clase mejora el de los niños de la clase media cuando el profesor usa
recompensa para reforzar los esfuerzos de los niños Variable de control:
reforzamiento esfuerzos.
* Los administradores que requieren mucha estructura organizacional son
más eficientes en las organizaciones recientes fundadas de lo que son
los administradores que no requieren mucha estructura organizacional.

Variable de control: tipo de organización.
En la investigación educativa hay algún variables que suelen aparecer como variables de
control o variables moderadoras. Entre ellas se cuentan el sexo, la inteligencia, nivel de
educación y la clase socioeconómica. Tuckman (1978, p. 73) sugirió tres consideraciones
que deben tomarse en cuenta; decidir si una variable debe ser tratada como una variable
moderadora o como una variable de control:
1. Consideraciones teóricas.
* ¿Se relaciona la variable con la teoría; en que se basa el estudio?
* ¿Puede influir en las interpretaciones: prácticas y en las aplicaciones?
* ¿Cuán probable es que se llegue a ejercer influencia?
2. Consideraciones de diseño.
* ¿Cómo se relacionan las decisiones respecto a las variables, con el deseo de
maximizar la validez interna, a través de un diseño adecuado?
3. Consideraciones prácticas.
* ¿Cuán difícil es tratarla como variable moderadora en vez de como variable de
control?
* ¿Existen los recursos necesarios para tratarla como variable de control?
* ¿Cuánto control hay sobre la situación experimental?
4.6 Las Variables Extrañas
Todas las variables que puedan tener alguna influencia sobre la variable dependiente, y
que no sean identificadas como variables independientes, moderadoras o de control, son
variables extrañas. Muchos estudios pierden su valor debido a la influencia de variables
extrañas. En un estudio de la relación entre la cantidad de tareas asignadas y el
rendimiento de alumnos, si no se mide si los alumnos realizan las tareas, ni la calidad de su
desempeño, esos factores pueden ser variables extrañas que expliquen las diferencias en
la variable dependiente. Uno de los propósitos principales de los diseños experimentales
es el control directo de variables extrañas o el control indirecto a través de procesos
aleatorios. Algunos investigadores denominan a las variables de control como variables
extrañas controladas y a las variables extrañas como variables extrañas no controladas.
A continuación, en la Figura 4.6.1, se presenta un esquema que refleja la relación de ' los
tipos de variables mencionadas anteriormente.
Figura 4.6.1 La relación entre los tipos de variables
Variables Variables Variables

Moderadoras de Control Extrañas
Variable --------------------------- • ---- Variable

Independiente Dependiente
4.7 Definiciones Operacionales de las Variables

Para averiguar la relación que existe entre las variables es necesario medirlas. La

medición de las variables requiere que se cuente con definiciones especiales que se
llaman definiciones operativas.
Las definiciones operativas se basan en los procesos o las operaciones que se usan para
medir las características del término que se define. Estos procesos o estas operaciones
tienen que ser observables.
Muchas definiciones aparecen en forma conceptual. Es decir, un concepto se define en

términos de otro. Por ejemplo, una definición conceptual de la inteligencia puede ser la
"facultad de comprender '. Para hacer esta definición no se usa un criterio medible. Para
llegar a una definición operativa de la inteligencia puede usarse el puntaje obtenido en un
test de inteligencia. También, es posible definir la inteligencia operacionalmente como
algo que tienen los alumnos que sacan notas altas; o algo que tienen las personas que
tienen buena memoria, vocabularios extensos y destrezas de razonamiento. Como se ha
visto, una sola variable puede tener distintas definiciones operativas. Lo importante es que
cualquier definición operativa de una variable debe indicar cómo se observa y se mide esa
variable. Además, cuando sea posible una definición operativa deberá ser lo
suficientemente clara para que signifique' lo mismo para todos.
A veces, es bastante obvia la forma de medir la variable. Las definiciones operativas de
sexo, edad, estatura, grado escolar y sueldo anual son las más patentes. A continuación, se
presentan varias variables y las posibles definiciones operativas de las mismas:
* Rendimiento académico: el promedio de las notas que el alumno obtiene en un
semestre, dado.
* Actitud frente a las matemáticas: puntaje obtenido en una escala de actitudes; y otra
sería, el número de veces que el alumno selecciona por su propia cuenta una
actividad matemática.
* Clase socioeconómica: la ubicación en un continuum desarrollado por un sociólogo;
otra sería, asistir a una escuela que se ha clasificado informalmente como de la
clase baja, media o alta.
Ya se ha visto que un término puede tener más de una definición operativa. Vale la pena
señalar que cada definición operativa es tentativa, y que puede darse el caso que se
considere conveniente perfeccionarla aún más.

Bibliografía 4

Longman, 1983.
De Landsheere, Gilbert. La Investigación Pedagógica, Buenos Aires: Editorial Estrada,
1971.
Hernández, Pablo. Introducción a la Investigación Educativa, San José, Costa Rica: Centro
Multinacional de Investigación Educativa, 1978.
Hopkins, Charles D. Understanding Educational Research, Columbus, Ohio: Merril, 1980.
Whitney, Frederick L. Elementos de Investigación, Educational Planning, Harvard
University Center for Studies in Education and Development, 1980.
Leedy, Paul D. Practical Research: Plannir and Design, New York: MacMillan, 197'
Pardinas, Felipe. Metodología y Técnicas c Investigación en Ciencias Sociales, Méxicc Siglo

XXI, 1970.
Pérez Álvarez, Felipe. Las Investigaciones E) ploratorias y Descriptivas en las Ciencia de
la Educación, Buenos Aires: Libren del Colegio, 1978.
Tuckman, Bruce W. Conducting Education; Research, New York: Harcourt Brace
Jovanovich, 1978.
Van Dalen, Deobold. Manual de Técnicas d la Investigación Educacional, México: Pa dos,

1971. Barcelona: Omega, 1970
Whitney, Frederick L. Elementos de Investigación, Barcelona: Omega, 1970.

1. Una conjetura sobre la relación entre dos o más variables se llama

a) Un problema
b) Una teoría
c) Una hipótesis
d) Un principio
2. Una hipótesis debe formularse en forma

a) Concisa
b) Que pueda ser comprobable
c) Afirmativa
3. Una hipótesis nula
a) Debe indicar lo que el investigador esfera
b) ES simplemente una forma negativa
c) Es necesaria en varios test estadísticos
4. Una condición o característica que puede tomar más de un valor y por lo tanto está
sujeta a la medición es
a) Una hipótesis
b) Una variable
c) Un control
d) Un experimento
5. Las condiciones o características que aparecen, desaparecen, o cambian; según el

investigador introduce, suprime o cambia que tratamiento experimental es
a) Una variable independiente
b) Una variable dependiente
c) Una variable moderadora
d) Una variable de control
6. Una variable moderadora influye en
a) La variable independiente
b) La variable dependiente
c) La variable de control
d) La variable extraña
7. Si el investigador eliminara el efecto, de la variable, la misma sería

a) Una variable dependiente
b) Una variable independiente
c) Una variable de control
d) Una variable extraña

8. Ese factor que el investigador mide, manipula, o selecciona para determinar una
relación con un fenómeno observado es
a) Una variable independiente
b) Una variable dependiente
c) Una variable moderadora
d) Una variable de control
9. Muchos estudios pierden su valor debido a la influencia de

a) Las variables independientes
b) Las variables dependientes
c) Las variables extrañas
d) Las variables de control
10. Las definiciones operativas

a) Relacionan un concepto con otro
b) Se basan en características que se pueden medir
c) Siempre son únicas
Ejercicio 4
1. Indique si las siguientes afirmaciones son hipótesis de investigación, hipótesis nulas,

objetivos u observaciones.
a) Eva hizo un test de inteligencia y obtuvo un puntaje alto.
b) Las niñas de la edad de Eva tienen el C.I. más alto que los niños de esa misma
edad.
c) Se planifica la aplicación de un test de inteligencia para recabar datos sobre los
condiscípulos de Eva.
d) No existe una diferencia significativa entre el C.I. de los niños y el de las niñas.
e) Las nuevas guías curriculares funcionaron mejor que las antiguas en diez
escuelas piloto.
f) No existe una diferencia significativa entre el rendimiento de los alumnos que
asisten a las escuelas donde se aplicaron las nuevas guías curriculares y el
de los que asisten a aquellas donde se siguen usando las antiguas.
g) Las nuevas guías curriculares se aplican para mejorar el rendimiento de los
alumnos.
h) Los alumnos deben rendir mejor con las nuevas guías curriculares.
2. Para cada uno de los problemas del No. 1 del Ejercicio 3 redacte dos posibles hipótesis
de investigación.
3. Redacte las hipótesis nulas para las hipótesis de investigación del No. 2.
4. Aparece las expresiones de la columna A con los términos de la columna B.
A B
a) Variable independiente- 1)Efecto
b) Variable dependiente- 2)Evitado
c) Variable moderadora 3) Amenaza
d) Variable de control 4)Causa
e) Variable extraña 5)Modificadora

5. Indique cuál es la variable independiente y cuál es la variable dependiente en cada una
de las siguientes hipótesis.
a) Las actitudes de los profesores hacia las nuevas guías curriculares son más positivas
después de que han recibido entrenamiento en el uso de dichas guías.
b) En las organizaciones ya establecidas los administradores que hacen énfasis en las
relaciones humanas tienen más éxito.
c) El rendimiento académico de los alumnos en aulas donde hay menos de 35
alumnos es mayor que el rendimiento de aquellos en aulas donde hay más de. 50
alumnos.
d) Ej. Levantamiento de pesas mejora el rendimiento de los fondistas.
6. Identifique las variables dependientes e independientes de las hipótesis que redactó

en el No. 2.
7. Identifique las variables moderadoras en las siguientes hipótesis:
a) Los profesores dogmáticos aceptan mas las cuando se imponen como

(reglamentos- y los profesores no dogmaticos las aceptan cuando las mismas
tienen el respaldo de expertos de expertos que gozan de respeto.
b) El uso de libros para colorear mejora la percepción visual de los niños y las niñas,
siendo la mejora, más notable entregas niñas.
c) La inteligencia y el rendimiento académico se correlacionan más en la ¿clase media
que en la clase baja.
d) Los docentes con poca experiencia, con título, se afilian a organizaciones más a
menudo que aquellos profesores con poca experiencia que no tienen título,
mientras que tales diferencias no se encuentran entre profesores con más de diez
años de experiencia.
8. Identifique dos posibles variables moderadoras relacionadas con las hipótesis del No. 5.
9. Identifique las variables de control en las siguientes hipótesis:

a) Entre los alumnos más inteligentes la instrucción personalizada funciona mejor que
la instrucción tradicional.
b) Entre los varones existe una correlación entre el tamaño físico y la madurez social,
pero entre las niñas de la misma edad tal correlación no existe.
c) El rendimiento académico de los varones en los primeros años básicos es mejor
cuando tienen maestros en vez de maestras.
d) Entre los profesores sin título universitario, la eficiencia, según opinan sus
directores, se relaciona positivamente con sus años de servicio.
10. Considere la siguiente hipótesis de Tuckman (1978, p. 75): Con la edad como cons-
tante, los zurdos que reciben entrenamiento preceptuó-motor rinden mejor en tareas de
la coordinación ojo mano que los zurdo que no han tenido ese entrenamiento, mientras
que tales diferencias no se manifiesto; entre los que usan la mano derecha.
Indique la variable independiente, dependiente, moderadora, y de control.

11. Considere la siguiente hipótesis de Tuckman (1978, pp. 75-76): Es más probable que
profesores de estudios sociales, sin experiencia, cambien sus actitudes hacia la enseñanza
después de obtener experiencia; aplicando la microenseñanza que antes d tenerla,
mientras que es probable que profesores de estudios sociales con experiencia mantengan
sus actitudes hacia la enseñanza habiendo aplicado o no la microenseñanza.
Indique cuál es la variable independiente la de endiente, la moderadora, y de control.
MODULO 5
EVALUACIÓN CRÍTICA DE LA INVESTIGACIÓN
5.1 Una Pauta de Evaluación para Informes de Investigación
La evaluación crítica a la cual se someten los informes de investigación puede ayudar a

evitar las fallas y los errores comunes. Dicha evaluación requiere que se entiendan los
elementos básicos del proceso de investigación.
A continuación se presenta una pauta de evaluación que puede servir como guía. En los
módulos anteriores ya se ha presentado una explicación de algunos de los puntos de la
pauta. Después de la pauta, se encuentra una explicación de los otros puntos.
Cada ítem de la pauta puede calificarse con un numeral del 0 al 3 o con la letra N. 0 = no se
cumplió; 1 = se cumplió muy vagamente; 2 = se cumplió implícitamente; 3 = se cumplió
explícitamente-, N = el ítem no es aplicable al estudio. Se puede calcular un promedio de
calificación dividiendo el puntaje total por el número de ítems que son aplicables al
estudio. Hay que tratar ese promedio con cuidado para que no haya posibilidad de que se
diga que cada ítem es igual a los demás.
A. Se presentan citas o hechos aceptados que fundamentan el problema.
B. Se indica la importancia práctica o teórica del problema.
C. Se plantea el problema en forma concisa y clara.
D. Se indican el alcance y los límites del problema.
E. Las hipótesis se relacionan con el problema.
F. Las hipótesis se enuncian de modo que puedan ser comprobadas.
G. Se ofrecen definiciones operativas de las variables y de otros términos
importantes.
H. Se identifican todas las variables significativas que se relacionan con el problema.

A. Se especifican los supuestos del estudio.
B. Se presenta un resumen adecuado a la literatura relacionada con la teoría que
fundamenta el problema.
III. El Marco Metodológico.
A. Sesgos premeditados
1. El investigador mantiene la neutralidad científica, en vez de tratar de probar su
punto de vista.
2. El investigador evita un uso excesivo de expresiones emotivas.

B. Carece de sesgos no premeditados.
C. Se especifican las características de los sujetos y la manera de seleccionarlos.
D .Sesgos de muestreo -
1. Se evita el uso de voluntarios como sujetos.
2. Todos (o casi todos) los sujetos se quedan hasta terminar el' estudio.
3. El grupo experimental y el grupo de control sólo difieren en cuanto a la variable
independiente.
4. Se evitan muestras que no sean muy representativas de la población.
E. Los instrumentos
1. Se presenta información sobre la confiabilidad y validez de los instrumentos.
2. Los instrumentos son los apropiados para la población.
3. Las normas-de los instrumentos son adecuadas.
4. Los cuestionarios son precisos y apropiados.
F. Se especifica el diseño y es el indicado.
G. Sesgos del observador al realizar Entrevistas.
1. La guía de entrevistas evita que se hagan preguntas de tal forma que sugieran la
respuesta deseada.
2. El entrevistador evita sacar inferencias sobre el significado de la conducta que está
observando.
3. Carece de preguntas amenazadoras o molestas.
H. Carece de los efectos Hawthorne, John Henry y Pigmaleón.

I. Carece de contaminación del experimentador.
J. Carece de contaminación estadística.
K. Los resultados del análisis estadístico se presentan en forma clara.
L. Se explica el tratamiento estadístico y es el adecuado.
IV. Las Conclusiones y Recomendaciones

A. Las conclusiones son claras y precisas.
B. Corresponde hacer las generalizaciones.
C. Hay recomendaciones que corresponden a los resultados.
5.2 El Sesgo en la Investigación
Un sesgo es una influencia o un efecto indebido o injusto; algo así como, una inclinación
hacia alguna forma de prejuicio. A veces se manifiesta como una tendencia a errar en una
sola dirección, o como una intención de influenciar o alterar.
Borg y Gall (1983, pp. 201-207) identificaron cuatro tipos de sesgos:
1) Sesgos premeditados,
2) Sesgos no premeditados,
3) Sesgos de muestreo, y
4) Sesgos del observador.
Los Sesgos Premeditados

A veces, es posible identificar los sesgos premeditados de un investigador, si fuese muy
obvio que él estuviese tratando de probar o demostrar su punto de vista. Si el informe
contiene muchas expresiones emotivas, estas suelen indicar los sesgos del investigador.

Hay que tener cuidado al usar porcentajes en los que no se mencionan datos brutos, y
cuando se emplean cifras en las que hay muchos puntos decimales. Si el investigador
informa que el 50o/o de los alumnos c ron, sin indicar el número total de alumnos es
posible que se trate del 50o/o de alumnos que el investigador encontró jugando al fútbol
en un parque de la localidad investigador indica seis o siete cifras decimales, puede ser
que esté usando los da la forma que salen de una computadora puede ser que él esté
tratando de en indebidamente las diferencias entre variables. Si en el resumen de la
literatura aparecen solamente los estudios que de acuerdo con la hipótesis, puede ser I se
hayan realizado estudios contradictorias o que el investigador tenga sesgos.
Los Sesgos No Premeditados

Es más difícil identificar los sesgos no premeditados. Todo el mundo tiene su punto de
vista y está sujeto a varias influencia muchos investigadores tratan de mantener una
posición neutral, objetiva y científica, debido a la importancia emocional que tienen por la
investigación, cometen "errores” en sus observaciones y medidas. Un ejemplo de sesgo
no premeditado es el de un antropólogo que viví en una región de indígenas aislada, y por
muchos años estudió la adopción del uso de productos producidos fuera de la región. Su
hipótesis era que intrusión de productos de afuera ocasionaba cada vez más y más que la
gente ya no elaborara a mano empleando materiales locales productos necesarios para
satisfacer sus necesidades vitales. El notó que algunos salían de su poblado con el fin de
comprar ropa, comestibles y utensilios de diversa índole decidió entonces abrir una tienda,
con el propósito de ayudar a la gente, sin darse cuenta del efecto que la tienda tendría
sobre los resultados de su estudio.
Los Sesgos de Muestreo
Borg y Gall (198 3, pp. 205-206) indique los sesgos de muestreo debilitan r los estudios
educativos que cualquier otro factor y mencionaron cuatro posibles tipo sesgo:
1) El uso de voluntarios,
2) La pérdida de sujetos,
3) La posibilidad de que el grupo experimental y el grupo de control difieran en algo
más que en la variable independiente, y
4) Tener sujetos que no representen a la población.
El problema de usar voluntarios como sujetos es que, generalmente no representa. Bien a
la población. Suelen tener un nivel más alto de motivación y a veces, tienen otras
características especiales. En un estudio que usa voluntarios, tal vez pueda generalizarse
con más exactitud a otros grupos de voluntarios que a la población de que proceden los
voluntarios. Es de lamentar que existan tales problemas de sesgos de muestreo con volun-
tarios, porque sobre todo, cuando hay problemas éticos o legales en una investigación
resulta muy conveniente usar voluntarios.
Si durante una investigación algunos sujetos desertan, existe la posibilidad de que
ellos tengan características no aleatorias que influyan en los resultados. Por ejemplo, en
un estudio de rendimiento académico, cabe la posibilidad de que los alumnos que se
cambian a otras escuelas o que desertan, tengan en general un rendimiento más bajo que
aquellos que permanecen en una misma escuela durante todo el año lectivo.
Si un investigador prefiere usar una muestra de alumnos que tengan una actitud positiva
hacia la escuela y otro grupo que tenga actitudes negativas es posible que los dos grupos
también difieran en rendimiento o en aptitud. Cuando haya que seleccionar a dos grupos

cuyas características sean distintas, es muy importante tratar de averiguar si solamente
difieren en las características deseadas.
Otro ejemplo del uso de grupos que difieren en algo más que la variable necesaria, se
encuentra a veces en los estudios que se han realizado sobre la educación bilingüe. Hay
una muestra de alumnos procedentes de escuelas donde está vigente un programa
bilingüe y una muestra obtenida en las escuelas donde no funciona un programa
semejante. Hay que tener mucho cuidado de no sacar el grupo de control de aquellas
escuelas donde todos o la mayoría de los alumnos sean monolingües.
Si la muestra tiene características muy distintas a las de la población corriente, es muy
difícil generalizar a toda la población. Por ejemplo, de una muestra obtenida en un área
muy remota, es muy difícil generalizar a todo un país.
En el Módulo 6 se encontrará una descripción detallada del muestreo. Si se siguen las
pautas presentadas en el mismo, el investigador no debería tener sesgos de muestreo.
Los Sesgos del Observador

Los sesgos del observador constituyen un riesgo que se corre al realizar las entrevistas y en
las investigaciones basadas en la observación. A pesar de sus intentos de observar todo y
de hacerlo con objetividad, resulta que el investigador, como ser humano que es, observa
de una manera muy selectiva. Generalmente el ser humano ve 'lo que quiere ver, oye lo
que quiere oír, y recuerda lo que quiere recordar. Al leer un informe, es bastante difícil
darse cuenta si hay sesgos del observador. No obstante, hay algunos errores que sí se
pueden detectar:
1) El uso de preguntas que se han formulado de tal forma que sugieren la respuesta.
2) La oportunidad de anotar lo que se espera en vez de todo lo que pasó. (El uso de una
grabadora puede ayudar a evitar esto).
3) El uso de una guía de observación que exige que se efectúen muchas observaciones
distintas.
4) El uso de preguntas amenazadoras o molestas.
5) El uso de entrevistadores que conocen qué resultados se espera obtener como
consecuencia de la investigación.
5.3 Los Efectos Hawthorne, John Henry y Pigmaleón
Además de los posibles sesgos que confunden los resultados de una investigación, existen
otras influencias que pueden alterar los resultados.
El Efecto Hawthorne
Quizás la más famosa de tales influencias es el llamado "Efecto Hawthorne". Fue
descubierto en los años veinte, durante una investigación en una fábrica del pueblo de
Hawthorne, en el estado de Nueva York. Resulta que la productividad en la fábrica
aumentó cuando la intensidad de la luz. Luego, cuando se disminuyó la intensidad de la
luz, la productividad siguió aumentando. En experimentos posteriores cambios que se
introdujeron en los períodos de descanso y en las horas de trabajo dicen como resultado
un aumento en la productividad. Aparentemente, en el ambiente ocurrido de trabajo de
esa fábrica, la pura de que se estaba realizando una investiga ocasionó aumentos en la
productividad, actualmente, el efecto Hawthorne se refiere a cualquier situación en la cual
el hecho de participar en una investigación mejora el rendimiento de los participantes.

Se supone que en muchos experimentos educativos, sobre todo en
aquellos donde se emplean nuevos métodos, materiales y equipos, el
efecto Hawthorne sea una influencia. Hasta ahora la evidencia de que eso
es cierto es indirecta, y los intentos de comprobarla directament e no han
resultado. De todos mo dos, vale la pena reducir la novedad d el tratamiento
experimental y disminuir la conciencia de los participantes de que están
participando en algo novedoso. Algunos escri tores señalan que, aunque
para los propósitos de una investigación se desea minimizar el efecto
Hawthorne, un profesor puede usar el efecto Hawthorne como una de las
técnicas para mejorar el rendimiento de los alumnos.
El Efecto John Henry

El efecto John Henry es parecido al efecto Hawthorne, pero tiene que ver
con el rendimiento de un grupo de control. John Henry' es la figura que , en
el folklore de los ferroca rriles norteamericanos, compitió contra una
máquina de vapor clavando los clavos de lí nea. Según la leyenda, John
Henry ganó la competencia haciendo un esfuerzo increíble. Por lo tanto, si
los participantes del grup o de control llegan a saber que su rendimiento se
compara con el rendimiento de un grupo ex perimental, entonces van a
hacer todo lo po sible para mejorar. Es difícil evitar el efecto John Henry en
muchas situaciones, porque hay muchas personas que tienen el deseo de
probar que "son tan buenos como los de más".
El efecto Pigmaleón toma su nombre de una obra de George Bernard Shaw,
(que fue la base de Mi Dulce Dama), en la cual un pro fesor de idiomas
cambió la manera de hablar y actuar de una muchacha de la clase baja de
Inglaterra. Rosenthal y Jacobson (1968) en un estudio controversial
llamado Pygmalion in the Classroom, comprobaron que la opinión de los
profesores con respecto a la inte ligencia de sus alumnos, influyó mucho en
los puntajes en un test de inteligencia. Por lo tanto, el efecto Pigmaleón es
la influencia que ejercen las expectativas que tenga el in vestigador en
cuanto los cambios que se darán en los sujetos. Para evitar el efecto
Pigmaleón, el investigador tiene que tener cuidado de no comunicarles sus
expectativas a los sujetos.
5.4 La Contaminación
Borg y Gall (1983, pp. 224 -225) seña; dos tipos de contaminación: '
1) La contaminación del experimenta
y
2) La contaminación estadística
La Contaminación del Experimentador

La contaminación del experimentador ocurre cuando el mismo tiene
conocimientos previos de los sujetos que van a participar en investigación.
Si el experimentador ha el rendimiento o la conducta de un sujeto
determinada situación, es posible que influya en lo que observe de él en
otra sil situación Por ejemplo, si el experimentador a presenciado que un

alumno se comporta agresivamente en la cancha de fútbol, es posible que
vaya a interpretar mal la conducta de alumno en el aula. La contaminación
es un tipo de sesgo, pero el sesgo del observador es distinto a la
contaminación del experimenta dor. El sesgo del observador es una
tendencia va a ver solamente lo que se desea ver, mientras que la
contaminación del experimentador se refiere a la influencia que ejercen los
conocimientos previos que se tengan acercan de los sujetos.
La Contaminación Estadística
Existe la posibilidad de contaminación estadística cuando los sujetos del
grupo de control llegan a estar en contacto con los sujetos del grupo
experimental o con el tratamiento.
Si se investiga el rendimiento que resulta al emplear dos métodos distintos
de enseñanza con los dos grupos en cuestión, y estos estudian juntos en la
tarde, los resultados se contaminación Otro tipo de contaminación
estadística ocurre cuando se mide la correlación, entre dos medidas,
cuando una de las medida ya es un factor importante que influye sobre la
otra. Cuando en un estudio se encuentra una correlación alta entre
inteligencia capacidad para reconocer la definición, ciertas palabras, dicha
correlación está contaminada porque la capacidad para definir palabras
forma una parte significativa de la mayoría de los test de inteligencia.

Bibliografía 5
Best, John W. Cómo Investigar en Educación, Madrid: Ediciones Morata,1974.
Borg, Walter R. y Gall, Meredith D. Educational Research: An Introduction, NewYork:

Longman, 1983.
Pardinas, Felipe. Metodología y Técnicas de Investigación en Ciencias Sociales, México:

Siglo XXI, 19'0.
Rosenthal, Robert y Jacobson, Lenore. Pigmalion in the Classroom; New York: Holt,
Rinehart and Winston-, 1968.
Van Dalen, Deobold. Manual de Técnicas de la Investigación Educacional, México:

Paidós, 1971.

1. El uso de expresiones emotivas en un informe de investigación

generalmente indica
a) Sesgos de muestreo
b) Contaminación del experimentador
c) Sesgos premeditados
d) Sesgos del observador
2. Si alguien que esté trabajando en una investigación tien e conocimientos

de cuál ha sido el desempeño de los sujetos en la variable in-
dependiente y observa su desempeño en la variable dependiente, existe
mucha posibilidad de
a) El efecto Pigmaleón
b) Contaminación estadística
d) Contaminación del experimentador
3. ¿Cuál de los siguientes factores constituye la debilidad más común de las

investigaciones educativas?
a) Los sesgos premeditados Los sesgos de muestreo
b) Fallas en el análisis estadístico

c) Una hipótesis inadecuada
4. La contaminación del experimentador ocurre cuando un ayudante de un

investigador
a) Ya tiene conocimientos de cuál ha sido el rend imiento de los sujetos
en la variable dependiente
b) No recibe suficiente entrenamiento
c) No tiene conocimientos del propósito del experimento
d) Todas las respuestas anteriores son co rrectas
5. Cuál de los siguientes factores puede implicar sesgos de muestreo?
a) El uso de voluntarios
b) La pérdida de sujetos
c) Tener sujetos que no representen bien a la población
6. EJ efecto Hawthorne tiene que ver con
a) El grupo experimental
b) El grupo de control
c) La pérdida de sujetos
d) Ninguna de las respuestas anteriores es correcta.
7. Si el grupo de control sabe que forman par te de una investigación, es

posible que surja
a) El efecto Hawthorne
b) El efecto John Henry
c) El efecto Pigmaleón
d) Ninguna de las respuestas anteriores es correcta
8. Si los alumnos del grupo de control estudian junto con los alumnos del
grupo experimental, existe la posibilidad de que haya
a) Sesgos del observador
b) Contaminación estadística
d) Todas las respuestas anter iores son correctas
9. ¿Cuál de los siguientes factores puede implicar sesgos de observador?

a) El uso de preguntas amenazadoras
b)Tiempo insuficiente para registrar todo lo que se desea
c) El uso de observadores que conocen las hipótesis
d)Todas las respuestas anteriores son correctas
10. La pérdida de sujetos suele indicar ses gos porque

a) El efecto Hawthorne es más probable
b) La muestra que queda es demasiado pequeña
c) No se pierden aleatoriamente
Ejercicio 5

1. Considere el siguiente ejemplo sobre las características de una muestra
de una investigación. Identifique los posibles sesgos de muestreo.
Para determinar qué efectos tuvo un nuevo tipo de laboratorio que se usa
en un curso de ingeniería civ il sobre el ren dimiento de estu diantes
universitarios, se seleccionó una mues tra de 12' estudiantes, de esa carrera
en el curso de "Análisis de Materiales". Cada sujeto estaba en uno de los
cuatro laboratorios exis tentes, teniendo cada laboratorio un profesor
distinto. Se seleccionaron dos de los laborato rios aleatoriamente para que
sirvieran como experimenta les y los otros dos como contro les. Se realizó el
experimento en una univer sidad particular con alumnos del quinto se -
mestre. De los 63 -que comenzaron en el grupo experimental, 35
terminaron/el curso. De los 64 del grupo 35 controles, "53 terminaron.
2. Identifique y explique la naturaleza de los posibles sesgos en los

siguientes estudios:
a) El propósito de este estudio es probar de una vez por todas que las
calculadoras de moran el aprendizaje de la matemática.
b) Un estudio que tiene el título: "El Desperdicio en las Agencias
Internacionales
3. Identifique y explique la naturaleza de sesgos o de las contaminaciones -

que está presentes en los sig uientes estudios:
a) Un investigador presenta la hipótesis que las maestras de enseñanza
primaria disciplinan más a los varones que a las niñas, mientras que
los maestros son más justos en impo ner disciplina. El seleccionó a 30
maestros a 30 maestra s y observó a cada cual dos es en el lapso de
tres horas. Cada vez que u maestro le llamó la atención a un alumno
investigador anotó la conducta del alumno la medida de disciplina
y el sexo del alumno .
b) Un investigador tiene un grupo experimental que está estudian do una
unidad sobre la ecología y un grupo de control que no está
estudiando, con el objeto de observar las diferencias en las actitudes
de los alumno hacia la conservación del ambiente natural Durante el
período en que se realiza la investigación, se abre un museo de
historia natural: y hay un espectáculo en la televisión sobre
conservación de la naturaleza.
4. Uno de los integrantes de un equipo adiestramiento de un ministerio de

educad desarrolla un programa para mejorar las destrezas de los
profesores para interrogar y i como consecuencia, mejorar el rendimiento
de sus alumnos. Para comprobar la eficacia del programa , decide probarlo
con un grupo experimental y con un grupo de control, explica el programa
a un grupo de profesores y 60 de ellos acceden a participar en el estudio.
Se asignan 30 aleatoriamente para recibir el entrenamiento y 30 para el
grupo de control.
a) Existe la posibilidad de sesgos de muestreo. Explique.
b) Existe la posibilidad del efecto Hawthorne. Explique.
c) Existe la posibilidad del efecto John Henry. Explique.

d) ¿Cómo podría cambiarse el estudio para evitar esto
MODULO 6
EL MUESTREO
6.1 Introducción a los Conceptos de Población y Muestra
Con la finalidad de aportar algo significativo al avance de la práctica y de la

teoría de la educación, un investigador procura obtener resultados que
correspondan a un grupo nu meroso de individuos, de instituciones o de
sucesos. Generalmente, no es factible realizar la investigación con todo el
grupo, c sea la población, debido a las limitaciones de tiem po, dinero y
otros recursos, y a la poca acce sibilidad de algunos elementos de la
población. Por lo tanto, se hace necesario seleccio nar una parte de la
población, y a esto se le llama una muestra. En el Módulo 5 , ya se ha visto
que los sesgos de muestreo pueden anu lar los resultados de una
investigación. En es te módulo se considerarán las características de los
diferentes tipos de muestras, además de sus ventajas y desventajas.
Si el muestreo se concibe como la s elección de una cantidad determinada
de sujetos de una población, es necesario tener una visión clara de lo que
es una población. Para los propósitos de l a investigación educativa es
posible considerar dos tipos de poblaciones:
1) La población meta, (o univer so) y
2) La población accesible.
La Población Meta
La población meta es el conjunto de per sonas, cosas o sucesos con
respecto al cual el investigador desea generalizar los resultados de su
investigación. Una población meta puede ser grande y corresponder a un
área geográfica muy amplia o puede ser pequeña y pro ceder de un área
muy restringida. Una consi deración de los siguientes ejemplos deberá
mostrar los tip os de posibilidades que hay: to dos los alumnos de enseñanza
media en Lati noamérica, los supervisor es de una región, los desertores de
las escuelas primarias de la ca pital, los profesores de matemática -en las
escuelas normales de un país o los alumnos cie gos de escuelas rurales
oficiales.
Si se trata de una población amplia, aumen ta la validez externa y las
posibilidades de generalizar los resultados con confianza. Al mismo tiempo,
suele ser difícil sacar una muestra representati va de una población amplia
y esto requiere que la muestra sea grande. Si la población es más
restringida, es más fácil sa car la muestra, pero serán menores las
posibilidades de generalizar los resultados.

De vez en cuando es necesario, o es facti ble, utilizar la totalidad de la
población al realizar una investigación. Un Ministerio de Educación de sea
obtener información descrip tiva sobre todas las escuelas, todos los
alumnos y todos los profesores. La enumeración completa de todos los
elementos de una población se denomina censo. Ejemplos de esto son los
censos.de población nacional y los censos de salud pública. Por otro lado,
cabe la posibilidad de que la población sea tan pe queña que no se pueda
abarcar completamen te. Un ejemplo de esto podría ser el que se realice un
estudio sobre los alumnos de una escuela o univ ersidad, que no se desea
generalizar a otras escuelas; o una in vestigación activa que se lleve a cabo
en una sola aula.
La Población Accesible
Es bastante difícil sacar una muestra y a la vez recabar los datos para
realizar un estudio que abarque a todos los alumnos de enseñan za
media.de Latinoamérica. Por lo tanto, el investigador muchas veces saca su
muestra de lo que se llama la población accesible. En este caso, tal vez, la
población accesible se rían todos los alumnos de enseñanza media de un
país, de una región, o de una ciudad. Generalmente, aunque se saca la
muestra de una población accesible, se desea generalizar los resultados
con relación a la población me ta. Es decir, la generalización que el
investigador quiere hacer requiere que se lleven a cabo dos pasos
importantes: 1) Generalizar de la muestra a la población accesible y lue go
2) Generalizar de la población accesible a la población meta.
Generalizar de la muestra a la población accesible, result a fácil si se trata

de una muestra aleatoria, es decir, si cada eleme nto de la población ti ene
la misma posibilidad de que dar incluido dentro de la muestra. Si la
obtención de una muestra aleatoria no es facti ble, entonces el investigador
debe tratar de presentar, en l as variables claves de la inves tigación, datos
que indiquen que la muestra y la población accesible son semejantes. Por
ejemplo, si un estudio se realiza con una muestra no aleatoria de los
alumnos de en señanza media de un país, tal vez el investi gador encuentre
datos que indiquen que los alumnos qu e integran la muestra tienen
características de rendimiento, de edad y de clase socioeconómica, que son
semejantes a las que tienen todos los alumnos en general. Si los datos
indican que la muestra es muy distinta a la población accesible, van a
haber sesgos. El inves tigador tiene que discutir la naturaleza de los
posibles efectos que esos sesgos pueden tener sobre los resultados. Si el
investigador no puede proporcionar da tos sobre la semejanza entre la
muestra y la población acc esible, los resultados serán du dosos.
El segundo paso, hacer una generalización de la población accesible a la
población me ta, es semejante al proceso de generalización de la muestra a
la población accesible. Si no le es posible sacar la muestra de la población
meta, el investigador debe procu rar demostrar las semejanzas que haya
entre ambas pobla ciones.
La razón principal para utilizar una muestra tiene que ver con los recursos
de tiempo y de dinero. Esto obedece a que quizás el investi gador no

disponga de suficientes recursos, o a que la pobl ación vaya a cambiar en el
transcurso de la investigación, si es que la lleva a cabo con los recursos que
tiene disponibles. A veces, existen otras razones por las cuales es necesario
sacar una muestra. Si el investi gador tiene que controlar lo que pasa con
los sujetos, es necesario sacar una muestra. Al gunos tratamientos
experimentales producen cambios o contaminan lo que se está estu diando.
Por ejemplo, l a aplicación de un cu rriculum nuevo va a cambiar o a
"contaminar" los conocimientos y las actitudes de los alumnos.
Términos Importantes Relativos al Muestreo

Existen algunos términos que se usan mu cho al tratar el tema del
muestreo:
1) El error de muestreo significa la diferencia que hay entre las
características de una muestra y las de la población de donde se ha
sacado la misma. Si se trata de una muestra aleatoria, es posible
estimar matemáticamente el error de muestreo.
2) Un cuadro de muestreo o marco muestra es una lista que contiene los
elementos que integran una población. Una lista de los superviso res
escolares que hay en un país y la nómina de todos los alumnos de
enseñanza media ofici al, constituyen ejemplos de cua dros de muestreo.
Generalmente, es posible disminuir el error de muestreo si se aumenta
el tamaño de la muestra.
3) Una muestra es representativa si se aproxima a la población con
relación a las variables importantes de la investigación. Vale la pena
enfatizar que representativa no qu iere decir que sea exactamente igual
a la pobla ción.
4) Una muestra es probabilística si cada elemento de la población tiene la
misma probabilidad de ser seleccionado.
5) Una muestra es no probabilística si no se sabe la probabilidad de que
cada elemento sea seleccionado para la muestra. Aún existe la
posibilidad que algunos elementos no tengan ninguna probabili dad de
ser incluidos en la muestra.
6) Un estadístico es un valor de medida basada en una muestra.
7) Un parámetro es un valor de medida de una población.
La Información sobre el Muestreo que Apare ce en un Informe

Borg y Gall (198 3, pp. 243 -244) indicador. Que en un informe de
investigación debe pre sentarse por lo menos el siguiente informador sobre
el muestreo:
1)Una descripción de la población con re lación a la cual se desea
generalizar los resulta dos.
2) Una descripción del procedimiento de muestreo que permite que se
realice una "replicación". Debe incluir, como mínimo,
a) El tipo de muestra,
b) El tamaño de la muestra y

c) El área geográfica que ab arca la muestra. En muchos estudios
educativos es necesario incl uir también, información como el sexo,
la edad, el nivel educativo y el estatus socioeconómico.
3)Una identificación del cuadro de muestreo que se utilizó.
4)La proporción de la muestra inicial que participó en la investigación
completa.
6.2 La Muestra Aleatoria Simple
Una muestra aleatoria (al azar) simple es -ir. a selección de sujetos en la

que cada elemento de la población tiene la misma proba bilidad de ser
incluido. Una muestra aleatoria s imple es el tipo básico de muestra
probabilística.
Se han sugerido varias maneras de sa car una muestra aleatoria simple,

pero la manera más aceptable parece ser mediante el uso de números
aleatorios; empleando una tabla de números alea torios, o con una
calculadora i q ue dé una secuencia de números aleatorios, o utilizando una
computadora. A continua ción, se presenta el proceso a seguir para sa car
una muestra aleatoria simple empleando una tabla de números aleatorios.
Una tabla de números aleat orios es una lista de varias columnas que
contienen números seleccionados de tal forma que su secuencia no tiene
un patrón (ver Tabla 6.2.1). Es de cir, cada cifra del 0 al 9 tiene la misma
probabilidad de seguir cualquier cifra dada.
Para sacar una muestra aleatoria simp le, deben seguirse los siguiente s
pasos:
1) Se obtiene un cuadro de muestreo de la población correspondiente y
se enumeran en forma consecutiva los elementos de 1 a N, donde N
significa el número de elementos de la población. A veces es
conveniente colocar ceros frente a los números que contienen menos
cifras que N. Por ejemplo, si hay 3545 elementos -en el cuadro de
muestreo, 5 pueden representarse como 0005, 45 como 0045 y 328
como 0328. Dicha representa ción puede ayudar cuando hay que
tomar los números de la tabla.
2) Se determina el tamaño de la muestra, un número n menor que N.
3) Se empieza con la selección en la tabla de números aleatorios, en
cualquier punto de la misma. (Tal vez convendría cerrar los ojos y
luego colocar el lápiz en una de las colum nas).
4) Anotar los primeros n números menos que, o igual a N, que se
encuentran leyendo de arriba hacia abajo. Deben pasarse por alto los
números mayores que N y los números que se repit en. Cuando se
termine una columna, se pasa a la próxima.
5) Cada número seleccionado de la tabla de esta forma corresponde a
un elemento del cuadro de muestreo.
6) Como ejemplo se selecciona una muestra de 30 de u n cuadro de
muestreo que contie ne 534 elementos. Se empieza en la Tabla 6.2.1
.al principio de la segunda co lumna. Debido a que en el cuadro de
muestreo hay 5 34 elementos, es necesario tomar números de tres

cifras. Se puede tomar cualquiera de las tres cifras de la columna.
Una manera podría ser tomar las t res cifras de la mitad de la
columna. Así, se selecciona como el primer elemen to el número 008
del cuadro de muestreo. El segundo elemento será 059, Conti núa así:
3 -> 421 4 ->134->5-> 024->6->453

7->95 8->339 ->9->520->hasta->30->333
Los número s 659, 911 y 988 no se seleccio naron porque son mayores que
534, que es el número d e elementos que contiene el cua dro de muestreo.
Obviamente, las circunferen cias indican los números que son útiles y los
números rayados quedan fuera del rango correspondiente.
Con este método de formar una muestra, no puede ha ber sesgos del
investigador. Generalmente, lo difícil de este método es en contrar un
cuadro de muestreo que conten ga e identifique, sin ambigüedad, a cada
elemento de la población.
6.3 Otras Muestras Probabilísticas
Las Muestras Sistemáticas

Si el investigador dispone de un cuadro de muestreo que contiene los
elementos en un orden aleatorio y tiene que sacar a mano la muestra, tal
vez convendría sacar una mue stra sistemática. A continuación, se
presentan los pasos a se guir para sacar una muestra sis temática:
1) Se divide el tamaño del mar co muestra por el tamaño que se desea
que tenga la muestra. Ese valor, redondeado a un número entero, se
denomina "k".
2) Se comienza en el cuadro de muestreo en un punto seleccionado
aleatoriamente. Ese elemento así seleccionado sirve como el pri mero
de la muestra.
3) Se suma el valor "k" al número del pri mer elemento, para así obtener
el segundo ele mento.
4) Se suma el valor "k" al número del segundo elemento, para así
obtener el tercer ele mento.
5) Se continúa hasta haber obtenido toda la muestra.
En el ejemplo de la sección 6.2 hay un cuadro de muestreo de 534
elementos y se desea obtener una muestra de 30 elementos.

TABLA 6.2.1
Se saca una muestra total de 400 de las 1200 escuelas, se encuentran las
siguientes cantidades en cada subgrupo:
Dividiendo 534 entre 30, el resultado es 17.8 por lo tanto, k=18. Si se

comienza en el cuadro de muestreo aleatoriamente en el elemento 8, el
primer elemento de la muestra será el nú mero 8 del cuadro y el segundo
elemento será 8 + 18, o sea 26. El tercer elemento será 26 + 18, o sea 44.
Se continúa en esta forma hasta tener 522 como el último elemento en la
muestra de 30 elementos.
Si el trabaje se hace a mano, es un poco más sencillo sacar una muestra
sistemática que una muestra aleatoria simple. Debe recordarse que, para
sacar una muestra sistemática que sea equivalente a una aleatoria, el

cuadro de muestreo tie ne que estar en un orden aleatorio. De no ser así,
puede resultar que una ca racterística que no se a común a todos los
elementos de la población aparezca con bastan te frecuencia. Por ejemplo,
si el cuadro de muestreo está en tal orden que las mujeres y los hombres
se alternan, es p osible que se obtenga una muestra de sólo hombres o sólo
mujeres. En dichos casos es más fácil sacar una muestra aleatoria simple
que volver a ordenar el cuadro de una manera aleatoria.
Las Muestras Estratificadas
Si existe la posibilidad de que una muestra aleatoria simp le o sistemática
no sea lo suficientemente representa tiva (porque haya mucha
heterogeneidad) entonces tal vez sea con veniente sacar una muestra
estratificada. En la sección 6.1 ya se mencionó que, en general, las
muestras grandes son más representativas, así como también las muestras
obtenidas de poblacione s homogéneas. Una muestra estra tificada se basa
en el hecho de que de las po blaciones homogéneas se obtienen muestras
más representativas. Para sacar una muestra estratificada hay q ue dividir
la población en subgrupos o estratos y luego sacar una mues tra aleatoria
simple de cada subgrupo.
Otra manera de conceptualizar una mues tra estratificada es en términos de
las variables de control. Primero, hay que identificar las variables de
control que van a servir para determinar los subgrupos de estratificación.
En un estudio en el que se comparan las ac titudes de los profesores de
enseñanza prima ria y media hacia las computadoras, se restrin ge a los
profesores de esos niveles porque es un a variable de control especificada.
Hay que seleccionar una muestra compuesta de profe sores de educación
primaria y de profesores de educación media, porque esa es la variable
independiente. Tal vez al investigador le pa rezca que deb e controlar el
efecto de las diferencias habidas entre hombres y mujeres. En esta forma
él podrá averiguar el porcenta je de hombres y mujeres que trabajan en
cada nivel y seleccionar aleatoriamente una mues tra estratificada de
acuerdo con esos porcen tajes.
La Tabla 6.3.1 indica cómo es posible se leccionar una muestra estratificada
de directores de escuelas de enseñanza media. Cabe señalar que algunas de
las variables de control se controlan por exclusión y otras por
estratificación.
Entre las variables de estratificación (de control) que suelen usarse están
el sexo, la edad, la clase socioeconómica y la región geográfica. Una
muestra estratificada mejora el carácter rep resentativo de la muestra y
asegura en cada subgrupo una cantid ad suficiente que permitirá llevar a
cabo un análisis esta dístico.
Las Muestras por Conglomerados

A veces, en las investigaciones educativas es conveniente empezar con una
muestra de los grupos de individuos para luego generali zar a los individuos.
Los grupos de individuos se llaman conglomerados. Un ejemplo podría ser
un cuestionario de actitudes hacia la matemática que se desea pasar a una
muestra de 500 al umnos de educación media. En lu gar de sacar una
muestra aleatoria simple, es posible sacar u na muestra aleatoria de las

clases de matemática. Si e n la población hay 200 clases de matemática con
un promedio de 3 3 alumnos en cada clase, sería más con veniente sacar una
muestra de 16 ó 17 clases y pasarles el cuestionario a todos los alumnos de
cada una de esas clases.
También se puede sacar una muestra por conglomerad os haciéndolo por
etapas. De modo que, tal vez, un investigador que desee in dagar algo sobre
los alumnos de enseñanza primaria pueda sacar una muestra de escuelas y
luego, dentro de cada escuela, una muestra de clases.
La ventaja de sacar una muestra por con glomerados es que se ahorra

dinero y tiempo. A veces es más fácil realizar la investigación con
conglomerados que solamente con indi viduos. La desventaja es que al sacar
una muestra semejante, existe mayor posibilidad de que haya error de
muestreo. El investiga dor tiene que considerar cuidadosamente si el ahorro
de tiempo y dinero vale la pérdida del carácter representativo de la
muestra.
Se pueden combinar los métodos de muestreo para obtener muestras tales
como: muestras estratificadas por conglomerados, o mues tras
estratificadas sistemáticas. También exis ten muestras de probabilidad no
igual y otros tipos aún más complejos. Si el lector tiene interés en diseños
más complicados, sería con veniente que consultara libros sobr e muestreo.
Tabla. 6.3.1
Un Plan de Muestreo Estratificado
Para Escuelas de Enseñanza Media de un país
Población: Todos los directores de escuelas de enseñanza media de un país.

Las variables controladas por exclusión:
1. Los directores con menos de un año de servicio en el plantel.

2. Las variables controladas por estratificación:
Las variables controladas por estratificación:
1. Particulares versus Oficiales
60% Particulares 40%Oficiales
2. Urbana Versus Rural
50%Urbana 10%Rural 30%Urbana 10%Rural
3. El número de alumnos
(Grande=más de1000 Pequeña= Menos de 1000)
20%grande 5%grande 16% Grande 5% Grande

30% Pequeño 5% Pequeño 14%Pequeño 5%pequeño
Si se saca una muestra total de 400de los1200 escuelas, se encuentran las

siguientes cantidades en cada subgrupo:
Muestra Población
Particular, Urbana Grande 20% 80 240
Particular, Urbana Pequeña 30% 120 360
Particular, Urbana Grande 5% 20 60
Particular, Urbana Pequeña 5% 20 60
Oficial, Urbana Pequeña 16% 64 192
Oficial, Urbana Grande 14% 56 168
Oficial, Urbana Pequeña 5% 20 60
Oficial, Urbana Grande 5% 20 60
6.4 Las Muestras No Probabilísticas
Las Muestras Disponibles

Un ejemplo muy común de una muestra disponible es la muestra que
obtiene el entrevistador que se para en una esquina de una ciudad y
detiene a los transeúntes para hacer les preguntas. En la educación, las
muestras disponibles a menudo son las clases que di cta el propio
investigador o las que dictan sus conocidos. Dichas muestras también se
llaman muestras accidentales o incidentales.
Las muestras disponibles son de mucha utilidad en los estudios piloto.
Indudablemente, son las muestras que requieren menos d inero y tiempo,
pero generalmente el investigado: no tiene la menor idea de si so n de
característica:-. Representativo. Por lo tanto, es preferible usar cualquier
otro tipo de muestra.
Las Muestras por Expertos

Las muestras por expertos se selecciona según los juicios de los expertos
que conocer bien la poblaci ón y el propósito de la investigación y que, por
lo tanto, pueden opi nar.; sobre el carácter represent ativo de una muestra.
Las muestras por juicio y las intenciona les son muy semejantes a las
muestras por expertos. Tales muestras son muy apropiadas para
seleccionar ejemplos para estudios como; casos y para identificar muestras
de grupos muy particulares, tales como personas o ins tituciones que
poseen características extrañas .
Las Muestras por Cuotas

Las técnicas para seleccionar las muestr eo; por cuotas evolucionaron de los
métodos que se emplean para sacar las muestras por expertos. La idea es la de
determinar la cantidad de elementos que se desean y que posean cier ras
características determi nadas. Es decir, se seleccionan varios subconjuntos
de elementos. Son muy seme jantes a las muestras estratifi cadas, pero sin
que se haya hecho una selección completamente aleatoria. En las
entrevistas ha sido común usar las muestras por cuotas. De m odo que, tal

vez, un entrevista dor tenga que entrevistar a 35 hombres de un barrio de
clase baja, a 45 hombres de un ba rrio de clase media y a 25 de un barrio de
clase alta.
6.5 El Uso de Voluntarios
En el Módulo 5 se enfatizó que el uso de voluntarios puede implicar

muchos sesgos de muestreo. Borg y Gall (1983, pp. 251 -257) señalaron que,
a pesar de los problemas de sesgos de muestreo, el inve stigador en
educación a menudo se ve obligado a usar volun tarios. En las encuestas
que no demandan mucho tiempo de los sujetos, es posible usar muestras
aleatorias, pero en los estudios co rrelaciónales y experimentales que
demandan mucha cooperación de parte de los sujetos, es difícil que t odos
estén dispuestos a partici par. Por lo tanto, aunque se comienza con una
muestra aleatoria, después de que muchos ha yan decidido no participar,
los que se quedan, efectivamente, son voluntarios. A pesar de que se sabe
que los voluntarios no tienen las mismas características que los no
voluntarios, muchas veces e l investigador se ve e n la nece sidad de usarlos.
Lo importante es tratar de averiguar la influencia que puedan tener las
características especiales de los voluntarios sobre los re sultados y
aumentar el porcenta je de la pobla ción que esté dispuesta a parti cipar en
la investigación.
Rosenthal y Rosnow (1975) publicaron una reseña m uy completa de las
investigaciones realizadas en Norteamérica con relación al uso de
voluntarios. Parece que, en relación a los no volunt arios, los voluntarios
norteamericanos tienen un nivel más alto de preparación académ ica y
pertenecen a una clase so cio-económica más alta. Además, son más
sociables y sienten una necesidad más grande de ser ace ptados
socialmente. Hay otras ca racterísticas de los voluntarios que no son tan
confiables. No se sabe si estas características pueden encontrarse "también
en Latinoamérica. Las características que poseen los vo luntarios en
Latinoamérica podría ser un tema para realizar una investigación muy
interesante.
El investigador tiene que decidir si las ca racterísticas de sus voluntarios
significan ses gos. Además, el investigador debe hacer todo lo que esté a su
alcance para incrementar el porcentaje de los posibles sujetos que estén
dispuestos a participar en su investigación. Rosenthal y Rosnow (1975)
presentaron diez suge rencias que puedan motivar a que las per sonas
participen voluntariamente:
1. La solicitud de voluntarios debe hacer se en la forma más interesante
posible, toman do en consideración la naturaleza de la po blación
meta.
2. Hay que hacer la solicitud de la forma lo menos agresiva posible, para
evitar la posibilidad de que surjan temores de que se va a hacer una
evaluación personal negativa en el transcurso de la investigación.
3. Afirmar explícitamente la importancia práctica y teórica de la
investigación.

4. Afirmar explí citamente la pertenencia particular que tiene la
población meta y lo importante q ue es participar en una
investigación que posiblemente vaya a beneficiar a otras personas.
5. Cuando sea posible, hay que ofrecer una remuneración a los que
participan en la investigación y dar obsequios de cortesía a los que
consideran la posibilidad de parti cipar.
6. Una persona cuyo estatus sea alto debe solicitar la participación de
los voluntarios.
7. Cuando sea posible, hay que evitar las investigacion es que provoquen
tensiones sico lógicas y biológicas.
8. Cuando sea posible, hay que indicar que participar en calidad de
voluntario es un hecho normal y aceptado.
9. Una persona que sea conocida por la población debe solicitar la
participación de los voluntarios, en una forma personal.
10. Si dentro de la población es algo común y corriente participar como
voluntario, el compromiso de acceder a participar debe hacerse
públicamente. Si dentro de la población no es común y corriente
participar como voluntario, el compromiso de accede r a participar
debe hacerse en privado.
6.6 El Tamaño de una Muestra
Todo investigador confronta el problema de decidir de qué tamaño será la

muestra que va a estudiar. La regla más simple para hacer ésta es usar l a
muestra más grande que sea po sible. En esta forma, se minimiza el error de
muestreo. Además, una muestra grande fa cilita la obtención de resultados
que estadísticamente sean significativos. Partiendo de es ta regla, muchas
personas suponen que una muestra de un 5o/o de la población es 5 ve ces
más confiable que una muestra del lo/o de la poblac ión. Pero, resulta que
matemáticamente se puede demostrar que es el tamaño absoluto de la
muestra lo que importa y no así el porcen taje de la población total.
También, se puede decir que debe ser la más pe queña posible que
mantiene las calidades de representatividad. En realidad, la' calidad es más
importante que la cantidad.
Borg y Gall (1983, pp. 257 -261) señalaron algunas de las consideraciones
importantes que hay q ue tomar en cuenta cuando se de termina el tamaño
de la muestra. Si se trata de una invest igación de tipo encuesta, se
necesitan como mínimo 100 sujetos en cada subgrupo principal y de 20 a
50 en cada subgrupo secundario. El tamaño mínimo de las muestras en los
estudios correlaciónales es de 30 s ujetos. En los estudios experimen tales
es aconsejable tener por lo me nos 15 sujetos en cada grupo que se va a
comparar. Bajo las siguientes con diciones, Borg y Gall consideraron que
será necesario aumentar el tamaño de la muestra.
Cuando existen muchas variables extrañas no controladas.

Si la muestra es grande es más probable que las variables extrañas
aparezcan aleato riamente y se eliminen por sí mismas.

Cuando se espera obtener diferencias míni mas.
Algunos tratamientos experimentales pue den causar diferencias entre el
grupo experimental y el grupo de control, pero puede su ceder que dichas
diferencias sean mínimas. Por ejemplo, las diferencias en el rendimiento
estudiantil utilizando dos textos distintos pueden ser pequeñas y a la vez
importantes. Si ninguno de los dos grupos es grande, los errores de
muestreo pueden ocultar las di ferencias.
Cuando una muestra se divide en subgrupos.

Una muestra se divide en subgrupos cuando se desea consi derar diversas
variables moderadoras o de control. Por ejemplo, puede ser que se
investiguen las actitudes de los alum nos hacia la escuela en escuelas donde
se está usando una nueva guía curricular y en aq uellas don de no la están
usando. Luego, d esea considerar también las diferencias se gún el sexo, la
clase socioeconó mica, o el rendimiento. Puede ser que, aunque la muestra
total sea de 100, se encuentren sola mente cinco varones de la clase baja
cuyo rendimien to es alto. El uso de muestras estratificada puede ayudar a
evitar este problema. No obs tante, es posible, aún con una muestra
estratificada, que el investigador piens e en otros subgrupos y, por lo tanto,
debe empezar con una muestra que sea más grande que la mí nima que se
requiera.
Cuando se espera una gran pérdida de sujetos
Esto puede suceder si la investigación es muy larga y/o exige mucho
esfuerzo o dedicación por parte de los participantes. Si han pérdida de
sujetos, hay que estudiar las ca racterísticas de los sujetos que se perdiero n
para medir el efecto de la pérdida.
Cuando se requiere un alto nivel de signifi cación.

Se necesita una muestra más grande cuando se requiere un alto nivel de
significación y también cuando se requiere mucho poder es tadístico. Estos
conceptos se examinarán en el Módulo 8.
Cuando la población es muy heterogénea.

Por supuesto se trata de la heterogeneidad con respecto a las variables que
se consideran. Si una población fuera completamente ho mogénea, todas las
personas serían iguales y bastaría tener una muestra de un solo sujeto.
Cuando existen muchas diferencias entre los sujetos y rangos de
diferencias, hay que tener una muestra grande para que represen te de-
bidamente a la población. Las desviaciones estándares de algunas medidas
pueden dar una idea de la heterogeneidad.
Cuando no hay medidas confiables de la variable dependiente.

Una medida confiable produce la misma medida en cada oportunidad que
se aplica. Aunque sería ideal contar con instrumentos de medición que
fueran confiables, no siem pre es posible. Para poder detectar las dife -
rencias cuando se emplean instrumentos no muy confiables, es necesario
tener un número mayor de su jetos. El concepto de la confia bilidad se
presenta con más detalle en el Mó dulo 7.

Existen fórmulas matemáticas para esti mar el tamaño necesario de
muestra, si se trata de una muestra aleatoria. Para aplicar esas fórmulas es
necesario tener una estimación de la desviación estándar de la población
con relación a la variable dependiente. General mente ese valor se
estima usando los resulta dos de otros estudios seme jantes que se han
llevado a cabo. Actualmente, en Latinoamé rica todavía se hace difícil
encontrar estudios semejantes que ofrezcan medidas confiables que
puedan aplicarse a las fórmulas .
Bibliografía 6
Babbie, Earl R. Survey Research Methods, Belmont, Calif.: Wadsworth Publishing, 1973.

Longman, 1983.
Hernández Pablo. Introducción a la Investigación Educativa; San José, Costa Rica:
Centro Multinacional de Investigación Educativa; 1978.
Educational Planning, Harvard University: Center for Studies in Education and
Development, 1980.
Siglo XXI, 1970.
Pérez Alvarez, Felipe. Las Investigaciones Exploratorias y Descriptivas en las Ciencias
de la Educación, Buenos Aires: Librería del Colegio, 1978.
Rosenthal, Robert y Rosnow, Ralph L. The Volunteer Subject, New York: John Wiley,
1975.
Sudman, Seymour. Applied Sampling, New York: Academic Press, 1976.
Tuckman, Bruce W. Conducting Educational Research, New York: Harcourt Brace
Jovanovich, 1978.
Para cada uno de los siguientes ítemes sub raye la respuesta más apropiada.

1. El conjunto de personas, cosas, o sucesos a los cuales el investigador
desea generalizar los resultados de una investigación se llama
a) La población accesible
a) La población meta
b) La muestra aleatoria
c) La muestra sistemática
2. La razón principal para utilizar una muestra tiene que ver con
a) Los recursos de tiempo y din ero
b) Su carácter representativo
c) Los problemas de sesgos
d) El uso de métodos estadísticos
3. Generalmente, la dificultad que se encuentra al aplicar el muestreo

aleatorio es
a) Encontrar una tabla de números aleatorios
b) Identificar la población meta
c) Evitar los sesgos
d) Encontrar un cuadro de muestreo que sea adecuado
4. Para obtener una muestra sistemática carente de sesgos, es necesario

tener
a) Una computadora
b) Una tabla de números aleatorios
c) Un cuadro de muestreo en orden aleatorio
d) El porcentaje de cada subgrupo
5. En comparación con una muestra aleatoria simple, una muestra

estratificada debe
a) Ser más fácil de sacar
b) Ser más representativa
c) Ser más pequeña
d) Obtenerse sin una tabla de números aleatorios
6. El concepto de una muestra estratificada se relaciona más con las

a) Variables independientes
b) Variables dependientes
c) Variables de control
d) Variables extrañas
7. En general, ¿cuál de los siguientes tipos de muestras requiere que se cuente con menos
recursos de tiempo y dinero?
a) Una muestra aleatoria simple
b) Una muestra sistemática
c) Una muestra estratificada
d) Una muestra por conglomerados
8. Si se usa una muestra disponible, es necesario

a) Usar una tabla de números aleatorios
b) Usar una computadora
c) Comparar sus características con las de la población
d) Encontrar el porcentaje de sujetos en cada subgrupo
9. Una muestra por expertos es muy apropiada para

a) Los estudios de casos
b) Evitar sesgos
c) Realizar encuestas
d) Asegurar que la muestra tenga un carácter representativo
10. ¿Cuál de las siguientes condiciones implica la necesidad de contar con una muestra
que sea más grande que la mínima que se n quiere?
a) El uso de una muestra aleatoria simple
b) Una población meta muy homogénea
c) Cuando se espera obtener diferencia mínimas
d) Cuando no hay muchas variables extrañas
Ejercicio 6
1. En las siguientes poblaciones y los siguientes procedimientos de muestreo

I. Discuta el posible carácter representativo
de la muestra y
II. Discuta los posibles sesgos de muestreo
Población
Procedimiento Para seleccionar la Muestra
a) Todos los alumnos de primer grado de
Todos los alumnos de una ciudad pequeña
un país
Los primeros 50 estudiantes que salen de la
b) Los 25000 estudiantes de la universidad Facultad de
nacional.
Humanidades después de las 9, el lo. De abril.
c) Los 25000 estudiantes de la universidad
nacional Los primeros 50 estudiantes que salen de una
cafetería a las 10, el lo. de abril. Cada
d) Los 25000 estudiantes de la universidad quingentésimo nombre de la nómina de
nacional. estudiantes.
e) Los 25000 estudiantes de la universidad Usar una tabla de números aleatorios para
nacional.
seleccionar a 50 estudiantes.
f) Todos los estudiantes de ingeniería de Los estudiantes que cursan el último
la universidad nacional. semestre de ingeniería electrónica.
g) Todos los supervisores del

Los supervisores que asisten a la inauguración del nuevo edificio del Ministerio de
Educación.
2. Use la Tabla 6.1 para sacar una muestra de 30 de un cuadro de muestreo imaginario que
consta de 3000 nombres. Empiece por la parte superior de la quinta columna y use las
últimas cuatro cifras de esa columna.
3. Se desea sacar una muestra estratificada de 300 profesores de educación primaria de una
población meta de los 25000 profesores de un país. Determine el número de sujetos que se
necesitan en cada subgrupo, si se encuentran los siguientes porcentajes. Un 20o/o son
hombres y un 80o/o son mujeres. Un 6O0/0 de los hombres tiene menos de cinco años de
experiencia y un 40o/o tiene más de cinco. Un 30o/o de las mujeres tiene menos de cinco
años de experiencia y un 70o/o de las mujeres tiene más de cinco.
4. Un investigador desea probar un método para mejorar la memoria de los alumnos de

quinto grado de primaria. Después de administrar un pre-test al grupo experimental y al
grupo de control, van a llevarse a cabo dos sesiones de entrenamiento de una hora de
duración con el grupo experimental. Dos meses después del entrenamiento, se va a
administrar un post-test a ambos grupos. Le parece que la inteligencia actúa como variable
moderadora y, por lo tanto, va a dividir ambos grupos según el cociente intelectual de la si-
guiente forma: subgrupo 1 = C.I. menor que 90, subgrupo 2 = C.I. entre 90 y 110, sub-grupo
3 = C.I. entre 110 y 130 y subgrupo 4 = C.I. mayor que 130. Indique dos razones por las
cuales se selecciona una muestra más grande o más pequeña que lo mínimo.
5. ¿Por qué es aconsejable tener muestras grandes en estudios longitudinales?
6. Un investigador desea estudiar el efecto producido por un método para mejorar la

enseñanza de la matemática. Va a impartir 100 horas de adiestramiento a un total de 100
profesores durante las vacaciones. Después, al principio del próximo año escolar, va a
administrar un pre-test a los alumnos de los profesores así adiestrados y a un grupo de
control. Va a administrar un post-test al finalizar el año escolar. Dé por lo menos cuatro
razones que justifiquen que se usen todos los alumnos de los profesores adiestrados en vez
de solamente una muestra de ellos.
7. Presente un procedimiento para obtener una muestra de los alumnos de quinto año de
primaria de su país. Justifique el tipo y el tamaño de la misma. ¿Cómo sería posible medir el
carácter representativo de la muestra?
8. Presente un procedimiento para obtener una muestra de los profesores de educación

primaria de su país. Justifique el tipo y el tamaño de la muestra. ¿Cómo sería posible medir
el carácter representativo de la muestra?
9 - Un investigador quiere investigar la habilidad para resolver problemas matemáticos que
poseen los 10400 alumnos del primer año de enseñanza media. Hay 234 clases de|
matemática. El investigador desea seleccionar una muestra de 100 alumnos. Sugiera tres
posibles procedimientos para obtener la muestra y discuta las ventajas y desventajas de
cada uno de ellos.
Aplicación 6

1. Diseñe un plan de muestreo para su problema. Incluya los cuatro puntos que se
encuentran al final de la sección 6.1
A Q U Í
MODULO 7
EL USO DE TEST
7.1 Las Características de un Buen Test

Un test, o prueba, puede definirse como cualquier instrumento para medir las diferencias
entre individuos según una o más dimensiones. Entre los diversos tipos de tests que existen
se encuentran los tests basados en normas y los tests basados en criterios, tests orales y los
tests por escrito, tests que se administran individualmente y los tests que se administran en
grupo. Aunque los tests son los instrumentos de medición que más se usan en la
investigación educativa, existen otras maneras de medir los fenómenos, tales como las
observaciones, las entrevistas y los cuestionarios.
Para los efectos de la investigación educativa, un test debe tener, tanto como sea posible,
un alto grado de las siguientes características:
1. Confiabilidad,
2. Validez,
3. Objetividad,
4. Economía,
5. Simplicidad de administración e
6. Interés.
La Confiabilidad
Un test es confiable si se obtienen los mismos resultados cada vez que se administra. Es
decir, si los resultados que se obtienen son consistentes. Un amigo confiable siempre actúa
de la misma forma ante una misma situación. Un test confiable siempre da los mismos
resultados bajo las mismas condiciones. Si un test de inteligencia indica que el C.I. de
Juanito es de 120 y al administrarle otra vez el mismo test, bajo las mismas condiciones, el

C.I. de Juanito es de 90, éste podría ser un indicio de que el test no es confiable. En la
sección 7.2 se presentan algunas formas para medir la confiabilidad de un test.
La Validez
Un test es válido si realmente llega a medir lo que pretende medir. Cuando existe una
relación directa entre una característica y su medición, generalmente no hay problemas de
validez. Por ejemplo, una regla da una medida válida de altura porque hay una relación
directa entre la regla y la altura. Sin embargo, esa misma regla no puede dar una medida
válida de peso. No existe dicha relación directa entre la inteligencia y un test, ni entre la
mayoría de las características que desean medirse en la investigación educativa y los tests
que se aplican. Por lo tanto, la validez es una característica que es difícil de medir.
Por consiguiente, un test que sea válido a la vez será confiable. Si un test siempre llega a
medir lo que se pretende medir, sus resultados serán consistentes. Un test confiable no es
siempre válido, porque existe la posibilidad de que aunque sí mida con consistencia, no
llegue a medir lo que se pretende medir. Es común usar un ejemplo con blancos (Figura
7.1.1) para demostrar el sentido de confiabilidad y validez y a la vez la relación que existe
entre las dos.
Figura 7.1.1 Posibilidades de confiabilidad y validez
En la sección 7.3 se presenta una descripción de cuatro tipos de validez.
La Objetividad
Un test es objetivo si los sesgos de carácter humano no han entrado en la elaboración del
mismo, ni influyen en su administración. Si al administrar y calificar un test ocurre que dos
personas que han usado el mismo test para medir el mismo fenómeno han obtenido
resultados distintos, el test no podría considerarse objetivo. Por ejemplo, un test de

selección múltiple es muy objetivo, mientras que un test que requiere que las respuestas se
den en la forma de ensayos largos, generalmente no lo es. Este tipo de objetividad puede
considerarse como un tipo de confiabilidad. Es importante señalar que aunque algunos tests
no tengan el grado de objetividad deseada, sí proporcionaran un tipo de información que no
es fácil conseguir administrando un test objetivo.
La Economía La economía se refiere al tiempo que se necesita para administrar y calificar un

test. Un test largo requiere mucha cooperación de parte del sujeto y mucho tiempo de
parte del investigador. El investigador tiene que tomar en cuenta si dispone del tiempo
necesario para administrar el test que se ha seleccionado y si los sujetos están dispuestos a
realizarlo como es debido.
La Simplicidad de la Administración La simplicidad de la administración es semejante a la

economía. No se debe pensar simplemente en la aplicación misma del test, sino en la
calificación del mismo y también en la interpretación que se haga de él. El investigador y las
personas que colaboren con él en la administración del test tienen que dominar bien las
técnicas necesarias para administrarlos, calificarlo e interpretarlo. Algunos tests, como por
ejemplo los de rendimiento, son muy simples de administrar, mientras que la
administración de algunos tests sicológicos requiere que se tenga un entrenamiento muy
especial.
El Interés Si un test es interesante y agradable es más fácil conseguir sujetos que estén
dispuestos a tomarlo. Por supuesto, lo que le resulte interesante a una persona, tal vez no lo
sea así para otra. En general, hay que cerciorarse de que el test no tenga ítems confusos y
de que no sea demasiado pesado para los sujetos a quienes se aplicará.
7.2 La Confiabilidad
Ya se indicó que la confiabilidad (o fiabilidad) de un test tiene que ver con su consistencia.
Ningún test es completamente confiable, es decir, ninguna medida se duplica siempre con
exactitud. La confiabilidad de un test es sumamente importante si éste se utiliza para
determinar algo concreto sobre el futuro de un individuo. Tuckman (1978, p. 161) ha
identificado ocho factores que pueden contribuir a que un test no sea confiable, a saber:
1) El conocimiento previo de la forma que tiene el test,
2) El cansancio,
3) La tensión emocional,
4) Las condiciones físicas de la sala en donde se administra el test,
5) La salud de la persona que toma el test,
6) Las fluctuaciones de la memoria humana,
7) La práctica o experiencia que la persona que está tomando el test tiene con respecto
a lo que el test va a medir y

8) Los conocimientos específicos que se obtienen fuera de la experiencia que se mide
con el test.
Si esos factores afectan mucho los resultados de un test, éste no será confiable y sufrirá
sesgos de instrumentación.
El investigador debe averiguar cuan confiable es un test antes de utilizarlo. Si se trata de un
test comercial, su manual debe contener datos sobre la confiabilidad. Si es un test que el
propio investigador ha desarrollado, existen por lo menos cuatro formas de medir la
confiabilidad:
1) La confiabilidad de "test-retest",
2) La confiabilidad de formas paralelas,
3) La confiabilidad .de la división en mitades y
4) La confiabilidad de Kuder-Richardson.
La Confiabilidad de "test-retest "

Si fuera posible administrar el mismo test al mismo grupo de personas en dos ocasiones
distintas, sería factible medir su confiabilidad. Los resultados obtenidos en ambas ocasiones
generalmente se comparan por medio de la correlación. En el Módulo 8 se presenta más
información sobre la correlación.
Las ventajas de la confiabilidad de test-retest son que únicamente se necesitará administrar
una sola forma del test y que el mismo proporcionará información sobre su propia
consistencia al transcurrir el tiempo. Las desventajas son que la memoria, la práctica y las
experiencias que intervienen en la administración del mismo, pueden influir en los
resultados y que a menudo es difícil programar una segunda aplicación.
La confiabilidad de formas paralelas

Si existen dos formas equivalentes del test, es posible administrarlas al mismo grupo y luego
comparar los resultados. Las formas paralelas (equivalentes, o alternativas) deben ser
desarrolladas de tal manera que a cada ítem de una de las formas del test le corresponda un
ítem de la otra forma que pretende medir lo mismo. Este método también resulta útil
cuando se tiene el propósito de usar una de las formas como un pre-test y la otra como un
post-test.
La confiabilidad de la partición en dos mi tades

Si se desea obtener una estimación de la confiabilidad de un test administrando una sola
forma del mismo en una sola oportunidad, se puede medir lo que se llama la confiabilidad
de la partición en dos mitades. La manera más común de hacer esto es tratar los ítem es
pares como una mitad y los ítemes impares como la segunda mitad. Se puede calificar cada
mitad y sacar la correlación, r, entre las dos. Para estimar la confiabilidad de todo el test, r',
hay que substituir r en la siguiente fórmula de Spearman-Brown:
r' = 2r r' = la confiabilidad corregida

1 + 1r r = la confiabilidad no corregida
La confiabilidad Kuder -Richardson

Bajo ciertas condiciones es posible obtener una estimación de la confiabilidad de un test
directamente de una sola administración de la misma en una sola forma. Esas condiciones
son:
1) El test tiene que pretender medir una sola característica o calidad,

2) Tiene que ser un test sin límite de tiempo y
3) Existen solamente dos maneras de calificar cada ítem (por ejemplo, correcta o
incorrecta).
La fórmula de Kuder-Richardson que se puede aplicar, si las tres condiciones están
presentes, es la siguiente: r r = [1 - (X(n-X)/ns2)]
K-R21
X = media del test
n = número de ítemes
s2 = varianza del test
Los conceptos de media (X) y varianza (s) se presentan en el Módulo 8.
7.3 La Validez
Un test que tiene validez realmente mide lo que se afirma que se puede medir mediante el
mismo. Un manual para la aplicación de un test comercial debe contener información sobre
la validez del mismo test. Suelen encontrarse uno o más tipos de validez, los cuales han sido
identificados por un comité de la Asociación Norteamericana de Sicología:
1) La validez del contenido,
2) La validez predictiva,
3) La validez concurrente,
4) La validez de constructo.
La validez del contenido

La validez del contenido no es estadística y se usa generalmente con test de rendimiento.
Para que tenga validez del contenido, un test debe tener una muestra de ítem es que
represente bien a la totalidad de los posibles contenidos. La manera más apropiada de
asegurar que el test tenga validez del contenido es a través de los objetivos específicos del
test. Comparando los ítems del test con el posible contenido u objetivo, es posible averiguar
la validez del contenido del test. Si los ítem es no cubren una muestra representativa.de los
contenidos y si hay ítem es que no tienen que ver con éstos, entonces el test no tiene
validez del contenido.
Por ejemplo, para averiguar la validez del contenido de un test de rendimiento en
geometría, es posible solicitar las opiniones de matemáticos y profesores de matemática
sobre el contenido y los objetivos específicos que un test de geometría debe cubrir y
comparar sus opiniones con el ítem es del test. Si se desea elaborar un test de
conocimientos para administradores sobre los reglamentos de auditoría, es posible verificar
si los ítem es constituyen o no, una muestra representativa de lo que se indica en el
documento oficial que ha establecido dichos reglamentos.
La validez predictiva
A veces la validez predictiva y la validez concurrente se denominan conjuntamente como la
validez basada en criterios. La validez predictiva trata de establecer que un test sí puede
predecir el desempeño posterior de una persona según criterios previamente establecidos.
Por ejemplo, si existe un test de aptitud académica que se usa para controlar el ingreso a
una universidad, entonces se desea saber si ese test verdaderamente predice el éxito

universitario. Se puede comparar el puntaje obtenido en el test con las notas, o comparar el
porcentaje de los estudiantes graduados que obtuvieron puntajes altos, con el de los
estudiantes graduados que obtuvieron puntajes bajos. Como otro ejemplo, puede
averiguarse la validez predictiva de un test de preferencias ocupacionales, si se comparan
los resultados del test con las carreras que las personas realmente seleccionan.
La validez concurrente
En la validez concurrente se usa como criterio la correlación entre los resultados que se
obtienen con un test nuevo y los que se obtienen con un test que ya se ha aceptado.
Algunos tests que ya han sido plenamente aceptados son bastante largos y difíciles de
administrar y calificar. A veces, un investigador desarrolla un test que resulta más
económico y simple y realiza un estudio piloto usando el test recién elaborado y el test que
ya ha sido aceptado para sacar la correlación y comprobar la validez concurrente del nuevo
test.
La validez de constructo
Un constructo puede definirse como un concepto sicológico que no se puede observar
directamente y, por lo tanto, se infiere de efectos observables en la conducta. La
inteligencia, la dignidad, la creatividad, la hostilidad y la ansiedad son ejemplos de
constructos. La validez de constructo tiene que ver con la relación que el puntaje obtenido
en el test tiene con una manifestación de conducta que se supone constituye la base del
constructo. A continuación se presentan algunos ejemplos dé las posibles maneras para
averiguar la validez de constructo que tienen ciertos tests-.
1. Un test de creatividad puede compararse con los juicios emitidos por expertos acerca
de lo que los sujetos han producido con creatividad.
2. Un test de la dignidad puede compararse con la manifestación de conducta que
implica dignidad (tal como hablar enérgicamente para defenderse, tomar decisiones
importantes, etc.).
3. Un test de hostilidad en los niños puede compararse con los actos de hostilidad
contra otros niños.
7.4 Los Tests Estandarizados
El término test estandarizado (o normalizado), generalmente, se refiere a los tests que se

preparan y se publican comercialmente. Estos ofrecen procedimientos uniformes de
administración y de calificación y datos, los cuales se llaman normas, las que indican los
puntajes que varios grupos de individuos han obtenido en ellos. Las normas sirven para
comparar los resultados obtenidos por los sujetos de la investigación que se está llevando a
cabo. Para cada test estandarizado debe existir un manual de instrucciones sobre el uso del
mismo, que contenga normas e información sobre la confiabilidad y la validez de dicho test.
Parece que muchos de los tests estandarizados que se usan en Latinoamérica son
adaptaciones de los tests que se han desarrollado en Norteamérica o en Europa. En los
departamentos de sicología y pedagogía de varias universidades, así como también en los
departamentos de orientación e investigación de los ministerios de educación, o en los
centros de documentación de los institutos de investigación educativa o sicológica, se
encuentra información sobre dichas adaptaciones. Si no se llega a encontrar un test
adecuado en español, existe la posibilidad de desarrollar uno completamente o de solicitar
la autorización que hace falta para adaptar un test que esté disponible en otro idioma. El

compendio más completo de tests en inglés es el Mental Measurement Yearbook,
cuyo editor es Osear K. Buros.
Existen muchos tipos de tests estandarizados, los cuales se pueden dividir en las siguientes
cuatro categorías:
1) Tests de inteligencia
2) Tests de aptitud
3) Tests de rendimiento y
4) Tests de personalidad.
Los tests de inteligencia

Los tests de inteligencia utilizan una muestra de varios tipos de tareas para sacar un solo
puntaje que se llama el cociente intelectual, C.I. Las tareas más comunes que integran los
tests de inteligencia tienen que ver con la habilidad para resolver problemas matemáticos,
la definición de palabras, capacidad de retención inmediata (short-term memory), y los
conocimientos generales. Algunas personas valorizan mucho los tests de inteligencia debido
al éxito que han tenido en la predicción del rendimiento escolar. En cambio otras personas
los critican y dicen que discriminan indebidamente a algunos grupos étnicos. En los Estados
Unidos algunos sicólogos han intentado desarrollar tests de inteligencia en los que el grupo
cultural de la persona no influye mucho en los resultados que se obtengan (culture-fair
tests).
Algunos tests de inteligencia se administran en grupo y otros individualmente. Los tests de
inteligencia que pueden administrarse en grupo tienen la ventaja de su rapidez, pero tienen
la desventaja de que la persona que administra el test no siempre puede averiguar si la
condición emocional y física de los sujetos es propicia para rendir normalmente. Otra
desventaja es que requieren que el sujeto pueda leer y escribir. Un test de inteligencia que
puede administrarse en grupo, y que está adaptado al español, es el Test Otis-Lennon de
Habilidades Mentales.
Los tests de inteligencia individuales no tienen las desventajas que tienen los tests de grupo,
pero sí requieren de mucho tiempo para ser administrados y que la persona que los vaya a
administrar haya tenido un entrenamiento especial. No obstante, si se considera que los
resultados de un test en grupo van a ser dudosos, es preferible usar un test individual,
aunque ello implique una reducción del tamaño de la muestra. El test individual de
inteligencia más conocido es, tal vez, el Stanford-Binet. Binet fue uno de los pioneros en la
medición de la inteligencia, a principios del siglo veinte. Los tests de Weschler, también se
usan mucho.
Los tests de aptitud

Los tests de aptitud pretenden predecir la capacidad que una persona debe tener en un
área específica. Es posible clasificar los tests de inteligencia como tests de aptitud, pero los
tests de aptitud miden algo más específico que la inteligencia. Para la mayoría de las
asignaturas académicas tradicionales, existen tests de aptitudes. También, se han
desarrollado tests de habilidades físicas y de creatividad. Algunos de estos tests pretenden
medir un rango de habilidad. Un test de aptitud conocido, que está adaptado al español es
el Test de Aptitudes Diferenciales.
Un uso importante que se les da a los tests de aptitud en la investigación educativa es el de
identificar a un grupo que tenga mucha o poca aptitud en determinada área, con el objeto
de probar un método de enseñanza diseñado para tal grupo. Por ejemplo, para probar un
método diseñado para enseñar el álgebra a alumnos con poca habilidad matemática, es

necesario identificar un grupo experimental y un grupo de control de alumnos con poca
habilidad matemática. Si se usan las notas obtenidas por los alumnos para seleccionar los
grupos, se van a incluir alumnos que, aunque tengan habilidad, tienen problemas de
motivación. La validez predictiva es sumamente importante en los tests de aptitud.
Los tests de rendimiento

Si los tests de aptitud miden el posible rendimiento (o el aprovechamiento), los tests de
rendimiento pretenden medir lo que verdaderamente se ha logrado. Estos tests, por
supuesto, se usan mucho en la investigación y evaluación educativa. La validez del
contenido de un test de rendimiento es muy importante. Los tests de diagnóstico son un
tipo de test de rendimiento que pretenden identificar a aquellos alumnos que no hayan
aprendido lo que les corresponde y que necesitan ayuda académica especial.
Si no existe un test estandarizado de rendimiento que sea adecuado para los propósitos de
la investigación, es común proceder a desarrollar uno. En la sección 7.7 se presentan
algunas de esas técnicas para desarrollar un test semejante.
Los tests de personalidad

Anastasi (1977, p. 451) definió los tests de personalidad como "instrumentos para la medida
de las características emocionales, motivacionales, interpersonales y de actitud, como
contrapuestas a las aptitudes". Tal vez, los cuatro tipos principales de tests de personalidad
sean:
a) Los inventarios autodescriptivos,
b) los instrumentos proyectivos,
c) las escalas de actitudes y
d) los inventarios de los intereses.
Hay algunos inventarios autodescriptivos que proporcionan información general sobre la
personalidad y otros que dan información específica sobre un determinado rasgo de la
personalidad. La ventaja principal de algunos inventarios de autodescripción es su
simplicidad y el bajo costo que involucra su aplicación. Otros inventarios requieren que la
persona que administra el test reciba entrenamiento especial. La desventaja de los
inventarios autodescriptivos es su misma naturaleza. No todas las personas pueden o
quieren dar una autodescripción verdadera. Algunas personas siempre dan la respuesta que
les parece que es socialmente aceptable, en lugar de dar su propia opinión personal.
Existen adaptaciones al español de algunos de los inventarios autodescriptivos. Entre ellos
se encuentra el más usado en Norteamérica, el Inventario Multifásico de Personalidad de
Minnesota. De las 5 50 ítemes del inventario se obtiene información acerca de muchos tipos
de actitudes, de muchas posibles manifestaciones neuróticas y sicóticas, de las condiciones
sociales y personales y de la salud general. Otro inventario bastante conocido, que ha sido
adaptado al español, es el Inventario Sicológico de California.
Los instrumentos proyectivos son instrumentos no estructurados que facilitan la proyección
de los sentimientos, las actitudes, las necesidades y los valores o deseos internos hacia un
objeto externo. El más conocido es tal vez el uso de las manchas de tinta de Rorschach. Otro
instrumento proyectivo que se utiliza en Latinoamérica es el Test de Apercepción Temática.,
La aplicación e interpretación de instrumentos proyectivos requieren de entrenamiento
especial.
Las escalas de actitudes son semejantes a los inventarios de personalidad y tienen la misma
desventaja, es decir, que es imposible averiguar si los sujetos han respondido de acuerdo a

sus verdaderas actitudes o no. Las escalas de tipo Likert son muy utilizadas. A veces es
posible encontrar una escala de actitudes que haya sido previamente probada que resulte
útil, otras veces será necesario elaborar una escala completamente nueva. En la sección 7.8
se presentan los métodos para el desarrollo de dichas escalas.
Los inventarios de intereses que más se usan tienen que ver con los intereses vocacionales.
Mediante el uso de dichos inventarios es posible estudiar el desarrollo de los intereses de
los alumnos, e implícitamente, algo sobre las características de sus respectivas
personalidades. Que existe una adaptación al español de la Encuesta de Interés General de
Kider que mide el interés de alumnos de 11 a 18 años, en diez áreas vocacionales, a saber: la
artística, la científica, la clerical, la computacional, la de las actividades al aire libre, la
literaria, la mecánica, la musical, la persuasiva y la de servicio social. Otro de los citados
inventarios es el Inventario de Intereses de Strong-Campbell.
7.5 Los Tests Basados en Criterios
Los tests estandarizados generalmente se tests basados en normas. Es decir, el punta que
obtenga un sujeto o el promedio qi obtenga un grupo se compara con los puntajes que
obtenga un grupo normativo apropiado. Los tests basados en criterios, (o test de dominio),
en vez de comparar a un sujeto con otro, indican el rendimiento en termine absolutos.
Mediante la aplicación de test basados en criterios es posible averiguar porcentaje de
objetivos específicos que i sujeto domina y determinar los que no domina. Es decir, es
posible averiguar, con algo de precisión, exactamente cuánto de lo que debe saber,
realmente sabe. Es común seleccionar un porcentaje de ítems correcto generalmente 80o/o
ó 90o/o, para identifica un grupo que domina la materia y otro que no la domina.
Los tests basados en normas tratan de distinguir entre los sujetos, y por lo tanto,
desarrollarlos, es necesario eliminar ítems que son demasiado fáciles. Se busca la
variabilidad entre los sujetos. En un test basado en criterios los ítemes permanecen según
su pertinencia, no según los resultados que se obtienen. Si un método de enseñanza es
bueno casi todo el mundo debe obtener un 100o/ en un test basado en criterios.
Debido a esas diferencias entre los propósitos que tienen los dos tipos de tests, los metodos
que se examinaron en la sección 7.2 n son adecuados para averiguar exactamente 1
confiabilidad de un test tasado en criterio: Una manera de averiguar la confiabilidad d
dichos tests es aplicarlos empleando dos formas distintas, en los mismos sujetos, y verificar
si estos mismos sujetos están en el grupo que domina y en el que no domina. En le tests
basados en criterios la validez del contenido es muy importante.
7.6 La Selección y Administración de Tests
Si se cuenta con un test ya elaborado, e investigador puede ahorrarse mucho tiempo Si

cuenta con por lo menos un test que ya se haya desarrollado que pretenda medir lo que se
desea, el investigador tendrá que averigua si es el apropiado para la población meta
¿Corresponde a la edad y al nivel general di la población? Si es demasiado fácil o demasiado
difícil, ¿no va a discriminar entre los sujetos? ¿Tiene el test un nivel de lectura que
corresponde al nivel de los sujetos? Si existen normas para el test, ¿son de un grupo similar
a su población meta? Las normas establecidas en Chile, tal vez no sean útiles en Guatemala.
Las normas aptas para un grupo urbano, probablemente no sean las más adecuadas si la
población meta es de tipo rural.
Otros factores que hay que considerar al seleccionar un test son:

1. La confiabilidad y validez de los tests,
2. El tiempo que se requiere para administrarla,
3. Si se aplica un test individual o uno de grupo y
4. El entrenamiento que se necesita para administrar el test.
Ya se ha dicho mucho sobre la confiabilidad y la validez. Se desea un máximo de
confiabilidad y de validez, pero si el test que es más confiable y válido requiere demasiado
tiempo para su aplicación, o no es el más apropiado para el grupo, entonces se puede
escoger un test con menos confiabilidad y validez.
Es común que la aplicación del test (o los tests) que se desea administrar requiera
demasiado tiempo. En dichos casos, a veces se puede encontrar un test más corto o lo que
se llama una "forma corta" o "forma abreviada" del test. Una forma corta de un test
consiste en una selección de algunos de los ítems de un test en particular. La confiabilidad
se relaciona con la longitud de un test, pero a veces lo que se pierde al usar una forma corta
no es muy significativo para los efectos de la investigación. Si no existe una forma corta,
puede considerarse el desarrollo de una. Generalmente eso implica que se tenga la
autorización de la casa editorial que ha publicado el test. Eso puede ser un proceso
complicado y a veces no se obtiene la autorización debido al temor de que la validez del test
se afecte adversamente. Si cabe en lo posible desarrollar una forma corta, es necesario
eliminar ítem es de una manera que no dé lugar a sesgos y que no afecte mucho la validez.
Es aconsejable solicitar la opinión de dos o tres expertos, con respecto a los ítem es que se
van a eliminar.
¿Son de un grupo similar a su población meta? Las normas establecidas en Chile, tal vez no
sean útiles en Guatemala. Las normas aptas para un grupo urbano, probablemente no sean
las más adecuadas si la población meta es de tipo rural.
Corto o lo que se llama una "forma corta" o "forma abreviada" del test. Una forma corta de
un test consiste en una selección de algunos de los ítems de un test en particular. La
confiabilidad se relaciona con la longitud de un test, pero a veces lo que se pierde al usar
una forma corta no es muy significativo para los efectos de la investigación. Si no existe una
forma corta, puede considerarse el desarrollo de una. Generalmente eso implica que se
tenga la autorización de la casa editorial que ha publicado el test. Eso puede ser un proceso
complicado y a veces no se obtiene la autorización debido al temor de que la validez del test
se afecte adversamente. Si cabe en lo posible desarrollar una forma corta, es necesario
eliminar ítems de una manera que no dé lugar a sesgos y que no afecte mucho la validez. Es
aconsejable solicitar la opinión de dos o tres expertos, con respecto a los ítem es que se van
a eliminar.
Condiciones. Borg y Gall (198 3, p. 305) sugirieron que no es aconsejable administrar un test
cuando las vacaciones están próximas o durante el último mes del año escolar. Durante esas
épocas el comportamiento y las actitudes de los alumnos pueden ser bastante fuera de lo
común.
Otra sugerencia de Borg y Gall (1983, p. 306) es que no se utilicen datos obtenidos en tests
que una escuela ya haya recabado por su propia cuenta. Ellos indican, además, que los tests
que se usan tal vez no sean los más adecuados para los propósitos de la investigación, que
tal vez no todos los sujetos deseados tomaron el test y que el investigador no puede
controlar ni conocer las condiciones bajo las cuales se administra el test.
7.7 El Desarrollo de un Test de Rendimiento

El desarrollo de un test no es una tarea que es propia de la investigación. Sin embargo, el
investigador a veces se ve más o menos obligado a desarrollar su propio test, si quiere que
el mismo responda al problema que va a investigar. Un test es un instrumento de medición,
y por lo tanto el investigador, cuando desarrolla un test, tiene que decidir qué es, lo que se
va a medir, cómo se va a medir, y cómo se va a validar las mediciones. El desarrollo de un
test requiere que se haya obtenido entrenamiento en medición sicológica y pedagógica. Lo
que sigue a continuación pretende dar una visión del proceso, aunque tal vez el lector desee
consultar algunas de las obras que aparecen en la lista de referencias que se encuentra al
final del módulo, antes de desarrollar su primer test.
Los posibles pasos para desarrollar un test son los siguientes:
1. Se definen las metas (los objetivos específicos ) y el contenido del test.
2. Se examinan tests que sean semejantes
3. Se definen las especificaciones del
4. Se desarrolla un banco de ítemes.
5. Se prepara un borrador.
6. Se evalúa el borrador.
7. Se revisa y se revisa y se revisa y
8. Se averigua más acerca de la contabilidad y validez.
Se definen las metas y el contenido

Para asegurar la validez del contenido necesario especificar las metas y el contenido.
Algunos expertos insisten más en que debe contar con una lista de metas (u objetivos
específicos), mientras que otros prefieren que se elabore un bosquejo del contiene De dicha
lista o bosquejo es posible saca puntos importantes para redactar los ítemes.
Se examinan tests que sean semejantes

Si ya existe un test que sea completan: adecuado, el investigador no tendrá que desarrollar
su propio test. Si un test de esta i raleza no existe, es aconsejable examinar algunos tests
que sean semejantes, a fin de tener ideas sobre los posibles formatos tipos de ítems y los
niveles esperado confiabilidad y de validez.
Se definen las esp ecificaciones del test

Partiendo de una consideración de semejantes y de las características de la población meta,
debe ser posible especificar formato general, el nivel de lectura, el de ítems, el tipo de
instrucciones y el mero de ítems.
Se desarrolla un banco de ítemes

De una consideración de la lista de n y del bosquejo del contenido se redacta: ítemes. Esta
etapa resulta ser más difícil lo que muchos suponen y es aconsejable soltar la literatura
profesional sobre la redacción de ítemes. Existen muchas técnicas para redactar ítemes. Un
método está relacionado con el uso de una tabla de especificaciones para cerciorarse de
que los ítems abarcan el contenido y de que haya suficientes que correspondan a cada nivel
cognitivo. Otro método es reunir a profesores se desempeñen en el campo sobre el cual se
el test y pagarles para que escriban ítem.
Se prepara un borrador
"El borrador del test debe incluir todas decisiones que se hayan tomado en las etapas
anteriores. En general, es necesario incluir más ítemes del número que se desea, porque es

probable que algunos sean descartados. Excepto por el número de ítemes, el borrador debe
parecerse mucho a la forma definitiva.
Se evalúa el borrador
Uno de los propósitos de la evaluación de un borrador de un test de rendimiento es
identificar los ítemes "buenos" y los ítemes "malos". Los ítemes buenos son los que
discriminan entre los sujetos buenos y malos, y los que tienen el grado debido de dificultad.
Primero, hay que administrar el borrador a un grupo piloto. Luego se sigue un proceso de
análisis de ítemes. Existen varias maneras de efectuar un análisis de ítemes. Si hay muchos
ítemes y muchos sujetos es más conveniente usar una computadora para realizar un análisis
de ítemes. A continuación se presenta un posible método manual:
A. Basándose en el puntaje total, se identifican dos subgrupos:
a) El 2 7 % que haya obtenido puntajes más altos y
b ) El 2 7 % que haya obtenido puntajes más bajos. (Algunos expertos usan un tercio
en vez de 2 7 % ) .
B. Para cada ítem se identifica el número de los sujetos que
a. Haya obtenido puntajes altos, y
b. El número de ellos que haya obtenido puntajes bajos y que haya contestado
correctamente.
Contando con esos datos, será posible calcular el índice de dificultad y el índice de
discriminación de cada ítem. La dificultad se define básicamente como la proporción de
individuos que contestan correctamente el ítem. También es posible usar subgrupos para
calcular la dificultad. El índice de discriminación mide cómo un ítem distingue entre per-
sonas que han obtenido un puntaje alto total y las que han obtenido un puntaje total bajo.
Como ejemplo simplificado, considere un test de 10 ítemes, que se va a aplicar a 100 sujetos
El índice de dificultad = número con el ítem incorrecto

Número total para ambos grupos
Para el ítem 1:(54-(27 + 15)) / 54 = 12/54 = .22

El índice de = No. del grupo alto con el ítem correcto Discriminación No. de ambos grupos
con el ítem correcto
Para el ítem 1:27/ (27 + 15) = 27/42 = .64

En muchos tests de rendimiento el índice ideal de dificultad es de .50. Se puede obtener ese
nivel en la misma forma que se obtiene un promedio. De este modo es posible poner ítems
fáciles al principio del test e ítemes difíciles al final del mismo.
El poder de discriminación que tienen todos los ítemes del ejemplo es más o menos
adecuado. Algunos expertos opinan que un índice de discriminación de .30 es adecuado.
Se revisa
Con base en la experiencia obtenida en la prueba piloto y los resultados que rinde la
evaluación, hay que revisar el borrador. A veces se hace necesario repetir las etapas de
evaluación y revisión varias veces antes de obtener un test adecuado.
Se averigua más sobre la confiabilidad y validez

Durante el desarrollo del test es posible obtener alguna información sobre su confiabilidad y
validez. El principal intento suele realizarse después de que se tenga un test en su forma
definitiva.
7.8 El Desarrollo de un Test de Actitudes
Al igual que el desarrollo de un test de rendimiento, el desarrollo de un test o escala de

actitudes no es una tarea de la investigación propiamente, sino que es algo que un
investigador suele verse obligado a hacer. Las escalas que se presentan a continuación
pueden utilizarse para obtener datos sobre actitudes, preferencias, juicios y percepciones.
Con una escala diseñada cuidadosamente es posible identificar un número que indica la
tendencia e intensidad de la actitud de una persona frente a una variable determinada. El
desarrollo de una escala no es una tarea fácil, ni corta, sino que es necesario, si no se
encuentra un instrumento adecuado.
Existen varios tipos de escalas de actitudes. En este módulo se consideran tres:
1) Las escalas de Likert,
2) Las escalas de Thurstone y
3) Las escalas de Osgood.
Las escalas de Likert

Las escalas de Likert llevan el nombre de Rensis Likert quien promovió el método durante
los años treinta. También se conocen como las escalas de acuerdo. Las escalas de Likert
presentan afirmaciones y el sujeto responde con la intensidad, que esté de acuerdo o en
desacuerdo, según una escala de cinco puntos. En la Tabla 7.8.1 se presenta una escala de
tipo Likert sobre actitudes frente a computación.
Aunque las posibles respuestas de ACUERDO COMPLETO Acuerdo Neutralidad Desacuerdo
DESACUERDO COMPLETO son tal vez las más comunes, existen muchas otras posibilidades:
MUY IMPORTANTE MUY BUENO
Importante Bueno
Indeciso Indeciso
No importante Malo
NO IMPORTANTE
EN ABSOLUTO MUY MALO
El término medio es a veces conflictivo. Se han presentado las posibilidades de "neutralidad
' e "indeciso". Parte del conflicto es el rol doble que esa palabra tiene. Debe ser usada por la
persona que siente cierta duda respecto a una afirmación y además por la persona que
carece de opinión. Otros posibles términos medios incluyen "ninguna opinión", "no sé" y
"no estoy seguro".
A continuación se presentan los pasos para el desarrollo de una escala de Likert:
1) Agregar una lista de afirmaciones sobre la actitud o creencia pertinente. Algunas
deben ser de índole positiva y otras negativas. Generalmente es necesaria una lista
de 50 ó 60, porque algunas se rechazan después de una prueba. La persona que
desarrolla la escala puede redactarlas todas, pedir la colaboración de sus colegas, e
incluso pedir a algunas de las personas de la población meta que redacten algunas.
2) Administrar una prueba piloto de los ítemes a una muestra de la población meta. Es
conveniente usar una muestra disponible, pero es necesario tener un grupo que
tenga un rango de actitudes representativas. Una muestra de 50 deberá ser
suficiente, aunque muchos usan muestras más pequeñas.
3) Calificar la prueba piloto. Cada ítem positivo recibe una calificación entre 5 y 1 (o
entre 4 y 0), mientras que cada ítem negativo se califica entre 1 y 5 (o entre 0 y 4).
4) Es decir, ACUERDO COMPLETO = 5, Acuerdo = 4, Neutralidad = 3, Desacuerdo = 2 y
5) DESACUERDO COMPLETO = 1.
6) Sumar las calificaciones de todos los ítemes individuales de cada sujeto para obtener
los puntajes totales.
7) Se calcula la correlación para cada ítem, entre las calificaciones otorgadas a cada
ítem y el total de cada puntaje. Dicha correlación proporcionará una indicación de
Tabla 7.8.1
En cada uno de los siguientes ítemes subraye la respuesta que mejor caracteriza su
reacción.
1) Hoy en día es fácil evitar la influencia de las computadoras. Definitivamente SI Sí
Indeciso No Definitivamente NO
2) Cualquier persona puede entender fácilmente las computadoras. Definitivamente SI
Sí Indeciso No Definitivamente NO
3) Los bancos de datos de protección de créditos le dan un uso valioso a las

computadoras. Definitivamente SI Sí Indeciso No
Definitivamente NO
4) Nuestro país estaría en mejores condiciones sin computadoras.
Definitivamente SI Sí Indeciso No Definitivamente NO
5) Las computadoras van a desplazar los trabajos de bajo nivel y a reemplazarlos con
trabajos que requieren adiestramiento especial.
Definitivamente SI Sí Indeciso No Definitivamente
NO
6) Las computadoras cometen errores por lo menos un lO o/o del tiempo.

NO
7) Algún día una computadora va a reemplazarme en mi trabajo. Definitivamente SI Sí
8) Algún día voy a tener una computadora en mi casa. Definitivamente SI Sí

9) Los programadores y operadores cometen errores, pero las computadoras.

generalmente, no los cometen.
NO
10) Las computadoras retardan y complican las operaciones comerciales simples.

NO
11) Las computadoras van a mejorar la ejecución de la ley. Definitivamente SI Sí

12) Las computadoras van a contribuir al mejoramiento de la educación.

Definitivamente SI Sí Indeciso No Definitivamente. NO
13) Las computadoras aíslan a las personas porque evitan la interacción social normal
entre los usuarios.
Definitivamente SI Sí Indeciso No Definitivamente N0
14) Las computadoras crearán tantos trabajos como los que van a eliminar.
NO
15) Las computadoras son herramientas, tales como los martillos y los tornos.
NO
16) Las computadoras van a mejorar los servicios de salud. Definitivamente SI Sí

17) Es posible diseñar un sistema computacional que proteja la seguridad de los datos.
Definitivamente SI Sí Indeciso NO Definitivamente NO
La relación que existe entre lo que mide cada ítem y lo que mide el test en su totalidad.
6) Se seleccionan alrededor de 20 ítemes que tengan un alto coeficiente de correlación.
7) Se organizan los ítemes .seleccionados en orden aleatorio. Se incluyen instrucciones
claras.
La escala debe estar lista para administrársele a la muestra que participará en la investi-
gación.
Las escalas de Thurstone

Alrededor de 1930, Thurstone propuso un procedimiento para establecer una escala de
actitudes. Dicha escala se denomina también escala ordenada o escala de intervalos
aparentemente iguales.

Los pasos para desarrollar una escala de' Thurstone son los siguientes:
1) Se recaban muchas opiniones (por lo menos 100) acerca del modo de pensar o de la
actitud que se desea investigar. Es necesario evitar juicios sobre hechos. Cada ítem
debe representar la opinión de alguien. Debe buscarse una gama de opiniones, e
incluir algunas de carácter moderado.
2) Se escribe cada opinión en una hojita por separado.
3) Se selecciona un grupo de jueces (entre 10 y 100) para calificar cada ítem entre 1 y 11
(o entre 0 y 13). Una calificación de 1 indica que el ítem es una afirmación muy
negativa o desfavorable sobre la variable de la escala. Una afirmación neutral debe
recibir un 6 y una afirmación muy positiva, un 11. Por supuesto hay que considerar
toda la gama del 1 al 11. Es importante recalcarles a los jueces que deben calificar o
clasificar el ítem, y no indicar en qué medida ellos están personalmente de acuerdo
o en desacuerdo. El método de calificación más conocido es tener once cajas
numeradas del 1 al 11, e ir colocando cada hojita en la caja correspondiente.
4) Se rechazan las opiniones que reciben calificaciones muy diversas.
5) Se calcula la media (o mediana) de las calificaciones que recibió cada ítem que se
selecciona para tener su valor. Por ejemplo, si de 30 jueces un ítem recibe 9 diez
veces, 10 diez veces, y 11 diez veces; su valor es 10.
6) Se seleccionan alrededor de 2 5 ítemes que representan un rango de valores del 1 al
11
7) Se organizan los ítemes en un orden aleatorio.
8) Se administra el instrumento con instrucciones de que los sujetos indiquen con cuáles
ítemes están de acuerdo.
9) Se califica a cada sujeto con la medií de los ítemes con los cuales está de acuerdo
10) Las escalas de Thurstone se utilizan meno que las escalas de Likert debido a que es
pre caso contar con la cooperación de buenos juez ese para poder elaborarlas.
Las escalas de Osgood

Habiéndolas desarrollado por Osgood, Suc y Tannenbaum en 1957, estas escalas suele
llamarse de diferencial semántico. La Tabla; 7.8.2 presenta un ejemplo de un diferencia
semántico que se usa para medir la reacción de una persona hacia las computadoras.
Tabla 7.8.2
Un ejemplo de un diferencial semántico.
¿Qué le parecen las computadoras? Coloque una X en una de las 7 rayitas que hay entre
cada pareja de adjetivos.
Las Computadoras
Mala _____________________buena
Correcta________________ incorrecta
Injusta________ _______ justa
Amistosa_________________ inamistosa
Pertinente _________________ impertinente
Fría ______________________ calurosa
Confusa ___________________ clara
Aburrida __________________ interesante

Alegre ____________________ triste
Tranquila __________________ tensa
Nótese que no todos los adjetivos positivos están colocados en el mismo lado y que algunos
de los adjetivos no se relacionan directamente con las computadoras. Se coloca una mezcla
de adjetivos positivos v negativos en cada columna para evitar que el sujeto responda
siguiendo un patrón, como pensar en su respuesta. Algunos no tienen que ver directamente
con las computadoras porque al usa un diferencial semántico se pretende obtener
impresiones generales.
La calificación se obtiene como la media del 1 al 7 para cada ítem. El 1 indica lo más
negativo y el 7 lo más positivo.
Después de definir el propósito de la escala es posible crear las parejas de adjetivos
apropiados.
Existen otros métodos para desarrollar escalas de actitudes y opiniones. El lector a quien le
interese averiguar otros métodos debe referirse a la literatura sobre medición sicológica. En
inglés, el compendio tal vez más conocido de ejemplos de escalas de actitudes lo constituye
la obra de Shaw y Wright (1967).
Bibliografía 7
Anastasi, Anne. Tests Psicológicos, Madrid: Aguilar, 1973.
Borg, Walter R. y Gall, Meredith D. Educational Research: And Introduction, New York:
Longman, 1983.
Buros, Oscar K. The Eighth Mental Measure ment Yearbook, Highland Park, NJ-. Gry-
phon Press; 1978.
Henerson, Marlene E.; Morris, Lynn Lyons; y Fitz-Gibbon, Carol Taylor. How to Measure
Attitudes, Beverly Hills: Sage, 1978.
Hopkins, Charles D. Understanding Educational Research, Columbus, Ohio: Merril,
1980.
La fourcade, Pedro D. Evaluación de los A prendizajes, Buenos Aires: Kapelusz, 1969.
Pardinas, Felipe. Metodología y Técnicas de Investigación en Ciencias Sociales,

México: Siglo XXI, 1970.
Shaw, M.E. y Wright, J.M. Scales d; for the Measurement of Attitudes, New York:
McGraw-Hill, 1967.

Jovanovich, 1978.

Para cada uno de los siguientes ítemes subraye la respuesta más apropiada.
1. Un test válido
a) Es confiable
b)Mide lo que se pretende medir
c) Debe indicarse que lo es en el manual del test
d)Todas las respuestas anteriores son correctas
2. La confiabilidad test-restes es muy apropiada para los

a) Tests de rendimiento
b) Tests de reconocimientos
c) Tests de personalidad
3. Se dice que un test que está libre de la influencia de los prejuicios de la persona que lo
administra es
a. Confiable
b. Estandarizado
c. Objetivo
d. Válido
4. Un test comercial
a) Siempre tiene mucha validez
b) Mide los conocimientos de las personas que trabajan en el comercio
c) Se publica y se vende
5. La validez predictiva es muy apropiada para los
a) Tests de rendimiento
b) Tests de aptitud académica
c) Tests basados en criterios
6. La validez del contenido se determina mediante
a) El uso de métodos estadísticos
b) Una comparación con otro test
c) Una comparación con manifestaciones de un constructo
d) El juicio de varios expertos
7. La validez concurrente es más útil para
a) Probar una forma corta de un test
b) Desarrollar un test de rendimiento
c) Predecir el rendimiento
d) Desarrollar formas paralelas para un pre-test y un post-test
8. ¿Cuál de las siguientes características es una ventaja en un test individual para
determinar el C.I.?
a) La simplicidad de la administración
b) La economía de tiempo y dinero
c) Evitan la discriminación contra subgrupos culturales
d) Es fácil para ser administrado a sujetos que tienen limitaciones intelectuales, físicas o
emocionales

9. Para motivar a los sujetos a quienes un investigador va a administrar un test es
conveniente
a) Asegurarles que los resultados son confidenciales
b) Agradecer su participación
c) Enfatizar la importancia del test
10. Los ítemes "buenos" de un test de rendimiento

a) Discriminan entre los sujetos que han obtenido un puntaje alto y los que han
obtenido un puntaje bajo
b) Son muy difíciles
c) Los contestan correctamente un 2 7 % de los sujetos
Ejercicio 7
1. Al desarrollar un test de rendimiento en matemática elemental, se administraron

ambas formas: A y B, a una muestra aleatoria de 500 alumnos del nivel primario y se
calculó una confiabilidad de .88. ¿Qué tipo de confiabilidad es?
2. Al desarrollar un test sobre la personalidad de los adolescentes, se administró a una

muestra aleatoria de 200 y volvió a administrárseles en cuatro meses después. Se
calculó una confiabilidad de .72.
a) ¿Qué tipo de confiabilidad es?
b) Indique dos posibles razones por las cuales esa confiabilidad no sea muy alta.
3. Un investigador quiere comparar dos métodos para enseñar a leer. Tiene a su alcance un
test de rendimiento de lectura cuyo manual indica una correlación de .7 3 entre los puntajes
obtenidos en el test y las notas finales.
a) ¿Qué tipo de validez es?
b) ¿Qué tipo de validez es la más apropiada en este caso? ¿Por qué?
4. Se desarrolló un test para seleccionar a estudiantes universitarios. Tres catedráticos de

renombre opinaron sobre la validez del test.
a) ¿Qué tipo de validez es?
b) ¿Qué tipo de validez es la más apropiada en este caso? ¿Por qué?
5. En cada una de las siguientes situaciones indique si se debe usar un test de grupo o un
test individual y justifique por qué.
a) Un investigador quiere indagar sobre la rapidez con que los alumnos del quinto grado
primario pueden resolver las cuatro operaciones aritméticas.
b) Un investigador quiere indagar sobre la comprensión que los alumnos, con serios
problemas de aprendizaje, tienen de las cuatro operaciones aritméticas.
6. La Evaluación de un Test Estandarizado.

A) Nombre del test:
B) Editorial: Fecha:
C) Tiempo requerido Edades apropiadas:

D) La Confiabilidad.
a) ¿Qué tipo de confiabilidad se presenta?
b) ¿Qué coeficiente de confiabilidad se presenta?
c) ¿Qué opina Ud. sobre los datos de confiabilidad?
E) La Validez.
a) ¿Qué tipo de validez es la más apropiada en este caso? ¿Por qué?
b) ¿Qué tipo de datos sobre validez se presentan?
c) ¿Qué opina Ud. sobre los datos de validez?
F) La Objetividad
a) ¿Le parece que hubo sesgos durante su desarrollo? Explique.
b) ¿Existe la posibilidad de que hubo sesgos en la administración?
c) Explique.
d) ¿Existe la posibilidad de que hubo sesgo en la calificación? Explique.
MODULO 8
LA PRESENTACIÓN Y EL ANILISIS ESTADISTICICO DE LOS DATOS
8.1 El Uso de la Estadística en la Investigación Educativa
El uso de métodos estadísticos es sumamente importante en la investigación y evaluación

educativa. Se puede usar la palabra "estadística" para indicar el sistema de análisis que se
emplea para interpretar datos cuantitativos. Como se mencionó en el Módulo 6, un valor
que se basa en una muestra se denomina un 'estadístico" y un valor de población inferido
de un estadístico se llama un "parámetro".
A veces es conveniente distinguir entre la estadística descriptiva y la estadística inferencial.
La estadística descriptiva ofrece técnicas para organizar y resumir la información acerca de
un conjunto de datos. Las tablas, las gráficas y los distintos tipos de promedios son las
principales técnicas para presentación de datos con que cuenta la estadística descriptiva. La
estadística descriptiva no pretende llegar más allá del grupo al cual se refieren los datos. Por
otra parte, la estadística inferencial permite hacer inferencias sobre una población, basadas
en los datos obtenidos en una muestra.
Ocasionalmente, se distingue otra división de la estadística, conocida como la estadística de
tests. Esta última se refiere a los métodos que se usan para describir y analizar las
propiedades' sicométricas de un test. Ya se presentó algo sobre la estadística de tests en el
Módulo 7 con el tratamiento de la confiabilidad, la validez, el índice de dificultad y el índice
de discriminación.
Borg y Gall (1983: 357-359) señalaron cuatro tipos de información que un investigador debe
considerar en los instrumentos estadísticos:
1) ¿Con qué instrumentos estadísticos se cuenta?

2) ¿Bajo qué condiciones sería apropiado emplear una técnica determinada?
3) ¿Cuál es la significación de los resultados estadísticos? y
4) ¿Cómo se realizan los cálculos estadísticos?
¿Con qué instrumentos estadísticos se cuenta?

Un investigador querrá proporcionar una explicación lo más completa posible sobre la
situación que se está investigando. Para lograrlo, será necesario que utilice los datos al
máximo. Un error fundamental que se nota en algunos informes de investigación es que se
proporcionan medidas sin que se presenten las desviaciones estándar correspondientes,
para indicar la variabilidad de las medias. Otro ejemplo más complejo es la práctica común
de comparar las medias obtenidas en un post-test por dos grupos para averiguar si existe
una diferencia significativa entre dichos grupos. Además se deben comparar las
desviaciones estándar de los pre-tests y post-tests de cada grupo para averiguar si durante
el tratamiento cada grupo llegó a ser más homogéneo o más heterogéneo.
¿Bajo qué condiciones sería apropiado emplear una técnica determinada?

El proyecto de investigación debe especificar las técnicas estadísticas que se aplicarán. En
esta forma, algunos asesores tendrán la oportunidad de opinar sobre si las mismas son
apropiadas, o no. Ciertas técnicas requieren que se cuente con cierto tipo de datos, que se
tengan ciertas distribuciones de datos, que haya números iguales en cada subgrupo, o que
haya solamente dos grupos.
¿Cuál es la significación de los resultados estadísticos?

Aunque la selección y aplicación de instrumentos estadísticos apropiados parece ser la tarea
más difícil, la interpretación de los resultados no suele ser fácil. El error más común al hacer
la interpretación tal vez es que se informa sobre las diferencias que son estadísticamente
significativas, sin pensar si esa diferencia es significativa desde un punto de vista práctico. Si
hay grupos numerosos en un experimento sobre dos métodos de enseñanza, es fácil lograr
una diferencia significativa aunque las medias de los grupos no difieran mucho. Sobre todo
si el método cuya media es más alta resultaría mucho más costoso, habría que considerar la
significación práctica de esa diferencia.
¿Cómo se realizan los cálculos estadísticos?

Aunque los cálculos estadísticos generalmente no son muy difíciles de realizar, sí resulta una
labor ardua. Algunas de las fórmulas son complejas y, por lo tanto, se hace difícil
aprenderlas de memoria. Actualmente es mediante el uso de las calculadoras y las
computadoras que se realizan cada vez más los cálculos. En el año de 1984 en la mayoría de
los países latinoamericanos se podía comprar una calculadora científica por un precio de
menos de US$50, con la que se pueden calcular medidas, desviaciones estándar y
correlaciones. La existencia de dichas máquinas implica que el ser humano no tiene que
preocuparse más de la ardua labor que significa realizar cálculos. Sin embargo, la mente
humana aún tiene que seleccionar cuáles cálculos se van a realizar. Eso es lo difícil e implica
una comprensión de la significación de los cálculos estadísticos. En el resto de este módulo
se pretende explicar la significación que tienen los instrumentos estadísticos. Para aprender
la aplicación de las diversas fórmulas, el lector puede consultar un libro que verse sobre los
métodos estadísticos. Las referencias con respecto a algunos libros de esta clase aparecen al
final del módulo. Si se usa una calculadora o una computadora, debe consultarse el manual
correspondiente para el manejo de la misma.

Antes de empezar a presentar los métodos estadísticos, cabe señalar algunos puntos que
indican la importancia que tiene la estadística en el campo de la investigación y la
evaluación educativa, a saber:
1. Permite que se realice un tipo de descripción muy exacto.
2. Exige que se empleen procedimientos y se tengan pensamientos definidos y
precisos.
3. Facilita que los resultados se presenten en una forma conveniente y comprensible.
4. Ayuda a formular conclusiones.
5. Sirve en el proceso de hacer predicciones.
6. Facilita el análisis de los factores y los hechos que influyen en hechos y situaciones
muy complicados.
8.2 Los Tipos de Datos
Existen varias maneras de clasificar los datos. Tal vez la más común sea clasificarlos según la
escala o el nivel de medición, a saber:
1) El nivel nominal,
2) El nivel ordinal,
3) El nivel de intervalo y
4) El nivel de razón.
El nivel nominal
Se puede decir que el nivel nominal (o cardinal) involucra un proceso de nombrar, en vez de
medir. Se trata de basar la asignación de números .solamente en la clasificación de las
observaciones. Algunos ejemplos del nivel nominal son el número de nombres y mujeres, el
número de niños de alto y bajo rendimiento y el número de personas de la clase baja, media
y alta. Se pueden considerar muchas variables independientes del nivel nominal porque las
mismas se dividen en dos grupos: el grupo experimental y el grupo de control, o un grupo
que tiene una característica y otro que no la tiene.
Se pueden distinguir tres tipos de datos nominales: las dicotomías artificiales, las dicotomías
verdaderas y las categorías.
Existe una dicotomía cuando una variable tiene solamente dos posibles valores. Muchas
veces se forman dicotomías artificiales partiendo de datos continuos. Por ejemplo, dividir un
grupo de alumnos en dos: los que rinden excepcionalmente y aquellos cuyo rendimiento es
inferior; probablemente significa escoger dos puntajes y afirmar que todos aquellos que
hayan obtenido un puntaje más elevado de lo que se considera un puntaje alto, son
alumnos de alto rendimiento, mientras que todos los que hayan obtenido un puntaje
inferior son alumnos de rendimiento bajo. Esto es artificial porque es necesario establecer
un punto arbitrario al hacer la división.
El sexo generalmente se considera como una dicotomía verdadera. No es necesario
establecer un punto arbitrario para distinguir entre hombres y mujeres. Asistir a un curso o
no, probablemente sea una dicotomía verdadera, pero a veces en tales situaciones existe un
tercer grupo que asistió solamente a parte del curso y, por lo tanto, puede ser distinto a los
otros dos grupos.
En el caso de una categoría, ésta simplemente tiene más de dos divisiones. Algunas
categorías que se encuentran comúnmente en las investigaciones educativas son los grados
y los niveles de educación, las clases socioeconómicas, la religión, los niveles de escalafón y
los tipos de nombramientos.

Otra manera de conceptualizar los datos que comprende el nivel nominal es fijarse en el
hecho de que dicho nivel no implica que haya una relación matemática entre las categorías.
Si se obtiene la cifra de niños extrovertidos e introvertidos, esto no implica que existe una
relación matemática entre la extroversión y la introversión. Simplemente se trata de dos
categorías. A veces en esto surge una confusión porque para codificar los datos se suelen
asignar valores como 0 = extroversión y 1 = introversión.
El nivel ordinal
Los datos ordinales implican un orden de personas u objetos. En vez de simplemente
clasificar a los niños como extrovertidos o introvertidos, es posible ordenarlos según su
grado de extroversión. El nivel ordinal de un dato es su posición relativa con respecto a los
otros datos de su conjunto. Los datos que comprende el nivel ordinal no son absolutos ni
existe la necesidad de indicar el grado de las diferencias que hay entre los niños, solamente
el orden en que se encuentran. En la investigación educativa es bastante común pedirles a
los sujetos que ordenen un conjunto de características o de personas según su importancia
o su calidad, sin darle un puntaje absoluto a cada una de ellas.
El nivel de intervalo
Tal vez la mayoría de los datos que se obtienen en las investigaciones educativas son de
nivel de intervalo. Los datos de intervalo indican, el intervalo o distancia que hay entre los
puntajes obtenidos. Dichos ciatos también se denominan datos continuos. Los datos de
intervalo tienen todas las características que tienen los datos del nivel ordinal, además de
ser iguales las unidades. Muchos consideran que el C.I. es un ejemplo de una medición el
nivel de' intervalo. La diferencia de un C.I. de 90 y uno de 100 es la misma que la diferencia
entre 120 y 130. Si se ordenan los integrantes de un grupo según su inteligencia, no se
puede afirmar que la diferencia entre el 10o. y el 20o. es la misma que la. Diferencia entre el
30o. y el 40o.
Existe cierta controversia con respecto a si muchas de las mediciones de la investigación
educativa, como la de los puntajes obtenidos en un test para determinar el C.I., la de los
resultados de tests de rendimiento y la de las escalas de actitudes e intereses son del nivel
ordinal o del nivel de intervalo. Esto constituye un asunto importante, porque la aplicación
de varias técnicas estadísticas requiere que se utilicen datos de intervalo.
Es posible sumar y restar los datos de intervalo, pero no es válido referirse a los unos y a los
otros como múltiplos o razones. Por ejemplo, no puede afirmarse que una persona con un
C.I. de 140 tiene dos veces la inteligencia de una persona con un C.I. de 70.
Tal vez la mayoría de los datos de intervalo de las investigaciones educativas la constituyen
los puntajes de varios tipos de tests. En su forma original (puntajes brutos o burdos) y sin
contar con otra información, resulta difícil interpretar los puntajes. Si un alumno ha
obtenido 58 de 80 puntos, no sabemos de inmediato si su rendimiento es bajo, regular, ni
siquiera si es bueno. La interpretación del puntaje por un alumno suele depender del
rendimiento de los demás o de los deseos del alumno mismo. Para facilitar la interpretación
de los puntajes, se calculan puntajes derivados, tales como los equivalentes de edad, los
equivalentes de grado, los percentiles y los puntajes estandarizados.
Los equivalentes de edad y de grado dependen de las normas del test. Se establecen las
normas a través de un proceso de administración de, un test a una muestra grande (una
muestra de estandarización) y de estudio de los resultados, a fin de determinar el promedio

que se espera obtener en sujetos de varias edades o varios grados. El manual de un test
estandarizado debe contener las normas necesarias para traducir un puntaje original a un
equivalente de edad o de grado. Puede resultar que un puntaje bruto de 58 de 80
corresponde al promedio de sujetos de 10.4 años, o tal vez corresponda al grado 5.2. El
equivalente puede compararse con la edad o el grado actual del sujeto.
Los percentiles (o centiles) también se sacan de una muestra de estandarización. Algunos
manuales de tests contienen tablas de percentiles. Si un puntaje bruto de 58 de 80
se encuentra en el percentil 82, esto implica que 82o/o de la población debe
tener un puntaje inferior a 58. Algunos percentiles reciben nombres
especiales. El percentil de 50 se llama la mediana, el de 2 5 se llama el
primer cuartil y el de 75 el tercer cuartil. Cuando los percentiles se usan es
muy importante indicar el grupo que formó la muestra de estandarización.
Un puntaje estandarizado (o típico) relaciona a un puntaje con la media y

con la desviación estándar (ver las secciones 8.4 y 8.5). En cualquier
distribución de puntajes la media de los puntajes estanda rizados es de 0 y la
desviación estándar es de 1.0. A un puntaje estandarizado, a veces se le
denomina puntaje z, puntaje sigma, o puntaje Z.
Los puntajes estandarizados transformados son más fáciles de interpretar

porque, para cualquier grupo específico, tienen una media de 50 y una
desviación estándar de 10. Los puntajes estandarizados se denominan como
puntajes Z o puntajes T. Si se encuentra alguna referencia a un puntaje Z es
muy importante averiguar si se trata de un puntaje estandarizado o un
puntaje estandarizado transformado. Existen otros tipos de puntajes
estandarizados transformados que difieren en cuanto a las medias y
desviaciones estándares que poseen .
El propósito de todos los puntajes estandarizados es dar una idea de la

posición que ocupe n los puntajes dentro de la distribución de todos los
puntajes obtenidos por un grupo. Los puntajes estandarizados se usan
mucho en la investigación y es posible usarlos al realizar un análisis
estadístico. Los percentiles y los equivalentes de edades y gr ados
proporcionan información valiosa sobre un sujeto o una muestra cuando se
comparan con la muestra de estandarización, pero no deben usarse al
realizar un análisis estadístico porque no tienen intervalos iguales.
El nivel de razón
Las mediciones del nivel de razón solamente se encuentran en las ciencias
físicas y no así en las ciencias de la conducta. Dichas mediciones tienen lo
que se llama un cero absoluto. Se puede hablar de un peso de 0 como la
ausencia completa de pesó. Sin emb argo, no se puede hablar de un puntaje
de 0 como una ausencia completa de inteligencia o conocimientos. Es
posible que los datos de razón se refieran unos a otros como múltiplos o
razones. Se puede decir que una persona que mide 2 metros es dos veces
más alta que una persona que mide 1 metro. No es posible decir que una
persona con un puntaje de 100 sabe dos veces más que una persona con 50.
8.3 La Presentación de Datos

Como ya se mencionó en varias oportunidades, uno de los propósitos
principales de la inv estigación y evaluación educativa es la comunicación de
información. Muchas veces esa información se encuentra en forma de datos
numéricos. Los datos numéricos pueden presentarse en forma de tablas o de
gráficas.
El Uso de Tablas
Si los datos son muchos, cabe la posibilidad de que sean difíciles de
interpretar, si se presentan de una forma no ordenada. Por ejemplo, en la
Tabla 8.3.1 se presentan los puntajes obtenidos en un test de rendimiento
de historia. Tal vez, oculta entre eso s datos no ordenados, haya alguna
información importante relacionada con una hipótesis. Un primer paso al
analizar un conjunto de datos nuevos puede ser la agrupación de éstos en lo

que se llama una distribución de frecuencias.
Tabla 8.3.1

Una Distribución de Frecuencias. La Tabla 8.3.2 presenta una distribución de
frecuencias que facilita un poco la comprensión de los resultados del test.
En el caso de la distribución de frecuencias de la Tabla 8.3.2, tal vez sea el
ordenamiento de los datos lo que más facilite la comprensión de las
frecuencias.
La Tabla 8.3.3 presenta los mismos datos en una distribución de frecuencias
con datos agrupados. Así se tiene una mejor visión de la totalidad de los
datos, pero también se pierde información so bre los datos específicos .
TABLA 8.3.3
La Distribución de Frecuencias con Datos Agrupados
Por ejemplo, Puntajes Frecuencia no se sabe si
los cuatro 91-100 4 valores entre
91 y 100 son 81-90 8 todos más
próximos, al 71-80 15 91, o al 100,
o están 61-70 11 dispersos
entre 91 v 51-60 5 100.
Witte (1980: 41-50 6 17) sugirió
siete pautas 31-40 1 para
"minimizar las
irregularidades y ambigüedades" en el formato de una tabla de distribución
de frecuencias con datos agrupados. Dichas sugerencias se encuentran en la
Tabla8.3.4.

Las tres primeras sugerencias aparecen con letras mayúsculas para destacar
su importancia especial. Las otras cuatro pueden modificarse o pasarse por
alto, según las circunstancias. La última pauta sea tal vez la más flexible. La
Tabla 8.3.3 tiene solament e
Siete intervalos debido a la cantidad limitada de datos. (Sería posible incluir
los intervalos 1 -10, 11-20 y 21-30 aunque éstos están fue ra del rango de
datos).
Otros dos tipos de tablas de distribuciones de frecuencias son las tablas de
distribuciones de frecuencias relativas y las tablas de distribuciones de
frecuencias acumuladas. En la Tabla 8.3.5 se ofrece un ejemplo.
Las frecuencias relativas se expresan como porcentajes en Ta Tabla 8.3.5.
También es posible presentarlas como proporciones. Dos de las ventajas de
las frecuencias relativas son que: al presentarlas como porcentajes, facilitan
la comprensión de la incidencia de cada intervalo y la posibilidad de
comparar las frecuencias de dos distribuciones que no tienen el mismo
número total de datos .
Las frecuencias acumuladas son la suma de la frecuencia de un intervalo más
las frecuencias de los intervalos anteriores. Con las frecuencias acumuladas
es posible averiguar la cantidad de datos que caen por debajo o por encima
de un intervalo dado.
Tal vez valga la pena señalar que se puede hablar de distribuciones de
frecuencias de Dato del nivel de intervalo y del nivel nominal pero no tiene mucho
sentido de hablar de frecuencia si se trata de datos ordinales pues cada posición tendrá
una frecuencia de uno con la excepción de cuando hay empates

El Uso de Gráficos.
En idioma ingles hay un dicho que se puede traducir como “Un dibujo vale lo que vale mil
palabras” Cuando se trata de la presentación anterior de datos ese dicho es muy elocuente
en una grafica se puede mostrar las forma de la distribución de los datos por lo tanto, a
simple vista se proporciona una imagen de donde están concentrados los datos.
Los Histogramas.
En el histograma, el eje horizontal (el e je x) representa los intervalos. Ya se
mencionó en la Tabla 8.3.4 que es necesario tener inter valos iguales. Esa
pauta se aplica a las gráficas también. A lo largo del eje vertical (el eje y) se
coloca la escala de frecuencias. La inter sección de los eje s generalmente
indica el origen, en donde los valores de los datos y las frecuencias son de
cero. La línea de corte de escala que está cerca del origen indica que existen
intervalos entre 0 y 30 que están fuera del rango. Es importante que no
aparezca nin gún espacio entre las barras adyacentes, pues tales espacios
indicarían continuidades que no existen.
La figura 8.3.1 histograma que muestra los obtenidos como resultado del test de
rendimiento de historia que se han presentado en las tablas anteriores
Figura 8.3.1 Un Histograma
El Polígono de Frecuencias. La Figura 8.3.2 es un polígono de frecuencias donde se

presentan los mismos datos que aparecen En la Figura 8.3.1. Se supone que
en un histograma los datos se dispersan igualmente por todo el intervalo.

Figura 8.3.2
Un Polígono de Frecuencias Puntajes Obtenidos en un Test de Rendimiento
de Historia
En un polígono de frecuen cias se tiene el supuesto de que el punto me dio

de cada intervalo representa todos los da tos del intervalo.
Para representar datos nominales, se usa mucho una gráfica de barras, la

cual tiene se mejanza con un histograma. Es muy común que un Ministerio de
Educación utilice datos que indiquen la cantidad de los distintos ti pos de
alumnos, docentes, escuelas, etc. L T abla 8.3.6 indica el número de docente
que trabajan en el nivel medio de un país En cada uno de los años de un
lustro aparee el número de docentes de escuelas ofíciales y privadas y la
suma de ellos o el total.
La Figura 8.3.3 presenta los datos de un; for ma tal que se puede apreciar el
numen de los dos tipos de docentes y el total en 1; misma barra. De esa
manera se puede ver mu) fácilmente que el porcentaje de docentes oficiales
aumentó durante ese período.
Tabla 8.3.6
Número de Docentes que Trabajan en Escuelas de Nivel Medio
AÑO TOTAL OFICIAL PRIVADA
1975 7 342 3009 4333

1976 7740 3 304 4417
1977 8275 3704 4571
1978 8602 3954 4650
1979 9020 4201 4824

8.3.3 Una Gráfica de Barras
Número de Docentes que Trabajan en
Escuelas d e Nivel M edio
10010
0 9500
9000
8500
8000
7500
7000
6500
6000
5500
5000
4500
4000
3500
3000
2500
2000 1
97
1500 7
1975 1976
1000 5
1978 1979
9
500 Año
Oficial
Privada
Es necesario tener mucho cuidado al desarrollar e interpretar gráficas. A

veces la forma en que se elabora una gráfica puede introducir sesgos. Las
Figuras 8.3.4 y 8.3.5 se refieren a la misma situación. Cada una de las
gráficas da una impresión muy distinta.
Figura 8.3.4
¿Está de acuerdo a adoptar un texto nuevo?
SI NO
Respuestas

Figura 8.3.5
¿Está Ud. de acuerdo en adoptar un nuevo texto?
SI NO
Respuestas
8.4 Las Medidas de Tendencia Central
El propósito de las medidas de tendencia central es ofrecer en un solo valor

una expresión típica de todos los datos de una distribución. Si se obtienen
los puntajes que 100 alumnos han sacado en un test de rendimiento, es muy
difícil obtener una idea del rendimiento del grupo en general con sólo mirar
todos los puntajes. Aunque una medida de tendencia central puede
proporcionar una indicación del grupo en general, vale la pena enfatizar que
no puede proporcionar toda la información sobre la distribución de un
conjunto de datos.
Las medidas de tendencia central que más se usan son:
1) La media,
2) La mediana y
3) La moda.
Es posible calcular la media, la mediana y la moda partiendo de datos
ordenados, de intervalo y de razón, pero no así de datos nominales.
La media
La media es el valor de tendencia central que más se usa. Es el promedio
aritmético de un conjunto de datos. El símbolo más común para representar
la media es X.
Entre las ventajas que tiene la media se encuentran las siguientes:
A) La forma de calcularla es muy sencilla.
B) No es necesario ordenar los datos para calcularla.

C) Es más estable que la mediana. Esto significa que, las medias de varias
muestras de la misma población están generalmente más cerca a la media de
la población de lo que están las medianas.
Sin embargo, la media también tiene algunas desventajas:
A) No puede obtenerse a través de una simple ojeada de los términos.
B) Un término que mide una modalidad anormal de un fenómeno influye
mucho en la media.
Distribución A Distribución B
7 30
7 7
6 6
5 5
4 4
2 2
Media=5.1 Media=8.4
C) Dos conjuntos muy distintos pueden tener la misma media.
90 55
50 50
10 45
Media = 50 Media = 50
La mediana
La mediana es el valor central de una distribución de datos. Ya se ha visto
(en la sección 8.2) que es igual al percentil de 50.
La mediana tiene ciertas ventajas :
A. Puede deducirse de un simple examen de los datos, si están en orden.
B. No la afectan los valores de los términos extremos de una distribución de
datos.
C. Puede determinarse sin conocer el valor particular de cada término.
También tiene algunas desventajas :
A. No puede determinarse por medio de una fórmula matemática.
(Muchos paquetes de programas estadísticos de computadoras
calculan la mediana, pero en general las calculadoras no pueden
calcular una mediana).
B. Los datos deben haberse ordenado para poder encontrarla.
C. Si hay mucha variación en los datos, es posible que la mediana no
refleje bien la realidad.

La moda
La moda es el valor más frecuente de una distribuci ón de datos. No sé, usa
tanto como la media y la mediana. Algunas distribuciones tienen dos modas
(bimodal) o hasta más de dos (plurimodal).
A. A continuación se indican algunas de las posibles ventajas de la moda:
B. Se puede conocer su valor con una simple inspección de los datos.
C. No es necesario ordenar los datos para poder determinarla.
D. No la afectan los valores extremos. Entre las desventajas de \a moda
se encuentran
E. No se calcula por medio de una fórmula matemática.
F. Dos distribuciones muy distintas pueden tener la misma moda.
90 75
85 75
84 75
75 50
75 40
75 25
¿Qué medida de tendencia central debe usarse? Si la distribución de datos

es más o menos simétrica, las tres deben tener más o menos el mismo valor.
En dichos casos, una ventaja de la media es que se usa al calcular otros
valores, como la desviación estándar. La media es la única que usa todos le
valores de la distribución. Eso es una desventaja si existen algunos valores
que son muy distintos de la ma yoría de ellos. En tales casos tal vez sea
conveniente indicar ambas la media y la mediana. Quizás sea más fácil
encontrar la moda que las otras dos medida: y por lo tanto en situaciones
apremiantes 1; moda puede dar una idea aproximada de 1; tendencia cen tral
de una distribución de datos.
8.5 Las Medidas de Variabilidad
Considere las siguientes distribuciones de puntajes en los dos grupos de

alumnos de que test de rendimiento:
Tabla 8.5.1
Dos Distribuciones con las Mismas Medias y Medianas
90 60
80 60
70 60
60 60
50 50
40 40
30 40
20 40
10 40
Media=50 Media=50

Como se indica en la tabla, las medias y las medianas son iguales (no valdría
la pena siquiera hablar de las modas), pero las distribuciones son muy
diferentes. La diferencia tiene que ver con lo que se llama la variabilidad de
las dos distribuciones, es decir, la dispersión de los datos alrededor de un
valor central. La media y la mediana proporcionan información sobre el
grupo total. Las medidas de variabilidad proporcionan información que se
relaciona más con los individuos. En el ejemplo de la Tabla 8.5.1, un
problema de investigación puede deberse a que existen esas diferencias de
variabilidad entre los dos grupos. En general , es interesante investigar por
qué algunos obtienen puntajes altos y los otros los obtienen bajos.
El Rango
La medida de variabilidad más sencilla es el rango. El rango es simplemente
la diferencia entre el dato más alto y el más bajo. En la Tabla 8.5.1 l a
distribución A tiene un rango de 80 y la distribución B tiene un rango de
solamente 20.
Aunque es fácil de calcular y de entender, el rango tiene ciertas desventajas.
Se usan solamente dos de los datos de una distribución para calcularlo. Si
esos dos datos son muy distintos de los demás, se puede creer que hay más
variabilidad de la que realmente existe.
La Desviación Estándar
La medida de variabilidad preferida es la desviación estándar (o desviación
típica). Se usan todos los datos de una distribución para calcularla. La
desviación estándar puede considerarse como un promedio de las distancias
a que están los datos de la media. La media es una posición y la desviación
estándar es el promedio de las distancias a que está esa posición. Entre los
símbolos que se usan para indicar una desviación estándar se encuentran la
letra s y la letra griega sigma (o ) •
Una ventaja de la desviación estándar es su estabilidad. Es decir, varias

muestras de la misma población tienen desviaciones estándar semejantes.
Además, la desviación estándar se usa para hacer cálculos más avanzados. Si
en un informe de una investigación se indican medias, también se deben
indicar las desviaciones estándar correspondientes.
Otra medida de variabilidad, que a veces se encuentra, es la varianza. La
misma es simplemente el cuadrado de la desviación estándar.
8.6 La Distribución (Curva) Normal
Se consideraron en la Sección 8.3 varias maneras de presentar una

distribución de datos. Resulta que muchas de las características que se
miden en la investigación y evaluación educativa, tales como el C.I. y el
rendimiento, suelen aproximarse a lo que se llama una distribución normal.
El polígono de frecuencias de una distribución normal es bastante conocido
por su forma simétrica que se parece a una campana y que se denomina
como la curva normal (ver Figura 8.6.1).

F i g u r a 8 . 6 . 1 La C u r v a N o r m a l
Aunque muchos de los fenómenos reales se aproximan a la curva normal, la

curva misma es teórica y se obtiene mediante una fórmula matemática.
Abraham De Moivre, un matemático francés, desarrolló la fórmula
correspondiente durante el siglo XVIII, mientras experimentaba con juegos
de azar.
Hay algunas características de la curva normal que son más o menos obvias y
que deben notarse:
1. Es simétrica: la media, la mediana y la moda son iguales.
2. La mayoría de los datos están muy próximos a la media.
3. Hay relativamente pocos datos cerca de los extremos de la curva.
Como ya se ha mencionado, muchos fenómenos de interés en la
investigación y evaluación educativa se c aracterizan por una distribución'
normal. Sin embargo, generalmente se necesita una muestra más o menos
grande para obtener una curva que refleje bien la normalidad.
Una característica importante de la curva normal, que no es obvia, es la

relación entre las unidades de desviación estándar y la proporción de datos
que están bajo la curva normal. La Figura 8.6.2 muestra los porcentajes de
datos que se relacionan con las desviaciones estándar. Esta situación puede
aclararse con el siguiente ejemplo.
Figura 8.6.2
La Relación entre el Porcentaje de los Datos y las Desviaciones Estándar con
la Curva Normal
-3<0 -2<r -lo- 0 +l 0 +2CT +3<r
Para la población en general se puede su poner que la media del C .I. es de

1.00 con una desviación estándar de 15 en una distribución normal. Resulta
que el 34.13o/o de la población tiene un C .I. entre la media y una desviación
estándar de la media. Es decir, el 34.13o/o tiene un C.I. que está entre 100 y
115. Solamente un 2.28o/p tiene un C.I. de más de 130. Aproximadamente
dos tercios de las personas tienen un C.I. dentro de una desviación estándar
de la media, es decir, entre 85 y 115.

Aunque las curvas de todas las distribuciones normales tienen la forma de
una campana, la forma exacta de éstas depende de los valores de la media y
la desviación estándar. La Figura 8.6.3 presenta dos distribuciones normales
con medias distintas, pero con desviaciones estándar iguales. En la Figura
8.6.4 las medias son iguales, mientras que las desviaciones estándar son
distintas. Las curva s de la Figura 8.6.5 son ambas normales, pero las medias
y las desviaciones estándar son distintas.
Figura 8.6.3
La Curva Normal con Medias Distinta s y Desviaciones Estándar Igua les
Fi g ur a 8 .6 .4 La C ur v a N o r mal co n M ed ia s
I g ua le s y De s vi ac io ne s Es tá nd ar
Di st i nt as

Actualmente contamos con tablas que indican la proporción de los datos de
una distribución normal que se encuentran bajo una desviación estándar
determinada. De este modo se pueden encontrar los percentiles de una
distribución normal. Parte de la importancia de la distribución normal tiene
que ver con el hecho de que muchas técnicas para realizar análisis
estadísticos funcionan solamente con distribuciones normales.
8.7 La Correlación
Las estadísticas descriptivas, tales como la media y la desviación estándar
sirven para dar información acerca de una variable. Si se desea obtener
información sobre la relación entre dos o más variables, una manera de
conseguirlos es mediante una correlac ión. Puede ser que un investigador
tenga interés en la relación entre el C.I. y el rendimiento matemático de un
grupo de alumnos. Una correlación puede proporcionar información sobre
dicha relación. El valor mismo que indica el grado de correlación se llam a
coeficiente de correlación. Un coeficiente tiene un rango posible de -1.00
hasta +1.00. El signo ( - o+) indica la dirección que toma la relación y el
número indica su magnitud. El signo + indica una relación positiva. Es decir
una relación en que la medi da alta de una variable implica que la otra tiene
una medida alta también. Por ejemplo, se espera que haya una correlación
positiva entre el C.I. y el rendimiento, el peso y la estatura, la edad de los
niños y la estatura, el nivel de educación y el ingres o anual. En una relación
negativa la medida alta de una variable implica que la otra tiene una medida
baja. Por ejemplo, generalmente existe una correlación negativa entre el C.I.
y el tiempo que es necesario para resolver problemas matemáticos, el
tiempo de práctica y los errores dactilograficos, fumar y el índice de
longevidad. Entre algunas variables no suele existir ninguna o poca relación,
lo cual se indica mediante una correlación de aproximadamente 0.00. Por
ejemplo, no hay mucha correlación entre el C.I. y el peso, el tamaño de
calzado y la actitud hacia la escuela; el rendimiento escolar y una afición a
comer chicharrones.
Una Grafica de Dispersión
Una manera gráfica de averiguar algo sobre la correlación entre dos
variables es por medio de una gráfica (o diagrama) de dispersión. Cuando
existen dos variables, el conjunto de los valores de una de las variables suele
llamarse X y el conjunto de la otra Y. En una gráfica con un eje "x" y un eje
"y" es posible hacer una gráfica con los pares de valores. En la Figura 8.7.1 se
indican algunas posibilidades.

El Coeficiente de Correlación de Producto-Momento de Pearson
Aunque un diagrama de dispersión puede dar una indicación de la
correlación que existe entre dos variables, generalmente dicho diagrama no
tiene la- exactitud necesaria que proporciona un análisis estadístico. Se han
desarrollado varias fórmulas para calcu lar correlaciones, pero la que más se
usa es el coeficiente de correlación de producto momento de Pearson la cual
se presenta con la letra r. La mayoría de las calculadoras que se emplean
para calcular un coeficiente de correla ción usan la fórmula de Pear son. Para
poder aplicar la fórmula de Pearson los datos deben reunir los siguientes
requisitos:
1) Deben ser datos del nivel de intervalos.

2) Deben estar distribuidos normalmente.
3) Deben ser observaciones apareadas del mismo conjunto de sujetos.
4) Debe existir una relación lineal entre las variables. (Si es curvilineal,
como la Fi gura 8.7.id ican, el valor de r subestima la relación.)

Hay ciertos riesgos en la interpretación de r que es preciso evitar. Un valor r
no es ni un porcentaje ni una propo rción. Si r = .25, no puede decirse que
eso indica una correlación que es el 25°/o de una correlación completa. Otra
manera de considerarlo es que los valores r son de un nivel ordinal. En
general, se puede decir solamente algo así como: "r = .37 refleja u na
relación más fuerte que r = .25." El otro riesgo que hay es que se piensa que
una correlación alta entre dos variables implica que una de las variables es
causa de la otra. Nunca se da el caso de que un coeficiente de correlación
proporcione información sobre causa y efecto. Simplemente indica una
relación o asociación entre las dos variables. Aunque tal vez exista una
correlación alta entre el nivel de educación y los ingresos, no debe
deducirse que la educación es la causa del ingreso. Puede ser que ha yan
factores que influyan en ambos casos, tales como la actitud, el deseo, la
clase socioeconómica y la inteligencia. Para averiguar algo sobre la causa y
el efecto es necesario realizar una investigación experimental empleando los
controles adecuados.
La Interpretación Informal de Coeficientes de Correlación

Es corriente oír hablar de coeficientes de correlación altos (o fuertes) o
bajos (o débiles). En general, no puede decirse que alto es lo mismo que
importante, ni que bajo quiere decir no importante. L a importancia de una
correlación depende de las variables y de la situación. De todos modos, es
posible dar criterios, como los que se han expuesto en la Tabla 8.7.1, que
sirven de guía informal para interpretar coeficientes de correlación. En la
sección 8.9 se contempla la forma de usar co rrelaciones en la estadística
inferencial.
Otros tipos de Coeficientes de Correlación
Cuando los datos no llenan todos los requisitos antes mencionados

para poder usar la fórmula producto -momento de Pearson, existen otra s
fórmulas que se pueden emplear. En la Tabla 8.7.2 se indican los
nombres de algunas de las fórmulas que pueden utilizarse según sean
las características de las dos variables. Si el lector tiene interés en
conocer las fórmulas, se le aconseja que consulte un texto de
estadística avanzada

Tabla 8.7.1
Criterios Informales para Interpretar el Tamaño de un Coeficiente de
Correlación Positiva
r=1.00 Correlación perfecta
0.90 < r < 1.00 Correlación muy alta
0.70 < r < 0.90 Correlación alta
0.40 < r < 0.70 Correlación moderada
0.20 < r < 0.40 Correlación baja
0.00 < r < 0.20 Correlación muy baja
r = 0.00 Correlación nula
Ya se mencionó que el coeficiente de correlación de Pearson no es muy

apropiado cuando se trata de una situación curvilineal. Si los datos son de
intervalo, la razón de correlación "eta" puede detectar relaciones
curvilineales.
A la correlación entre dos v ariables a veces se le denomina correlación
bivariada. También existen métodos de correlación múltiple. La correlación
múltiple (R) proporciona la correlación entre una variable y una combinación
lineal de otras variables. Al hacer una correlación parcial es posible
determinar la correlación que hay entre dos variables y a la vez suprimir la
influencia de una tercera variable. Con la correlación de partes es posible
impedir la influencia de la tercera variable sobre una de las dos variables
principales. El análisis factorial es un método que se utiliza para determinar
si un conjunto de variables puede reducirse a un número menor de factores.
(El lector que tenga interés en conocer más a fondo los métodos anteriores
deberá consultar un texto de estadística av anzada.)
La Regresión Lineal (Predicción)

Si resulta que hay una correlación alta entre dos variables, se puede usar el
coeficiente de correlación y el valor de una de las variables de un individuo
para predecir el valor de la otra variable para ese mismo individuo. Cuando
se usa el coeficiente de Pearson para realizar este proceso de predicción, a
esto se le denomina regresión lineal. Por ejemplo, tal vez alguien podría
tener in teres en predecir el éxito que tendrá un curso mediante el uso de
un test de entrada.
Tabla 8.7.2
Nombres de Fórmulas d e Coeficientes de Correlación según los Tipos de

Variables

Primero hay que seleccionar una muestra de regresión y para esa muestra
encontrar el coeficiente de correlación entre los puntajes obtenidos en el
test de entrada y las calificaciones de rendimiento del curso. Luego, se
puede usar ese coeficiente de correlación y el puntaje por un individuo en el
test de entrada para predecir cuál será su rendimiento en el curso. Los
individuos acerca de quienes se hacen las predicciones deben tener
características semejantes a las de la muestra de regresión.
En este ejemplo el puntaje obtenido en el test de entrada es la variable

independiente y se le denomina variable predictora. La variable dependiente
es el rendimiento y se le conoce como una variable d e criterio.
También existen métodos de regresión no lineal y de regresión múltiple para
hacer predicciones. En el caso de una regresión múltiple se puede usar más
de una variable para hacer la predicción.
8.8 Los Tests de Significación Estadística

La estadística descriptiva cuenta con instrumentos o técnicas que pueden
usarse para describir los datos que ha obtenido el investigador. En cierto
sentido la estadística inferencial permite que se diga algo sobre los datos
que el investigador no tiene. Es decir, las técnicas de la estadística
inferencial facilitan que se hagan conjeturas sobre las características de las
poblaciones las cuales corresponden a las muestras acerca de las cuales el
investigador sí cuenta con datos. Para utilizar los métodos de la esta dística
inferencial un investigador debe tener muestras, aleatorias. Si se usan
muestras disponibles, tal vez sea permisible usar métodos inferenciales,
siempre y cuando se haga con mucha cautela.

Si un investigador tiene datos sobre el rendimiento de una muestra de
alumnos del primer grado primario a quienes se les enseña matemática
siguiendo un método que empleaba materiales concretos y datos de otra
muestra semejante cuyos maestros usaron un método tradicional, desea
inferir si las diferencias en el rendimiento de las dos muestras es algo que
corresponde a otras muestras en las que se usan estos dos métodos
distintos de enseñanza. Es decir, tal vez quiera comprobar la hipótesis de
que el método que empleaba materiales permite u n mejor rendimiento que
el que se produce mediante el método tradicional.
Dicho investigador puede tomar la estadística descriptiva como punto de

partida y calcular la media y la desviación estándar para cada muestra. Tal
vez él obtenga los siguientes resu ltados:
Desviación
n
Método con media estándar
Materiales 60 77 9
Método tradicional 60 71 8
Los alumnos a quienes se les enseña con el método que utilizaba materiales
concretos, tienen un promedio de rendimiento que es más alto que la
muestra de alumnos con el método tradicional. El investigador se verá en la
necesidad de preguntarse: "¿Sucedió la diferencia por azar? Si me dedico a
estudiar otras muestras, ¿voy a encontrar los mismos resultados? Si llego a
inferir que hay una difere ncia verdadera entre las dos muestras, ¿cuál es la
probabilidad de que tal in ferencia sea falsa?'
Existen tests de significación que permiten darle respuesta a preguntas
semejantes a algunas de las anteriores. Los conceptos importantes en torno
a los test s de significación son:
1) La hipótesis nula,
2) El nivel de significación,
3) El error de decisión,
4) El poder estadístico y
5) Los tests de una y dos colas.
La Hipótesis Nula
En la sección 4.2 ya se mencionó que una hipótesis nula indica que no existe
una diferencia s ignificativa entre las variables y que dicha hipótesis nula es
necesaria al realizar un test estadístico. En el ejemplo de los métodos de
enseñanza una posible hipótesis nula sería: "No existe una diferencia
significativa entre el rendimiento de los alumno s a quienes se les enseña
siguiendo un método que emplea materiales concretos v el de los que se les
enseña siguiendo un método tradicional". El investigador realiza un test de
significación para averiguar si es posible rechazar la hipótesis nula. Si el te st
de significación indica que existe una diferencia signi ficativa, entonces el
investigador puede rechazar la hipótesis nula. Sin embargo, si el citado test
indica que una diferencia semejante puede presentarse con frecuencia
debido solamente al azar, el investigador debe aceptar la hipótesis nula.
El Nivel de Significación
Un test de significación proporciona lo que se llama un nivel de significación
que puede usarse para decidir si se rechaza o se acepta la hipótesis nula. El
nivel de significación generalmente se expresa como un decimal, es decir,
0.05, 0.01, 0.001, etc. Un nivel de 0.05 implica que hay menos de 5
posibilidades entre 100 de que la diferencia sucederá si en realidad no
existe una diferencia entre las poblaciones. En este caso, se dic e que la
diferencia tiene un nivel de significación de punto cero cinco. Si tiene un
nivel de punto cero uno (0.01),'existe menos de una posibilidad entre 100 de
que la diferencia sucede ría aún cuando no existe una diferencia entre las
poblaciones.
Considerando el ejemplo de los dos mé todos de enseñanza, si se averigua
que la diferencia entre las medias de 77 y 71 tiene un nivel de significación
de 0.05, eso implica que existen menos de 5 posibilidades entre 100 de que
en dos muestras de la población de a lumnos del primer grado primario
pueda haber tal diferencia. Otra manera de considerarlo es: con muestras de
60 sujetos, cuyas medias son 77 y 71 y sus desviaciones estándar de 9 y 8
existen menos de 5 posibilidades entre 100 de que ocurra una diferencia t an
grande si las medias de la población son iguales y por lo tanto podemos
llegar a la conclusión de que las medias de población sí son distintas.
En el ejemplo anterior ambas muestras son de la población de alumnos del
primer grado. El investigador desea saber si el tipo del método de enseñanza
es algo que divide al grupo en dos poblaciones distintas. Como se explicó en
el párrafo anterior, un nivel de significación de 0.05 indica que hay menos
de 5 posibilidades entre 100 de que las medias de dos muestras de esa
población tengan una diferencia tan - grande. Por lo tanto se puede inferir
que en realidad es probable que el tipo de método de enseñanza contribuye
a formar dos poblaciones distintas.
Sin embargo, si se consideran otros ejemplos, la situación pued e ser
distinta. Si un in vestigador quisiera estudiar la diferencia en cuanto a
habilidad matemática entre niños y niñas, podría pensar desde el principio
el hecho de que hay dos poblaciones distintas. Una hipótesis nula implica
que las dos poblaciones tie nen la misma media. Basándose en un test de
significación, el investigador puede aceptar la hipótesis nula o rechazarla.
Después de rechazarla, se puede sugerir que las medias de las poblaciones
correspondientes no son iguales.
A veces, un nivel de signifi cación se presenta con la letra p. Por ejemplo, un
nivel de 0.05 puede aparecer en esta forma: p< 0.05. Además, algunas veces
el nivel de significación se le llama nivel alfa.
Una pregunta importante que debe hacerse un investigador es: ¿Qué nivel
de significación debe utilizarse? Aunque los niveles de 0.05 y 0.01 son los
más comunes en la investigación y evaluación educativa, tal vez una
respuesta razonable a la pregunta sería: depende de la situación. Si se trata

de una situación en la que se compara un m étodo de enseñanza muy costoso
con uno menos costoso, tal vez un administrador deba exigir que haya un
nivel de 0.001 ó 0.0001 antes de invertir el dinero necesario para implementar
el método en toda una región o en todo un país. Si se trata de escoger entre
dos métodos que exigen costos y esfuerzos semejantes, tal vez un nivel de
0.10 sea suficiente.
Ha sido una regla aceptada que el investigador fije el nivel de significación
antes de recabar y analizar los datos. En esta forma, es posible evitar ciert os
sesgos. En el pasado los investigadores solían buscar en una tabla el nivel
que seleccionarían, a fin de determinar si sus datos habían alcanzado tal
nivel. Actualmente muchos investigadores usan paquetes estadísticos de
computadoras para realizar los t ests de significación. Los paquetes
estadísticos suelen proporcionar el nivel obtenido con una precisión de
cuatro dígitos. Aparentemente, existe una tendencia a usar el nivel que
proporciona la computadora y luego decidir si es conveniente o no rechazar
la hipótesis nula.
El Error de Decisión
En realidad, un test de significación nunca proporciona una certeza a un
investigador. Es decir, nunca se sabe a ciencia cierta si hay una diferencia o
no. Siempre existe la posibilidad de equivocarse, o de cometer errores.
Si se rechaza la hipótesis nula porque se ha alcanzado un nivel determinado
de significación, todavía existe la posibilidad de que no haya una diferencia
real. Si no existe una diferencia a pesar de lo que indica el test, esto implica
que se ha cometido un error de Tipo L
Si el investigador acepta la hipótesis nula y si de hecho existe una
diferencia, se ha co metido un error de Tipo II.
En la Tabla 8.8.1 se indican los cuatro resultados posibles cuando un
investigador toma una decisión con respect o a una hipótesis nula.
Es más probable que ocurra un error de Tipo I si se selecciona un nivel de
0.05 en vez de uno de 0.01. Por otra parte, es más proba ble encontrar un error
de Tipo II cuando el nivel es más exigente. Al seleccionar un nivel de significación,
el investigador puede considerar qué tipo de error seda el más gra ve.
A veces al error de Tipo I se le denomina como error alfa. Asimismo, el error
de Tipo II se conoce también como error beta.
El Poder Estadístico
El concepto del poder estadístico de un test tiene relación con el concepto
del error de decisión. El poder estadístico que tiene un test estadístico es la
probabilidad de rechazar una hipótesis nula que sea falsa. Se puede
conceptualizar el poder estadíst ico como la capacidad que tiene un test para
evitar el error de Tipo II. Los métodos para medir el poder estadístico son
muy técnicos.
Los Tests de Una y Dos Colas

Muchas de las tablas de 'niveles de significación estadística indican valores
para tests de una cola y de dos. Generalmente un investigador utilizará un
test de dos colas.

El investigador puede usar un test de una cola si la teoría u otros trabajos
de investigación indican que solamente uno de los tratamientos
experimentales puede resultar mejor.
La "cola" se refiere a la parte extrema de la curva de una distribución. En el
caso de los tests de significación la curva es del error estándar.
La Significación Estadística de las Correlaciones
El ejemplo utilizado para indicar la idea de significación estadística tenía
relación con las medias de dos muestras. Si un investiga dor encuentra el
Coeficiente de correlación entre dos variables de la mi sma muestra, la
significación puede ser también un asunto importante.
La Tabla 8.8.1
La Relación entre el Error de Tipo I y el Error de Tipo II
La Realidad Se rechaza la hipótesis nula Se acepta la hipótesis nula

La Hipótesis nula es
Un Error de tipo 1 Decisión Correcta
realmente correcta
La Hipótesis nula es
Decisión Correcta Un Error de tipo II
realmente correcta
En la sección 8.7 se presentaron algunos criterios informales para

interpretar los coeficientes de correlación. Sin embargo, esos criterios no
dan ninguna indicación en cuanto a la significación estadística que tiene un
coeficiente de correlación.
El coeficiente de correlación correspondiente a una muestra puede ser
mayor o menor que el coeficiente que le corresponde a la población. El
tamaño de la muestra influye en la significación de un coeficiente. Contamos
con tablas que indican el coeficiente que se necesita para alcanzar vario?
niveles de significación según el tamaño de la muestra. (Dichas tablas
generalmente se refieren al coeficiente del producto -momento de Pearson).
Si hay 30 sujetos en la muestra, un coeficiente de 0.46 es si gnificativo al
nivel 0.01 y un coeficiente de 0.36 es significativo al nivel 0.05. Sin
embargo, si se trata de una muestra de 100, un nivel de 0.01 requiere
solamente un coeficiente de 0.26 y el nivel de 0.05 requiere uno de 0.20.
Vale la pena enfatizar qu e, en los tests estadísticos, una significación
estadística no siempre implica que la significación es práctica.
8.9 El Test-t
Es muy común que en el campo de la investigación y evaluación educativa se

desee comparar dos grupos. El test de significación que más se usa en tales
casos es el Test -t. Existen tres situaciones generales en las que tal vez se
pueda usar un Test -t:
1) Para comparar la media de una muestra con la media de otra muestra,
2) Para comparar la media de una muestra medida en una oportunidad,
con la media de la misma muestra medida en otra oportunidad y

3) Para comparar la media de una muestra con la media de la población.
8.10 El Análisis de Varianza (ANOVA)
El Análisis de Varianza (ANOVA), desarrollado por el conocido científico

inglés R. A. Fisher proporciona un método que sirve para comprobar una
hipótesis nula que involucra dos o más grupos. Es decir, el ANOVA es un test
de significación de las diferencias entre las medias de dos o más muestras.
Si resulta que hay solamente dos grupos, puede u sarse un Test-t el cual
podría considerarse como un caso especial de un ANOVA.
Puede parecer extraño que un test para determinar las medias hable de
varianzas. Hay que recordar que la varianza es el cuadrado de la desviación
estándar y que esta última pued e conceptualizarse como un promedio de las
distancias alrededor de la media.
Al igual que el Test -t, el ANOVA es un test paramétrico y, por lo tanto, está
basado en los mismos supuestos que un Test -t. Es decir, se supone que:
1) Los datos son del nivel de intervalo,
2) Cada conjunto de datos se distribuye normalmente,
3) Cada conjunto de datos tiene la misma varianza y
4) Las muestras se seleccionan aleatoriamente.
Aunque los datos de la variable dependiente tienen que ser del nivel de
intervalo, los datos de las variables independientes y de las variables
moderadoras (si existen) tienen que ajustarse a un nivel nominal. En el
ANOVA las variables independientes y dependientes suelen denominarse
factores y a los distintos valores nominales se les llama niveles.
El ANOVA para Un Factor

Cuando hay una sola variable independiente y ninguna variable moderadora
puede usarse lo que se llama un ANOVA para un factor o un ANOVA para una
clasificación simple. Por ejemplo, tal vez un investigador estudie el
rendimiento de lectu ra de tres grupos de alumnos a los que se les enseña
con tres métodos distintos. Hay un factor que tiene tres niveles. Los
resultados pueden ser como los que aparecen en la Tabla 8.10.1.
Tabla 8.10.1
Rendimiento según el Método de Enseñanza de Lectura
Grupo Media Desviación Estándar
Método A 70.3 10.2

Método B 76.8 9.7
Método C 77.4 9.3
Como ejemplo de la primera situación se pueden considerar las medias de

rendimiento obtenido empleando dos métodos de enseñanza. La

comparación entre un pre -test y un post-test de una sola muestra es un
ejemplo de la segunda situación. Si la media de C.I. de una muestra se
compara con la media de la población (que generalmente es de 100), se
tiene un ejemplo de la tercera situa ción.
Las Muestras Independientes versus las Muestras Dependientes

La mayoría de los Tests -t se realizan con dos conjuntos de datos. La fórmula
que se usa depende de si los dos conjuntos son independientes o
dependientes. Los conjuntos son independientes cuando no hay intención
ninguna de aparear los datos. Por otro lado, si para cada sujeto de una
muestra se ¿parea un sujeto de la otra muestra de acuerdo con algunas
variables apropiadas ?, como la inteligencia, la clase socioeconómica, o la
actitud, sé puede usar una fórmula que se emplea para cal cular la relación
entre medias dependientes o correlacionadas. Dicha fórmula tiene más
poder estadístico. Es decir, existe más posibilidad de rechazar una hipótesis
nula que sea falsa cuando se usa la mencionada formula.
Los Cuatro Supuestos del Test -t

El Test-t se basa en cuatro supuestos:
1. Los datos son del nivel de intervalo,
2. Cada conjunto de datos se distribuye normalmente,
3. Cada conjunto de datos tiene la misma varianza y
4. Las muestras se seleccionan aleatoriamente.
Boneau (1969) encontró que un Test -t puede proporcionar una estimación

acertada de la significación estadística, aún cuando los supuestos no se
satisfagan totalmente. Si el investigador tiene datos que infringen mucho en
los supuestos, se pueden comparar los res ultados de un Test -t con los de un
test no paramétrico, como lo es un Test - U de Mann-Whitney. Si hay mucha
diferencia entre los resultados de los dos, hay que usar aquellos resultados
del test no paramétrico que no se basan en dichos supuestos.
Algunas Precauciones al Usar un Test-t

El investigador debe cerciorarse de que la fórmula que va a usar es la
indicada para tratar con medias independientes y medias dependiente.
Generalmente, es mejor usar un Test -t de dos colas en vez de una cola. Si los
supuestos se infringen mucho, es buena idea verificar los resultados
empleando un test no paramétrico. Si en vez de tener dos muestras el
investigador tiene dos poblaciones completas; no Hay razón para usar
métodos de estadística inferencial. Si existen más que do s grupos o más que
una variable, hay que seleccionar otro tipo de test de significa ción. En
muchos de dichos casos, un análisis de varianza (ANOVA) es Ji apropiado. En
la siguiente sección se contempla el ANOVA.
Las medias indican que existen diferencias en el rendimiento. Es posible
realizar un ANOVA para determinar si esas diferencias entre los grupos son
significativas entre sí. Si resulta que no son significativas, no hay nada más
que hacer. Si hay una diferen cia significativa el investigador puede aplicar lo

que se llama el método de Scheffé con los distintos pares para averiguar
exactamente dónde están las diferencias.
El ANOVA para Dos Factores
Una ventaja del ANOVA es que permite que se considere una variable
moderadora. Tal vez el investigador crea que el sexo del alumno influye en
el éxito de los distintos métodos que se emplean en el ejemplo de la Tabla
8.10.1. La Tabla 8.10.2 presenta los resultados obtenidos por los mismos
grupos, separados según el sexo.
El ANOVA que se realiza en este caso es para dos factores que son el método
y el sexo. Hay tres niveles de métodos y dos de sexo. Por lo tanto, en este
caso puede llamarse un ANOVA de 3X2. Un ANOVA para dos factores también
se conoce como un ANOVA para clasificación doble.
Un ANOVA tiene como resultado lo que se llama un valor o razón F. Existen
tablas que se usan para averiguar la significación de los valores F, dados los
grados de libertad,
8.11 El Ji Cuadrado
El Ji Cuadrado es un test de signifi cación no paramétrico. Por lo tanto,

puede usarse con confianza con datos nominales y datos que no representan
una distribución normal. Si los datos obtenidos en una investigación se
presentan como frecuencias, tal vez sea indicado usar un test de Ji
Cuadrado.
Un Ji Cuadrado puede usarse cuando hay una, dos o más variables, pero el
caso donde hay dos variables probablemente sea el más común. El Ji
Cuadrado compara las frecuencias que se han encontrado en la investigación
con las frecuencias que puedan resultar a l azar. Por ejemplo, si se desea
saber si el número de varones de la enseñanza media de una región es
significativamente más alto que el número de niñas, se pueden comparar las
frecuencias que se han encontrado con las frecuencias que pueden resultar
al azar. Algunos de los datos que hay la posibilidad de obtener aparecen en
la Tabla 8.11.1.
Tabla 8.10.2'
Rendimiento según el Método de Enseñanza de Lectura y según el Sexo
NIÑOS NIÑAS
Grupo Media Desviación Grupo Media Desviación Estándar
Estándar
Método A 74.1 10.1 Método A 66.5 10.4
Método B 76.6 10.8 Método B 77.0 9.1
Método C 72.8 8.7 Método C 82.0 10.1
Como quiera que el número de niños y niñas es el mismo, lo que se debe

esperar es que hayan 365 de ambos sexos matriculados y 1625 no
matriculados. El Ji Cuadrado proporciona un método para averiguar si la
realidad difiere significativamente de lo que se espera.

Existen tablas del Ji Cuadrado semejantes a las del Test -t y del ANOVA. Si se
desea realizar un test de Ji Cuadrado con datos del nivel de intervalo, es
posible cambiarlos al nivel nominal. La manera más común de hacerlo, si se
desean dos grupos, es hacer una división en la mediana. Por ejemplo, es
posible dividir un grupo en un subgrupo de alumnos cuyo rendimiento es
alto en el cual se incluye a todos los individuos cuyos puntajes son
superiores a la mediana. Los demás permanecerán formando parte del
subgrupo cuyo rendimiento es bajo.
8.12 Otros Tests de Significación
Anteriormente se presentó algo sobre los instrumentos estadís ticos más

conocidos y que más se usan. Los lectores que deseen obtener más
información sobre dichos instrumentos pueden consultar algunos de los
textos de estadística que se han incluido en la bibliografía que aparece al
final de este módulo.
Existen muchos otros tests de significación estadística. A continuación se
presenta una exposición breve de la utilidad que tienen algunos de ellos.
Otros Test Paramétricos

El análisis de covarianza (ANCOVA) es semejante al ANOVA. La diferencia
principal entre ellos es que en el análisis de covarianza es posible controlar
la influencia que ejerzan una o más variables sobre la variable dependiente.
El análisis de covarianza posee más poder estadístico que el ANOVA.
El análisis multivariado (MANCOVA) permite que se determine la diferencia
entre varios grupos que tienen más de una variable dependiente .
Tabla 8.11.1
Número de Niños y Niñas de 16 Años de Edad Matriculados y No
Matriculados del Sistema de Educación Media
En la Escuela Fuera de la Escuela Subtotal

Niños 410 1580 1990
Niñas 320 1670 1990
3980
Subtotal 730 3250
Aunque se trata de un método muy complicado, tiene mucha importancia

porque permite identificar muchas variables relacionadas con un fenómeno
educativo. Si un investigador tiene el sexo como la variable independiente,
utilizando el MANCOVA podrá estudiar a la vez las diferencias entre el
rendimiento, las actitudes, la asistencia, los hábitos de estudio, etc.
Ya se mencionó en la sección 8.10 que, después de usar un ANO VA, se
puede emplear un test de Scheffé para comprobar da significación
estadística entre las medias de los varios grupos. Otro test que se puede
utilizar para realizar un estudio semejante es el test de rango múltiple de
Duncan.
Otros Tests No Paramétricos

Aunque los tests paramétricos tienen más poder estadístico, si los datos se
desvían mucho de una distribución normal, o si no son del nivel de intervalo,
se hace necesario usar un test no paramétrico. Tal cual se indicó en la
sección 8.9, el Test -U de Mann-Whitney es semejante al Test -t, si se trata de
medias independientes. El uso del "Wilcoxon signed rank test" es apropiado
siempre y cuando las medias sean dependientes.
Si los datos son por lo menos del nivel ordinal y hay m ás de dos grupos, el
test de Kruskal-Wallis ofrece un ANOVA no para -métrico para un factor .

Bibliografía 8
Best, John W. Cómo Investigar en Educación,Madrid: Ediciones Morata, 1974.
Boneau, C.A. "The Effects of Violations of Assumptions Underlying the t Test",
Psychological Bulletin, vol. 57, 1960, pp. 49-64.
Borg, Walter R. y Gall, Meredith D. Educational Research: And Introduction, New York:
Longman, 1983.
Caballero, Wilfredo. Introducción a la Estadística, San José, Costa Rica: Instituto
Interamericano de Ciencias Agrícolas, 1975.
Downie, N.M. y Heath, R.W. Métodos Estadísticos Aplicados, México: HARLA, 1973.
Escotet, Miguel A. Estadística Psicoeducativa, México: Editorial Trillas, 1973.
García Pérez, Andrés. Elementos de Método Estadístico, México: Universidad Nacional
Autónoma, 1978.
Hinkle, Dennis E. Wiersma, William; y Jurs, Stephen G. Applied Statistics for the Behavioral
Sciences, Boston: Houghton Mifflin Company, 1979.
Plutchik, Robert. Fundamentos de Investigación Experimental, México: HARLA, 1975
Popham, W. James y Sirotnik, Kenneth A. Educational Statistics, New York: Harper and Row
Publishers, 1973.
Snedecor, George W. y Cochran, William G. Statistical Methods, Ames, Iowa, EE.UU.: The
Iowa State University Press, 1978.
Spiegel, Murray R. Estadística, México: McGraw-Hill, 1970.

Jovanovich, 1978.
Weinberg, Sharon L. y Goldberg, Kenneth P. Estadística Básica para las Ciencias Sociales,
México: Nueva Editorial Interamericana, 1982.
Witte, Robert S. Statistics, New York: Holt, Rinehart and Winston, 1980.
Test de Selección Multiple 8

1. La medida de tendencia central que más se usa en la investigación el
a) La media
b) La mediana
c) La moda
2. La medida de tendencia central que más está influenciada por algunos

datos anormales es
a) a La media
b) La mediana
c) La moda

3. La media de una muestra es
a) Una medida de variación
b) Un parámetro
c) Un puntaje estándar
d) Un estadístico
4. Los datos que representan asignaciones de números basadas en la
clasificación de observaciones son del nivel
a) Nominal
b) Ordinal
c) De intervalo
d) De razón
5. De los siguientes tipos de puntajes ¿cuál de ellos puede facilitar la

interpretación de los resultados de un test?
a) Los equivalentes de edad
b) Los percentiles
c) Los puntajes estándares v
ó. De los siguientes tipos de puntajes ¿cuál puede usarse para realizar un

análisis estadístico?
a) Los equivalentes de edad
b) Los percentiles
c) Los puntajes estandarizados
d) Todas las respuestas anteriores son correctas.
7. Si se presenta una media en un informe, también debe presentarse

correspondiente.
a) La mediana
b) El rango
c) La desviación estándar
d) La varianza
8.¿Cuál de las siguientes medidas puede calcularse según una fórmula
matemática?
a) La media
b) La mediana
c) La moda
9. El cuadrado de la desviación estándar se llama
a) El rango
b) La frecuencia
c) El Ji Cuadrado
d) La varianza
10. ¿Cuál de las siguientes pautas es la más importante para elaborar una
tabla de frecuencia con datos agrupados?
a) Tener entre 10 y 20 intervalos

b) Usar múltiplos de 5 para el tamaño de los intervalo
c) Todos los datos deben incluirse dentro de un, y solamente un,
intervalo
d) Todos los intervalos deben tener un límite inferior y uno superior
11. Si se supone que los resultados de un test hecho a nivel nacional tienen
una distribución normal, y si la media es de 60 y la desviación estándar es de
10; entonces aproximadamente dos tercios de ellos tienen sus puntajes
entre
a) 50 y 80
b) 40 y 80
c) 55 y 65
d) 50 y 70
12. El nivel de significación indi ca

a) La probabilidad de que una investigación es correcta
b) Que la hipótesis nula puede rechazarse o aceptarse
c) La probabilidad de tener los mismos resultados si la investigación se
repite
13. Una distribución de frecuencias con datos agrupados
a) Puede facilitar la comprensión de los

b) datos de una investigación
c) Ofrece una mejor visión de la totalidad de los datos que una
distribución de
d) datos no agrupados
e) No cuenta con información sobre da tos específicos
f) Todas las respuestas anteriores son correctas
14. El rango de un coeficiente de correlación es del,
a) -1 al 1
b) 0 al 1
c) 0 al 100
d)-100 al 100
15. Para aplicarla fórmula del producto momento de Pearson los datos
a) Deben ser del nivel ordinal o nominal
b) Deben ser observaciones apareadas del mismo conjunto de sujetos
c) De una variable deben tener una relación curvilineal con los datos de la
otra
16. La gráfica que se usa para averiguar algo sobre la correlación entre dos
variables se llama
a) Un histograma
b) Un polígono de frecuencias
c) Una gráfica de dispersión

17. La aceptación de una hipótesis nula que es falsa es
a) Un error de Tipo I
b) Un error de Tipo II
c) Un error de muestreo
d) Un error de diseño
18. La significación estadística

a) no siempre implica que la significación y es práctica
b) Se relaciona con la hipótesis nula
c) Puede respaldar indirectamente a una hipótesis de investigación
19. El test estadístico que compara las frecuencias que se han encontrado
con las frecuencias que se espera que ocurran al azar es
a) El ANO VA
b) El Ji Cuadrado
c) El Test-t
d) El Test-U de Mann-Whitney
20. Se puede analizar el efecto de una variable moderadora con
a) Un Ji Cuadrado
b) Un ANOVA con un factor
c) Un ANOVA con dos factores
Ejercicio 8
l. Para cada una de las siguientes observaciones, indique si el nivel de

observación es nominal, ordinal, de intervalo o de razón.
a) El promedio de notas
b) La calificación total de una escala de Likert de 20 ítemes
c) El color de los ojos
d) El número de los diversos tipos de escuelas
e) El lugar en que los alumnos entregaron una tarea
f) El número de alumnos cuyo rendimiento es alto
g) El peso de individuos
h) La categoría de los colegios de un país
i) EL C.I
j) El número de varones que hay en una escuela
2. Identifique el nivel de medición que co rresponde a cada una de las

siguientes definiciones:
a) Categorías con orden y con unidades iguales
b) Categorías sin orden
c) Categorías con orden, con unidades iguales y con un cero verdadero
d) Categorías con orden
3. A continuación se encuentran las calificaciones del 1 al 10, que recibió un

profesor de .sus estudiantes:
3 6 2 7 0 1 4 10
2 5 3 5 9 7 6 3
7 8 9 6 4 6 5 2
8 3 1 7 2
a) Presentar los datos en una tabla de distribución de frecuencias de datos

no agrupados
b) Describa cualquier patrón de datos que encuentre
4. Los estudiantes que pretenden ingresar a una universidad han obtenido

puntajes en una
Prueba de aptitud académica con la siguiente distribución de frecuencias:

Frecuencias
Puntajes
740-759 3
720-739 21
700-719 34
680-699 98
660-679 142
640-659 287
620-639 345
600-619 323
580-599 256
560-579 204
540-559 151
520-539 103
500-519 43
480-499 17
460-479 1
a) Presente los datos como frecuencias relativas

b) Presente los datos como una distribución de frecuencias acumuladas
c) Presente los datos como una distribución de frecuencias acumuladas relativas
d) Dibuje un histograma para representar los datos
5. Los siguientes datos representan los puntajes obtenidos en un test de rendimiento:

120 128 93 130 110 125 118 125
123 129 205 120 112 150 139 117
112 120 130 140 110 116 150 116
117 153 186 118 185 95 125 95
140 132 120 130 105 145 112
165 111 180 126 112 119 116
125 117 150 166 132 135 114
a) Ordene los datos en una tabla de frecuencias con datos no agrupados

b) Ordene los datos en una tabla de frecuencias con datos agrupados
c) Presente los datos en una tabla de frecuencias relativas y acumuladas
d) Presente los datos en un histograma
e) Presente los datos en un polígono de frecuencias
6. Indique si es preferible tomar la media o la mediana como medida de tendencia central y

justifique su selección.
Se interesa en el promedio de in cremento de la rapidez mecanográfica de un grupo, de 300
secretarias al usar un nuevo método para aumentar dicha rapidez. Se administra un pre -test
y post-test antes y después del curso. Una revisión de los datos indica que la mayoría de las
secretarias aumento entre 5 y 10 palabras por minuto. Sin embargo, hay un grupo de
aproximadamente 50 de ellas que obtuvieron un aumento sobresaliente de entre 25 y 40
palabras por minuto.
7. La media del C.I. de un curso es de 115 y la desviación estándar de 20. Para los que
toman otro curso los datos correspondientes son 100 y 5. ¿A cuál de los grupos que
tomaron un curso debe ser más fácil enseñarle? ¿Por qué?
8. La media y la desviación estándar de la prueba final que corresponden al curso A de

matemática son de 77.3 y 6.2 . El curso B de la misma materia tiene una media de 68.9 y una
desviación estándar de 11.7.
a) En general ¿cuál de los cursos tuvo mejor rendimiento?

b) ¿Cuál de los cursos tuvo un rendimiento más homogéneo?
c) Sin considerar ninguna otra información ¿en cuál de los cursos se podría suponer que
aparecieron los puntajes individuales más bajos y más altos?
9. En un país X la media de los sueldos de los profesores en términos de dólares es de

$350 y la desviación estándar es de $30. En un país Y la media es de $300 y la desviación
estándar es de $75.
a) ¿En qué país supondría Ud. que los profesores ganan más en su primer año de
servicio?
b) ¿En qué país supondría Ud. que los profesores ganan más después de 20 años de
servicio?
c) ¿En qué país preferiría usted trabajar como profesor? ¿Por qué?
10. Se supone que la media de muchos tests de inteligencia es de 100 y la desviación

estándar es de 15. Cons ulte la Figura 8.6.2 para determinar el porcentaje de personas que
tienen un C.I.
a) Entre 85 y 115
b) Mayor de 1 30
c) Menor de 85
d) Entre 115 y 130
11. A continuación se encuentran las gráficas de dispersión de tres situaciones con dos
variables. • Con cuál(es) es conveniente medir el grado de relación entre las dos variables
con el coeficiente del producto-momento de Pearson. Decisión con relación a La
hipótesis nula, si

12. Cada persona que integra un grupo de estudiantes ordena a sus siete profesores
según su calidad como profesor y también según su sentido de humor. ¿Cuál coeficiente de
correlación sería el apropiado para medir la relación entre la calidad como profesor y el
sentido de humor?
13. Si se desea desarrollar un método para predecir el éxito que tendrán algunos
estudiantes universitarios, interesa más saber ¿cuál es el coeficiente del producto momento
de Pearson o la regresión?
14. Un investigador usa un test de significación para comprobar la hipótesis nula con
respecto a la relación entre dos grupos.
a) Si resulta que existe solamente una posibilidad entre un millón de que la diferencia que
se encuentra entre los dos grupos pudiera existir al azar entre las poblaciones
correspondientes ¿se debe aceptar o se debe rechazar la hipótesis nula?
b) Si resulta que existe una posibilidad entre cinco que una diferencia semejante pudiera
existir al azar entre las poblaciones correspondientes ¿se debe aceptar o se debe
rechazar la hipótesis nula?
15. Un investigador ha seleccionado un nivel de significación de 0.05. ¿Cuál debe ser su

decisión con relación a la hipótesis nula?
a) ¿p<0.05?
b) ¿p<0.05?
c) ¿p<0.01?
d) ¿p<0.01?
16. ¿Cuáles son los cuatro posibles resultados de un test de significación?
17. Defina
a) Error de Tipo I y
b) Error de Tipo II.
18. Un investigador quiere comprobar la eficacia de algunos materiales nuevos que se

usarían en el hogar como apoyo para el primer grado de primaria. ¿Cómo puede seleccionar
una muestra experimental y una muestra de control para poder usar un Test-t que
corresponda a muestras dependientes?
19. Si un investigador desea comprobar las diferencias entre las medias de cuatro grupos

¿Qué resulta mejor, aplicar una serie de Test-t, o un análisis de varianza (ANOVA)?
20. Un profesor de historia administró un pre test a dos clases y los resultados fueron
equivalentes. Realizó su labor docente para un grupo por medio de presentaciones de
carácter tradicional. Con el otro grupo puso en práctica un método a base de indagación.
¿Cómo puede él comprobar si existen diferencias significativas entre los resultados del pre-
test y el post-test?
21. Un investigador desea comparar la eficacia de tres métodos para enseñar ortografía.
Selecciona aleatoriamente tres grupos de alumnos que se aparean según su C.I., los
puntajes obtenidos en un pre-test de ortografía y su rendimiento escolar en general. ¿Qué
test de significación debe aplicar?
22. Si un investigador desea comparar las medias de dos muestras, pero teme que no le
den todas las condiciones necesarias ¿Qué test debe usar?
M O D UL O 9

LAS INVESTIGACIONES DE TIPO ENCUESTA
9 . 1 Los Propósitos y Tipos d e la Investigación d e Tipo Encuesta
Muchas de las técnicas de la investigación de tipo encuesta fueron desarrolladas por

sicólogos, sin embargo, son muy comunes y resultan útiles en el campo de la educación. No
obstante, la buena reputación de que gozarían las investigaciones de esta índole se ha visto
afectada negativamente debido a que han sido aplicadas inapropiadas inadecuadamente. En
este módulo se pretende dar una visión de algunos métodos adecuados para emplearlas y
señalar algunos de los errores comunes que deben evitarse.
Mediante encuestas se puede recabar información descriptiva, asociativa y de causa y
efecto. La información descriptiva indica "lo que es", es decir "algo que existe". Se refiere a
condiciones existentes; a las prácticas que prevalecen; a las actitudes, creencias y
opiniones que se mantienen; a los procesos en marcha; a los efectos que se sienten y a las
tendencias que se van desarrollando. La información asociativa pretende identificar la
relación entre dos o más variables, sin indicar cuál(es) variable(s) es (son) la causa y
cuál(es) es (son) el efecto. Generalmente, la asociación entre dichas variables se identifica
por medio de una correlación. Para obtener información de causa y efecto es necesario
combinar los métodos de la investigación de tipo encuesta con los de la investigación
experimental.
Los dos tipos principales de encuestas son el uso de cuestionarios y las entrevistas. Los
cuestionarios pueden enviarse por correo, o entregarse personalmente a individuos o a
grupos (tales como las clases en una escuela) . Las entrevistas pueden realizarse
personalmente o por teléfono.
Las investigaciones de tipo encuesta suelen realizarse con una muestra. Las muestras más
recomendables para este propósito son las aleatorias simples, las estratificadas y las por
conglomerados. Si se usa toda la población, al estudio se le llama censo. Las encuestas
transversales proporcionan los datos que se han recabado en un momento dado. Ese
"momento" puede ser desde un día, hasta más de un mes y el mismo depende del ti empo
que sea necesario para completar la recabación. Las encuestas longitudinales generalmente
duran años y los datos se recaban periódicamente para estudiar los cambios que hayan
surgido.
Existen por lo menos tres tipos de estudios longitudinales: los es tudios de tendencias (o
predictivos), los estudios de cohorte y los estudios de panel. Los estudios de tendencia s
utilizan una muestra nueva cada vez que se recaban los datos. Por ejemplo, un estudio de
las actitudes de profesores hacia la tecnología podrí a tomar la forma de un estudio de
tendencias. Cada año sería posible pasar un cuestionario a una muestra aleatoria. Aunque
no serían los mismos profesores cada año, si es aleatoria, la muestra debe representarlos a
todos y, por lo tanto, sería posible estu diar los cambios y, tal vez, identificar las tendencias
habidas en los cambios de las actitudes de los profesores hacia la tecnología. La población
de profesores siempre cambia. Un es tudio de cohorte sigue a una población específica,
como sería la de los profesores que se graduaron en las escuelas normales de un país en un
año determinado. Para estudiar el desarrollo profesional de los egresados de ese año, tal
vez se saque una muestra distinta cada año, pero la población será la misma. En un estudio
de panel, el panel es una muestra. Que se identifica al comienzo del estudio y que se usa
durante el período de duración del estudio. Por supuesto, la pérdida de sujetos es un
problema agudo al realizar un estudio de panel.

9.2 El Uso de Cuestionarios
Los pasos a seguir para desarrollar admi nistrar un cuestionario son paralelos a los que se
siguen en el plan de investigación que se presentó en el Módulo 3. En este módulo, los
pasos se presentan de una forma que enfatiza los requerimientos específicos de un
cuestionario:
1. La definición del propósito de la encuesta.
2. La selección de la muestra.
3. La redacción de los ítemes.
4. El diseño del formato.
5. La puesta a prueba del borrador,
6. La recabación de los datos.
7. El análisis de los datos.
8. La elaboración del informe.
La definición del propósito de la encuesta

Antes de diseñar el cuestionario propiamente dicho, es muy importante plantear el
problema, e identificar los objetivos o las hipótesis. Debe examinarse toda la literatura
pertinente que se tenga disponible y form ularse el marco teórico del estudio. Hay que
decidir qué tipo de información se trata de obtener con el cuestionario y la que se
conseguirá por otros medios. Por ejemplo, si se está tratando de descubrir las necesidades
que los profesores tienen de recibir capacitación, no es necesario pedir información
demográfica ni sobre los profesores ni sobre las escuelas. Esa información ya debe aparecer
en el sistema computacional del Ministerio. En otras palabras, se debe definir la
información que se ha de recabar con el cuestionario de tal forma que en el mismo no se
pida información no pertinente ni superflua, o sea, que se prescinda de pedir información
que sí tiene importancia.
Además, hay que cerciorarse de que el cuestiona rio sea la forma más adecuada de recabar
la información que se desea obtener. Cabe la posibilidad de que una entrevista o un
experimento sea un método más apropiado.
La selección de la muestra
La población meta debe tener la información que se busca. I so parece obv io, pero no
siempre es fácil identificar quien tiene la información que se I nunca y si está dispuesto a
proporcionarla. Se puede pensar que los directores de escuelas saben cómo se s eleccionan
los profesores, pero posiblemente sea el Ministerio de Educación el que ¿e encarga de
seleccionar a los profesores.
Vale la pena enfatizar, otra vez, que es preferible seleccionar una muestra aleatoria. Si se
desea examinar las diferencias entre las respuestas obtenidas de varios subgrupos, una
muestra estratificada es la más adecuada. Si faltan recursos de tiempo y dinero, tal vez el
uso de una muestra por conglomerados sea lo más indicado.
La redacción de los ítemes
La redacción de los ítemes de un cuestionario es algo sumamente importa nte. Si no se
pregunta exactamente lo que se desea, las respuestas no proporcionarán la información
deseada. Si parecen estar redactados de una manera descuidada, los sujetos no les van a
dar importancia y tal v ez ni los contesten. Existen varios formatos para redactar los ítemes.

Las preguntas versus las afirmaciones.
Probablemente habrá muchos que piensen que la investigación que se realiza mediante
cuestionarios se trata de formular preguntas. En realidad, mu chas veces el investigador
presenta afirmaciones y el sujeto responde en la medida en que esté de acuerdo o en
desacuerdo. Las escalas de Likert, Thurstone y Osgood son buenos ejemplos de lo anterior,
pero las afirmaciones también se utilizan en situacione s menos formales.
L o s h e c h o s v e r s u s l a s o p i n i o n e s . "¿Qué texto de matemática usa?" y "¿Cuántos

años de experiencia docente tiene?" son ejemplos de ítemes que piden respuestas que sean
hechos. "¿Qué texto de matemática prefiere?" y "¿Cómo contribuye la exp eriencia a la
eficacia docente?" piden una opinión como respuesta. Ha \ que darse cuenta de que con am -
bos tipos de ítemes el sujeto no siempre responde con veracidad. A veces experimenta falta
de memoria o tiene el deseo de dar cierta impresión.
Las preguntas directas versus las indirectas.

Las preguntas directa 1 piden exactamente lo que el investigador quiere saber. Por ejemplo,
"¿Está de acuerdo con las nuevas guías curriculares?" es una pregunta muy directa. Una
manera indirecta de preguntar sería: "¿Cuál es su opinión con respecto a las guías
curriculares?" También se puede pedir opiniones acerca de ciertos aspectos de las guías y
de ellas inferir algo con respecto a si les gustan o no a los sujetos. Aunque es más fácil usar
preguntas directas, a v eces ocasionan que el sujeto responda con cautela. Las respuestas a
las preguntas indirectas suelen ser más fran cas.
Las preguntas predeterminadas versus las preguntas adaptadas a las

r e s p u e s t a s . Algunos cuestionarios piden que el sujeto responda a todos los ítemes.
Otros tienen preguntas que dependen de las respuestas a otras preguntas. Por ejemplo, tal
vez en un cuestionario sobre el uso de medios audiovisuales se pregunta si un profesor
emplea un retroproyector. Si la respuesta es afirmativa, habrá que contestar a otras
preguntas acerca de la manera de usarla. Si la respuesta es negativa, entonces se pregunta
por qué.
También existen varias formas de respuestas. La diferencia principal existe entre una forma
abierta y una forma cerrada de respuestas. La forma abierta de respuestas permite que el
sujeto responda con sus propias palabras y sin restricciones. Por ejemplo "¿Por qué decidió
asistir a esta escuela normal?" pide una respuesta de forma abierta. La ventaja de emplear
una forma abierta de respuestas es que el sujeto puede dar su propia respuesta, en vez de
escoger una de las respuestas que le ha proporcionado el investigador. La desventaja de la
forma abierta es que hay dificultad para cuantificar las respuestas. Existen varios tipos de
respuestas cerradas que facilitan la cuantificación, a saber:
Las respuestas cortas. En realidad los ítemes de respuesta corta representan una transición
entre las respuestas abiertas y las respuestas cerradas. Aunque el sujeto proporciona su
propia respuesta, el espacio que se le proporciona para responder restringe las posibles
respuestas. Por ejemplo: ¿En cuál escuela secundaria se
graduó?______________________________________________
Escriba una palabra que indique su opinión de esa escuela.--------------------------------------------
------------------------------------------------------------------

Las respuestas de escala. Las escalas de Li-kert constituyen un ejemplo del uso muy formal
de las respuestas de escala. También existen otras maneras de usarlas. A continuación se
presentan algunos ejemplos.
¿Cuánto tiempo dedica cada semana a leer cuentos a sus alumnos?

Menos de 2 Horas________
Entre 2 y 5 Horas ________
Entre 5 y 8 Horas_________
Más de 8 Horas __________
¿Cómo calificaría la posibilidad que" tu ni te superarse profesionalmente en el Ministerio de
Educación?
Excelente buena regular mala muy mala
L a s r e s p u e s t a s t a b u l a d a s . Se pueden usar tablas con respuestas cortas o de escala.

Una tabla restringe mucho una respuesta corta debido al espacio que hay disponible para
responder. Las respuestas tabulares no son un tipo distinto de respuestas, sino más bien
una manera conveniente de organizar un cuestionario. A Continuación se presenta una
reproducción parcial de un cuestionario que requiere que se den respuestas tabuladas.
Cursos de capacitación o especialización que ha
recibido____________________________________________________________________
____________________________________________________________________
Nombre del Curso-------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------
Institución__________________________________________________________________
____________
Duración Fechas
Años Meses De A
________________________________________________________________________
L a s r e s p u e s t a s o r d e n a d a s . En algunos casos, el investigador desea que los sujetos

ordenen algunas de las posibles respuestas, según su importancia o prioridad. Considere el
siguiente ejemplo:
Ordene las siguientes características, según su importancia, al seleccionar un director de
escuela. Use los números de 1 al 5; el 1 para indicar la más importante y 5 la menos
importante. Si cree que hay alguna característica que no tiene ninguna importancia,
indíquelo con un 0.
____ Experiencia docente
___ Antecedentes académicos
____ Recomendaciones de colegas
____ Apariencia personal
____ Experiencia administrativa

Una ventaja que tienen las respuestas ordenadas es que el sujeto se ve obligado a distinguir
entre las posibles respuestas. De otra forma, sería posible indicar que todas tienen
importancia igual sin darle suficiente consideración a la respuesta. Otra ventaja es que las
respuestas ordenadas permiten que se haga una comparación entre las selecciones hechas
por grupos distintos.
L a s r e s p u e s t a s d e l i s t a s d e s e l e c c i ó n ( c h e c k - l i s t ) . Partiendo de una lista de

selección, el sujeto tiene que marcar la mejor respuesta. Las listas de selección requieren
que el sujeto emplee menos tiempo para responder que lo que requiere las respuestas
ordenadas. Sin embargo, dichas listas le proporcionan menos información al investigador. A
manera de ejemplo considere lo sigui ente:
¿Cuál es la Facultad de más importancia de la Universidad Nacional?

En el espacio en blanco, marque con X una de las siguientes:
_---------La Facultad de Leyes
_---------La Facultad de Humanidades
_---------La Facultad de Ciencias
_---------La Facultad de Medicina
---------- La Facultad de Educación
L a s r e s p u e s t a s c a t e g ó r i c a s . Las respuestas categóricas son semejantes a las de las

listas de selección, pero cada ítem presenta sola mente dos posibles respuestas. Las
respuestas más comunes son "sí" o "no", o "verda dero “o "falso".
¿Tiene Ud. un título docente ?: ____ Sí _____ No
Todos los directores de escuela deben tener preparación en cuanto a métodos

administrativos.
___ Verdadero _____ Falso
Existen muchos factores que el investigador debe considerar al redactar los ítemes de un
cuestionario. A continua ción se especifican algunos de los más importantes.
L a c l a r i d a d . Sobra decir que es necesario redactar los ítemes sin cometer errores
gramaticales. Además, es importante evitar las ambigüedades. Esto, a veces, resulta difícil
porque el investigador está tan embebido en su trabajo que no se percata de la ambigüedad
de lo que está diciendo. Por ejemplo, el ítem "¿Cuál es su opinión de la Guía Curricular?" se
podría contestar así: "¿Qué Guía Curricular?" Para cerciorarse de que la pregunta se ha
expresado con claridad, a veces se hace necesario definir algunos términos que son poco
comunes o que tienen varios sentidos. D ebe evitarse el uso de la jerga profesional. Hay que
tener cuidado con los adjetivos y los adverbios que no tienen el mismo sentido para todo.
"Frecuentemente", "la mayoría", "generalmente", y "pocos" pueden interpretarse de
maneras muy distintas.
Tener c u i d a d o con los ítemes d e carácter negativo . Existe la posibilidad de que la
persona que responde no se fije en el carácter negativo del ítem y que por consiguiente
responda como si el mismo tuviera una forma positiva. También surgen dificultades cuando
es necesario responder con un "sí" o un "no" a un ítem de carácter negativo. Considere el
siguiente ítem de una escala de Likert:

Una persona común y corriente no puede entender el funcionamiento de las computadoras.
Claramente sí Sí Indeciso No Claramente no
Alguien a quien le parece que es imposible que una persona común y corriente entienda el
funcionamiento de las computadoras, tal vez responda con un sí o tal vez responda con un
no.
E m p l e a r í t e m s c o r t o s . Aunque, con fines de lograr claridad, existe u na tendencia a

redactar ítemes largos, eso no será muy eficaz si el sujeto no estudia cada ítem
cuidadosamente. Por lo tanto, es preferible elaborar ítemes cortos porque se pueden leer
con mayor rapidez y son más fáciles de entender.
E v i t a r e l u s o d e í t e m e s d o b l e s . Los investigadores suelen hacer una pregunta a la
cual los sujetos d eben responder con una sola res puesta, cuando en realidad se trata de dos
preguntas. Considere los siguientes ejemplos:
El gobierno debe gastar menos en la milicia y más en la educación.

_____ Sí ______________ No
Aunque las calculadoras son instrumentos muy útiles, en las escuelas no se debe permitir su
uso.
_____ Sí ______________ No
Cada uno de los dos ejemplos consta de dos partes. Un sujeto puede estar de acuerdo con
una parte y no así con la otra, o puede estarlo con ambas, o con ninguna de las dos. Si un
ítem contiene la palabra "y" o dos cláusulas, el investigador debe cerciorarse de que no se
trata de un ítem doble.
E v i t a r t é r m i n o s q u e i m p l i c a n s e s g o s . El mencionar el nombre de una persona
respetada puede sesgar la respuesta. Por ejemplo,"¿Está Ud. de acuerdo con el plan del
Ministro de crear una unidad de capacitación dentro del Ministerio?" El sujeto puede
responder según su opinión del Ministro, en vez de lo que piensa acerca de la unidad de
capacitación. Un ejemplo de un ítem que indica cuál es la respuesta deseada podría ser:
"¿Todos los patriotas están de acuerdo en que se le dé más énfasis al Día de la
Independencia?"
El Diseño del Formato

El formato de un cuestionario puede facilitar el hecho de qu e el sujeto responda con
precisión y con buena voluntad. Si el formato de un cuestionario no es apropiado, es
posible que el sujeto se confunda, deje de ver algunos ítemes, o, en caso extremo, deseche
el cuestionario con desdén. A continuación, se presenta n algunas de las consideraciones
que se pueden tomar en cuenta al diseñar un cuestionario:
Las cualidades atractivas.

Es recomendable que se use por lo menos una buena máquina de escribir con cinta nueva y
un proces o de reproducción lo más nítido posible . Algunos investigadores usan papel de
color con un membrete especial.

Una organización que facilite las respuestas . La organización y el arreglo de los ítemes
debe facilitar las respuestas al cuestionario No deben aparecer dos preguntas en la misma
línea y debe haber espacio suficiente para las respuestas abiertas .
El aprovechamiento del espacio . A la vez que en el cuestionario se debe preguntar

estrictamente lo que es necesario y que no debe presentarse en forma amontonada, debe
ser lo más corto posible. Si es muy largo y se pide información sin pertinencia, tal vez los
sujetos lo rechacen. Es necesario insistir en la importancia que tiene el formato. El
investigador tiene que procurar que la presentación del cuestionario resulte atractiva, que
sea fácil de contestar y además que no sea muy largo.
Instrucciones claras y a la vez breves . Las instrucciones deben ser claras, pero tan breves
como sea posible. Las instrucciones largas, aunque sean muy precisas, no resultan prácticas
y los sujetos ni se toman e l trabajo de leerlas.
Una organización lógica . La organización del cuestionario debe seguir una secuencia lógica.
Una forma de hacer esto es reunir todos los ítemes que están relacionados entre sí. Otra
manera es reunir todos los ítemes que tengan la mism a forma de respuesta. En general, tal
vez sea mejor empeza r con ítemes generales e ir avanzando hacia los ítemes más
específicos.
Empezar con ítemes fáciles . Cuando así sea posible los ítemes iníciales deben ser
interesantes, no intimidantes y fáciles de contestar.
Los ítemes y las páginas deben enumerarse . Los ítemes no deben dividirse entre dos
páginas. Generalmente, un ítem no debe dividirse entre el final de una página y el principio
de la siguiente.
¿Explicar el propósito del cuestionario? El investigador tendrá que decidir si el

cuestionario deberá llevar un título que explique el propósito del mismo o no. A veces una
explicación semejante puede sesgar los resultados. Sin embargo, cabe l a posibilidad de que
los sujetos sean muy suspicaces y rehúsen responder a un cuestionario, a menos que el
mismo lleve un título que sea indicativo del propósito del mismo.
Consideraciones especiales para realizar encuestas por correo. Si se trata de un

cuestionario a ser enviado por correo, es acons ejable escribir el nombre y la dirección del
investigador al principio y al final del cuestionario, aún cuando se mande en un sobre
franqueado, con remitente.
La puesta a prueba del cuestiona rio
Antes de administrar el cuestionario a la muestra de la investigación, es necesario llevar a
cabo una especie de prueba piloto. Ge neralmente una muestra disponible de la población
meta sirve para realizar la prueba pi loto. El tamaño de la muestra pilot o depende de la
heterogeneidad de la población, pero generalmente una muestra de 20 sujetos es
suficiente.
Es aconsejable dejar espacio para que.los sujetos puedan expresar sus comentarios. Es
conveniente preguntarles qué ítemes no están claros, si hay alg o en las instrucciones o en
el formato que Tos confunde, si existen ítemes que deberían agregarse o suprimirse y si
tienen alguna sugerencia. Si existe la posibilidad, de que haya una mala interpretación de
los ítemes, es posible pedirles a los sujetos de la prueba piloto que expliquen con sus

propias palabras el sentido de cada ítem. Si ay ítemes que dan lugar a malas
interpretaciones, es preciso revisarlos bien y ponerlos a prueba de nuevo hasta que puedan
ser comprendidos correctamente.
Es necesario examinar cuidadosamente los resultados obtenidos en la prueba piloto.

Además de los comentarios que se hayan hecho, es preciso determinar si hay algunos
ítemes que muchos dejan de contestar y tratar de averiguar por qué razón no los contestan.
Vale la pena analizar los datos para comprobar si están más o menos de acuerdo con lo
esperado y poner a prueba los métodos estadísticos que se aplicarán a los resultados
definitivos. Si se notan algunas áreas en las cuales existe mucho desacuerdo entre los
sujetos, tal vez sea necesario incluir más ítems con el fin de explorar esas diferencias
La Recabación de los datos

La manera más común que se utiliza en los Estados Unidos para recabar datos empleando un
cuestionario es por medio del correo. Felipe Pardinas, (1979:102) ha sugerido que "sobre
todo en países donde no existe esta costumbre, el número de respuestas tiende a ser
sumamente bajo". Existen muchas técnicas diseñadas con miras a aumentar el número de
respuestas que se reciban, a saber:
1. Redactar una carta de introducción para enviarla junto con el cuestionario. La carta
debe indicar el propósito y la importancia del estudio, lo importante que es que el
sujeto responda, y una fecha razonable para devolver el cuestionario. En dicha carta se
deberá garantizar que los resultados individuales tendrán carácter confidencial y
ofrecer el envío de un resumen de los resultados obtenidos del grupo completo. Si es
posible, una persona bien conocida, como el Ministro de Educación o el Decano de una
Facultad universitaria, debe ser el firmante de la carta.
2. Hay que incluir un sobre franqueado con la dirección del investigador, para facilitar la
devolución.
3. Si es posible, suele resultar más conveniente mandarle el cuestionario al jefe de la
persona que deberá lle narlo.
4. Si no se obtienen respuestas de un número adecuado de sujetos, para subsanar este
hecho existen técnicas de seguimiento. El primer paso generalmente es enviar otro
cuestionario con otro sobre franqueado y con una carta de introducción distinta.
Algunos investigadores han llegado a enviar hasta cuatro cuestionarios a los sujetos que
dejan de responder. Otras técnicas de seguimiento incluyen el uso de tarjetas postales,
de telegramas o las llamadas telefónicas.
Si finalmente, menos de un 80o/o responde n al cuestionario, el investigador tiene la
responsabilidad de averiguar si el grupo que no respondió difiere significativamente del
resto de la muestra. La mejor manera de efectuar esa comparación es entrevistar a una
muestra aleatoria del grupo que no re spondió para hacerles las preguntas que aparecen en
el cuestionario y comparar los resultados de la entrevista con los obtenidos de los que sí
respondieron.
En muchos países de Latinoamérica el uso de un cuestionario no es común y además algunos
de los sistemas de correo no son muy confiables. Una alternativa que aunque resulte más
costosa, tal vez pueda dar mejores resultados, es que alguien entregue el cuestionario
personalmente y pase a recogerlo después. Por supuesto, si se trata de un cuestionario que
se aplica a grupos, como son las clases en una escuela, el investigador o su ayudante puede
estar presente para entregar y recoger el cuestionario, aclarar las dudas que pueden haber
acerca de las instrucciones y responder a las consultas que se le hagan.

El análisis de los datos
Durante la prueba piloto del cuestionario es conv eniente poner a prueba las técnicas
estadísticas que se aplicarán. Dicha prueba deberá incluir los procesos para ordenar los
datos, introducirlos en una computadora (si es que se usa) y analizarlos.
La redacción del informe

Una investigación no tendrá mayor trascendencia, si los resultados no se dan a conocer. En
el Módulo 13 se presentarán algunas consideraciones que pueden tomarse en cuenta al
elaborar un informe.
9.3 La Entrevista Personal
Los pasos a seguir al realizar una investigación por entrevista son muy semejantes a Tos
pasos que se dan al emplear un cuestionario. Primeramente, se define el propósito de la
entrevista y se identifica la muestra. Debido al alto costo de las investigaciones por
entrevista, hay una tendencia a utilizar muestras pe -quenas; por lo tanto, existe el riesgo
de que la muestra no sea representativa. Si es posible, es aconsejable procurar que los
sujetos se comprometa n a brindar su cooperación antes d e empezar a realizar las
entrevistas. Si hay algunos que no desean participar, será necesario seleccionar otros de
una manera aleatoria y tratar de averiguar si las personas que se rehúsan a participar,
tienen características distintas que implican que la muestra resulte sesgada.
La guía para realizar la entrevista es análoga a un cuestionario. La misma proporciona fas
preguntas que el entrevistador debe hacer y la secuencia que debe seguir al hacerlas.
Pueden identificarse tres tipos de entrevistas, a sabe r:
1) Las estructuradas,
2) Las semiestructuradas y
3) Las no estructuradas.
Las Entrevistas Estructuradas

En una entrevista estructurada el entrevistador solicita información que el sujeto puede
responder con algo tan simple como un sí o un no, o con una respuesta que el entrevistador
puede ir marcando en una lista de selección. La única diferencia entre una e ntrevista
estructurada y un cuestionario que ha sido entregado personalmente, es que en la primera
es el entrevistador quien lee los ítemes y va escribiendo las respuestas en vez de hacerlo el
sujeto mismo. Una entrevista estructurada resulta muy útil cuan do los sujetos son
analfabetos.
Las Entrevistas Semiestructuradas

Una entrevista se mi-estructurad a es generalmente la más apropiada para realizar una
investigación educativa. Tiene algunos ítemes estructurados y otros que requieren que se
den respuestas más extensas. Las respuestas más abiertas pueden proporcionar información
más profunda. El problema que surge con esas respuestas más completas es que puede
haber sesgos del entrevistador (del observador) si no le es posible escribir todo lo que el
sujeto va diciendo. Además, si el entrevistador tiene que escribir mucho es posible que vaya
a perder su r a p p o r t con el sujeto, es decir, su relación de confianza y de amistad con él.
Una posible manera de superar esos dos problemas es mediante el uso de una gra badora.

Aunque una grabadora tiene la ventaja de grabar todo lo que el sujeto dice y de permitir un
cuidadoso análisis posterior tiene la desventaja de cambiar la situación. Algunas personas
no se sienten cómodas frente a una grabadora. El uso de una graba dora oculta se considera
poco ético.
Las Entrevistas No Estructuradas

Las entrevistas no estructuradas se usan en la sicología clínica. Se requiere un
entrenamiento muy especial y disponer de mucho tiempo para realizarlas.
Pautas para la Realización de Entrevistas

Borg y Gall (1983, p. 443) sugirieron las siguientes reglas para la realización de entrevistas:
A. Probar la guía en algunas entrevistas a fin de averiguar si el vocabulario y el lenguaje
son adecuados, si los sujetos entienden bien las preguntas y la forma en que ellos
responden.
B. Relacionarse con el sujeto como una persona igual.
C. Si hay preguntas acerca de temas muy personales, recordarle al sujeto que sus
respuestas tendrán un carácter confidencial. Si a pesar de haberle dado esta explicación
todavía hay problemas, enseñarle los procedimientos que se seguirán para asegurar la
confidencialidad de sus respuestas.
D. Llevar a cabo la entrevista de una manera que al hacer las preguntas no se den las
respuestas que se esperan recibir. Si se quiere evitar sesgos, es preciso mantenerse en
un plano neutral.
El Entrenamiento de los Entrevistadores

Un paso muy importante al desarrollar una entrevista, que no se mencionó como paso al
elaborar un cuestionario, es el entrenamiento de los entrevistadores. Por supue sto, si no es
el investigador quien va a aplicar un cuestionario, quien lo haga necesitará cierta
preparación previa. Sin embargo, para realizar una entrevista, tal entrena miento es más
importante y tiene que ser más extenso. Ya se señaló en el Módulo 5 qu e generalmente no
es el mismo investigador quien realiza las entrevistas. El conocimiento que él tenga de los
propósitos de la investigación implica, contaminación del experimentador.
En la primera etapa del entrenamiento de los entrevistadores se lee y se contempla la guía
de entrevista. El investigador debe indicarle cuáles son las condiciones de la entrevista,
pero sin mencionar los resultados que espera obtener. La segunda etapa consiste en realizar
algunas entrevistas de práctica, bajo la observación d el investigador, quien puede brindar
sugerencias. Si fuera pos ible grabar las sesiones de práctica con un equipo de video, sería
factible analizarlas para identificar los errores y hacer sugerencias para el mejoramiento de
las entrevistas.
9 . 4 E l C u e s t i o n a r i o versus l a E n t r e v i s t a
Una entrevista tiene varias ventajas sobre un cuestionario, si el entrevistador es hábil.
La principal ventaja que tiene la misma es su adaptabilidad o flexibilidad. El

entrevistador puede pedirle al sujeto que aclare sus respuestas y que proporcione
una información más completa, precisa y profunda. Otra importante ventaja de la
entrevista es que un entrevistador puede motivar a un sujeto que al principio no
muestra mucho interés en el tema de la entrevista a que participe activamente.
Puede crear lo que en inglés y en francés se llama rapport, o sea una relación de

confianza y de amistad. Si se logra establecer un rapport con el sujeto, será más
fácil obtener la información profunda y fidedigna que se está tratando de obtener.
Un entrevistador puede controlar la secuencia de los ítemes y cerciorarse de que
las condiciones sean adecuadas. Una entrevista es imprescindible cuando los
sujetos son analfabetos. Además, muchas personas que sí pueden leer y escribir, no
pueden hacerlo bien o prefieren proporcionar la información verbalmente.
Las desventajas que tienen las entrevistas generalmente son las que en un
cuestionario resultan ser más bien ventajas. Una entrevista requiere que se
disponga de más tiempo y más dinero que lo que requiere un cuestionario. Por lo
tanto, para realizar entrevistas se usan generalmente muestras más pequeñas y,
por consiguiente, menos representativas. A veces, al realizar entrevistas surge el
problema de que algunos entrevistad ores inventan los datos en vez de obtenerlos
mediante la realización de entrevistas. El investigador tiene que supervisar a los
entrevistadores a fin de que ellos continúen llevando a cabo su labor con buena
voluntad.
Aunque en general, mediante una entrevista se obtiene información más profunda
que al emplear un cuestionario, este último tal vez sea mejor usarlo para investigar
cuestiones personales o embarazosas. Algunas personas tienen más confianza en el
carácter confidencial de un cuestionario. En realidad, mucho depende de las
características de la población meta. El investigador debe conocer y tomar en
cuenta aquellas características de la población que puedan tener influencia en el
éxito de los métodos que él emplee.
Evitar Errores al Realizar una Entrevista

Ya se mencionaron varias veces, las posibilidades de que hayan sesgos al realizar
una entrevista. Otra manera de enfocar este problema es dándole consideración a
lo que se llama el "efecto de la respuesta". El efecto de la respuesta es la diferencia
entre lo que el sujeto ha dicho y la verdad. A veces al sujeto se le hace difícil
recordar y a veces su buena voluntad (o la falta de ella) hace que sus respue stas no
sean completamente fidedignas. Weiss (1975) ha indicado que existen varias
fuentes de errores al realizar una entrevista. Las tres más importantes son:
1. Las predisposiciones del sujeto,
2. Las predisposiciones del entrevistador
3. Los procedimientos de la investigación.
Borg y Gall (1983, pp. 438-439) proporcionaron algunos ejemplos de esas fuentes
de errores y dieron sugerencias para evitarlas.
Las predisposiciones del sujeto. Ya se mencionó que el investigador tiene que
conocer bien a su población meta. Así se pueden evitar algunos de los errores que
surgen de las predisposiciones de los sujetos. El entrevistador tiene que estar
preparado para afrontar las predisposiciones individuales. Algunas predisposiciones
del sujeto que pueden afectar a la veracidad de la información, son:
A) La suspicacia o la hostilidad hacia la investigación.
B) La indiferencia o la falta de voluntad para cooperar.
C) La falta de la información que el entrevistador trata de obtener.
D) El deseo de complacer al entrevistador o de recibir su aprobación.
E) El deseo de producir una buena impresión.
Las predisposiciones del entrevistador.

El investigador tiene que preocuparse mucho de la selección, del entrenamiento y
de la supervisión de los entrevistadores. A fin de cerciorarse de que el
entrevistador podrá relacionarse bien con los sujetos, algunos investigadores han
sugerido que los entrevistadores deben seleccionarse de la población meta. Entre
las posibles predisposiciones del entrevistador que puedan causar problemas están:
A. El no sentirse cómodo ante los sujetos.
B. El no sentirse cómodo en el ambiente donde se realiza la entrevista.
C. El dejar que sus propias opiniones influyan en lo que le responden y va
anotando.
D. La inhabilidad de establecer un rapport con un sujeto.
E. Las expectativas estereotipadas sobre los sujetos y las respuestas que
puedan dar.
Los procedimientos para realizar la investigación . El investigador debe
procurar cerciorarse de que los procedimientos que él va a seguir aumenten la posibilidad
de ganarse la buena voluntad de los sujetos y de obtener los datos con precisión. Debe
tratar de considerar la investigación desde el punto de vista de los sujetos. Mediante
conversaciones con los sujetos de un estudio piloto se pueden destacar algunos problemas
de los cuales el investigador tal vez no se percató. Algunos de los procedimientos que hay
que planificar bien para evitar cometer errores son:
A. La manera de explicar el estudio a los sujetos.
B. Los métodos que se usan para lograr la cooperación de los sujetos.
C. La duración de la entrevista.
D. El lugar en que la entrevista se realiza.
E. La presencia de otras personas durante la entrevista.
9.5 Las Entrevistas por Teléfono
Si el investigador cree que los individuos de su población meta, que tienen teléfono,
representan bien a la población, entonces tal vez una entrevista por teléfono sea
aconsejable. Una entrevista por teléfono puede tener todas las ventajas de una entrevista
personal, además de las siguientes:
1) Es menos costoso que una entrevista personal. Incluso, si nadie contesta, no hay
ningún costo y se puede llamar en otra oportunidad.
2) A veces es posible usar una población accesible más amplia.
3) Es más fácil comunicarse por teléfono con algunas personas que se mantienen muy
ocupadas, que concertar una cita con ellas.
4) Es más fácil supervisar a los entrevista-dores cuando están entrevistando por
teléfono desde un lugar central. De este modo es más sencillo controlar la calidad de
las entrevistas y cerciorarse de que los entrevistadores realmente las han realizado
todas.
5) Son muy útiles cuando son posteriores a una entrevista personal. Durante tales
entrevistas es posible indicar a los sujetos que dentro de algunas semanas se les
llamará a fin de averiguar si han sucedido algunos cambios en la situación que se
está estudiando mediante la entrevista. '
6) Existe la posibilidad de que el entrevistador use una microcomputadora para registrar
las respuestas. El uso de una computadora con un programa apropiado puede dar la
seguridad de que el entrevistador registrará las respuestas donde corresponde y que
preguntará solamente los ítemes correspondientes. Esto de preguntar solamente los

ítemes que corresponden es muy importante si hay preguntas que se adaptan a las
respuestas de otras preguntas. Por ejemplo, si el entrevistado teclea SI como
respuesta a la pregunta, "¿Ha recibido capacitación en el uso de las nuevas Guías
Curriculares?", la computadora puede indicar las preguntas que tienen relación con
la naturaleza de esa capacitación. Si la respuesta es NO, la computadora puede
indicar que otro tipo de preguntas pueden hacerse. De esta manera, el entrevistador
no tiene que tratar de encontrar por sí mismo las preguntas correspondientes. Otra
ventaja de usar una computadora para realizar una entrevista es que los datos, una
vez ingresados en la máquina, ya están listos para proceder con el análisis de los
mismos.
A pesar de dichas ventajas que son importantes, el investigador tiene que considerar la
naturaleza de su estudio y las posibles desventajas que puedan tener las entrevistas por
teléfono.
1. Como ya se mencionó, el hecho de que no todos tienen teléfono, implica una posible
dificultad para realizar entrevistas por teléfono. Por ejemplo, en algunos países
latinoamericanos es muy conveniente realizar por teléfono las entrevistas con los
directores de las escuelas secundarias, pero no así con los de las escuelas primarias.
2. En general, las entrevistas por teléfono tienen que ser breves. Es difícil realizar
entrevistas por teléfono que duren más de cinco minutos. Por lo tanto,
generalmente no se puede profundizar acerca de lo que se está indagando.-
3. Es más difícil establecer el mismo rapport durante una entrevista por teléfono.
Desafortunadamente, los expertos todavía no están de acuerdo con respecto a la
influencia
4. que puedan tener los efectos de la respuesta durante las entrevistas por teléfono.
5. Es más fácil para el sujeto colgar el teléfono que despedir de su oficina o de su casa a
un entrevistador.
En resumen, si los sujetos tienen teléfono, y si la entrevista no es muy larga ni profunda, un
entrevistador p o r t e l é f o n o m e n o s costosa.

Bibliografía 9
Best, John W. Cómo Investigar en Educación, Madrid: Ediciones Morata,
1974.
Borg, Walter R. y Gall, Meredith D. Educational Research: An Introduction ,

New York: Longman, 1983.
De Landsheere, Gilbert. La Investigación Pedagógica, Buenos Aires: Editorial

Estrada, 1971.
Goode, William J. y Hatt, Paul K. Métodos de Investigación Social , México:

Trillas, 1967.
Hopkins, Charles D. Understanding Educational Research , Columbus, Ohio:

Merril, 1980.
Kline, David. Planning Education for Development: Volume III Research

Methods for Educational Planni ng, Harvard University: Center for Studies in
Education and Development, 1980.
Pardinas, Felipe. Metodología y Técnicas de Investigación en Ciencias
Sociales, México: Siglo XXI, 1970.
Pérez Álvarez , Felipe. Las Investigaciones Ex ploratorias y Descriptivas en las

Ciencias de la Educación , Buenos Aires: Librería del Colegio, 1978.
Tuckman, Bruce W. Conducting Educational Research, New York: Harcourt

Brace Jovanovich, 1978.
Van Dalen, Deobold. Manual de Técnicas de la Investigación Educacional,

México: Paidós, 1971.
Whitney, Frederick L. Elementos de Investigación , Barcelona: Omega, 1970.

Para cada uno de los siguientes ítemes, subraye la respuesta más apropiada.
1) La reputación de que goza la investigación de tipo encuesta se ha visto

afectada debido a que
a) No permite el uso de muestras aleatorias
b) Ha sido aplicado inapropiada a inadecuadamente
c) No permite más de una descripción de una situación
d) Su aplicación no es frecuente

2) ¿Cuál de los siguientes tipos de investigación de tipo encuesta es más
adaptable y flexible?
a) Una entrevista personal
b) Un cuestionario por correo
c) Una entrevista por teléfono
d) Un cuestionario de grupo
3) Un estudio que dura años y que recaba datos periódicamente se llama

a) Estudio longitudinal
b) Estudio transversal
c) Estudio anual
d) Estudio extenso
4) ¿Qué falla tiene el siguiente ítem de un cuestionario? "El Ministerio debe invertir
menos en su computadora para aumentar los sueldos",
a) Es demasiado largo
b) Es un ítem doble
c) No está claro
d) No tiene falla
5) Una desventaja del cuestionario por correo es que

a) Es muy costoso
b) Es difícil recabar datos cuantitativos por medio de él
c) El número de respuestas que se obtienen tiende
d) a ser sumamente bajo
e) Las muestras suelen ser pequeñas
6. El tipo de entrevista que más se usa en la investigación educativa probablemente

sea
a) La entrevista estructurada
b) La entrevista semiestructurada
c) La entrevista no estructurada
d) La entrevista por teléfono
7) Una ventaja de la entrevista estructurada sobre el uso de un cuestionario es

que
a) Existe menos posibilidad de que se produzcan sesgos del observador
b) Es menos costoso realizar una investigación semejante
c) Resulta más útil con los sujetos que no saben leer muy bien
8) El rapport es
a) Un tipo de entrevista persona
b) Una relación de amistad y confianza
c) Un tipo de cuestionario
d) Una manera de evitar sesgos
9) El uso de una grabadora durante una entrevista

a) Permite un cuidadoso análisis posterior
b) Cambia la situación de la entrevista
c) Evita ciertos sesgos
10) ¿Cuál de las siguientes sugerencias es aconsejable durante una entrevista?

a) Recordarle al sujeto que sus respuestas son confidenciales
b) Usar una grabadora oculta
c) Usar preguntas que sugieran las respuestas deseadas
Ejercicio 9
1. Escoja un tema de interés para elaborar un cuestionario.

A) Defina el propósito de la encuesta.
B) Redacte algunos ítemes. Incluya por lo menos un ejemplo (s i es apropiado) de
cada uno de los siguientes formatos.-
a) Preguntas directas
b) Preguntas indirectas
c) Afirmaciones
d) Hechos
e) Opiniones
f) Preguntas predeterminadas
g) Preguntas adaptadas a las respuestas
h) Respuestas cortas
i) Respuestas de escala
j) Respuestas tabuladas
k) Respuestas ordenadas
l) Respuestas de listas de selección y
m) Respuestas categóricas
2. Identifique las fallas en los siguientes ítems y escrib a una versión mejor de cada
uno de ellos:
A. El Ministerio debe estipular que se dedique menos tiempo a la literatura y más
tiempo a las artes manuales.
B. Los profesores no deben aplicar el castigo corporal.
C. Todo profesor que sea dedicado debe trabajar horas extras.
D. La reforma educativa cumplió sus objetivos.
3. Considere la siguiente guía de entrevista que elaboraron Borg y Gafi (1 983, pp.
462-463), la cual se puede usar para averiguar hasta qué punto una muestra de
padres de familia siente satisfacción con una escuela determinada:
1) ¿Cuántos niños tiene usted?
2) ¿Cuántos años tiene cada uno de ellos?
3) ¿A cuál(es) escuela(s) asisten ellos?
4) ¿Por cuánto tiempo han asistido a la(s) escuela(s)?
5) ¿Qué es lo que más le gusta acerca de la(s) escuela(s) donde asisten?
6) ¿Qué es lo que menos la gusta?
7) ¿Qué tipo de contactos ha tenido usted con los profesores de sus hijos?

A. ¿Constituye esta guía una entrevista .estructurada, semiestructuradas. o no
estructura?
B. ¿Por qué cree usted que las preguntas están organizadas en esa secuencia?
C. ¿Cuáles preguntas requieren que se den respuestas abiertas?
D. ¿Podría usted identificar algunos problemas que el entrevistador pueda tener
si utilizara esta guía con algunas poblaciones de su país?
Aplicación 9
Si el problema que usted ha identificado implica que se realice una investigación de

tipo encuesta, diseñe el cuestionario o la guía de entrevista correspondiente. —

MODULO 10
LA INVESTIGACIÓN POR INDAGACIÓN
NATURALISTICA
10.1 Las Características de la Indagación Naturalística
El uso de cuestionarios y entrevistas formales presenta varios problemas. Muchas

personas no responden con veracidad y la mera presencia del investigador puede
sesgar los resultados. Un experimento controlado suele carecer de un ambiente
natural que refleje bien la realidad. La investigación por indagación naturalística
ofrece métodos que sirven para remediar tales problemas. Kline (1980: V-4)
definió la indagación naturalística como "un método para obtener información
descriptiva, asociativa, y a veces lógica de causa y efecto sobre personas, por medio
de la observación y las entrevistas en su ambiente natural, de obtener sus informes
acerca de acontecimientos, y de analizar documentos y rastros físicos que
describen su historia."
La indagación naturalística se asocia con la antropología y sus métodos
etnográficos. Aunque es sistemática, es más cualitativa que cuantitativa. En vez de
basarse en el uso de tests y de entrevistas formales, se funda en la observación y
las entrevistas informales. En vez de requerir que las condiciones sean controladas,
funciona en medio del ambiente natural de la gente. Lo que le hace falta en cuanto
a exactitud científica, queda compensado con la realida d del ambiente y del
proceso humano.
Es común que a la investigación por indagación naturalística se le denomine
investigación por observación o investigación cualitativa. Kline (1980: V-3) insistió
en que dichas expresiones no son adecuadas. Aunque la observación tal vez sea el
método principal que se emplea en la indagación naturalística, también se usan
entrevistas informales y el análisis de documentos y rastros físicos. Por lo tanto, es
algo más que una simple observación. Cualquier tipo de investigación puede
producir una recabación de datos cualitativos. La palabra "cualitativo" sirve más
bien para describir un tipo de datos en vez de un método para recavarlos.
Aunque la investigación por indagación naturalística se ha asociado mucho con los
antropólogos, sociólogos, y sicólogos sociales, el aula ha llegado a ser el ambiente
donde tienen lugar muchas investigaciones por indagación naturalística. De este
modo, el investigador puede ocupar un lugar con naturalidad dentro del aula, sin
que los alumnos se percaten de que su presencia tiene que ver con una
investigación, y así' se evitan los problemas del efecto Hawthorne.
10.2 Los Tipos de Investigación Naturalística
Se pueden identificar ciertos tipos de indagación naturalística muy específicos aún

cuando algunos de ellos traspasan los linderos de los otros. A continuación se
identifican cinco divisiones importantes:

1. los estudios de casos
2. la investigación por observaciones/ entrevistas
3. la investigación etnográfica
4. la observación de situaciones preparadas y
5. el análisis de documentos.
A continuación se ofrece una breve explicación de la naturaleza de esos cinco tipos
de investigación por indagación naturalística. Si alguno de ellos parece poder serle
útil al lector para realizar sus investigaciones, es aconsejable que lo estudie con
más profundidad, consultando una o más de las referencias que aparecen en la
bibliografía al final de este módulo.
Los Estudios de Casos

En su forma más sencilla, un estudio de casos es un examen detallado de un
individuo, de un grupo, de una institución o de un fenómeno.
Los investigadores que realizan estudio.de casos pueden usar los métodos de
observación o de análisis de documentos. Aunque se ha dicho que los estudios de
casos no son muy científicos, los mismos sí ofrecen detalles, profundidad y una
visión que sería imposible de obtener con sólo números. Gran parte del trabajo de
Piaget y de Freud se realizó mediante estudios de casos.
Borg y Gall (1983, p. 489) identificaron cinco clases básicas de estudios de casos:
1) los estudios de casos históricos de organizaciones
2) los estudios de casos por observación
3) las historias orales
4) el análisis de las situaciones y
5) los estudios de casos clínicos.
Los Estudios de Casos Históricos de Organiza ciones

Los estudios de casos históricos de organizaciones se refieren al desarrollo de una
organización a través del tiempo. El estudio de la trayectoria que ha seguido una
institución en cuanto a su desarrollo y a su filosofía constituye un ejemplo de este
tipo de estudio. Para realizar un estudio semejante, el investigador suele valerse de
entrevistas y del análisis de documentos.
Los Estudios de Casos por Observación

Un estudio que se concentra en un grupo de alumnos dentro de un aula, es un
ejemplo del estudio de casos por observación. Los estudios de esta índole
proporcionan una visión global del grupo que se investiga y además facilitan el
desarrollo de las teorías en torno a las estructuras y a los procesos socio-
educativos. El método de observación participante (que se explica en la sección
10.3) generalmente se usa para recabar los datos.
Historias Orales
Las historias orales pueden consistir en entrevistas extensas con una persona que
ha tenido mucho que ver con un fenómeno educativo. Este método sería muy útil
para estudiar un programa que ha tenido el mismo director por muchos años, o
para estudiar un fenómeno semejante al que presentan las escuelas unitarias.
El Análisis de las Situaciones

El análisis de las situaciones (situacional análisis ) difiere de una historia oral
en que en este último se entrevistan a todos los participantes principales en un
acontecimiento específico. Se puede usar este método para estudiar situaciones
tales como los problemas que experimenta un alumno en particular, desde el punto
de vista del alumno mismo, de sus profesores, de sus padres, de sus amigos, del
orientador y tal vez de su ministro religioso.
Los Estudios de Casos Clínicos

Se usan los estudios de casos clínicos para tratar de ente nder a fondo a un tipo
específico de persona. Estos estudios requieren que se realicen observaciones y
entrevistas intensivas y extensas. Su uso tiene una larga historia en el campo de la
sicología clínica. También son muy útiles para tener una mejor comprensión de los
problemas de un alumno, de sus dificultades de aprendizaje o de alguna
característica especial.
La Investigación por Observación/Entrevista Como ya se indicó, al realizar los

estudios de casos se suele usar la observación y las entrevistas. Estas últimas
también se usan para llevarse a cabo investigaciones más amplias y menos
específicas. Los dos tipos principales de observación son la observación
participante y la observación no participante.
La Observación Participante
Está de más decir que, en la observación participante el i nvestigador participa en
las actividades del grupo que está estudiando. La definición cl ásica de la
observación participante es la de Kluckholm (1940, p. 331) y la considera como un
proceso Consistente y sistemático de compartir, en todo lo que le permitan las
circunstancias, las actividades de la vida, y, en ocasiones, los intereses y afectos de
un grupo de personas. Tiene como propósito la obtención de datos acerca de la
conducta, a través de un contacto, directo y en términos de aquellas situaciones
específicas en las cuales la distorsión producida en los resultados por el efecto del
investigador, como agente exterior, es mínima.
Es importante destacar esta frase: "en todo lo que le permitan las circunstancias."
A tal extremo es la participación completa, que nadie se apercibe de que se le está
observando. Por el contrario, en el caso de la observación, ésta es obvia y hay
solamente la participación que hace falta para obtener la confianza del grupo, o
para establecer "rapport "con él. La observación participante facilita una com-
prensión total del grupo (incluso de asuntos que se mantienen más o menos en un
plano de reservas y ofrece un gran número de oportunidades para observar.
Aunque la participación completa tal vez sea la más eficaz, ésta puede ocasionar
algunos problemas. Entre los problemas que pueden surgir están: el problema ético
que involucra el engaño y lo que podría suceder si el grupo llega a descubrir que
está siendo observado, la dificultad de poder registra r los acontecimientos, los
posibles cambios que pueden ocurrir a causa de la presencia de otra persona, la
pérdida de objetividad al sentir empatía hacia el grupo y la dificultad (o quizás
imposibilidad) de replicar al estudio.
La Observación No Participante
La investigación no participante no tiene las mismas ventajas que tiene la
observación participante, sin embargo sus desventajas son menores. El observador
puede dedicarse tanto a observar como a anotar los acontecimientos a la vez. No
obstante, la presencia de un observador no participante puede cambiar aún más la
situación. Si la observación no participante se realiza en forma disimulada, pueden
surgir problemas éticos.
La Investigación Etnográfica
La investigación etnográfica es un método prestado directamente de la
antropología y en el campo de la educación se usa generalmente para estudiar l o
que sucede en el aula. El propósito de la etnografía es proporcionar una descripción
analítica y profunda de un grupo. Una de las características que define la
etnografía es que el etnógrafo no parte de una hipótesis. A partir de un marco
teórico va anotando todo lo que sucede y de la información así obtenida podrá
formular hipótesis para explicar lo que ha observado. Otro investigador empleando
métodos asociativos o experimentales puede tratar de comprobar las hipótesis que
han sido generadas por el etnógrafo. A veces el investigador, en calidad de
etnógrafo, puede ser un observador participante algunas veces o puede ser un
observador no participante en otras ocasiones.
La Observación de Situaciones Preparadas

A veces las situaciones que un investigador quiere estudiar no ocurren
oportunamente. Por lo tanto, es posible que el investigador intervenga para
preparar una situación como la que él quiere estudiar. Esto puede hacerse de ta l
manera que los sujetos no se den cuenta de que la situación está preparada, o por
otra parte, los sujetos también pueden participar en la preparac ión de una
situación de esta naturaleza.
Como ejemplo de la primera clase de situación, un investigador que desea estudiar
la reacción de los alumnos cuando el director de la escuela entra en el aula, no
tiene que esperar indefinidamente hasta que el director llegue por casualidad. Es
decir, puede pedirle a él que llegue al aula a cierta hora. En este caso, los sujetos
(los alumnos) no sabrán que la llegada del director fue algo preparado. Otra
manera de preparar la situación sería ponerse de acuerdo con los alumnos para que
ellos actúen como lo harían si el director se presentara de pronto en el aula.
Otro ejemplo sería investigar las reacciones de los profesores cuando los alumnos
se portan mal. En vez de esperar hasta que esto suceda, el investigador, sin que el
profesor se entere, puede ponerse de acuerdo con algunos alumnos para que ellos
se porten mal. Otra manera de preparar la situación sería pedirlas a los profesores
que actúen como lo hacen cuando los alumnos se portan mal.
Existen otras ventajas en las situaciones preparadas además de la que es obvia, es
decir, que mediante ellos se ahorra tiempo. Además, el investigador puede
controlar la intensidad de la situación. Por ejemplo, si se trata de la reacción de los
profesores ante el mal comportamiento de los alumnos, el investigador puede
ponerse de acuerdo con ellos para que se comporten de cierta manera. Así mismo,
en las situaciones preparadas, se hace más fácil darle enfoque a la observación y
prepara los instrumentos de observación.
Por supuesto también existen desventajas en las situacio nes preparadas. Cuando
los sujetos no deben enterarse de los detalles de una situación específica, el
investigador tiene que preocuparse de los posibles problemas éticos que esto

pueda acarrear. A veces es obvio que una situación ha sido preparada y los sujetos
no actúan con naturalidad. Si los sujetos participan en la preparación de la
situación, hay aún más posibilidad que ellos no actuarán como suelen hacerlo en
situaciones similares.
El Análisis de Documentos
En vez de estudiar directamente a los seres humanos, es posible hacerlo
indirectamente a través de lo que escriben o dicen, o a través de los rastros o
signos que ellos dejan.
Aunque su nombre lo indica, es conveniente señalar algunos posibles ejemplos de
análisis de documentos. Las políticas que se siguen en un Mini sterio de Educación
se pueden estudiar haciendo un análisis de las guías curriculares que se han
publicado. El investigador puede desarrollar un sistema de calificaciones
examinando el énfasis que se le da a cada asignatura y las metodologías que se han
utilizado. En los Estados Unidos de Norteamérica se han realizado análisis de textos
de matemática para averiguar qué actitudes tienen los autores hacia las mujeres y
hacia las minorías étnicas. Para desarrollar un diccionario de términos educativos
español-inglés, se puede empezar con un análisis de documentos para encontrar la
frecuencia con que se usan varios términos educativos en español.
Como se podrá apreciar, a veces se hace necesario usar métodos de muestreo para
realizar el análisis de documentos y desarrollar procedimientos para codificar la
información que se está tratando de obtener. En los últimos años el uso de la
computadora ha facilitado mucho algunos aspectos del análisis de documentos. Un
término más amplio es el análisis de contenidos en el cual se puede incluir
cualquier tipo de comunicación.
10.3 La Recabación de Datos
Las técnicas que se emplean para el registro de los datos que se obtienen en las
investigaciones de indagación naturalística son muy importantes. Borg y Gall (1983,
pp. 468-471) han sugerido que, aunque continuamente se están desarrollando
nuevas técnicas, las mismas se pueden clasificar en cuatro categorías:
1) el registro de duración
2) el registro de frecuencias
3) el registro de intervalos y .
4) la observación continúa.
El Registro de Duración
Con cualquier instrumento semejante a un cronómetro se puede medir e ir
anotando la duración de alguna manifestación conductual. En algunas
investigaciones se ha estudiado, tanto la cantidad de tiempo que el profesor habla,
como la cantidad de tiempo que los alumnos hablan. También se puede registrar el
tiempo que emplea el profesor para hacer distintos tipos de preguntas y
presentaciones para realizar otras actividades. Si hay más de un observador
registrando la duración.de alguna manifestación conductual, será posible calcular lo

que se denomina el "acuerdo entre observadores" a través del coeficiente de
correlación entre los conjuntos de medidas de tiempo que ellos han registrado.
El Registro de Frecuencias
Si la duración de una manifestación conductual es muy breve, o ésta no ti ene
ninguna importancia, es posible ir registrando con cuanta frecuencia ocurre, ya sea
en una hoja de cuentas o empleando un contador manual. En esta forma se puede
ir registrando el número de veces que un alumno levanta la mano o que un profes or
elogia a un alumno. Si un tipo de comportamiento sucede con mucha frecuencia, es
probable que un sólo observador puede ir registrando con cuánta frecuencia
ocurrió un comportamiento determinado. Si acaso ocurren varios tipos de
comportamientos con tan poca frecuencia que no hay forma de que sucedan a la
misma vez, con la práctica un observador que haya sido debidamente adiestrado,
podrá ir registrando la frecuencia con que ocurre más de un tipo de
comportamiento. Cuando hay más de un observador registrando con cuánta
frecuencia ocurre determinado comportamiento, se hace posible averiguar si hay
acuerdo entre los observadores. Si se trata de la observación de un sólo
comportamiento, se puede calcular la razón entre los res ultados obtenidos por los
observadores. Cuando se registra con qué frecuencia ocurre más de un
comportamiento, se puede calcular un coeficiente de correlación.
El Registro de Intervalos
Algunos investigadores han desarrollado sistemas para observar el comportamiento
dentro de un intervalo determinado. Por ejemplo, es posible observar a un sujeto
cada diez segundos o cada minuto, con el fin de ir anotando si se está comportando
de alguna manera específica.
La Observación Continua
En vez de anotar las formas de comportamiento predeterminadas, el observador
puede observar una situación o un sujeto y tratar de ir anotando todo lo que está
pasando. Generalmente, escribe lo que se llama un protocolo, el cual no es más que
un relato en orden cronológico de todo lo que hace un sujeto en una situación
determinada. Dicha situación puede ser una clase, una reunión, un grupo de
trabajo, etc. En el protocolo tal vez sea posible notar ciertos patrones que luego se
pueden estudiar empleando uno de los otros métodos que se utilizan para registrar
observaciones.
Escribir protocolos es algo muy difícil. El observador tiene que ser muy hábil para
observar y entender los posibles patrones de conductas que puedan surgir del
análisis del protocolo. El análisis de protocolos es un tipo de análisis de
documentos.
Los Tipos de Comportamiento se Pueden Observar

Weick (1968, pp. 380-401) ha señalado cuatro tipos de comportamiento que se
prestan a la observación:
1. El comportamiento verbal
Este tipo de comportamiento lo constituye, por supuesto, lo que se expresa
verbalmente. La observación puede registrarse en un protocolo o por medio de una

grabación, o haciendo una calificación de la calidad y/o cantidad de lo que se ha
dicho.
2. El comportamiento no verbal
El proceder del sujeto es lo que consideramos comportamiento no verbal. En esta
categoría pueden incluirse las expresiones faciales, la dirección de la mirada y la
forma en que él mira, cómo mueve el cuerpo, cómo se sienta, etc.
3 El comportamiento espacial
La forma en que un sujeto hace algo tiene que ver con el comportamiento espacial.
Se acerca o se aleja de algo o de alguien, si usa la fuerza o no la usa, si actúa con
rapidez o con lentitud.
4. El comportamiento lingüístico
Este tipo de comportamiento está representado por la forma de expresarse. Tiene
que ver con el tono de voz que la persona usa y su estilo de hablar.
Las Guías de Observación

Una guía de observación es análoga a una guía de entrevistas. Algunas guías
solamente facilitan el registro de la apariencia exterior de algunos tipos de
comportamiento o de ciertas condiciones, otras exigen al mismo tiempo que se
haga una calificación. De cualquier modo, aún en una hoja de cu entas se debe
especificar claramente el comportamiento que se está tratando de encontrar.
Del mismo modo que debe ponerse a prueba un cuestionario o una guía de
entrevistas antes de usarlo en una investigación, asimismo es conveniente poner a
prueba una guía de observación. De esta manera será posible detectar y corregir
fallas. Una falla común es tratar de registrar demasiada información a la vez.
En los Estados Unidos de Norteamérica existen muchas guías de observación
estandarizadas. Tienen la misma ventaja que tienen los tests est andarizados, 's
decir, que generalmente se sabe algo acerca de su validez y su confiabilidad .
También tienen las mismas desventajas, o sea que no siempre se ajustan al medio
latinoamericano y no siempre incluyen todo lo que se desea.
Los equipos de audio y de video facilitan el análisis cíe va rias situaciones y
comportamientos. Estos pueden resultar apropiados cuando la persona indicada
para realizar la observación no puede estar presente a la hora señalada, a fin de
resolver los problemas que puedan haber entre los observadores. A pesar de tener
ventajas, dichos equipos también tienen sus desventajas. Con los equipos de video
se puede obtener un registro muy 'completo solamente si el usuario tiene el
entrenamiento apropiado para usarlo con eficiencia. Además, son equipos muy
costosos. Los de audio son más baratos y más fáciles de usar, pero registran
solamente los aspectos verbales y los extralingüísticos del comportamiento y a
veces es difícil distinguir entre las voces de las personas que han grabado.
El Uso de Microcomputadoras
Actualmente las microcomputadoras pueden facilitar y agilizar el registro de datos
obtenidos mediante la observación. Existen programas que facilitan el registro de la

duración de un comportamiento y de la frecuencia con que ocurre . Una ventaja de
usar una microcomputadora es que el programa puede ser diseñado para aceptar
solamente ciertos ingresos que sean convenientes para la investigación. Otra de las
ventajas es que se les dé ingreso a los datos mientras se están observando y al
mismo tiempo quedan listos para ser analizados. Entre las desventajas están el
costo del equipo, la falta de programas apropiados con instrucciones en español y
la-atención que pueda llamar la introducción de la microcomputadora en el
ambiente. Una manera de evitar en parte, el efecto de éste último, es colocar la
microcomputadora en una sala contigua y usar un teclado pequeño conectado a la
microcomputadora mediante un cable.
10.4 El Entrenamiento de Observadores
El éxito de una investigación por indagación Naturalística depende mucho de la

habilidad del observador. Ya se explicó en el Módulo 5 el problema de los sesgos
del observador y la contaminación del experimentador. Todas las personas tienen la
tendencia a ver lo que quieren ver y son susceptibles a la influencia del
conocimiento previo del propósito que tiene alguna cosa. Hay varias precauciones
que el investigador puede tomar para evitar que los observado res sesguen y
contaminen los resultados. La precaución principal que hay que tomar es la de
entrenarlos debidamente. Silos resultados obtenidos por un observador tienden a
sesgarse mucho durante el entrenamiento, es preferible que ese observador no
participe en la investigación. Además, cuando sea posible, es mejor tener por lo
menos dos observadores para cada situación, porque así se puede medir la
confiabilidad de sus observaciones. Durante el entrenamiento es necesario
indicarle lo que deberá observar, pero a fin de evitar contaminaciones, es
preferible no mencionar exactamente por qué debe observarlo.
A continuación se presenta un proceso bastante detallado para el entrenamiento
de observadores, el cual ha sido adaptado de lo que han sugerido por Borg y Gall
(1983, pp. 478486). Desafortunadamente, en la realidad un investigador no siempre
tiene los equipos, ni el tiempo necesario, para realizar un entrenamiento tan
completo.
Después de desarrollar, poner la prueba y revisar la guía de observación, el
investigador debe discutirla con los observadores. Ellos deben entender cómo
deben usarla y la significación de cada tipo de comportamiento que hay que
observar.
El próximo paso es grabar con un equipo de video un ejemplo de cada una de las
situaciones que van a observarse. Sin usar la guía de observación, hay que mostrar
el video y detenerlo cada vez que aparece un tipo de comportamiento que h a y a
que anotar. En esta forma será posible explicar por qué el incidente constituye un
ejemplo del tipo de comportamiento en el cual se tiene interés.
Después de que hayan comprendido lo que debe observarse, deberán practicar la
forma de registrar las observaciones. Cada observador debe practicar con el
aparato de video. Aunque deberán llenar sus guías independientemente, después
de completarlas es una buena idea volver a mirar el video, con el objeto de dis cutir
las diferencias que se encuentren. Tal vez, durante este proceso sea necesario
revisar la guía o las instrucciones de cómo usar el aparato. Los observadores deben

practicar varias veces. Para los comportamientos de naturaleza muy específica,
como por ejemplo, el número de veces que un alumno levanta la mano, debe existir
un acuerdo entre los observadores de más de 90 por ciento. Si se trata de
comportamientos de naturaleza menos específica que requieren las inferencias o
las evaluaciones del observador, un acuerdo del 70 al 80 por ciento puede ser
aceptable. Para calcular el acuerdo que hay entre los observadores, se divide el
número de veces en que han estado de acuerdo en cuanto a cada comportamiento
que debe registrarse, por la suma total de las veces en que han es tado de acuerdo y
las veces en que han estado en desacuerdo.
Después de haber practicado con el equipo de video, los observadores deberán
practicar en algunas situaciones reales que no sean las que forman parte de la
muestra. Lo ideal sería grabar esas sesiones con el fin de analizarla.
La investigación misma debe empezarse inmediatamente después del
entrenamiento, para que los observadores no pierdan los efectos del
entrenamiento.
10.5 La Investigación Participativa
En los últimos años se ha venido notando en el mundo en desarrollo que hay mucho
interés en un tipo de investigación que combina tres cosas: la investigación, la
educación-aprendizaje y la acción. La investigación participativa ha sido usada
como componente importante de algunos proyectos de educación de adultos, con
miras a mejorar las condiciones de vida y promover la justicia social. L a misma
comprende una interacción democrática entre los investigadores formales y las
personas entre las cuales la investigación se realiza. Dado su ambiente natural, tal
vez sea posible considerarla como un tipo de indagación naturalística. Si el lector
tiene interés especial en la investigación participativa, debe consult ar las
publicaciones que al respecto ha hecho el Centro Regional de Educación de Adultos
y Alfabetización Funcional para América Latina (CREFAL) en Pátzcuaro, Michoacán,
México.

Bibliografía 10
Anguera, María Teresa. Metodología de la Observación en las Ciencias Humanas,
Madrid: Ediciones Cátedra, 1982.
Boehm, Ann E. y Weinberg, Richard A. The Classroom Observer, New York:

Teachers
College Press, 1977.
Borich, G.D. y Madden, S.K. Evaluating Classroom Instruction, Reading, Mass.:

Addison-Wesley, 1977.
Longman, 1983.
Educational Planning, Harvard U.: Center for Studies in Education and Development,1980.
Krippendorf, Klaus. Content Analysis: An Introduction to its Methodology, Beverly Hills,
Calif.: Sage, 1980.

Siglo XXI, 1970.
Pérez Alvarez, Felipe. Las Investigaciones Exploratorias y Descriptivas en las Ciencias de

la Educación, Buenos Aires: Librería del Colegio, 1978.
Spindler, George, (Ed.). Doing the Ethnography of Schooling: Educational Anthropology

in Action, New York: Holt, Rinehart and Winston, 1982.

Jovanovich, 1978.
Weick, K., "Systematic Observational Methods", en G. Lindzey y E. Aronson (eds.),

Handbook of Social Psychology, Reading, Mass.: Addison-Wesley, 1968, vol. II, pp. 357-
451.

1. Los métodos de la indagación naturalística suelen ser útiles cuando

a) Es probable que los sujetos van a responder a cuestionarios con sesgos
b) Es necesario tener mucha exactitud científica
c) El presupuesto de la investigación es muy bajo
d) El investigador cuenta con poco tiempo para realizar su estudio
2. Un estudio que se concentra en un grupo de alumnos dentro de un aula, es un

ejemplo de
a) Un estudio de caso clínico
b) La observación de situaciones preparadas
c) Un estudio de caso por observación
3. Entre las dificultades que se encuentra al llevar a cabo la observación

participante están
a) Los posibles cambios debido a la presencia del investigador
b) La dificultad para registrar los acontecimientos
c) La dificultad para replicar el estudio
4. La indagación naturalística se asocia con

a) La sicología
b) Las ciencias naturales
c) La antropología
d) La estadística
5. La investigación etnográfica
a) Depende de métodos estadísticos
b) Es útil para formular hipótesis
c) Implica observación participante
6. Entre las ventajas de las situaciones preparadas se encuentra

a) El ahorro de tiempo
b) La posibilidad de controlar la intensidad de la situación
c) La posibilidad de darle enfoque a la observación
7. Entre las desventajas que presentan las situaciones preparadas se encuentra
a) El tiempo que se necesita para preparar la situación
b) La posibilidad de que surjan problemas éticos de decepción.

c) La dificultad de darle enfoque a la observación
8. El uso de equipos de audio y video en la investigación

a) Facilitan el análisis de diversas situaciones
b) Suele ser costoso
c) Requiere un entrenamiento especial
9. El entrenamiento de observadores
a) Debe incluir una explicación de la hipótesis
b) Se facilita con el uso de equipos de video
c) Se realiza con la muestra de la investigación
10. El uso de un cronómetro es necesario con

a) El registro de duración
b) La observación continua
c) El registro de frecuencias
Ejercicio 10
l. Dos auxiliares de investigación miden la duración del tiempo que un profesor

habla y la duración del tiempo que sus alumnos hablan. ¿Qué debe hacer el
investigador para comparar el trabajo de sus dos auxiliares?
2 . Un investigador desea medir el entusiasmo que manifiestan algunos profesores a

través de la observación.
A. Sugiera cuatro ítems que se pueden incluir en una guía de observaciones.
B. Indique los pasos que se deben seguir para entrenar a los observadores.
C. Indique dos ventajas y dos desventajas de la investigación por indagación

Naturalística.
Aplicación 10
Si su problema requiere que se lleve a cabo una investiga ción por indagación
Naturalística, identifique el tipo de indagación Naturalística que estima que es
conveniente emplear, diseñe la guía de observación y planifique el entrenamiento
de los observadores.

MODULO 11
LA INVESTIGACIÓN EXPERIMENTAL
11.1 Las Características de la Investigación Experimental
En los tipos de investigación que se consideraron en los módulos anteriores, el investigador

observa lo que pasa, pero no tiene la intención de cambiar lo que está pasando. Con el
método experimental, el investigador introduce algo (una causa) que él cree va a cambiar
una situación (el efecto). De modo que éste es el único método que permite la
comprobación de hipótesis de causa y efecto.
Otra forma de conceptualizar la investigación experimental es que en ella el investigador
manipula una variable independiente (o varias) con un grupo experimental, mantiene un
grupo de control que no recibe la variable independiente (o que recibe otra) y observa la
diferencia que resulta entre los dos grupos. Un ejemplo muy sencillo es la aplicación de un
método de enseñanza nuevo a un grupo experimental mientras que a un grupo de control
se le imparte la enseñanza empleando un método tradicional. Si, después de un período, el
investigador puede verificar que hay una diferencia significativa entre los dos grupos a favor
del grupo experimental, verá respaldada la hipótesis de que el método experimental es más
eficaz.
Otros nombres que recibe el método experimental que a veces se encuentran en la
literatura son: el método de causa y efecto, el diseño de pretest post-test con un grupo de
control y el método de laboratorio.
Algunos investigadores (como Gay 1981: 208) opinan que el método experimental es el
método de investigación más exigente y más productiva. Tal vez se pueda decir que ha
existido algo de esnobismo entre algunos académicos que le han dado preferencia a la
investigación experimental. De todos modos, actualmente se reconoce que hay ciertas
dificultades para lograr el control experimental en las situaciones educativas y la utilidad de
emplear otros métodos.
1 1 . 2 Las Amenazas a la Validez Experimental
En el Módulo 5 se presentaron algunos factores que constituyen una amenaza para la

validez de las investigaciones, tales como los sesgos, los efectos y las contaminaciones. En
este módulo, se pueden reconocer algunos de ellos como amenazas a la validez de un
experimento. En el módulo 7 se consideró lo que constituye la validez de un instrumento. La
validez de un experimento constituye un concepto semejante.

Un experimento es válido si llega a comprobar lo que en realidad siempre ha sido cierto. En
otras palabras, un experimento es válido SÍ:
1. Los resultados obtenidos se deben solamente a la variable independiente y
2. Se pueden generalizar los resultados con respecto a situaciones ajenas al ambiente
donde se lleva a cabo el experimento.
Cuando los resultados que se obtienen se deben solamente a la variable independiente dice
que tienen validez interna. Cuando se pueden generalizar los resultados con respecto a
otras situaciones se llama validez externa. Una de las dificultades que se nos presentan al
realizar una investigación experimental, es que es difícil (si no imposible) aumentar al
máximo un tipo de validez, a la vez que el otro se aumenta al máximo. Las variables extrañas
que afectan a la variable dependiente constituyen amenazas a la validez interna de un
experimento. Para poder controlar todas las variables extrañas (validez interna) sería
necesario contar con una situación tan especial, que se haría difícil generalizar con respecto
a otras situaciones (falta de validez externa). Si la situación experimental es muy natural y
constituye un buen ejemplo de lo que son muchas situaciones (validez externa),
generalmente es porque existen muchas variables extrañas (faltas de validez interna).
Las Amenazas a la Validez Interna. Cabe la posibilidad de que el documento que haya
tenido la mayor influencia en el campo del diseño experimental y las amenazas a la validez
experimental sean: Diseños Experimentales y Cuasi-Experimentales para la
Investigación de Donald Campbell y Julián Stanley. Campbell y Stanley identificaron ocho
variables extrañas que constituyen las principales amenazas a la validez interna de un
experimento.
La historia es todo aquello que acontece fuera de la situación experimental sobre lo cual el
investigador no tiene ningún control, pero que puede influir en la variable dependiente. Por
ejemplo, tal vez se introduce algo en un curso de biología a fin de tratar de mejorar las
actitudes que tienen los alumnos hacia el ambiente natural. Otro curso de biología, que no
recibe ese tratamiento especial, sirve de grupo de control. Si durante el período
experimental el grupo de control tiene una experiencia de campo, donde por casualidad sus
miembros pueden palpar los efectos de la contaminación ambiental, es posible que sus
actitudes cambien aún más de lo que cambien aquellas que tenga el grupo experimental.
La maduración se refiere al crecimiento físico emocional e intelectual que sucede por obra
natural a través del tiempo. A veces, los cambios de esta naturaleza explican que hayan
diferenciasen la variable dependiente.
El uso de tests constituye una amenaza a la validez interna cuando el pre-test mismo
influye en la calificación que se obtenga en el post-test.
La instrumentación se refiere a los problemas de confiabilidad que puedan existir en los
instrumentos de investigación. La instrumentación puede además resultar problemática, si
el post-test que se aplica es muy distinto al pre-test y si se cambia la manera de calificarlos.
La regresión estadística puede suceder cuando los grupos se seleccionan con base en
calificaciones extremas. Existe una tendencia estadística cuando se trata de grupos altos y
bajos, de regresar hacia la media a través de la aplicación de otro test.
La selección diferencial de sujetos es otro nombre que reciben algunos de los sesgos de
muestreo, que ya se consideraron en el módulo 5. Se refiere específicamente al hecho de
que si los sujetos de los grupos experimentales no se seleccionan aleatoriamente, las
diferencias que se encuentren en el experimento tal vez obedezcan a diferencias iníciales
que habían entre los grupos y no al tratamiento experimental.
La mortalidad es sinónimo de pérdida de sujetos, es decir, otro tipo de sesgo de mues-treo.

La interacción se refiere al efecto que produce la combinación de dos o más de las otras
amenazas mencionadas. Tal vez la interacción más común ocurra entre la selección de los
sujetos y la maduración. Si el grupo experimental no tiene experiencia con la variable
dependiente y el grupo de control tiene mucha experiencia con ella, es posible que el grupo
experimental mejore mas debido a esa diferencia y no a causa del tratamiento experimental
que ha recibido.
Las Amenazas a la validez externa. Campbell y Stanley identificaron cuatro amenazas a
la validez externa, a saber:
El efecto reactivo del pre-test significa que cabe la posibilidad de que el tratamiento
experimental no funcione sin haber aplicado previamente el pre-test. Si en otra situación se
aplicara el tratamiento, sin el pre-test, es posible que no se obtuvieran los resultados
esperados. Esta amenaza podría ser muy común en las investigaciones sobre las actitudes.
El pre-test mismo puede cambiar las actitudes, o por lo menos disponer al sujeto a
considerar sus actitudes. Las personas que no reciben el pre-test, tal vez no cambien del
mismo modo sus actitudes.
La interacción entre la selección y el tratamiento es semejante a la amenaza a la va-
lidez interna que se conoce como "selección diferencial de sujetos". La diferencia es que,
quizás la diferencia entre el grupo experimental y el grupo de control sea verdadera, pero
esos dos grupos son tan particulares que esa misma diferencia no va a encontrarse
empleando otras muestras de la población.
Las situaciones reactivas se refieren a la manera de realizar el experimento. Ya se
consideraron algunos de ellos en el Módulo 5: el efecto Hawthorne, el efecto John Henry y
el efecto Pigmaleón.
La Interferencia de Tratamientos Múltiples se refiere a lo que puede pasar cuando los
sujetos reciben más que un tratamiento. Es posible que el efecto que se haya medido
después cíe aplicar un segundo tratamiento tenga que ver con el primer tratamiento.
11.3 Los Diseños Pre-Experimentales
El diseño experimental es un esquema de los procedimientos que el investigador sigue para

comprobar su hipótesis. Un diseño adecuado puede reducir al mínimo las amenazas a la
validez de un experimento.
Se suelen usar algunos símbolos para ilustrar los diversos diseños de investigación
experimental. Los más comunes se presentan a continuación:
X Significa un tratamiento experimental.
O Significa una observación (muchas veces un test).
A Significa una asignación aleatoria.
— Significa una asignación no aleatoria.
Campbell y Stanley identificaron tres diseños que, aunque se usan a menudo, son
inadecuados y se denominan diseños pre-experimentales:
1. El estudio de tiro (one shot),
2. El diseño de pre-test post-test con un solo grupo y
3. La comparación de grupos estáticos.
El Estudio de Tiro tiene un diseño sumamente sencillo:
X O
Es decir, un solo grupo recibe un tratamiento y luego se miden los resultados. Aunque no
todas las amenazas se presentan al emplear este diseño (véase la Tabla 11.3.1), como no se
pueden comparar los resultados con los obtenidos por otro grupo, esto hace que el estudio

sea inútil. Como dice Cay (1981), "si hay que escoger entre el uso de este diseño y dejar de
realizar el estudio -no realice el estudio".
Tabla 11.3.1
Fuentes de Invalidez al Usar Diseños Pre-Experimentales
El Estudio de Tiro --****-* * * -* *
El Diseño de Pre-test Post-test con un solo Grupo -----*+*-*? *
La Comparación de Grupos Estáticos
— Significa que el factor no se controla

+ Significa que el factor se. controla
* Significa que el factor no es pertinente
? Significa que tal vez sea un problema
El Diseño de Pre-test Post-test con un Solo Grupo permite hacer algo de comparación
al aplicar un pre-test y un post-test. La representación gráfica del diseño es así: 01 X 02
Aunque tal vez se pueda usar este diseño, si es que no hay otra manera de realizar un
estudio, existen aún más amenazas a su validez. La historia y la maduración pueden influir
en los resultados; algo puede suceder, ya sea a los sujetos o bien dentro del grupo de ellos.
El uso de tests y la instrumentación pueden causar problemas si los sujetos aprenden algo al
tomar el pre-test que les puede ayudar en el post-test o si las fallas en los mismos tests son
causas de las diferencias aparentes. No existe forma alguna de determinar si los resultados
pueden generalizarse con respecto a toda una población o si tienen que ver solamente con
la muestra.
La Comparación de Grupos Estáticos permite hacer una comparación entre dos grupos,
pero sin que al principio se sepa cuál es la relación entre los dos grupos, debido a la falta de
asignación aleatoria de sujetos a los grupos y a la ausencia de un pre-test. Se puede ilustrar
el diseño como aparece a continuación-.
XI O
-------
X2 O
11.4 Los Diseños Experimentales
Las características principales de los diseños experimentales son la selección aleatoria de

sujetos para integrar los grupos y el uso de, por lo menos, un grupo de control. De este
modo es posible controlar casi todas las fuentes de invalidez interna y externa. Otra
característica deseable es la asignación aleatoria de los sujetos a los grupos, después de
haber seleccionado los mismos aleatoriamente.
Campbell y Stanley identificaron tres diseños que son verdaderamente experimentales:
1) El Diseño de Pre-test Post-test con un Grupo de Control,
2) El Diseño de Solo un Post-test con un Grupo de Control,
3) El Diseño de Cuatro Grupos de Solomon.
El Diseño de Pre-test Post-test con un Grupo de Control

Es probable que el diseño de pre-test posttest con un grupo de control es el diseño que más
se usa. Para implementar este diseño es necesario tener por lo menos un grupo
experimental y un grupo de control. Los grupos deben formarse aleatoriamente Se aplica un
pretest de la variable dependiente a ambos grupos. Luego, el grupo experimental recibe un
tratamiento que el grupo de control no recibe.
Finalmente, se aplica un post-test a ambos grupos.
La presentación gráfica del diseño es así:
A O XO A O X1 O
AO O o A O X2 O
Se presentan dos gráficas porque la primera indica que el grupo de control no recibe ningún
tratamiento y la segunda indica que el grupo de control recibe un tratamiento distinto.
Este diseño permite que se usen más grupo
A OX1 O A O X1 O
A O X2 O A O X2 O
o
AO O A O X3 O

Si se aplica este diseño debidamente, todas las amenazas a la validez interna deben
controlarse. El pre-test permite el control de la mortalidad. Con un grupo de control es
posible controlar para la historia, el uso de tests, y la instrumentación. La selección aleatoria
de sujetos sirve para controlar los factores de selección y regresión. La combinación de la
selección aleatoria y el grupo de control permite controlar la maduración.
Aunque el uso de un pre-test permite que se controlen algunas de las amenazas a la falidez
interna, también permite el posible efecto reactivo del pre-test. Es decir, cabe la posibilidad
de que el pre-test influya mucho en los resultados. Entre los factores que inciden en la
gravedad con que se manifiesta esta amenaza a la validez externa se encuentran la
naturaleza del pre-test, el tipo de tratamiento y la duración del experimento. El investigador
que usa este diseño tiene la responsabilidad de considerar esta posible amenaza y
mencionar en su informe la posibilidad de que ésta sea seria.
Con este diseño el investigador suele tener cuadro medias:
1) la media del pre-test para el grupo experimental,
2) la media del pre-test para el grupo de control
3) la media del post-test para el grupo experimental y
4) la media del post-test para el grupo de control. Un error común al analizar
estadísticamente este diseño es sacar un Test-t comparando el pre-test y el post-test
para el grupo experimental y repetir el mismo proceso para el grupo de control. Si
los resultados son estadísticamente significativos para el grupo experimental y no
para el grupo de control, el investigador indicará, equivocadamente, que existe una
diferencia entre los dos grupos. El error en que se incurre es que no comparan los
dos grupos directamente.
Otro método mediante el cual se analiza incorrectamente es comparar la diferencia entre
las medias de los pre-tests y los posttests del grupo experimental con las medias análogas
del grupo de control. El posible problema que puede presentarse al emplear este método es
que no todos los sujetos tienen la misma posibilidad de mejorar sus puntajes. Por ejemplo,
es difícil comparar un sujeto que obtiene el 85o/o en el pre-test que mejora al 95o/o con
uno que obtiene el 25o/o que mejora al 65o/o.
Si las dos medias del pre-test son equivalentes, es aceptable usar un Test-t para comparar
las medias del post-test. En el caso de que, aunque los dos grupos se hayan seleccionado
aleatoriamente, sus medias del pre-test no sean equivalentes, es preferible usar el análisis
de covarianza.
El Diseño de Solo un Post-test con un Grupo de Control

Este diseño es muy semejante al diseño de pre-test post-test con un grupo de control
menos el pre-test. Su representación gráfica es así:
A XO A X1 O
A O o A X2 O
Aunque se considera que el uso de un pre-test es muy importante a veces no existe un pre-
test adecuado o se teme que el pre-test va a influir en el tratamiento experimental. En
dichos casos hay que considerar el diseño de sólo un post-test con un grupo de control.
El uso de la selección aleatoria y de un grupo de control elimina la mayoría de las amenazas
a la validez interna. La falta de un pre-test implica la posibilidad de mortalidad. A-

fortunadamente la mortalidad no siempre es un problema sobre todo en experimentos de
corta duración.
El test de significación estadística que es más apropiado para emplear con este diseño
generalmente es el Test-t, mediante el cual se compara la media del post-test para el grupo
experimental con la media correspondiente del grupo de control. Si el estudio involucra más
que dos grupos, se estudian las medias del post-test con el análisis de varianza.
El Diseño de Cuatro Grupos de Solomon
Para evitar el efecto reactivo del pre-test y, a la misma vez, la posibilidad de mortalidad, se
puede considerar el diseño de cuatro grupos de Solomon. Este diseño es como una
combinación de los otros dos métodos. La representación gráfica del diseño es así:
A OX O A OX1 O
A O O A O X2 O
A x O o A X1 O
A O O A X 2O
El test de significación estadística que es apropiado para emplearse con el diseño de cuatro
grupos de Solomon es un análisis de varianza (ANOVA) de 2X2. Las dos variables
independientes son el tratamiento experimental y el hecho de recibir o no el pre-test. De
este modo es posible averiguar si el tratamiento ha sido eficaz y si ha habido interacción
entre el pre-test y el tratamiento.
Aunque controla mejor las amenazas a la validez, no se puede decir que el diseño de cuatro
grupos de Solomon es el "mejor" diseño. Una desventaja que tiene es que requiere que se
use el doble de la cantidad de sujetos. A veces es difícil conseguir tantos sujetos y siempre
se requieren más recursos de tiempo y dinero. Si es la opinión del investigador que no existe
mucha posibilidad de un efecto reactivo del pre-test, tal vez el diseño de pre-test post-test
con un grupo de control sea el "mejor". Si el investigador opina que la mortalidad no
presenta un problema y que no es necesario ni posible administrar un pre-test, el Diseño de
solo un post-test con un Grupo de Control es el "mejor".
11.5 Los Diseños Cuasiexperimentales
Campbell y Stanley identificaron diez diseños cuasiexperimentales. A continuación se

presenta una consideración de tres de ellos que tal vez sean los más usados:
1) El Diseño de Serie de Tiempo,
2) El Diseño de Grupo de Control No Equivalente, y
3) Los Diseños Contrabalanceados.
El Diseño de Serie de Tiempo

Cuando se emplea el diseño de serie de tiempo, a un solo grupo se le aplica un pre-test
varias veces y después del tratamiento, un post-test varias veces. De cierto modo, es una
elaboración del diseño de pre-test posttest con un solo grupo. La representación gráfica de
este diseño es así:

OOOXOO0 0
Con este diseño se controlan tres factores que no se controlan con el diseño de pre-test
post-test con un solo grupo de control: la maduración, el uso de tests y la regresión.
Desafortunadamente la historia sigue siendo un problema porque todavía existe la posibi-
lidad de que algo pueda ocurrir entre el último pre-test y el primer post-test que, no siendo
parte del tratamiento, influye en los resultados. La instrumentación puede ser un problema,
sobre todo si el investigador cambia de instrumento durante el estudio. Por supuesto que, si
existe la posibilidad de interacción entre el pre-test y el tratamiento habiendo administrado
un solo pre-test, con varios pre-tests es aún más probable.
A manera de ejemplo sencillo de este diseño, se puede considerar un estudio de actitudes.
El uso de varios pre-tests antes del tratamiento puede ayudar a cerciorarse de que las
actitudes no están sufriendo cambios sin el tratamiento. A la vez, es obvio que aumenta el
peligro de que los pre-tests mismos puedan influir en los cambios.
La Figura 11.5.1 presenta algunos de los posibles patrones de los resultados obtenidos
utilizando un diseño de serie de tiempo. El patrón A representa una situación donde el
tratamiento produce ningún efecto. Los cambios están sucediendo en forma natural y el
tratamiento no produce cambios en el patrón. Los patrones B y C indican situaciones donde
el tratamiento sí ejerce influencia. La influencia es más fuerte en el patrón B. El patrón D
muestra cambios alrededor del tratamiento, pero como ocurrieron otros cambios en el
patrón, es difícil decir que el tratamiento fue lo que causó ese cambio.
El Diseño de Grupo de Control No Equivalente

Este diseño es como el diseño de pre-test post-test con un grupo de control, pero sin la
selección aleatoria de los sujetos para formar los grupos. Generalmente se usan dos
muestras disponibles para formar los grupos y se administra un pre-test, un tratamiento y
un post-test.
Tabla 11.5.1
Posibles Patrones Empleando un Diseño de Serie de Tiempo

Este es un diseño muy útil para realizar investigaciones en aquellas escuelas donde la única
posibilidad de realizar investigaciones es usar clases intactas.
Por supuesto que cuando la selección no se efectúa de forma aleatoria tal vez haya mayor
posibilidad de que aparezcan más fuente* de invalidez: la regresión y la interacción entre la
selección y tal vez la maduración, la historia o el uso de tests. Por lo tanto, es necesario
tener grupos lo más semejantes que sea posible y mencionar la posible falta de validez en el
informe de la investigación.
A continuación se presentan cuatro de las posibles formas de representar gráficamente el
diseño de grupo de control no equivalente:
O X1
O X O O O X1 O O X1 O
O X2
O O O O X2 O O X2 O
O
O O X3 O
Los Diseños Contrabalanceados

Cuando se emplean diseños contrabalanceados todos los grupos reciben todos los
tratamientos, pero en orden distinto. Es posible representarlos gráficamente así:
X1 X2
O O X3 O
X2 X3
O O X1 O
X3 X1
O O X2 O
Hay tres grupos y tres tratamientos. Cada grupo recibe los tratamientos en un orden
distinto aplicándosele un post-test después de cada tratamiento. Para analizar los
resultados es posible comparar los resultados obtenidos por cada grupo después de cada
tratamiento, con Cada uno de los otros grupos, después de cada tratamiento.
El punto débil más notable de este diseño es que cabe la posibilidad de que haya interacción
entre los tratamientos. Por lo tanto, se usa al aplicar tratamientos de tal naturaleza que, si
se usa uno de ellos, esto no influye mucho en los resultados que se obtengan con los otros.
11.6 Los Diseños No Experimentales: Estudios Correlaciónales y Comparativos Causales
Los diseños correlaciónales y comparativos causales son más bien tipos de investigación
descriptiva en vez de ser de índole experimental. Se incluyen aquí con el objeto de señalar
en qué se diferencian de la investigación experimental. Cabe la posibilidad de que el
principiante confunda estos dos diseños entre sí y con los diseños experimentales. Tal vez
un diseño correlacionar se confunde con un comparativo causal porque al utilizar cualquiera
de los dos el investigador no manipula la variable independiente y hay que tener el mismo

cuidado al interpretar los resultados. Las diferencias principales que hay entre un diseño
correlacional y uno comparativo causal se presentan en la Tabla 11.6.1. Un diseño
comparativo causal puede confundirse con un diseño experimental porque al emplear
cualquiera de los dos, se tiene el interés de determinar algo sobre las relaciones de causa y
efecto y el uso de grupos para hacer comparaciones. Sin embargo, al emplear el diseño
comparativo causal el investigador no manipula la variable independiente y solamente un
diseño experimental permite sacar conclusiones que sean más sólidas con respecto a las
relaciones de causa y efecto.
El Diseño Correlacional
El diseño correlacional no es muy complicado. Involucra que se use el coeficiente de
correlación para determinar si existe una relación entre dos o más variables.
Tabla 11.6.1
Las Diferencias-entre los Estudios Correlaciónales y los Estudios Comparativos Causales
Un Diseño Correlacional
Un Diseño Comparativo Causal
No intenta identificar las relaciones de Un intento de identificar las relaciones de

causa y efecto causa y efecto
Por lo general, solamente un grupo y dos o Por lo general, dos grupos y una variable
más variables Se usan comparaciones
Se usan correlaciones
Mediante estudios realizados utilizando un diseño correlaciona se ha comprobado que

existe una relación entre la inteligencia y el rendimiento escolar porque se ha encontrado
que hay una correlación alta entre el C.I. y las notas que reciben los alumnos. En la sección
8.7 se ha contemplado el uso del coeficiente de correlación.
La hipótesis de un estudio de correlación indica la relación que se supone debe existir entre
las variables que se van a considerar. Se usa un solo grupo que debe ser una muestra
integrada por treinta sujetos, por lo menos. Por supuesto, el uso de instrumentos con un
alto grado de confiabilidad y validez ocasiona que los resultados de un estudio correlaciona
sean mejores.
El diseño correlacional tiene varias ventajas. Permite efectuar un análisis de la relación
entre una cantidad grande de variables. Además, facilita la determinación del grado de
relación que existe entre las variables. Otra ventaja que tiene el mismo es que permite
predecir los puntajes que se obtendrán en un test basándose en los puntajes obtenidos en
otros tests.
El diseño correlacional tiene dos limitaciones principales. La primera es que la existencia de
una relación entre dos variables no implica necesariamente que una de las variables es la
causa de la otra. Por ejemplo, aunque un estudio de correlación haya comprobado que
existe una relación sólida entre la inteligencia y el rendimiento escolar, eso no quiere decir

que la inteligencia causa el rendimiento escolar ni que el rendimiento escolar causa la
inteligencia.
Otra limitación es que, aunque sea posible comprobar que existe una relación entre varias
características y el rendimiento en una materia, tal vez existan Otras características que
también posean una relación semejante. Por ejemplo, tal vez se pueda comprobar que
existe una alta correlación entre ciertas características y la medida en que un administrador
tenga éxito. Por otro lado, tal vez haya un grupo de administradores que aunque no poseen
esas mismas características, sí tienen otras características que les proporcionan un éxito
similar.
El Diseño Comparativo Causal
El estudio comparativo causal se hace con el propósito de intentar determinar la causa de
un fenómeno determinado. Cuando se emplea este diseño se comparan dos grupos, que se
denominan el grupo definido y el grupo de comparación, los cuales difieren en alguna
variable a fin de tratar de identificar los factores que han contribuido a que hayan
diferencias. A este diseño a veces se le llama investigación ex pos facto porque el
investigador está estudiando los efectos y sus supuestas causas que ya han ocurrido. Es
decir, el investigador no manipula la(s) variables(s) independiente(s).
Un ejemplo de este tipo de diseño sería un estudio del éxito económico que tienen los
individuos que han egresado a la universidad versus los individuos que solamente se
graduaron de la escuela secundaria. El investigador realmente no puede decidir quiénes
deben ir a la universidad y quiénes no, para realizar un experimento. El diseño comparativo
causal es popular porque en el campo de la educación existen muchas situaciones donde la
manipulación experimental no es posible.
Los pasos para realizar una investigación utilizando un diseño comparativo causal son muy
semejantes a los pasos que se dan al emplear un diseño experimental:
1. El planteamiento del problema.
2. La enunciación de una hipótesis.
3. La selección del grupo definido. Este grupo debe tener en sí la característica que el
investigador desea estudiar. El problema principal es que el grupo tal vez tenga otras
características que quizás influyan en el efecto. Por lo tanto, a veces es preferible controlar
algunas variables, tales como el sexo, la edad, la inteligencia, la clase socioeconómica, etc.
Por ejemplo, si se desea estudiar el efecto que ha tenido la enseñanza pre-primaria en el
rendimiento al cursar el primer grado, tal vez sería aconsejable limitar el estudio a alumnos
que pertenezcan a ciertas clases socioeconómicas y que tengan cierto rango de inteligencia
o identificar subgrupos según subcaracterísticas pertinentes. Una vez se haya identificado
un grupo con la característica principal, y tal vez las subcaracterísticas, sí se hace necesario
sacar una muestra, preferiblemente una muestra aleatoria.
4. La selección del grupo de comparación.

El grupo de comparación debe ser lo más semejante al grupo definido con la excepción de la
variable que se estudia. Una vez se haya identificado una población apropiada, el grupo de
control se podrá seleccionar aleatoriamente o mediante apareamiento es necesario
encontrar una pareja para cada miembro del grupo definido que tenga algunas
características semejantes

5. La recabación de datos. Casi cualquier instrumento de los que ya se ha mencionado
puede ser útil para efectuar estudios comparativos causales: los tests estandarizados, los
cuestionarios, las entrevistas, las observaciones naturalísticas, etc.
6. El análisis de datos. Las estadísticas descriptivas e inferenciales pueden ser útiles para
analizar los datos obtenidos mediante un estudio comparativo causal. El Módulo 8 contiene
una presentación de estadísticas de esta índole.
7. La interpretación de los datos. Hay que interpretar los resultados de un estudio

comparativo causal con mucha cautela. Puede ser que, en realidad, el supuesto efecto sea la
causa y la supuesta causa sea el efecto. También existe la posibilidad que haya otro factor
que en realidad sea la causa. Estas dificultades que se presentan al emplear el diseño
comparativo causal a veces se llaman falacia post-hoc. Por ejemplo, tal vez un estudio
comparativo causal indique que, al haber cursado más años de estudios, la condición
económica del individuo es mejor. Por otro lado, otros factores tales como la condición
socioeconómica de la familia, la inteligencia, la voluntad, la persistencia, pueden influir
mucho en la situación. Aunque el diseñó comparativo causal permite que se estudie la
relación entre varias variables, el mismo no indica las conexiones causales que hay entre
dichas relaciones.

BIBLIOGRAFIA 11
Borg, Walter R. y Gall, Meredith D. Educational Research: An Introduction, New
York: Longman, 1983.
Campbell, Donald T. y Stanley, Julián C. Experimental and Cuasiexperimental De-signs for
Research, Chicago: Rand McNally,1963.
Gay, L. R. Educational Research: Competencies for Analysis and Application, Columbus,
Ohio: Charles E. Merril Publishing, 1981.
Goode, William J. y Hatt, Paul K. Métodos de Investigación Social, México: Trillas, 1967.
Educational Planning, Harvard University: Center for Studies in Education and
Development, 1980.
Jovanovich, 1978.
Van Dalen, Deobold. Manual de Técnicas de la Investigación Educacional, México: Paidós,
1971.
Whitney, Frederick L. Elementos de Investigación, Barcelona: Omega, 1970.
1. La validez externa de un experimento se refiere

a) Al control de variables extrañas
b) A que se han usado instrumentos válidos
c) A que se pueden generalizar los resultados con respecto a la población meta
2. Una investigación que controla todas las variables extrañas tiene

a) Validez interna
b) Validez externa
c) Confiabilidad interna
d) Confiabilidad externa
3. Si algo pasara fuera de la situación experimental, sobre lo cual el investigador no tuviera

ningún control, pero que sí podría influir en la variable dependiente, sería una amenaza a la
a) Validez interna
b) Validez externa

4. Si los resultados de un experimento dependen de la administración de un pre-test, dicho
experimento carece de
a) Validez interna
b) Validez externa
5. ¿Cuál de los siguientes diseños experimentales es el mejor?

a) El de pre-test post-test con un solo grupo
b) El de pre-test post-test con un grupo de control
c) El de serie de tiempo
d) Depende de la situación
6. Para averiguar algo sobre el efecto que ha producido el pre-test se puede usar un diseño
a) De pre-test post-test con un grupo de control
b) De serie de tiempo
c) De cuatro grupos de Solomon
d) Contrabalanceado
7. A O X O
A O O es una representación gráfica de un diseño
a) Contrabalanceado
b) De sólo un post-test con un grupo de control
c) De la comparación de grupos estáticos
d) De pre-test post-test con un grupo de control
8. El diseño que ofrece más validez interna es el diseño

a) Contrabalanceado
b) De pre-test post-test con un grupo de control
c) De solo un post-test con un grupo de control
d) De pre-test post-test con un solo grupo
9. El diseño que ofrece más validez externa es el diseño

a) Contrabalanceado
b) De pre-test post-test con un grupo de control
c) De solo un post-test con un grupo de control
d) De pre-test post-test con un solo grupo.
10. Un diseño comparativo causal suele usarse cuando

a) No existen instrumentos confiables y válidos
b) No es posible conseguir un grupo de control
c) No es posible manipular la variable independiente
d) No es posible usar una muestra aleatoria
11. Una de las ventajas principales que tiene un diseño correlaciona! es que
a) Permite comprobar de las relaciones de causa y efecto
b) Evita los problemas que ocasiona el efecto reactivo de un pre-test
c) Permite estudiar la relación que existe entre varias variables
d) Facilita el uso de un grupo de control
12. Una de las desventajas que tiene un diseño comparativo causal es que
a) No permite que se use un grupo de control
b) No permite que se usen estadísticas inferenciales
c) No permite que se confíe mucho en la comprobación de si hay relaciones de causa y
efecto
Ejercicio 11
1. Considere el siguiente ejemplo sugerido por Borg y Gall (1983, p. 160): Un investigador
desea determinar el efecto que tiene un programa especial de lectura sobre el rendimiento
en lectura de los marginados de un barrio pobre. Será un estudio longitudinal que empezará
cuando ingresen al segundo grado y terminará cuando egresen del tercer grado. Identifica a
50 niños que no pueden leer bien al terminar el primer grado. Estos niños reciben el
programa especial. Selecciona aleatoriamente a otros 50 niños en la misma escuela y del
mismo grado, para que sirvan de grupo de control. Administra un test de lectura a ambos
grupos al principio del segundo grado y al final del tercero. Al final hay 27 niños en el
programa especial y 36 en el grupo de control.
Identifique y explique las posibles amenazas a la validez interna del experimento.
2. Indique cinco situaciones en las cuales un pre-test no sería factible.
3. En una investigación, el grupo experimental recibe un nuevo método de instrucción y el

grupo de control recibe un método tradicional. La media del pre-test del grupo
experimental es de 40.2 y de 40.3 la del grupo de control. La media del post-test es d75.6
para el grupo experimental y de 70.7 para el de control. Indique y justifique un test de
significación estadística para esta situación.
4. En una investigación el grupo experimental recibe un nuevo método de instrucción y el

grupo de control recibe un método tradicional. La media del pre-test para el grupo
experimental es de 29.2 y de 40.3 para el grupo de control. La media del post-test es de
69.6 para el grupo experimental y de 70.7 para el control. Indique y justifique un test de
significación estadística para esta situación.
5. Explique la ventaja principal que tiene el diseño de cuatro grupos de Solomon.
6. Explique la desventaja principal que tiene un diseño de serie de tiempo.
7. Explique la desventaja principal que tiene un diseño comparativo causal.
Aplicación 11
Si el problema que se estudia requiere que se lleve a cabo una investigación experimental,
identifique el tipo de diseño que Ud. estima que es conveniente utilizar y dé las razones por
las cuales a Ud. le parece que se debe usar.

MODULO 12
LA INVESTIGACIÓN EVALUATIVA
12.1 ¿Qué es la Investigación Evaluativa?
Se puede adoptar la postura de que la evaluación educativa es un tipo de investigación. Se basa

dicha postura en el hecho de que para realizar evaluaciones se aplican los métodos de
investigación. Con el objeto de aclarar la situación, lo que se pretende hacer a continuación es
considerar algunas de las definiciones tradicionales de la evaluación educativa, relacionarlas
con la investigación educativa y por último comparar más detalladamente la investigación y la
evaluación.
Popham (19.75: 8) indicó que "la evaluación educativa sistemática consiste en una valoración
formal de un fenómeno educativo." Scriven (1975), un filósofo quien es probablemente el
teórico más importante en materia de la evaluación educativa ha recalcado mucho que el
elemento clave de una evaluación es la valoración del mérito. Los calificativos "sistemática" y
"formal" excluyen a las evaluaciones informales que las personas siempre hacen de los
fenómenos u objetos educativos, e implican el uso de los métodos propios de la investigación
educativa.
Stufflebeam (1971) le dio un enfoque un poco distinto a la definición de la evaluación educativa
cuando al describirla como "el proceso dé delinear, obtener y proporcionar información útil
para juzgar alternativas de decisiones." Nilo (1983: 2) sugirió que la evaluación puede
entenderse como "un proceso selectivo de recolección y análisis de información con el
propósito de emitir juicios valorativos que ayuden a tomar decisiones." Considerando que las
definiciones citadas por lo menos implican la necesidad de medir el valor de un objeto
educativo para tomar decisiones, la investigación evaluativa puede definirse como la aplicación
de métodos de investigación con miras a proporcionar la información que se necesita para
evaluar los fenómenos y tomar las decisiones correspondientes. Esta última definición no limita
la evaluación a un método específico, ni a un solo nivel de explicación, ni a un tipo único de
datos.
12.2 Las Diferencias entre la Investigación y la Evaluación
Aunque se puede definir la evaluación educativa como un propósito, y además como un

método de investigación educativa, varios autores han señalado las diferencias entre la
investigación y la evaluación. Es importante señalar que las diferencias entre la investigación y
la evaluación no son siempre estrictas, sino que indican ciertas tendencias. Worthen y Sanders
(1973) presentaron una lista de doce "características de indagación que distinguen a la
evaluación de la investigación":
1) La Motivación del Indagador Tanto el investigador como el evaluador pretenden resolver
problemas. La curiosidad científica es la motivación principal del investigador. El evaluador se
motiva más bien por preocupación.
2) El Objetivo de la Búsqueda La investigación conduce a conclusiones, mientras que la
evaluación generalmente tiene como fin la toma de decisiones.

3) Leyes versus Descripciones El investigador se interesa más en las leyes generales
(teorías), usualmente a través de la relación entre dos o más variables. La evaluación se limita a
la valoración de un objeto específico.
4) El Rol de la Explicación La investigación se preocupa más que la evaluación por explicar
el "por qué" de un fenómeno.
5) La Autonomía de la Indagación El investigador plantea sus propios problemas de
investigación. El evaluador tiene un cliente quien le ha solicitado la realización de una
evaluación.
6) Las Propiedades de los Fenómenos que se Estudian El investigador busca la verdad
científica. El evaluador mide el valor o mérito.
7) La Generalización del Fenómeno que se Estudia El investigador suele tener interés en
generalizar a poblaciones amplias partiendo de muestras. La evaluación a menudo tiene un
propósito mucho más limitado y no se generaliza más allá de la situación propiamente dicha.
8) La Importancia del Valor En la evaluación el valor del objeto es algo de suma im-
portancia. En la investigación el valor del objeto es también importante, pero en menor grado.
9) Las Técnicas Investigativas Aunque algunos expertos han opinado que la investigación y
la evaluación requieren que se apliquen técnicas distintas para recabar y analizar datos, tal vez
la mayoría de ellos hacen hinca pié en el hecho de que las técnicas son las mismas. Si acaso
existe alguna diferencia, ésta es que el investigador, cuando se trata de una investigación
experimental, concentra su atención en el asunto de control.
10) Los Criterios para Juzgar la Actividad La calidad de una investigación se basa en los
juicios que se emitan sobre la validez interna (falta de error) y la validez externa
(generalización). La evaluación se juzga según el grado en que la misma refleja la realidad y de
acuerdo con su credibilidad.
11) La Base Disciplinaria El investigador, quien está en libertad de seleccionar sus propios
problemas, suele trabajar dentro de una sola disciplina. El evaluador debe considerar las
diversas perspectivas de muchas disciplinas, al evaluar un curriculum.
12) El Adiestramiento Se sugiere que el adiestramiento que reciba un investigador
educativo debe fundamentarse en una de las disciplinas tradicionales de las ciencias sociales. El
evaluador debe recibir un adiestramiento que abarque un poco de cada una de varias
disciplinas.
12.3 Los Criterios para Juzgar la Evaluación Educativa
En 1981, un comité conjunto integrado por representantes de nueve organizaciones educativas

en los Estados Unidos de América, bajo la dirección de Daniel Stufflebeam, publicó una lista de
criterios para juzgar la calidad de la investigación evaluativa. Se desarrollaron dichos criterios
por tres razones principales: una conciencia de que la calidad de las evaluaciones no siempre
fue alta; una comprensión del hecho de que algunas evaluaciones se vieron influenciadas por
los motivos ocultos de los evaluadores y un deseo de mejorar, en forma general, el nivel
profesional de las evaluaciones.
Los cuatro criterios principales son:
1) la utilidad
2) la viabilidad
3) la propiedad y
4) la precisión.
A continuación se presenta la lista de los treinta criterios elaborados por el comité aludido y
una explicación breve de cada uno de ellos.
La Utilidad
1. La identificación de los beneficiarios Deben identificarse todas las personas que vayan a
estar afectadas por la evaluación.
2. La credibilidad del evaluador El evaluador debe ser una persona capaz y fidedigna.
3. El alcance y la selección de la información Las preguntas a las cuales responde la
evaluación deben ser pertinentes con respecto a las personas a quienes la misma afectará.
4. La interpretación del valor Las bases para efectuar la interpretación y emitir los juicios de
valor deben describirse claramente.
5. La claridad del informe El informe debe redactarse de forma tal que todos los usuarios
puedan entenderlo fácilmente.
6. La diseminación del informe Los informes de evaluación deben llegar a todas las manos
debidas.
7. El momento oportuno de presentar el informe El informe debe completarse
oportunamente.
8. El impacto de la evaluación Una evaluación debe realizarse de forma tal que motive la
acción de los usuarios.
La Viabilidad
9. Los procedimientos prácticos Los procedimientos que se siguen para realizar una
evaluación deben ser prácticos y no deben interferir demasiado con las actividades de las
personas involucradas.
10. La viabilidad política Es necesario tener la cooperación de todas las personas afectadas
y evitar que cualquier grupo subvierta el proceso de evaluación.
11. La eficacia económica Los beneficios de la evaluación deben justificar el costo del mismo.
La Propiedad
12. La obligación formal Las obligaciones de todos los individuos involucrados en la
evaluación deben aparecer especificados en un documento escrito y firmado.
13. Los conflictos de interés Si surgen conflictos de interés, hay que tratarlos abierta y
honestamente.
14. La divulgación completa y franca Los informes de una evaluación deben ser sinceros y
correctos.
15. El derecho del público a saber El público tiene derecho de saber si eso no causa problemas
legales o éticos,
16. Los derechos que tienen los sujetos humanos Los derechos y el bienestar de las personas
involucradas en una evaluación deben protegerse.
17. Las interacciones humanas Los evaluadores deben respetar el valor y la dignidad de las
personas involucradas en una investigación.
18. Los informes equilibrados Los aspectos positivos y negativos de lo que se evalúa deben
aparecer en el informe.
19. El uso apropiado de los fondos Los gastos de una evaluación deben efectuarse en forma
prudente y responsable.

La Precisión
20. La identificación del objeto Se deben describir todos los aspectos pertinentes de lo que se
evalúa.
21. El análisis del contexto Se deben describir todos los aspectos de las condiciones que
afectan lo que se evalúa.
22. La descripción de los propósitos y los procedimientos Debe mantenerse un registro de
todos los propósitos que tengan y los procedimientos que se empleen.
2 3. Las fuentes de información fidedignas Hay que describir las fuentes de información en
forma tal que sea posible hacer un juicio sobre la exactitud de las mismas.
24. La medición válida Los instrumentos que se utilicen deben tener un nivel adecuado de
validez.
25. La medición confiable Los instrumentos que se utilicen deben tener un nivel adecuado de
confiabilidad.
26. El control sistemático de los datos Hay que tratar de reducir a un mínimo el
error humano al proceder a recabar los datos.
27. El análisis de la información cuantitativa El análisis de los datos cuantitativos debe
realizarse en forma precisa y cabal y dicho análisis debe conducir a una interpretación clara de
la información cuantitativa.
28. El análisis de la información cualitativa El análisis de los datos cualitativos debe realizarse
en forma precisa y cabal y dicho análisis debe conducir a una interpretación clara de la
información cualitativa.
29. Las conclusiones justificadas Las conclusiones de la evaluación deben seguir de los
resultados de un análisis cuidadoso y digno de crédito de los datos.
30. La objetividad del informe El informe debe ser una presentación cabal, sin reflejar la
parcialidad de cualquier grupo de presión.
12.4 Los Objetos de Evaluación
Existen muchos fenómenos educativos que sirven de objetos de la evaluación educativa. Borg y
Gall (1983, p. 742) presentaron una lista "que sugiere el rango de fenómenos educativos que
han sido objeto de la investigación evaluativa:"
1) Los métodos de instrucción (por ejemplo, las presentaciones por parte de los
catedráticos, la enseñanza personalizada, la enseñanza por indagación, el uso de
materiales concretos en la enseñanza de matemática y los métodos no tradicionales de
la enseñanza de lectura)
2) Los materiales curriculares (por ejemplo, los textos, las guías curriculares, los programas
de radio y de televisión)
3) Los programas (por ejemplo, los programas bilingües, los programas de educación no
formal, los programas de capacitación en servicio y preservicio para docentes y los
programas preescolares)
4) Las organizaciones (por ejemplo, las escuelas experimentales, las agencias
internacionales, los departamentos de un ministerio de educación, las escuelas
particulares subvencionadas por el gobierno)
5) Los educadores (por ejemplo, los profesores, los promotores, los directores de escuelas,
los supervisores, los voluntarios)

6) Los estudiantes (por ejemplo, los alumnos párvulos, los alumnos bilingües, los
estudiantes universitarios, los estudiantes que siguen carreras técnicas, los alumnos
superdotados, los alumnos con problemas de aprendizaje o de comportamiento).
La palabra "programa ' se usará a continuación para referirse a todos los posibles objetos de
evaluación.
En la sección 12.5 se presentan algunos modelos de evaluación. Por el momento se indicarán
algunos factores que deben tomarse en cuenta en casi cualquier modelo de evaluación. Para
empezar una evaluación es necesario delinear las características del programa que se va a
evaluar. Aunque éste puede parecer un paso obvio, si no se hace con cuidado es posible que
nos pasen desapercibidos algunos factores importantes. Después de haber identificado las
características del programa, el evaluador tendrá que decidir cuáles de ellas van a considerarse
en la evaluación. Borg y Gall (1983: 741) sugirieron que las características de un programa
pueden clasificarse en cuatro categorías: metas, recursos, procedimientos y control.
Muchas evaluaciones se basan en las metas o los objetivos de un programa. Muchos programas
ya tienen sus objetivos identificados. En otros casos, el evaluador tiene que inferirlos. Si los
objetivos se presentan en forma conductual, facilitan el desarrollo de los instrumentos de
medición. Scriven (1973) ha recalcado que el evaluador no debe conocer de antemano los
objetivos del programa que va a evaluar. Si el evaluador se limita exclusivamente a los
objetivos, es posible que no capte todos los efectos del programa. El mismo .autor sugiere lo
que se llama "la evaluación de los efectos reales" (goal-free evaluation). Aún cuando el
evaluador tenga que medir el logro de los objetivos de un programa, deberá. Considerar otros
efectos que no han sido contemplados dentro de los objetivos.
Entre los posibles recursos con que cuenta un programa se pueden citar: el personal, el
mobiliario y equipo, los materiales, las instalaciones físicas, etc. El evaluador quizás pueda
averiguar si los recursos son adecuados para lograr los objetivos, si el costo del programa es
razonable y si existen costos no previstos. Existen métodos sofisticados para evaluar el uso de
los recursos, tales como la evaluación de costo/beneficio y de costo/efectividad. Tales
evaluaciones generalmente son realizadas por economistas.
Los procedimientos de un programa consisten en los métodos, las técnicas, las estrategias y
demás procesos que se utilizan en el programa. El evaluador, si observa un programa varias
veces durante su desarrollo, puede tratar de determinar algo acerca de la eficacia y la eficiencia
de los métodos instruccionales que se han utilizado en un programa.
Una evaluación de los recursos y procedimientos es sumamente importante si un programa no
logra alcanzar sus objetivos. En tales casos el evaluador debe averiguar si se contó con todos los
recursos oportunamente y en forma suficiente y si los procedimientos fueron aplicados
debidamente.
Todo programa necesita una forma de control. Puede ser algo sencillo como los tests que los
alumnos pueden auto administrarse para determinar si se han logrado los objetivos de un
conjunto de materiales curriculares, o algo tan complejo como un sistema de control para
administrar los recursos y procedimientos de un programa. Se puede evaluar la funcionalidad
del control en términos de los recursos y procedimientos, o con relación a los objetivos del
programa.

12.5 Los Modelos o Tipos de Evaluación
Existen varios modelos para realizar evaluaciones educativas. Hay ciertos modelos que pueden
considerarse opuestos a otros modelos, mientras que hay algunos que traspasan los linderos de
tos demás.
La evaluación del individuo versus la evaluación de programas
La evaluación del individuo tal vez sea el tipo de evaluación más común. En ella generalmente
usan tests para comparar la inteligencia o el rendimiento de un individuo con las normas de un
grupo o con criterios especificados. Actualmente, en muchos lugares se pone énfasis en la
evaluación de la eficiencia y la eficacia del personal docente y administrativo de planteles
educativos. Para este propósito se han desarrollado varios tipos de cuestionarios.
En la evaluación de programas, por supuesto, se considera la información en torno a individuos,

teniendo el propósito de tomar decisiones sobre el programa propiamente dicho, en vez de
tomarlas acerca de cada individuo. Los tipos de evaluación que se consideran a continuación
tienen que ver con la evaluación de programas.
La evaluación formativa versus la evaluación sumativa

La evaluación formativa es la acumulación de información durante la implementación de un
programa para mejorar el mismo durante su desarrollo. Se realiza una evaluación sumativa
después de que un programa ha evolucionado. Los resultados de una evaluación sumativa
sirven principalmente para decidir si se adopta o se continúa operando un programa.
La evaluación formativa y la sumativa pueden diferenciarse en otros aspectos. La formativa
generalmente la lleva a cabo una persona que trabaja en el programa, mientras que la sumativa
debe encargarse un evaluador externo. La formativa depende más de la observación, los
cuestionarios, las entrevistas y los instrumentos informales en vez de depender de los
instrumentos estandarizados que se usan en la evaluación sumativa, en la cual la confiabilidad y
la validez constituyen una preocupación más seria. Además, en la sumativa se le da más
consideración al control experimental.
La evaluación por objetivos versus la evaluación de los efectos reales
Durante los años cuarenta, Ralph Tyler tuvo una influencia significativa en la evaluación
curricular que todavía se hace notar. Tyler insistió en que el currículo debía organizarse según
objetivos específicos y que el éxito de un programa debía medirse según la medida en que se
hayan logrado dichos objetivos. Muchos de los modelos modernos para realizar evaluaciones se
basan en los objetivos del programa.

En la sección 12.4 ya se mencionó que Scriven ha sugerido que tal vez sea mejor que el
evaluador haga caso omiso de los objetivos y trate de averiguar los efectos reales de un
programa.
El modelo CIPP
El modelo CIPP fue desarrollado por Daniel Stufflebeam y sus colegas para ayudar en el proceso
de la toma de decisiones en torno a los programas. CIPP es una sigla que indica los
componentes del modelo: la evaluación del Contexto, la evaluación de los Insumos, la
evaluación de los Procesos y la evaluación de los Productos.
La evaluación del Contexto empieza con el análisis de las necesidades en una situación
educativa. Es decir, ella constituye un intento de averiguar cuáles son las diferencias entre las
condiciones actuales y las condiciones que se desean. Después de haber identificado las
necesidades, se hace necesario desarrollar objetivos que indiquen cómo satisfacer dichas
necesidades.
La evaluación de los Insumos pretende identificar los recursos y las estrategias que hay
disponibles para alcanzar los objetivos del programa. Además de identificar la disponibilidad de
los recursos y las estrategias, el evaluador de Insumos tiene que considerar si el uso de los
mismos resultará factible dada la realidad de la situación.
La evaluación de los Procesos es muy parecida a la evaluación formativa. Se necesita

implementar una forma de recabar los datos relativos a la operación del proyecto que facilite la
toma de decisiones con respecto a posibles cambios.
La evaluación de los Productos puede considerarse como una evaluación sumativa. La misma
proporciona medidas del logro de los objetivos que quizás faciliten la toma de decisiones con
respecto a la continuación y a la modificación del programa.
La evaluación responsiva
En la evaluación responsiva se intenta identificar algunos de los intereses y las preocupaciones
que tienen las personas que han sido afectadas por un programa, los cuales suelen escapar a
una evaluación basada en objetivos:
1) ¿Son realmente importantes y aceptados los objetivos?
2) ¿Cuáles son los intereses y las influencias ocultas que varios individuos y grupos tienen
con respecto al programa?
3) ¿Cabe la posibilidad de que una evaluación formal sea más perjudicial que beneficiosa?
4) ¿Cómo es posible trabajar eficazmente con las personas involucradas en el programa?
Los métodos que utiliza un evaluador responsivo tienden a ser más informales y subjetivos que
los métodos tradicionales. El primer paso de una evaluación responsiva es la identificación de
las personas afectadas por la evaluación e interesadas en ella y de los factores políticos que
entrarán en juego al realizar la evaluación. El segundo paso es la identificación de. Los

intereses, las preocupaciones y los valores de las personas que identifiquen en el primer paso.
El uso de entrevistas v cuestionarios puede ayudar mucho. El tercer paso es la recabación de
datos relacionados con los intereses, las preocupaciones y los valores que identifiquen en el
segundo paso. Además de entrevistas y cuestionarios, la observación Naturalística y el uso de
test pueden facilitar este paso. El último paso es la redacción de un informe final que contenga
recomendaciones. El informe suele ser de una forma más narrativa de la que se emplea en un
informe tradicional.
La evaluación de contradicción
La evaluación de contradicción se modela a manera de un tribunal. Un equipo de evaluadores
desempeña el papel del 'abogado defensor" y otro equipo el de "fiscal acusador". Los
"abogados" tratan de demostrar que el programa ha sido un éxito y destacan sus hallazgos
positivos. Los "fiscales" indican las fallas y los problemas que ha tenido el programa. Después
de recabar los datos pertinentes y preparar sus presentaciones, se efectúa una audiencia. Las
personas encargadas de la toma de decisiones sobre el programa hacen las veces de "juez".
Aunque este es un proceso interesante que asegura que se presenten varios puntos de vista y
hayan varias fuentes de datos, tiene dos posibles desventajas: requiere de mucho tiempo y
dinero y si uno de los equipos es más capaz que el otro, los "jueces" pueden tomar una decisión
inadecuada.

Bibliografia 12
Borg, Walter R. y Gall, Meredith D. Educational Research: An Introduction, NewYork:

Longman, 1983.
GAY, L. R. Educational Research: Competencies for Analysis and Application, Columbus, Ohio:
Charles E. Merril Publishing, 1981.
Joint Commitree on Standards for Educational Evaluation. Standards for Evaluations of

Educational Programs, Projects, and Materials, New York: McGraw-Hill, 1981.
1980.
Morris, Lynn; Fitz-Gibbon, Carol; y Hener-son, Marlene. Program Evaluation Kit,Beverly Hills:
Sage, 1978.
Nilo, Sergio. "La Evaluación de los Aspectos Cualitativos en los Proyectos de Sector
Educación", Washington: Organización de Estados Americanos, 1983.
Popham, W. James. Educational Evaluation, Englewood Cliffs, New Jersey: Prentice-Hall,1975.'
Scriven, Michael. "Goal-Free Evaluation", en School Evaluation: The Politics and Process, ed.
Ernest House, Berkeley.- McCut-chan, 197 3.
Stufflebeam, Daniel L. Educational Evaluation and Decisión, Itasca, Illinois: F. E. Peacock,
1971.
Test de Selección múltiple 12
1. La evaluación educativa es
a) Útil en la toma de decisiones educativas
b) Una valoración formal de un fenómeno educativo
c) Un tipo de investigación educativa
2. Una investigación suele diferir de una evaluación en

a) El objetivo de la búsqueda
b) La autonomía para realizar la indagación

c) La generalización del fenómeno que se estudio
3. Una evaluación que se realiza mientras un programa se está desarrollando es una evaluación
a) Formativa
b) Sumativa
c) De los efectos reales
d) De contradicción
4. ¿Cuál de los siguientes fenómenos puede ser un objeto de evaluación?

a) Un método de instrucción
b) Un grupo de educadores
c) Una organización
5. ¿Con quién se asocia la investigación de los efectos reales?

a) Popham
b) Scriven
c) Stufflebeam
d) Tyler
6. Una evaluación de los efectos reales

a) Se concentra en objetivos conductuales en vez de hacer hincapié en las
metas generales
b) Se basa en los objetivos de un programa
c) Se realiza sin consideración de los objetivos específicos del programa
7. Una evaluación de contradicción usa

a) El testimonio de varios individuos
b) Los puntos de vista positivos y negativos con respecto a un programa
c) Varias fuentes de información
d) Todas las respuestas son correctas
8. La investigación responsiva
a) Demanda mucho control experimental
b) Se concentra mucho en los intereses y las preocupaciones de las personas
afectadas por la investigación
c) Ofrece un método muy objetivo
9. El modelo CIPP enfatiza

a) Los intereses y las preocupa ciones de las personas afectadas por la
evaluación
b) La presentación de dos puntos de vista opuestos

c) Que una evaluación debe apoyar la toma de decisiones con respecto a los
programa
10. En comparación con la eval uación formativa, la sumativa
a) Ejerce más control experimental
b) La realiza una persona ajena al desarrollo del programa
c) Usa instrumentos más formales
Ejercicio 12
1. Explique en sus propias palabras las semejanzas y las diferencias que hay
entre la investigación y la evaluación.
2. En la sección 12.3 se presentaron algunos criterios que han sido

desarrollados en los Estados Unidos de América para juzgar la evaluación
educativa. ¿Sirven a tal o cual en la América Latina ? Si su respuesta es
afirmativa, justifíquela. Si su respuesta es negativa, sugiera algunas
modificaciones que le parezcan necesarias.
3. Seleccione un tipo de escuela. ¿Qué evaluaría Ud. de esa escuela?
4. Seleccione un tipo de escuela. Identifique a las personas y a los grupos que

consultaría para realizar una evaluación responsiva de esa escuela.
Aplicación 12
Si el problema que Ud. está investigando requiere que se lleve a cabo una
investigación evaluativa, identifique el tipo de evaluación
Que Ud. estima conveniente que se realice y diseñe la evaluación.

MODULO 13
EL INFORME DE UNA INVESTIGACIÓN O EVALUACIÓN EDUCATIVA
13 .1 El Propósito de Elaborar un Informe
Como explicó Pérez Álvarez (1978, p. 148): "Nadie investiga para sí mismo, se
investiga para los demás, para todos'. Un informe debe comunicar en forma
clara y precisa los pasos que el investigador realizó para resolver su problema
de investigación. La investigación educativa es un proceso acumulativo. Es el
informe el que permite que los demás investigadores puedan replicar y
extender los resultados obtenidos por sus colegas. Es decir, mediante la
elaboración del informe, el investigador puede contribuir a aumentar los
conocimientos sobre el proceso educativo. También es a través de un informe
que un investigador puede influir en la práctica educativa y en la toma de
decisiones sobre el avance de la educación.
Se puede considerar que toda investigación tiene tres etapas fundamentales:
1) La planificación
2) La realización y
3) La elaboración de un informe.
Cada una de esas etapas requiere que se tengan distintas aptitudes. Tal vez
haya la tendencia de hacer énfasis en la segunda etapa. Sin embargo, las otras
dos son sumamente importantes también. En el Módulo 2 se destacó lo
importante que es la planificación, etapa en la cual se elabora el plan de la
investigación. En el presente módulo se presentaran algunas consideraciones
que facilitan la elaboración de un informe. El investigador tendrá que elaborar
un informe que sea aprop iado para los propósitos de la investigación y de los
destinatarios. Habrá de seguir un esquema y un formato que faciliten la
presentación de la información.
Hay otro aspecto importante que considerar al redactar un informe, el cual
queda fuera del alcance del presente módulo. El mismo tiene que ver como las
cuestiones de estilo general, tales como: la ortografía y la gramática correcta,
las oraciones completas y los párrafos bien organizados, la claridad y la
precisión de lenguaje y una secuencia coherente .
13.2 Los Tipos de Informe

Existen varios tipos de informe según el propósito y los destinatarios de la
investigación o evaluación educativa. Entre los tipos más comunes se
encuentran los siguientes:
1) Las tesis y las disertaciones (los trabajos de graduaci ón)
2) Los informes a organizaciones
3) Los artículos que se publican en revistas profesionales
4) Las exposiciones ante reuniones profesionales
5) Los informes sumarios y
6) Los informes formativos.
Las tesis y las disertaciones

Tal vez la mayoría de las investigaciones educativas se realicen como requisitos
para graduarse de las universidades o de las escuelas normales. La institución
misma debe proporcionar una guía que explique el esquema y el formato que
exige la institución. En general, las tesis y la s disertaciones son más largas y
detalladas que los otros tipos de informe.
Informes a organizaciones
Si una organización nacional o internacional provee respaldo financiero para
una investigación, generalmente exige que se le presente un informe final.
Tales organizaciones suelen tener pautas a seguir en la preparación del
informe. También suelen encargarse de la publicación y diseminación del
informe.
Los artículos de revistas

En Latinoamérica existen varias revistas que publican investigaciones
educativas. Entre ellas se encuentran La Revista Latinoamericana del centro de
Estudios Educativos (México), La Educación: Revista Interamericana de
Desarrollo Educativo (O.E.A.), La Revista de Ciencia de la Educación
(Argentina), Acción y Reflexión Educativa (Panamá). En muchos países el
Ministerio de Educación pública por lo menos una revista. Aunque en general el
propósito principal de las publicaciones de esa índole no es diseminar las
investigaciones, sí están dispuestas a publicar informes de investigació n, si los
mismos son de interés general para los profesores del país. Varios institutos de
investigación educativa, afiliados a universidades y a organizaciones
internacionales, publican su propia revista. Muchas revistas presentan en la
contraportada las condiciones que exigen para elaborar informes.
Las exposiciones ante reuniones profesionales

En los últimos años se han realizado reuniones o conferencias de investigación
educativa en varios países, muchas veces con el patrocinio de organizaciones
internacionales. Para recibir una invitación para hacer una presentación en una
de esas reuniones generalmente hace falta ser muy activo en la vida
profesional de la comunidad educativa del propio país.
Los informes sumarios
Los informes sumarios de evaluacione s educativas pueden ser muy importantes
porque sirven de base para tomar decisiones concernientes al futuro de un
programa. Generalmente, los mismos siguen las normas establecidas por el
Ministerio de Educación o por la organización internacional que ha pe dido el
informe.
Los informes formativos

Los informes de evaluación formad va se presentan mientras está
evolucionando un programa. Suelen ser menos formales que un informe
sumario, e incluso a veces se dan solamente en forma oral. Hay dos tipos
principales de informes formativos: El informe de ejecución que indica si se
cuentan con las condiciones necesarias para ejecutar oportunamente las
etapas de un programa y el informe de progreso que periódicamente
proporciona información sobre el logro de las metas u objetivos de un
programa.
13.3 Esquema de un Informe
Aunque varias instituciones y publicaciones pueden exigir que se sigan

esquemas distintos, en general la mayoría de ellos son muy semejantes. El
esquema que se presenta a continuación es muy semejante el plan de
investigación que se presentó en el Módulo 2. Se ha suprimido la sección del
Marco Metodológico, la subsec ción 1II-F del Análisis Estadístico se ha
convertido en una sección completa de resultados y se ha agregado una sección
de resumen y discusión. Si se tratara de una tesis, las secciones pueden servir
de capítulos. En un artículo para una revista lo que se presenta en cada sección
suele ser mucho más breve que lo que se presenta en una tesis.
La Sección Preliminar
1. La Carátula
2. Los Agradecimientos (si acaso los hay)
3. La Tabla de Contenidos
4. La Lista de Tablas (si acaso las hay)
5. La Lista de Figuras (si acaso las hay)
A. Los Antecedentes del Problema
B. La Importancia del Problema
C. El Planteamiento del Problema
D. El Alcance y los Límites del Problema

A. Las Hipótesis (o los Objetivos)
B. Las Variables

C. Los Sujetos
D. Los Instrumentos
E. El Diseño y los Procedimientos de Investigación
IV. Los Resultados

A. Los Procedimientos Estadísticos
B. Una Descripción de los Resultados Relacionados con cada Hipótesis
(u Objetivo)
C. Otros Resultados
V. El Resumen y una Discusión

A. Un Resumen
B. Las Conclusiones
C. Las Recomendaciones
Las Referencias y los Apéndices
Las secciones I, II y III del informe final generalmente se parecen mucho a las
del plan inicial. A veces hay que hacer modificaciones debido a los cambios que
ocasionó la prueba piloto o a los que surgieron durante la realización de la
investigación. El resumen de la literatura relacionada al problema que se
incluye en la subsección de "Los Antecedentes del Problema'' debe ampliarse.
En los Estados Unidos "El Marco Teórico" suele presentarse como una
subsección de "Los Supuestos" en la sección de "El Marco Conceptual" y el
segundo capítulo se dedica a un resumen de la literatura respectiva.
Para obtener mayor información sobre las secciones I, II y III, el lector puede
releer el Módulo 2. A continuación se presentan algunos detalles sobre las
demás secciones.
La Sección Preliminar
La universidad, organización o revista a la cual se dirige el informe debe
proporcionar información sobre el formato de la carátula, los agradecimientos,
la tabla de contenidos y las listas de figuras. Si se trata de un artículo para una
revista, la sección preliminar generalmente se limita al título, al nombre del
autor, y tal vez, al puesto que desempeña este último.
La parte más importante de la carátula es el título de la investigación. El título
debe ser breve, pero a la vez debe proporcionar suficiente información
específica que le permita, a cualquier persona que lo lea, decidir si el tema
está relacionado con su área de interés. Por ejemplo, un títul o como "Un
Experimento que Compara un Método Deductivo e Inductivo con la Matemática
del Quinto Grado" tiene una longitud' razonable y proporciona alguna
información sobre el propósito de la investigación. Un título como "La
Enseñanza de la Matemática" es muy vago. Por el contrario, algo como "Un
Estudio de las Diferencias en Rendimiento Escolar de los Alumnos de Quinto
Grado del Nivel Primario Utilizando un Método Deductivo o un Método
Inductivo" es demasiado largo y tiene demasiada información superflua.

En la subsección de agradecimientos cabe mencionar a aquellas personas que
han ayudado al investigador en la realización de su trabajo. Se les puede dar
reconocimiento a los profesores, los colegas, las secretarias, los jefes y los
miembros de la familia q ue hayan hecho un aporte especial al trabajo de
investigación.
Una tabla de contenido es importante si se trata de un informe largo, como lo
es una tesis. La misma puede ser similar al bosquejo que se presentó al
principio de esta sección e incluir también , los números correspondientes a
cada página. Cada renglón de la tabla de contenido debe tener, hasta donde
sea posible, la misma forma gramatical.
Los Resultados
Se presentan los resultados para comprobar las hipótesis o para lograr los
objetivos. Por lo tanto es una buena idea organizar los resultados con relación
a las hipótesis o los objetivos. Debe indicarse cuáles instrumentos estadísti cos
se utilizaron, dando una justificación para haber empleado los mismos. Es
decir, hay que indicar el "cómo" y el "por qué" del análisis estadístico.
Si se ha aplicado un test estadístico para comprobar una hipótesis, el
investigador tendrá que tener cuidado con el lenguaje que emplee en el
informe. Un test estadístico no puede probar una hipótesis en un sentido
estricto. Solamente puede servir para comprobarlas, en el sentido que la
respalda. Aunque la diferencia en el lenguaje parece mínima, si el investigador
afirma que probó la hipótesis estará exagerando un poco lo que realmente ha
logrado.
Borg y Gall (1983, p. 8 69) sugirieron los siguientes pasos para organizar y
presentar los resultados:
1. Tabular los datos.
2. Estudiar las tablas cuidadosamente.
3. Notar los resultados importantes.
4. Usar las tablas como una base de organización.
5. Redactar el texto.
En la sección 8.3 se i ncluyeron varias técnicas para desarrollar tablas y gráficas
para presentar los datos. En el texto mismo, después de cada tabla o gráfica, el
investigador debe destacar los resultados importantes. No es necesario que
repita en el texto toda la información que ya se ha presentado en una tabla o
gráfica. Cada tabla y cada gráfica debe contener la información necesaria para
poder interpretarlas, como por ejemplo, el tipo de estadísticas, una descripción
de cada variable y el número de sujetos.
A veces, durante la realización del análisis estadístico, surge algún otro análisis
posible, que no se había previsto. El investigador puede proceder a realizar tal
análisis e incluir en él los resultados suplementarios que obtenga.
El Resumen y una Discusión

Esta sección debe comenzar con un breve resumen del problema, la
metodología y los resultados. Tal vez sean dos razones por las cuales se incluye

un resumen semejante en una tesis. En primer lugar, puede ayudar al lector a
formarse una idea acertada del pr opósito de la investigación, antes de leer los
resultados. En segundo lugar, hay personas que leen este último capítulo,
primero, a fin de determinar si es de suficiente interés para ellas y si tiene
suficiente relevancia personal como para leer todo el in forme.
La tarea más importante de esta sección es la de identificación e interpretación

de los resultados más notables. Las conclusiones deben referirse a las hipótesis
y al problema. Deben basarse estrictamente en los datos que se han recabado.
Siempre que sea posible, es aconsejable relacionar las conclusiones con una
teoría y con la literatura relacionada con el problema de investigación. En este
punto, deben reevaluarse los límites y alcances del problema. Deben discutirse
las dificultades metodológica s que surgieron durante la investigación. Si a
pesar de la evidencia que se presenta, al investigador le parece que sus
resultados son erróneos, deberá exponer las posibles fallas metodológicas que
causaron los errores.
Redactar las conclusiones de una for ma objetiva y científica, no es una tarea
fácil. Si los resultados son importantes, pero su interpretación es muy
deficiente, el investigador no va a aportar al avance de la educación todo lo
que le corresponde.
Suele suceder que los resultados de una inve stigación sugieren posibles
aplicaciones o recomendaciones para la realización de otras investigaciones.
Esas sugerencias y recomendaciones, aunque sean apropiadas, deben separarse
de las conclusiones.
Las Referencias y los Apéndices

La sección de referen cias debe incluir por lo menos cada obra que haya citado
en el informe. Algunos autores también incluyen cada obra que han consultado,
aún las que no han citado específicamente. Es más apropiado usar el término
"referencias" cuando solamente se incluyen la s obras que se han citado. Si se
incluyen todas las obras que se consultaron, entonces puede llamársele a la
sección "bibliografía".
Cada universidad debe tener normas en cuanto a la preparación de las citas
bibliográficas de una tesis. Si se trata de un a rtículo para una revista, se
pueden examinar los artículos que aparecen en uno de los ejemplares de la
misma, a fin de averiguar la forma bibliográfica que se ha usado en ellos. En la
siguiente sección se presentarán algunas normas específicas eme se puede n
seguir para preparar citas bibliográficas. Una norma general es que debe haber
consistencia en las mismas. Por consiguiente el investigador debe escoger la
forma que va a usar, cuando inicia la in vestigación y usarla consistentemente.
En los apéndices e l investigador puede incluir aquellos documentos
relacionados con la investigación que sean de interés para algunos lectores,
pero que no son necesarios para entender el informe. En los apéndices suelen
incluirse tablas largas o complementarias; detalles s obre los métodos
estadísticos que se utilizaron; los cuestionarios, las guías de entrevista y los

tests que ha desarrollado el investigador, los materiales didácticos que fueron
elaborados para realizar la investigación, los resultados de una prueba piloto,
las hojas de salida (print outs) de las computadoras, etc.
13.4 La Escritura a Máquina del Informe
La escritura a máquina del informe debe corresponder a las normas que hayan
establecido la universidad, la organización o la revista correspondiente. No es
difícil encontrar algunos manuales o guías para la elaboración de trabajos
académicos, los cuales pro porcionan las normas relacionadas con el formato
que ha de seguir un informe. Una lista de algunos formatos aparece al final de
este modulo.
A continuación se presentan algunas normas que son más o menos estándares y
que pueden servir en los casos en que no se dispone de una guía para presentar
informes. Debe tener presente que, en cualquiera de los casos, la consistencia
es la norma más importante.
Tipografía
Se recomienda más el uso del tipo pica que tiene diez caracteres por pulgada.
En la mayoría de los casos, se usa doble espacio, dejando triple espacio entre
los párrafos. El tipo debe estar limpio y la cinta en buenas condiciones.
Márgenes
Se puede fijar el margen derecho a 10 espacios (1 pulgada), el margen
izquierdo a 15 espacios (1.5 pulgadas) y el margen superior y el inferior de 6
líneas (1 pulgada). Véase la Figura 13.4.1. La primera página de un capítulo, o
de un informe corto debe tener un margen superior de 9 líneas (1.5 pulgadas).
Sangría
Las distintas fuentes indican que cada párrafo debe comenzar con una sangría
entre cinco y ocho espacios. Es
necesario seleccionar una
sangría entre cinco y ocho espacios
y usarla
consistentemente.
Figura 13.4.1

Citas directas
Las citas directas deben encerrarse entre comillas, si son de menos de cinco
líneas. Si constan de más de cinco líneas, deben separarse del texto y escribirse
a espacio sencillo con una sangría de cinco espacios y sin comillas. El
investigador debe darle reconocimiento al autor de la cita incluyendo su
nombre, el año de publicación de su obra o su artículo y si corresponde, el (los)
número (s) de página. En esta forma se evita el uso engorroso de notas del pie
de página. Esta forma puede usarse también con las citas -paráfrasis. A
continuación se presentan dos ejemplo s:
Según Chávez (1979, p. 34): "Todos los egresados del programa encontraron
trabajo."
Los egresados de la universidad no tienen dificultad en encontrar algún empleo

porque "siempre pueden encontrar empleo mandando fuera del mercado a
quienes tienen menos preparación educativa (de Moura, 1979, p. 40).
Escotet (1978) ha indicado los factores adversos para el desarrollo de una

universidad abierta en América Latina.
Encabezamientos
Si el informe está dividido en capítulos, cada uno de ellos debe llevar un título
centrado, escrito a mayúscula cerrada. El título de un informe corto debe ser
presentado en la misma forma. Sin un informe necesita varios
encabezamientos, éstos deben presentarse de la siguiente manera.
Subtítulo de Primer Orden Centrado y Subrayado
Subtítulo de Segundo Orden Subrayado
Subtítulo de Tercer Orden (de Párrafo) Subra yado

Si un subtítulo de primer orden es muy largo, puede dividirse. En dos o más
renglones, a espacio simple, en forma de pirámide invertida. El subtitulo de
segundo orden se comienza junto al margen izquierdo. Si ocupa más de un
renglón, cada uno de ellos debe comenzar junto al margen izquierdo. Un
subtítulo de tercer orden lleva sangría y el texto se continúa en la misma línea.
Referencias
Ya se mencionó en la sección anterior que un informe debe incluir las
referencias que se han citado en una sección intitulada "Referencias", y que si
se incluyen las obras que se han consultado, puede llamarse bibliografía. La
mayoría de los manuales para la redacción de informes tienen muchos detalles
sobre la forma de presentar las citas bibliográficas. A continuació n se
presentan algunas normas que sirven en casos sencillos.
En el caso de libros, hay que indicar el autor, el título completo del mismo, el
lugar y la fecha de publicación. Por ejemplo,
Pérez, Santos. Cómo Presentar un Trabajo Académico, Guatemala: Editorial

Académica Centroamericana, 1980.
Si una cita lleva más de una línea, las líneas que siguen deben llevar una
sangría de tres espacios.
Las citas para los artículos de revistas deben incluir el nombre del autor, el
título completo del mismo, el nombre de la revista, el volumen y número, la
fecha de publicación y la (s) página (s) correspondiente (s). Por ejemplo:
Pescador, José Ángel. "El Efecto Redistributivo del Gasto en Educación Superior
en México," Revista del Centro de Estudios Educativos , vol. VII, no. 3, 1977,
pp. 57-78.
La cita de una tesis es más sencilla. Consta del nombre del autor, el título
completo de la misma, entre paréntesis el propósito de la tesis, el nombre de la
institución y la fecha. Por ejemplo:
Obregón, Jorge. La Correlación entre Actitudes y Rendimiento Matemático con

Alumnos de Sexto Grado , Universidad de San Patricio, 1983.

Bibliografía 13
Acosta Hoyos, Luis Eduardo. Guía Práctica para la Investigación y Redacción de Inmes,
Buenos Aires: Biblioteca del Educador Contemporáneo, 1975.
American Psychological Association. Publication Manual, Washington: The association, 1974.
Asti Vera, Armando. Metodología de la Investigación, Buenos Aires: Kapelusz, 1973.
Azafeifa, Isaac Felipe. Guía para la Investigación y Desarrollo de un Tema, San José: Editorial
Universidad de Costa Rica, 1979.
Borg, Walter R. y Gall, Meredith D. Educational Research: An Introduction, New York. Longman,
1983.
Carreño Huerta, Fernando. La Investigación Bibliográfica: Breve Guía para la Confección de
Trabajos Escritos, México, Grijalbo, 1975.
Comes, Prudenci. Técnicas de Expresión, Barcelona: CikosTau, 1974.
Linton, Marigold. Manual Simplificado de Estilo, México: Trillas, 1978.
Pardinas, Felipe. Metodología y Técnicas de Investigación en Ciencias Sociales, México. Siglo
XXI, 1970.
Standop, Ewald. Cómo Preparar Monografías e Informes, Buenos Aires: Kapelusz, 1976.
Para cada uno de los siguientes ítemes sub raye la respuesta más apropiada.
1. ¿Cuál de los siguientes tipos de informe suele ser más largo y detallado?
a) un artículo de revista

b) un informe formativo
c) un informe para una organización
d) una tesis o disertación
2. Generalmente el esquema de un informe final difiere del esquema de un plan

de investigación
a) en el marco metodológico
b) en que se le agrega una sección de resultados
c) en el marco teórico
3. El título de un informe debe

a) proporcionar suficiente información para identificar el área de interés
b) indicar la hipótesis
c) indicar el diseño de investigación
4. Si el investigador ha tenido resultados positivos, dichos resultados
a) prueban la hipótesis de la investigación
b) verifican la hipótesis de la investigación
c) apoyan la hipótesis de la investigación
5. La sección de resultados se relaciona más con

a) el problema
b) las hipótesis o los objetivos
c) las muestras
d) el marco teórico

APÉNDICE A
LAS RESPUESTAS DE LOS TESTS DE SELECCIÓN MÚLTIPLE
1b 2c 3c 4a 5d 6d 7d 8c 9d 10ª

1b 2d 3d 4b • 5d 6c 7d

1e 2d 3c 4d 5ª

1c 2d 3c 4b 5b 6b 7c 8a 9c 10b
Test de Selección Múltiple

5l e 2d 3b 4a 5d 6a 7b 8b 9d 10c
1b 2a 3d 4c 5b 6c 7d 8c 9a 10c
Id 2c 3c 4c 5b 6d 7a 8d 9d 10a
1 a 2a 3d 4a 5d 6c 7c 8ª 9d 10c 1d 12b
13d 14a 15b 16c 17b 18d 19b 20b
I b 2a 3a 4b 5c 6b 7c 8b 9d 10a
1a 2c 3d 4c 5b 6d 7b 8d 9b 10a
l e 2b 3a 4b 5d 6c 7d 8b 9c 10c 11c 12c
Id 2d 3a 4d 5 b 6c 7d 8b 9c lOd

1d 2b 3a 4c 5b
APÉNDICE B
GLOSARIO
CEE: Centro de Estudios Educativos (México).
CENSO: Es la enumeración compleja de todos los elementos de una POBLACIÓN.
CIDE: Centro de Investigación y Desarrollo de la Educación (Chile).
COEFICIENTE DE CORRELACIÓN : Simplemente indica una relación o asociación
que hay entre dos o más variables.
CONFIABILIDAD: Existe cuando se obtienen los mismos resultados cada vez que
se administra un test.
CONSTRUCTO: Es un concepto psicológico que no se puede observar
directamente y, por lo tanto, se infiere de efectos observables de la conducta.
CONTAMINACIÓN DEL EXPERIMENTADOR: Es la influencia que ejercen los
conocimientos previos que el experimentador tiene de los sujetos que van a
participar en una investigación.
CONTAMINACIÓN ESTADÍSTICA : Puede presentarse cuando los sujetos del
GRUPO DE CONTROL llegan a estar en contacto con los sujetos del GRUPO
EXPERIMENTAL.
CORRELACIÓN: Es una manera de conseguir información sobre la relación que
hay entre dos o más variables.
CUADRO DE MUESTREO : Es una lista que contiene los elementos que integran
la POBLACIÓN.
CURVA NORMAL: El polígono de frecuencias de una distribución normal. Tiene
la forma simétrica de una campana, donde la mayoría de los puntajes se
agrupan cerca de la media.
DATOS DEL NIVEL DE RAZÓN : Tienen todas las características de los datos del
nivel ordinal, además de ser iguales las distancias entre las unidades.
DATOS DEL NIVEL NOMINAL : Involucran un proceso de nombrar en vez del de
medir. Se trata de basar la asignación de números solamente en la clasificación
de las observaciones.
DATOS DEL NIVEL ORDINAL : Implican un orden de personas u objetos. Dan la
posición relativa de los datos con respecto a los otros datos de su m i m o
conjunto.
DATOS DEL NIVEL DE RAZÓN: Es posible que se refieran los unos a los otros
como múltiplos o razones. Dichas mediciones tiene n lo que se llama un cero
absoluto.
DEDUCCIÓN: Es un método de llegar a conclusiones partiendo de
generalizaciones. Fue desarrollado por Aristóteles.
DISEÑO COMPARATIVO CAUSAL : Es un diseño que pretende determinar la razón
para que exista una diferencia en tre grupos de individuos. También es
conocido como un DISEÑO EXPOS FACTO.
DISEÑO CONTRABALANCEADO : Es un diseño cuasi -experimental en el cual todos
los grupos reciben los mismos tratamientos, pero en un orden distinto,
aplicándose un post -test después de cada tratamiento.
DISEÑO CORRELACIÓNAL: Es un diseño para determinar si existe, y hasta qué
grado, una relación entre dos o más variables.
DISEÑO DE CUATRO GRUPOS DE SOLOMON : Un diseño experimental con cuatro
grupos formados aleatoriamente. Dos grupos rec iben un pre-test y los otros
dos no. Uno de los grupos recibe un tratamiento experimental, el mismo que
recibe uno de los grupos que no recibe el pre -test. Los cuatro grupos reciben
un post-test.
DISEÑO DE GRUPO DE CONTROL NO EQUIVALENTE: Un diseño cuasi -
experimental con por lo menos dos grupos, ambos reciben un pre -test, uno
recibe un tratamiento experimental y ambos reciben un post -test.
DISEÑO DE PRE-TEST POST-TEST CON UN GRUPO DE CONTROL : Es un diseño
experimental con por lo menos dos grupos seleccionados aleatoriamente.
Ambos grupos reciben un pre -test, un grupo recibe un tratamiento especial y
ambos reciben un post -test.
DISEÑO DE SERIE DE TIEMPO : Es un diseño cuasi -experimental que aplica un
pre-test varias veces, luego un tratamient o experimental seguido por varios
post-tests.
DISEÑO DE SOLO UN POST -TEST CONUN GRUPO DE CONTROL : Un diseño
experimental con por lo menos dos grupos seleccionados aleatoriamente. Un
grupo recibe un tratamiento experimental y ambos grupos reciben un post-test.
DISEÑO EX POS FACTO : (véase DISEÑO COMPARATIVO CAUSAL).
DESVIACIÓN ESTÁNDAR: Puede considerarse como un promedio de las
distancias a que los datos están de la media. También es conocida como
DESVIACIÓN TÍPICA.
DESVIACIÓN TÍPICA : (véase DESVIACIÓNESTÁNDAR).
DIFERENCIAL SEMÁNTICO : Es una escala de actitudes que pide que un individuo
responda hacia algo, según un conjunto de adjetivos bipolares. También es
conocido como una ESCALA DE OSGOOD. DEFINICIÓN OPERACIONAL DE
VARIABLES: Son definiciones esp eciales que indican una manera de medir o
encontrar los valores de las VARIABLES.
EFECTO HAWTHORNE: Se refiere a cualquier situación en la cual el hecho de
participar en una investigación mejora el rendimiento de los participantes. Este
efecto se presenta en el GRUPO EXPERIMENTAL

EFECTO JOHN HENRY: Se presenta cuando los participantes de un GRUPO DE
CONTROL saben que su rendimiento se va a comparar con el de un GRUPO
EXPERIMENTAL y entonces hacen todo lo posible por mejorar.
EFECTO PIGMALEON : Es la influencia que ejercen las expectativas que tenga el
investigador en cuanto a los cambios que se darán en los sujetos.
ERROR DE DECISIÓN TIPO I : Se da cuando el investigador rechaza una
HIPÓTESIS NULA que realmente es correcta.
ERROR DE DECISIÓN TIPO II : Es la aceptación de una HIPÓTESIS NULA que
realmente es falsa.
ERROR DE MUESTREO : Es la diferencia entre las características de una
MUESTRA y las de una POBLACIÓN. ESCALA DE ACUERDO: (véase DIFEREN -
CIADOR SEMÁNTICO).
ESCALA DE LIKERT : Presenta afirmaciones a las cuales el sujeto responde con la
intensidad con que esté de acuerdo o en desacuerdo, generalmente según una
escala de cinco puntos. También es conocida como una ESCALA DE ACUERDO.
ESCALA DE THURSTONE : Una escala de actitudes desarrollada según las
opiniones de expertos a la cual el sujeto responde si está de acuerdo o en
desacuerdo con varias afirmaciones. ESTADÍSTICA: Sistema de análisis que se
emplea para interpretar datos cuantitativos.
ESTADÍSTICA DESCRIPTIVA : Ofrece técnicas para organizar y re sumir la
información acerca de un conjunto de datos. No pretende llegar más allá del
grupo al cual se refieren los datos.
ESTADÍSTICA DE TESTS: Se refiere a los métodos que se usan para describir y
analizar las propiedades sicométricas de un TEST.
ESTADÍSTICA INFERENCIAL: Permite ha cer inferencias sobre una población,

basadas en los datos obtenidos de una muestra.
ESTADÍSTICO: Es el valor de una medida, basado en una MUESTRA.
ESTUDIO PILOTO: Un ensayo de los proce dimientos que se van a usar en una
investigación.
EVALUACIÓN DE CONTRADICCIÓN : Es un modelo de evaluación parecido a u n
tribunal con su respectivo "abogado defensor" y su respectivo "fiscal
acusador".
EVALUACIÓN DE LOS EFECTOS REALES : Es una forma de evaluación en la cual el
evaluador desconoce los objetivos del programa que se evalúa.
EVALUACIÓN FORMATIVA : Es una evaluación que se realiza mientras un

programa se está desarrollando.
EVALUACIÓN RESPONSIVA : Es una evaluación más subjetiva que se concentra
en los intereses y las preocupacion es de las personas afectadas por la
evaluación.
GRUPO DE CONTROL: El grupo de un estudio que recibe un tratamiento
distinto al GRUPO EXPERIMENTAL o que no recibe ningún tratamiento especial.
GRUPO EXPERIMENTAL: El grupo de un estudio que suele recibir un tratamiento
nuevo que se está investigando

HIPÓTESIS DIRECCIONAL: (véase HIPÓTESIS DE INVESTIGACIÓN).
HIPÓTESIS ESTADÍSTICA: (véase HIPOTESIS NULA).
HIPÓTESIS DE INVESTIGACIÓN; En un PROBLEMA DE INVESTIGACIÓN es la
conjetura, la especulación o la respuesta que se sugiere. (También es conocida
una HIPÓTESIS DIRECCIONAL).
HIPÓTESIS NULA: Indica que no existe una diferencia significativa entre las
variables. Se requiere en varios TESTS D E SIGNIFICACIÓN ESTADÍSTICA.
(También es conocida como HIPÓTESIS ESTADÍSTICA).
ÍNDICE DE DIFICULTAD: Básicamente se define como la proporción de individuos
Que contestan correctamente a determina -o ítem de un test de rendimiento.
ÍNDICE DE DISCRIMINACIÓN: Mide la Forma en que un ítem distingue entre las
personas que han obtenido un puntaje total alto y las que han obtenido un
puntaje total bajo de un test de rendimiento.
INDUCCIÓN: Partiendo de casos particulares se llega a conclusiones generales.
Fue desarrollada por Bacon.
INVESTIGACIÓN APLICADA: Su propósi to es el mejoramiento de un proceso o
producto. Es la comprobación de los conceptos teóricos en situaciones reales.
INVESTIGACIÓN ASOCIATIVA : Identifica las relaciones que puedan haber entre
dos o más VARIABLES sin indicar cuál de ellas es la causa ni cuál es el efecto.
INVESTIGACIÓN BÁSICA: Su propósito fundamental es el de desarrollar
TEORÍAS. (También es conocida como INVESTIGACIÓN FUNDAMENTAL,
INVESTIGACIÓN PURA, e INVESTIGACIÓN TEÓRICA).
INVESTIGACIÓN DESCRIPTIVA: Ofrece información que pretende describir un
fenómeno o situación, sin preocuparse de sus posibles causas.
INVESTIGACIÓN EDUCATIVA: Un proceso sistemático cuyo objeto es responder
a preguntas relacionadas con la educación.
INVESTIGACIÓN EVALUATIVA: Su propósito tiene relación con la toma de
decisiones sobre las prácticas o los programas educativos.
INVESTIGACIÓN EXPERIMENTAL : Permite inferir las posibles relaciones de
causa-efecto, al comparar los resultados de uno o más grupos que hayan
recibido un tratamiento experimental, con uno o más GRUPOS DE CONTROL que
no hayan recibido dicho tratamiento.
INVESTIGACIÓN FUNDAMENTAL: (véase INVESTIGACIÓN BÁSICA).
INVESTIGACIÓN HISTÓRICA: Un proceso sistemático que sirve para estudiar
documentos y otras fuentes de información lo cual permite responder a
preguntas sobre la significación del pasado.
INVESTIGACIÓN POR INDAGACIÓN NATURALÍSTICA: El estudio de personas
dentro de su propio ambiente natural. Sus. Técnicas incluyen la observación, l a
entrevista informal y el análisis de documentos.
INVESTIGACIÓN PURA.; (véase INVESTIGACIÓN PURA), INVESTIGACIÓN TEÓRICA: (véase
INVESTIGACIÓN BÁSICA). INVESTIGACIÓN DE TIPO ENCUESTA: Sirve para recabar
datos sobre grupos, siendo sus instrumentos princi pales los CUESTIONARIOS y
las ENTREVISTAS.
MEDIA: Es el promedio aritmético de un conjunto de datos.
MEDIANA: Es el valor central de una distribución de datos.
MEDIDAS DE TENDENCIA CENTRAL: Su propósito es ofrecer, en un solo valor,
una expresión típica de todos los datos de una distribución .
MEDIDAS DE VARIABILIDAD : Proporcionan información acerca de la dispersión
de los datos con relación a la media.
MÉTODO CIENTÍFICO : El uso de la INDUCCI ÓN para generar HIPÓTESIS, la
DEDUCCIÓN para comparar la validez de las inferencias derivadas de las
HIPÓTESIS, y finalmente la INDUCCIÓN para generalizar los resultados.
MODA: Es el valor que se presenta con más frecuencia en una distribución de
datos.
MUESTRA: Es una cantidad de individuos que se seleccionan de una POBLACIÓN
para participar en una investigación.
MUESTRA ALEATORIA SIMPLE: Es la selección de sujetos en la que cada
elemento de la población tiene la misma probabilidad de ser incluido en la
muestra.
MUESTRA DISPONIBLE : Es una MUESTRA que se tiene al alcance para usar en un
estudio, sin hacer una selección aleatoria.
MUESTRA ESTRATIFICADA: Es aquella en la cual los subgrupos, o estratos,
están representados en la misma proporción que se presentan en la POBLACIÓN
de donde provienen.
MUESTRA NO PROBABILISTICA: Una MUESTRA en la que no se sabe la
probabilidad que hay de que cada su jeto sea seleccionado para la muestra.
MUESTRA POR CUOTAS: Una MUESTRA NO PROBABILISTICA en la que se ha
identificado la cantidad de sujetos que se características determinadas.
MUESTRA POR CONGLOMERADOS: Una MUESTRA que se forma mediante la selección
aleatoria de grupos en vez de individuos.
MUESTRA POR EXPERTO: Una MUESTRA NO PROBABILISTICA en la que los expertos han
identificado a sujetos que ellos consideran que representan bien a la POBLACIÓN.
MUESTRA PROBABILISTICA: Una MUESTRA en la que cada elemento de la POBLACIÓN tiene la
misma probabilidad de ser seleccionado.
MUESTRA REPRESENTATIVA: Una MUESTRA que se asemeja a la POBLACIÓN con relación a las
VARIABLES importantes de la investigación.
MUESTRA SISTEMÁTICA: Una MUESTRA de cada elemento k sacada de un CUADRO DE
MUESTREO, en la cual k equivale al número de elementos que hay en el CUADRO DE
MUESTREO dividido por la cantidad que se desea para la MUESTRA.
MUESTREO: Es la selección de una cantidad determinada de los sujetos que integrarán una
POBLACIÓN.
NIVEL DE SIGNIFICACIÓN: Generalmente se expresa como un decimal y se utiliza para decidir si
se acepta o se rechaza la HIPÓTESIS NULA.
OBJETIVIDAD DE UN TEST: Es la medida en que los sesgos de carácter humano no influyen en la
elaboración ni en la administración del test.
OBJETIVO DE INVESTIGACIÓN: Indica lo que el investigador pretende lograr, en vez de lo que
imagina que sean las relaciones que puedan saber entre las variables.
OBSERVACIÓN: Se refiere a lo que se ha encontrado en una situación determinada.
OBSERVACIÓN PARTICIPANTE: Es una observación en la cual el observador toma parte, o sea,
es un participante en la situación que se observa.
PARÁMETRO: Es un valor de medida basado en una población.
PLAN DE INVESTIGACIÓN: Es un esquema de la investigación que se realiza antes de llevar a
cabo la investigación propiamente dicha, con el fin de cerciorarse de que los métodos son
adecuados y apropiados.
POBLACIÓN ACCESIBLE. Es parte de la población que está disponible para la realización de la
investigación.
POBLACIÓN META: El conjunto de personas, cosas o sucesos con respecto al cual el
investigador desea generalizar los resultados de su estudio.
PODER ESTADÍSTICO: Es la probabilidad de rechazar una hipótesis nula que sea falsa, es decir,
la capacidad que tiene un
TEST DE SIGNIFICACIÓN ESTADÍSTICA de evitar el error tipo II .
PROBLEMA DE INVESTIGACIÓN: Una pregunta que indica las variables que son de interés para
el investigador y que sugiere que existe una relación entre dichas variables.
RANGO: Es la diferencia que hay entre el valor más alto y el más bajo de una distribución.
REDUC: Red Latinoamericana de Documentación en Educación.
REPLICACION: Una repetición deliberada de un estudio previo, bajo diferentes condiciones de
tiempo, lugar, o situación socioeconómica.
SERENDIPITY: Una expresión sin traducción que implica que, en el curso de una investigación,
se descubren por casualidad, problemas o conocimientos valiosos que no se estaban buscando.
SESGO: Es una influencia, un efecto indebido, o una inclinación hacia alguna forma de prejuicio.
SESGO DEL OBSERVADOR: Es la tendencia a ver solamente lo que se desea ver, oír lo que se
requiere oír y recordar lo que se quiere recordar.
SESGO NO PREMEDITADO: Es un error en las observaciones y en las medidas que comete el
investigador, causado por la importancia emocional que le da a su tema, pese a la objetividad
científica que quisiera mantener.
SESGO PREMEDITADO: Ocurre cuando en una investigación se muestra más interés en apoyar
un punto de vista que en descubrir la verdad.
TABLA DE NÚMEROS ALEATORIOS: Es una lista que contiene números seleccionados de tal
forma que su secuencia no sigue un patrón.
TEORÍA: Una serie de conocimientos organizados que usa supuestos y principios aceptados
para explicar fenómenos específicos.
TEST: Es cualquier instrumento que se usa para medir las diferencias entre los individuos, según
una o más dimensiones.
TEST BASADO EN CRITERIOS: En vez de comparar un sujeto con otro» indica el rendimiento en
términos absolutos. También es conocido como un TEST DE DOMINIO.
TEST DE APTITUD: Pretende predecir la capacidad que una persona debe tener en un área
específica. Mide el posible rendimiento o aprovechamiento.
TEST DE DOMINIO: (véase TEST BASADO EN CRITERIOS).
TEST DE SIGNIFICACIÓN: Se usa para determinar si existe o no una diferencia significativa entre
dos o más medias a un nivel de significación seleccionado.
TEST ESTANDARIZADO: Generalmente se refiere a los tests que se elaboran y se publican
comercialmente, los cuales están basados en normas. También es conocido como TEST
NORMALIZADO.
TEST NORMALIZADO: (véase TEST ESTANDARIZADO).

TEST DE PERSONALIDAD: Es un instrumento que se usa para medir las características de las
personas en cuanto a sus emociones, a su motivación, a sus actitudes.
TEST DE RENDIMIENTO: Pretende medir lo que verdaderamente se ha logrado, es decir, mide
el rendimiento o el aprovechamiento que realmente se ha alcanzado.
TRATAMIENTO EXPERIMENTAL: (véase VARIABLE INDEPENDIENTE).
VALIDEZ: Se dice que hay validez cuando un test mide lo que pretende medir,
VALIDEZ CONCURRENTE: Usa como criterio la correlación entre los resultados que se obtienen
con un test nuevo y los copie se obtienen con un test que ya han sido aceptado.
VALIDEZ DE CONSTRUCTO: Tiene que ver con la relación que tiene el puntaje obtenido en un
test con una manifestación de conducta que se supone constituye la base del CONSTRUCTO.
VALIDEZ DE CONTENIDO: Requiere que se realice un test con una muestra de ítemes que
represente bien a la totalidad de los posibles contenidos. No es de naturaleza estadística y se
usa generalmente con TESTS DE RENDIMIENTO.
VALIDEZ EXTERNA, Es el grado hasta el cual se pueden generalizar Tos resultados de una
investigación con relación a otros grupos y ambientes.
VALIDEZ INTERNA: Es el grado hasta el cual las diferencias que se han observado en la
VARIABLE DEPENDIENTE dependen de la manipulación de la VARIABLE DEPENDIENTE y no de
otras variables.
VALIDEZ PREDICTIVA: Trata de establecer que un test sí puede predecir el desempeño
posterior de una persona, según criterios previamente establecidos. Se utiliza con TESTS DE
APTITUD.
VARIABLE: Es cualquier condición o característica que puede tomar más de un valor y por lo
tanto, está sujeta a la medición.
VARIABLE DE CONTROL: Es cualquier factor que pueda influir sobre la VARIABLE DEPENDIENTE
y que pueda ser cancelado o neutralizado por el investigador.
VARIABLE DE CRITERIO: (véase VARIABLEDEPENDIENTE).
VARIABLE DEPENDIENTE: Es la característica que aparece, desaparece o cambia, según el
experimentador introduce, remueve o cambia la VARIABLE INDEPENDIENTE. En las
investigaciones asociativas suele denominarse VARIABLE DE CRITERIO.
VARIABLE EXTRAÑA: Es un factor no identificado que influye en la VARIABLE DEPENDIENTE.
VARIABLE INDEPENDIENTE: Es el factor que el investigador mide, manipula o selecciona con el
objeto de determinar su relación con un fenómeno observado. (También es conocida como
TRATAMIENTO EXPERIMENTAL y en las investigaciones asociativas como VARIABLE
PREDICTORA).
VARIABLE MODERADORA: Es un tipo secundario De variable independiente. Que modera el
efecto de ésta sobre la VARIABLE DEPENDIENTE.
VARIABLE PREDICTORA: (véase VARIABLE INDEPENDIENTE)

2 MOD 1 CURSO 2 Introducción Investigación Educativa 24-11-15

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

2 MOD 1 CURSO 2 Introducción Investigación Educativa 24-11-15

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD MARTIN LUTERO

UN MINISTERIO DE LAS ASAMBLEAS DE DIOS

Managua, Noviembre 2015.

El texto “Introducción a la Investigación y Evaluación Educativa”,

Universidad de San Carlos de Guatemala. 2

Universidad de San Carlos de Guatemala. 3

4.2Las Hipótesis Nulas ...................................................................................................................44

Universidad de San Carlos de Guatemala. 4

7.1 Las Características de un Buen Test ...........................................................................79

Universidad de San Carlos de Guatemala. 5

Universidad de San Carlos de Guatemala. 6

12.3 Los Criterios para Juzgar la Evaluación Educativa ................................................................182

Universidad de San Carlos de Guatemala. 7

El Instituto de Investigaciones y Mejoramiento Educativo de la Universidad de San Carlos de

El trabajo denominado' INTRODUCCIÓN A LA INVESTIGACIÓN Y EVALUACIÓN EDUCATIVA, trata

Patrick B. Scott, su autor, posee un doctorado en Educación Matemática de la Universidad de

La elaboración de un texto de investigación educativa que se aplique a Latinoamérica presenta

La necesidad de desarrollar un texto de esta naturaleza surgió durante el transcurso de un

Un número plural de personas han colaborado en la corrección y la modificación del texto.

Universidad de San Carlos de Guatemala. 9

1.1. La adquisición de la información.

Autoridad, Tradición Intuición y Experiencia Personal

El Razonamiento Deductivo e Inductivo

Como se puede ver, el uso de la autoridad, la tradición, la intuición y la experiencia _personal

El método deductivo fue desarrollado en Grecia y muchos lo atribuyeron a Aristóteles. Este

Universidad de San Carlos de Guatemala. 10

Como ejemplos de silogismos aristotélicos considere los siguientes:

En el siglo dieciséis, Bacon desarrolló un método sistemático de pensamiento llamado

Cada Ministerio de Educación que he observado tiene un departamento de investigación

1.2. Un Método Científico

Universidad de San Carlos de Guatemala. 11

Este procedimiento, un método científico, proporciona una forma de comprobar

Universidad de San Carlos de Guatemala. 12

7) Replicación: recomprobación con datos nuevos aplicando el mismo diseño.

1.3. La Investigación Científica y la Investigación Artística

Se debe mencionar que la anterior es una introducción a un método, pero no al método

2. Métodos de indagación evaluados por el

5. Formatos individuales para comunicar el

7. Los propósitos principales son el predecir y

9. Neutralidad emocional. 10. El fin principal es lo significativo.

10. El fin principal es la verdad.

Universidad de San Carlos de Guatemala. 13

1.4. ¿Qué es la Investigación Educativa?

En general, la investigación puede definirse como un proceso sistemático para responder a

En general los pasos básicos del proceso sistemático son:

Aunque el proceso de investigación es sistemático en su concepción abstracta y esa concepción

1.5. Los Tipos de Investigación Educativa

El debate sobre la distinción y la importancia relativa de la investigación básica y la

Universidad de San Carlos de Guatemala. 14

Propósito Método Nivel de

La Investigación de Acción. La investigación de acción es un término que no se presenta

La Clasificación según Método

Existen varias maneras de clasificar los métodos de la investigación educativa. El sistema de

La Investigación Histórica. La investigación histórica es un proceso sistemático para estudiar

documentos y otras fuentes de información para responder a preguntas sobre la significación

La Investigación Experimental. Con la investigación experimental es posible inferir posibles

La Investigación por Indagación Naturalística. El estudio de personas en sus ambientes

Universidad de San Carlos de Guatemala. 16

La Investigación Evaluativa. Ya se mencionó que la investigación evaluativa tiene un propósito

La Evaluación de Costo/Beneficio y de Costo Efectividad. Cuando hay interés en comparar los

La Investigación de Tipo Encuesta-Experimento. Si se combinan los métodos precisos del

La Clasificación según el Nivel de Explicación. El nivel descriptivo ofrece información que

Universidad de San Carlos de Guatemala. 17

En general, las investigaciones de tipo encuesta y por indagación naturalística proporcionan