Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Doctorado Profesional en
Educación
INDICE
PRESENTACIÓN ...............................................................................................................................8
PREFACIO ........................................................................................................................................8
MODULO 1 ....................................................................................................................................10
1. UN BOSQUEJO DE LA INVESTIGACIÓN .................................................................................10
1.1. La adquisición de la información. .................................................................................10
1.2. Un Método Científico ...................................................................................................11
1.3. La Investigación Científica y la Investigación Artística .................................................13
1.4. ¿Qué es la Investigación Educativa? ............................................................................14
1.5. Los Tipos de Investigación Educativa ...........................................................................14
1.6. La Investigación Educativa en Latinoamérica...............................................................18
Test de selección múltiple 1.......................................................................................................23
Ejercicio 1 ...................................................................................................................................24
MODULO 2 ....................................................................................................................................27
ELPLAN DE INVESTIGACIÓN ...........................................................................................................27
2.1 El Propósito de un Plan de Investigación .................................................................................27
2.2 Un Esquema de un Plan de Investigación ................................................................................28
2.3 Los Pasos del Esquema del Plan de Investigación....................................................................28
MODULO 3 ....................................................................................................................................35
EL ROBLEMA DE INVESTIGACIÓN .................................................................................................35
3.1 ¿Qué es un Problema de Investigación? ..................................................................................35
3.2 Las Fuentes de los Problemas de Investigación .......................................................................36
3.3 El Planteamiento de un Problema de Investigación ................................................................37
Bibliografía 3 ..................................................................................................................................39
Test de selección múltiple 3...........................................................................................................40
Ejercicio 3 .......................................................................................................................................40
Aplicación 3 ....................................................................................................................................41
MODULO4 .....................................................................................................................................43
LAS HIPOTESIS Y LAS VARIABLESDEINVESTIGACIÓN.....................................................................43
4.1Las Hipótesis de Investigación .................................................................................................43
9 . 4 E l C u e s t i o n a r i o versus l a E n t r e v i s t a ...................................................................146
9.5 Las Entrevistas por Teléfono ..................................................................................................148
Bibliografía 9 ...........................................................................................................................150
Test de Selección Múltiple 9 ..............................................................................................150
Ejercicio 9 .....................................................................................................................................152
MODULO 10 .............................................................................................................................154
LA INVESTIGACIÓN POR INDAGACIÓN .............................................................................154
NATURALISTICA .......................................................................................................................154
10.1 Las Carac terísticas de la Indagación Naturalística ...........................................154
10.2 Los Tipos de Investigación Naturalística ..............................................................154
10.3 La Recabación de Datos .................................................................................................158
10.4 El Entrenamiento de Observadores ............................................................................161
10.5 La Investigación Participativa ..................................................................................162
Bibliografía 10 .........................................................................................................................163
Test de Selección Múltiple 10 ............................................................................................164
Ejercicio 10 ...............................................................................................................................165
Aplicació n 10 ...........................................................................................................................165
MODULO 11 ...............................................................................................................................166
LA INVESTIGACIÓN EXPERIMENTAL ........................................................................................166
11.1 Las Características de la Investigación Experimental ..........................................................166
1 1 . 2 Las Amenazas a la Validez Experimental ....................................................................166
11.3 Los Diseños Pre-Experimentales ....................................................................................168
11.4 Los Diseños Experimentales ...........................................................................................170
11.5 Los Diseños Cuasiexperimentales .................................................................................172
11.6 Los Diseños No Experimentales: Estudios Correlaciónales y Comparativos Causales ........174
BIBLIOGRAFIA 11 ..........................................................................................................................178
Test de Selección Múltiple 11 ......................................................................................................178
Ejercicio 11 ...................................................................................................................................180
Aplicación 11 ................................................................................................................................180
MODULO 12 .................................................................................................................................181
12.1 ¿Qué es la Investigación Evaluativa? ...................................................................................181
12.2 Las Diferencias entre la Investigación y la Evaluación .........................................................181
PRESENTACIÓN
Esperamos que esta publicación contribuya a satisfacer una necesidad bibliográfica sentida en
el medio. Asimismo, este trabajo constituye un esfuerzo serio del autor, luego de una etapa de
maduración, en la que se conjugan el conocimiento y la experiencia académicos hasta plasmar
un texto útil, claro y completo.
María Reinhardt M.
PREFACIO
Universidad de San Carlos de Guatemala. 8
Introducción a la Investigación y Evaluación Educativa.
Este libro, ha sido escrito para la persona que tenga interés en los conceptos y los métodos de
la investigación y la evaluación educativas. Se le ha dado énfasis a la aplicación de dichos
métodos y conceptos en Latinoamérica. Debe ser de utilidad para los cursos que se ofrecen en
las carreras de Pedagogía y Ciencias de la Educación que ofrecen las universidades y en las
escuelas normales, a la vez que en sesiones de capacitación que imparten los ministerios de
educación.
Son muchas las personas que han facilitado la elaboración de este texto. Primeramente,
quisiera agradecer a mi esposa Lilleth y nuestros hijos por la paciencia que han tenido durante
las largas horas que ha tomado su redacción. La oportunidad de iniciar el trabajo se presentó
gracias al apoyo del Dr. Ronald Blood, Director de los Programas Latinoamericanos de
Educación (LAPE); y del Dr. Jon Facey, Asesor Principal del proyecto Mejoramiento de la
Administración de la educación en Guatemala.
MODULO 1
1. UN BOSQUEJO DE LA INVESTIGACIÓN
A veces, la autoridad, la tradición, la intuición y la experiencia personal sirven muy bien aún en
los que haceres científicos. Sin embargo, tienen muchas limitaciones. Si se confía en la
autoridad, se acepta algo porque supone que una fuente es fidedigna. Por ejemplo, se cuenta
una historia acerca de Aristóteles en la que se muestra cómo la autoridad puede fallar. Dicen
que cuando joven, Aristóteles encontró un insecto. Siendo un joven curioso y ávido por adquirir
información contó las patitas del insecto y notó que tenía cinco. Pocos años después llegó a ser
un sabio muy conocido, es decir, una autoridad. Indicó a sus seguidores que los insectos tienen
cinco patitas y esto fue aceptado. Si se confía en la tradición como fuente de conocimientos, se
acepta algo como verdadero porque siempre ha sido aceptado. Por siglos se aceptó que la
tierra era plana y el sol giraba alrededor de la tierra. Muchos métodos de enseñanza se aceptan
por tradición. La intuición se define generalmente como la adquisición directa de
conocimientos sin el uso de razonamiento e inferencia. Puede definirse también como la
aceptación de lo que parece obvio. Algunos axiomas matemáticos no se pueden inferir y se
aceptan a través de la intuición como obvios. Algunas verdades informales como el hecho de
que "algo no puede ser rojo y a la misma vez verde" se aceptan aplicando la intuición.
partiendo de generalizaciones.
Por supuesto que el método deductivo depende de la veracidad de la premisa mayor. Aunque
proporciona una manera de verificar la validez de una conclusión particular, esa validez se basa
en la veracidad de la premisa mayor. El partir de premisas falsas o incompletas, basadas en
dogmas antiguos o en autoridades no confiables, puede conducir a errores.
Todos los niños que he conocido son buenos, por lo tanto todos los niños son buenos.
El problema que surge con el método inductivo es la enumeración incompleta de los hechos.
Pueden existir excepciones no observadas que invaliden la conclusión general.
Se puede decir que un método científico surgió durante el siglo diecinueve cuando Charles
Darwin combinó el uso de la inducción y la deducción. De este modo es posible.
1) Usar la inducción para generar hipótesis (especulaciones acerca de la relación entre dos
o más variables
2) Estudiar deductivamente la implicaciones de las hipótesis para comprobar su validez y
3) Generalizar los resultados inductivamente.
Por ejemplo, después de observar, estudiar y considerar varias teorías, un investigador puede
inducir que es más probable que un profesor adopte innovaciones auriculares si éstas resultan
concordar con sus creencias que si las mismas no concuerdan. Es decir, el investigador puede
afirmar la hipótesis de que la consistencia con un sistema de creencias se relacionan
positivamente con la ejecución de un curriculum.
Luego, tiene que aplicar el razonamiento deductivo para identificar una forma que, permita la
comprobación de la hipótesis. Puede suceder que el Ministerio de Educación vaya a introducir
un curriculum nuevo. Al estudiar las guías del nuevo curriculum, el investigador, nota que se
basan en creencias sobre la motivación personal de los alumnos, el investigador puede deducir
que si su hipótesis es correcta, entonces los profesores con creencias acordes con aquellas del
nuevo curriculum van a rendir en mayor medida en_ cuanto a la aplicación del mismo, que los
profesores cuyas creencias no estén de acuerdo con aquéllas del nuevo curriculum.
Para generalizar los resultarlos inductivamente, el investigador tendrá que recabar datos para
comprobar su hipótesis. Deberá aplicar instrumentos para medir creencias de los profesores y
su ejecución del curriculum. Una manera de proceder sería identificar un grupo de profesores
que hayan obtenido puntajes altos en la medida de creencias, y otro grupo que haya obtenido
puntajes bajos, y luego comparar las medias de los dos grupos en la medida de ejecución del
curriculum. Si la hipótesis es correcta, el grupo que obtuvo puntaje alto en las creencias, deberá
tener un puntaje más alto en la ejecución del curriculum.
Este esquema de tres etapas explica bien, cómo un método científico se desarrolló una
combinación del razonamiento inductivo pero no especifica todos los pasos que hay que tomar
al realizar una investigación. John Dewey, el famoso educador norteamericano, sugirió cinco
pasos para que resulte un proceso científico:
1) Identificación y definición del problema.
2) Formulación de una hipótesis.
3) Recabación, organización y análisis de los datos.
4) Formulación de conclusiones.
5) Verificación, rechazo o modificación de la hipótesis por la prueba de sus consecuencias
en una situación específica.
Charles Hopkins (1980, pp. 14-16) indicó como los siete pasos de un proceso científico los
siguientes:
1) Una dificultad percibida: una duda, una barrera, un obstáculo, una experiencia que
causa la perplejidad.
2) Identificación de un problema: dar un enfoque a la dificultad que se siente.
3) Información: la búsqueda de una respuesta dentro del conocimiento actual.
4) Hipótesis: una posible explicación que se compruebe.
5) Observación: a través de un diseño para recabar, organizar y analizar datos pertinentes.
6) Conclusión: aceptar, rechazar o modificar la hipótesis.
Es posible decir que realmente ambos métodos, el científico y el artístico, tienen algo con qué
contribuir en la búsqueda de conocimientos sobre la educación. El método artístico puede
servir en "áreas nuevas donde no existen investigaciones previas o donde métodos más
objetivos no resultan, es decir para la investigación exploratoria. Se puede aplicar los
conocimientos logrados con métodos artísticos para proponer hipótesis que se comprueben
con métodos positivistas.
Kline (1980, pp. 1-20 - 1-31) probablemente ha sugerido uno de los esquemas de clasificación
de investigación educativa más completos que existe. La Tabla 1.5.1 presenta el esquema de
clasificación de Kline. En la página 5 aparece una explicación de los componentes de los cuatro
sistemas del esquema.
La Clasificación según el propósito
La Investigación Básica. La investigación básica tiene como fin el desarrollo de la teoría; para
ello es necesario descubrir o comprobar generalizaciones y principios, y a la vez contribuir al
crecimiento del conocimiento fundamental. El desarrollo de la teoría obliga al investigador a
considerar las estructuras y los procesos fundamentales y a tratar de comprenderlos. Algunos
denominan la investigación básica como la investigación pura, la investigación fundamental o la
investigación teórica.
La Investigación Aplicada. La investigación aplicada, si se realiza fielmente, tiene muchas de las
características de la investigación básica. Sin embargo, su propósito es más inmediato y se
relaciona con el mejoramiento de un proceso o un producto. Por lo tanto se comprueban los
conceptos teóricos en situaciones reales. Como ya se mencionó, tiene un propósito más
inmediato que la investigación básica, pero siempre conlleva la intención de generalizar los
resultados a otras situaciones. Aunque el propósito principal de la investigación aplicada es
proporcionar resultados de utilidad práctica para educadores, en vez de ser el desarrollo de
teorías, dichos resultados prácticos suelen influenciar el desarrollo de teorías.
Tabla 1.5.1
Los Cuatro Sistemas para Clasificar La Investigación Educativa (Kline, 1980, p. 1-31)
La Investigación de Tipo Encuesta. Los cuestionarios y las entrevistas son los instrumentos
principales de la investigación de tipo encuesta. Sirven para recabar datos semejantes sobre
grupos de individuos. Si el grupo de individuos es toda una población, a la encuesta se le
denomina censo. No obstante, es más común seleccionar una parte de la población, a la cual se
le llama muestra. Si la investigación de tipo encuesta dura años y si los datos se recogen
periódicamente, es un estudio longitudinal. Si los datos son recabados sólo una vez, éste es un
estudio transversal. A veces las encuestas no ofrecen nada más que información descriptiva, y a
veces se usan para averiguar algo sobre la relación entre variables. En el Módulo 6 se presenta
información sobre la selección de muestras y el Módulo 9 se trata de otras técnicas de la
investigación de tipo encuesta.
investigación por indagación Naturalística. Un ejemplo sería un investigador dentro del aula con
el profesor y los alumnos registrando observaciones sobre el comportamiento. Algunas
sugerencias para la realización de una investigación por indagación Naturalística se presentan
en el Módulo 10.
Tal vez la persona que más haya estudiado la situación de la investigación educativa en
Latinoamérica sea el chileno Ernesto Schiefelbein (1980a, 1980b, 1982). Schiefelbein ha
señalado el crecimiento de la investigación educativa durante la década de los años setenta. A
continuación, se indican algunos de los factores más notables en dicho crecimiento.
Tabla 1.6.1
Características de las Revistas Educativas de Latinoamérica
Fecha de
Revista Tópico País
Comienzo
Boletín CINTEFOR Educación Uruguay 1965
Revista de Educación Educación Chile 1967
Construcción
CONESCAL México 1965
Escolar
Cuadernos FundaciónChagas InvestigaciónEducativa Brasil 1971
Educación e Sociedades Educación Brasil 1978
Educación de Adultos Educación Chile 1978
Educación Hoy Educación Colombia 1971
Ciencias
Ensayos ECIEL Brasil 1976
Sociales
Ciencias
Estudios Sociológicos Chile 1973
Sociales
Fórum Educacional Educación Brasil 1976
La Educación Educación EE.UU. 1956
Resúmenes Analíticos Educación Chile 1972
Revista Brasileira deEstudios
Educación Brasil 1915
Pedagógicos
Revista de la EducaciónSuperior Educación México 1972
Revista Latinoamericana de
InvestigaciónEducativa México 1971
Estudios Educativos
Revista Paraguaya de Sociología Ciencias Sociales Paraguay 1963
Tecnología Educativa Educación Venezuela 1973
García y Ochoa (1979) analizaron “los 1064 documentos Resúmenes Analíticos en Educación
(RAE) aparecidos entre octubre de 1972 y octubre de 1977”. Entre sus conclusiones más
importantes se encuentran las siguientes: aunque la mayoría de los documentos procedían de
instituciones nacionales, un 29º/o de los documentos eran de unidades extranjeras o de
organismos internacionales-, instituciones privadas proporcionaron un 18.5º/o de los
documentos. Hubo relativamente muchas investigaciones relacionadas con el nivel
universitario y pocas relacionadas con la educación preescolar, primaria, rural, especial y
privada. Los trabajos sobre los profesores y el contenido de la enseñanza eran escasos. La
investigación de tipo encuesta predominó.
Tabla 1.6.2
Centros de REDUC
Bibliografía
Para cada uno de los siguientes ítems subraye la respuesta más apropiada.
1. El uso del castigo corporal para mantener la disciplina en el aula probablemente
proviene de una de las siguientes fuentes de información; indique cuál.
a) Autoridad.
b) Tradición.
c) Intuición.
d) Razonamiento deductivo.
2. “Todos los hombres son buenos; Juan es un hombre; por lo tanto Juan es bueno” es un
ejemplo de una de las siguientes fuentes de conocimiento, señálela.
a) Razonamiento inductivo.
b) Autoridad.
c) Razonamiento deductivo.
d) Método científico.
3. “Todos los pájaros que he visto pueden volar, por lo tanto todos los pájaros vuelan” es
un ejemplo de una de las siguientes fuentes de conocimiento, señalada.
a) Razonamiento deductivo
b) Autoridad
c) Razonamiento inductivo
d) Método científico
4. De los siguientes científicos ¿quién conocido como el primero que combinó la deducción
y la inducción para crear un método científico.
a) Darwin
b) Bacon
c) Aristóteles
d) Dewey
5. ¿Cuál de los siguientes enunciados constituye una de las principales dificultades del
razonamiento inductivo?
a) Depende de la veracidad de la premisa mayor.
b) No permite el juicio humano
c) Parte de la observación de un solo caso
d) Pueden existir excepciones no observadas que invaliden la conclusión general
8. ¿Cuál de los siguientes métodos de investigación educativa suele tener más control?
a) L a investigación histórica
b) La investigación de tipo encuesta
c) L a investigación experimental
d) La investigación por indagación naturalística
9. ¿Cuál de los siguientes métodos de investigación educativa suele tener más control?
a) La investigación de tipo encuesta
b) L a investigación experimental
c) La investigación por indagación Naturalística
d) Todas las respuestas anteriores son correctas
10. Una ventaja de la investigación empleando datos cualitativos es que
a) Ofrece una visión muy amplia de la interacción de los muchos factores humanos
b) Es fácil de organizar, de analizar y de interpretar tales datos
c) Es fácil de llegar al nivel causal
d) Todas las respuestas anteriores son correctas
Ejercicio 1
10. Si tiene la intención de realizar una investigación es importante que conozca los
recursos y las experiencias ya existentes. Este ejercicio tiene como fin la recolección de
nombres de instituciones, de personas, y los recursos bibliográficos relacionados con la
investigación educativa en su país.
a) Enumere los nombres y las direcciones de los institutos y agencias (nacionales e
internacionales) que tienen que vea con la investigación y la evaluación en su país. Si los
conoce, indique los nombres de las personas encargadas de la; investigaciones de esas
instituciones.
b) Repita el ejercicio anterior, esta vez indicando los centros de documentación y las
bibliotecas que contienen informes acerca de trabajos de investigación.
c) Enumere los nombres de las personas que realizan investigaciones y evaluaciones
educativas en su país. Indique las instituciones en las cuales ellos trabajan.
d) Enumere las revistas y los boletines que se editan en su país, las cuales posiblemente
presenten investigaciones educacionales
11. El gobierno decide invertir una cierta cantidad de dinero para mejorar las destrezas de
estudio de los alumnos en las escuelas secundarias oficiales. Algunas personas prefieren invertir
todo el dinero en el desarrollo de materiales y programas modelo, y en la capacitación docente.
Otro grupo desea invertir un 15º/o de los fondos en la realización de investigaciones sobre
destrezas de estudio. ¿Cómo defendería Ud. El uso del 15º/o para realizar la investigación?
12. Lea los cuatro estudios (adaptados de Kline, 1980, pp. 1-39 – 1-40) que aparecen a
continuación. Clasifique cada estudio según cada uno de los 4 sistemas de Kline. Explique cada
clasificación.
Estudio 1. Se seleccionaron ocho pueblos al azar para que recibieran una de dos estrategias
educativas con el propósito de influir en su adopción de innovaciones de agricultura, salud y
educación social. Cuatro pueblos participaron en “foros de radio” y cuatro participaron en
“grupos de lectura” durante el mismo período. Se recabaron datos sobre las características
socioeconómicas de los participantes, y el uso real y las actitudes hacia las innovaciones antes
del comienzo de las actividades educativas y al haberse concluido un año después. También se
recabaron datos de otros seis pueblos semejantes a los ocho experimentales, pero que no
participaron en las actividades educativas. Se usaron los resultados para comprobar las
hipótesis sobre la adopción de innovaciones.
Estudio 2. Se realizó un estudio para determinar el efecto que tuvo en las actitudes y en los
conocimientos de alumnos de educación primaria y secundaria la introducción de un curriculum
nuevo sobre población, vida familiar y ecología. De 26 escuelas se sacó una muestra aleatoria
de 631 alumnos para que participaran en el estudio. Se recabaron datos al inicio y al final del
año escolar para determinar el cambio en las actitudes y en los conocimientos de los alumnos
con relación a los tópicos del nuevo curriculum. El nuevo curriculum se aplicó con 1856
alumnos. Otros 1775 tomaron los tests sin recibir el nuevo curriculum. Los resultados se usaron
para revisar el curriculum y para determinar la medida en que el curriculum tuvo un impacto o
logro sus objetivos.
Estudio 3. Se realizó un estudio para determinar en qué forma la organización burocrática y los
conflictos culturales afectan a los alumnos de una escuela secundaria. El investigador
permaneció en la escuela por varias semanas observando la conducta de los alumnos y del
personal y también examinó los documentos relacionados con la organización y la estructura de
la escuela.
Estudio 4. Se realizó un estudio en Indonesia con 109 familias, en las cuales por lo menos uno
de los hijos asistía a una escuela religiosa. Las familias se escogieron al azar. Se recabó
información sobre las características socioeconómicas de las familias y la demanda de
escolarización a través de entrevistas. La demanda se midió en términos de la intención de
continuar mandando al hijo a la escuela, del número de hijos de edad escolar que no asistieron
a una escuela, del promedio de años de escolaridad de los hijos, de la demanda de escuelas
seglares versus escuelas religiosas y de la demanda de escuelas vocacionales versus escuelas
académicas. Se hizo un análisis para determinar las características que predicen la demanda
escolar de una familia.
Existen muchas razones para elaborar un plan de investigación antes de realizar una in-
vestigación. Dicho plan sirve para organizar y aclarar las ideas y comunicárselas a otros. Así es
mucho más fácil evaluar lo que se pretende hacer. También, facilita dar enfoque a los
detalles que sean de una importancia crítica. El investigador mismo puede refinar y mejorar
sus planes y someterlos al juicio de sus colegas y de otros expertos. Tal crítica positiva puede
ayudar a evitar muchos errores y frustraciones. Además, si la investigación se lleva a cabo, es
posible evitar fallas de la memoria al tener un plan escrito con todos los pasos bien
bosquejados.
Chávez Zepeda (1983, p. 7) indicó la situación lamentable en que se ven los investigadores
que no preparan un plan de investigación, cuando escribió lo siguiente:
Es frecuente que algunas personas que hacen investigación, inicien su trabajo y una vez
recolectados los datos, se presentan ante un estadístico o un programador para solicitarle
que "haga algo" con estos datos. Este es un gravísimo error, que ha traído muchos fracasos,
pérdida de tiempo y esfuerzos desperdiciados.
Muchas veces se exige oficialmente elaboración de planes de investigación. Los estudia tes
universitarios generalmente tienen que presentar un plan de investigación para su
aprobación por un comité de catedráticos antes de realizar una tesis o disertación. Muchas
investigaciones extensas requieren el respaldo financiero de alguna agencia que suele
requerir que se cuente con un plan.
El plan debe empezar con el título de la investigación. Si todo marcha como se ha planificado,
dicho título debe ser el mismo que lleve el informe final. El título debe indicar las variables
que se van a estudiar, la relación entre las variables, y la población que se va a considerar.
A continuación, se presenta un esquema de planes de investigación. En la siguiente sección
hay una breve explicación de cada paso del esquema y una indicación del módulo en el que
se encuentran más detalles sobre cada paso.
I. El Marco Conceptual
A. Los Antecedentes del Problema
B. La Importancia del Problema
C. El Planteamiento del Problema
D. El Alcance y los Límites del Problema
II. El Marco/ Teórico (Los Supuestos)
III. El Marco Metodológico
A. Las Hipótesis o los Objetivos
B. Las Variables (y sus definiciones operacionales)
C. Los Sujetos
D. Los Instrumentos
E. El Diseño de Investigación
F. El Análisis Estadístico
IV. El Marco Operativo
A. La Recabación y el Tratamiento de Datos
B. El Estudio Piloto
C. Los Recursos que se Requieren
D. El Esquema de Tiempo (Cronograma)
E. Un Bosquejo del Informe Final
F. La Bibliografía Preliminar
I. El Marco Conceptual
A. Los Antecedentes del Problema. En esta sección es necesario indicar de dónde surgió
el problema. Es una buena idea citar a expertos que han sugerido investigaciones
relacionadas con el problema. Es más apropiado presentar un resumen más completo de la
literatura relacionada con el problema como parte del marco teórico. Un resumen acabado
B. La Importancia del Problema. Esta parte, a veces, se incluye en los antecedentes y por
lo menos debe relacionarse con ellos. Debe justificarse el valor que tiene estudiar el
problema. ¿Cómo va a contribuir a acrecentar los conocimientos educativos? ¿Cómo va a
contribuir a un mejoramiento de la docencia? Hopkins (1980, p. 194) indicó que la
significación educativa de un problema puede radicar en una o más de las características
siguientes:
1) Practicable. Una relación estrecha entre el problema de investigación y un
problema práctico da apoyo a un estudio.
2) Generalizable. Un estudio que puede generalizarse a varias poblaciones es
más aceptable que uno que tiene un ámbito más limitado.
3) Oportuno. Un estudio relacionado con un problema social que tenga la
importancia del momento tiene una buena acogida.
4) Teórico. Es fácil justificar un estudio que va a analizar un conjunto de hechos
y a crear el entendimiento de una nueva teoría.
5) Erudición. Un estudio puede justificarse porque aporta nuevas maneras de
abordar procedimientos de investigación.
D. El Alcance y los Límites del Problema. Aunque definición del problema debe ser muy
clara y precisa, debe ser concisa también y por lo tanto es necesario especificar el alcance de
la investigación. ¿Qué aspectos del problema van a incluirse y cuáles van a quedar fuera del
tratamiento? Los límites se refieren a las restricciones impuestas sobre las posibilidades de
generalizar los resultados a otras poblaciones y a las posibles amenazas' sobre la validez y
confiabilidad del estudio. Dos de las limitaciones más comunes Que tienen las investigaciones
son el tamaño de la muestra y la duración del estudio.
Se tratan los supuestos que acepta el investigador en el marco teórico. Cada problema
conlleva ciertos supuestos subyacentes. Una lista de supuestos establece las premisas o los
postulados en que el estudio se basa. Es posible presentar un resumen de la literatura
relacionado con el problema para establecer el marco teórico. La presentación del marco
teórico debe conducir a las hipótesis del estudio.
B. Las Variables. El problema pregunta si existe una relación entre dos o más variables y
la hipótesis sugiere la posible naturaleza de esa relación. En esta sección es necesario
identificar precisamente cuáles son las variables de la investigación y de qué tipo son
(independiente, dependiente, moderadora, dé control o extraña). También es conveniente
tratar de dar una definición operacional de las variables. Una definición operativa se basa en
las características observables de lo que se define.
D. Los Instrumentos. Una razón para especificar los instrumentos que se van a usar es
para asegurarse de que existen instrumentos adecuados para medir las variables del estudio.
Dependiendo de las variables, los instrumentos que se requieren pueden ser test
psicológicos, pruebas de rendimiento, cuestionarios, guías de entrevistas u otros tipos de
medidas. A veces se usan instrumentos estandarizados. En tales casos, deben presentarse los
datos que indican la validez y la confiabilidad de dichos instrumentos. Si resulta necesario
que el investigador elabore un instrumento adecuado, una tabla de especificaciones puede
indicar la naturaleza y la posible validez del instrumento. El Módulo 7 se ha dedicado a la
presentación de varios instrumentos de investigación.
Leedy, Paul D. Practical Research: Planning and Design, New York: MacMillan, 1974.
La investigación educativa parte de las dudas que surgen en la mente del investigador. Puede
ser que las perciba de una forma muy vaga. Así comienza un proceso de refinamiento para
llegar a un problema que sea manejable. Si el problema de investigación se define
adecuadamente, se facilita todo el proceso de la investigación.
Leedy (1974, p. 48) insistió en que para ser considerado como un problema de investigación un
planteamiento o pregunta, tendría que incluir (o por lo menos implicar) el hecho de la
interpretación de datos. Kline (1980, p. II-6) indicó que una de las características principales de
los problemas de investigación educativa es que surgen en un contexto en el cual se pueden
experimentar los fenómenos (sucesos, actividades, resultados) ya sea objetiva o
subjetivamente, con medidas confiables y válidas. Tener medidas de los fenómenos
experimentados implica la interpretación de datos.
Las tres dificultades principales que surgen en la definición de los problemas de investigación
son:
1. No mencionar el hecho de la interpretación de datos
2. Tratar de asuntos no observables/medibles
3. Elegir un problema demasiado amplio y ambicioso.
Generalmente, las preguntas que pueden contestarse con un simple "sí" o 'no' no sirven como
problemas de investigación. Resulta que tales preguntas suelen ser indicaciones •• superficiales
de asuntos más profundos. Por ejemplo, consideremos lo siguiente, "¿Es válida la instrucción
personalizada?" Lo importante realmente no es si vale la pena o no. Si se obtienen buenos
resultados vale la pena; si no se encuentran buenos resultados, entonces no vale la pena. El
problema de investigación que está involucrado en el asunto del valor de la instrucción
personalizada es "¿Cuál es su valor?", o si no tiene valor entonces, "¿Por qué no tiene valor?".
Cada una de estas dos preguntas implica la interpretación de datos.
Muchas veces los principiantes en la investigación educativa y aún los más experimentados
tratan de atacar un problema que resulta ser demasiado amplio y ambicioso. Esto tal vez tenga
Universidad de San Carlos de Guatemala. 35
que ver con una falta de comprensión de la complejidad de la investigación educativa y con el
deseo de aportar algo bastante significativo al avance de la educación. "La influencia de la
personalidad en el rendimiento académico" es un problema muy interesante e importante,
pero demasiado amplio para llevar a cabo un primer intento en la investigación educativa.
En el caso de Latinoamérica existe la posibilidad de replicar estudios importantes que han sido
realizados en otros países latinoamericanos o en otras regiones del mundo. Tales replicaciones
pueden contribuir a la adecuación de métodos y materiales ya comprobados en otra parte. La
replicación también aporta mucho al juicio que se emita sobre la validez de un estudio.
Tal vez una de las mejores formas de encontrar un problema de investigación es colaborar con
un grupo de colegas o trabajar bajo la dirección de un investigador con experiencia. Para un
principiante, la oportunidad de involucrarse en un proyecto grande que dirija un conocido
Muchos autores han considerado cuáles deben ser las características del planteamiento de un
problema de investigación. Algunas de dichas características son.-
1) Por supuesto, que emplee una forma gramatical que sea correcta, clara, concisa
completa;
2) Que generalmente se enuncia en forma de una pregunta-,
3) Que sea lo suficientemente limitado para poder ser manejado dentro de los recursos
disponibles, pero con un valor teórico y lo práctico;
4) Que pida algo acerca de la relación entre dos o más variables-,
5) Que permita la comprobación empírica, es decir, que se utilicen la recabación e
interpretación de datos;
6) Que no se exprese en una forma que permita dar un simple "sí" o "no" como respuesta;
7) Que no necesite que se adopta una posición moral o ética;
8) que generalmente se relacione con las teorías actuales y con los estudios que ya se
hayan realizado-,
9) Que se relacione con la(s) hipótesis que se sigue(n).
El hecho de tener una forma interrogativa que relaciona dos variables implica algo como lo
siguiente: "¿Cuál es la relación entre A y B?" La manipulación de por lo menos una variable para
determinar su efecto en otra variable, excluye a los problemas puramente descriptivos. Por
ejemplo, "¿Cuántos alumnos en un colegio dado aprueban un curso de física?" no requiere la
relación de variables, mientras que ' ¿En un colegio dado, cuál es la relación entre aprobar el
curso de física y el hecho de. Tener una calculadora?", sí reúne las características de un
problema de investigación. Esto no quiere decir que los problemas descriptivos no sean
Borg, Walter R. y Gali, Meredith D. Educational Research: An Introduction, New York: Longman,
1983.
Hernández, Pablo. Introducción a la Investigación Educativa, San José, Costa Rica: Centro
Multinacional de Investigación Educativa, 1978.
Hopkins, Charles D. Under standing Educational Research, Columbus, Ohio: Merril, 1980.
Kline, David. Planning Education for Development: Volume III Research Methods for
Educational Planning, Harvard University: Center for Studies in Education and Development,
1980.
Leedy, Paul D. Practical Research: Planning and Design, New York: MacMillan,1974.
Tuckman, Tuckman Bruce W. Conducting Educational Research, New York: Harcourt Brace
Jovanovich, 1978.
Van Dalen, Deobold. Manual de Técnicas de la Investigación Educacional, México: Pai Whitney,
Frederick L. Elementos de Investidos, 1971. Barcelona: Omega, 1970.
1. ¿Cuál de los siguientes enunciados constituye una de las principales fallas de muchos de
los problemas que se plantean en la investigación educativa?
4. ¿Cuál de los siguientes enunciados constituye una razón para replicar una
investigación?
Ejercicio 3
1. Evalúe cada uno de los siguientes problemas con respecto a las características que apa-
recen en la sección 3.3. El cuadro que se presenta después de los ejemplos debe facilitar la
evaluación
a) Nutrición y aprendizaje
b) El curriculum de la enseñanza básica
Universidad de San Carlos de Guatemala. 40
c) El efecto de la matemática moderna en la escuela secundario
d) ¿Cómo se puede impartir la enseñanza del curso de castellano de modo que se
elimine el problema de retraso en lectura a nivel secundario?
SI N0
1. ¿Es una oración completa?
2. Releerlo cuidadosamente ¿Dice exactamente lo que se desea decir sin
ambigüedad?
3. ¿Está libre de errores gramaticales?
4. ¿Está concisa y a la misma vez clara?
5. ¿Está en la forma interrogativa? __
6. ¿Está suficientemente delimitado? -
7. ¿Tiene un valor práctico o teórico?--
8. ¿Pide algo acerca de la relación entre dos o más variables?
9. ¿Contiene alguna(s) palabra(s) que impliquen la recabación e interpretación de
dato____-
10. ¿Necesita algo más que un simple "sí" o "no" como respuesta final?
11. ¿Es posible evitar la adopción de una posición moral o ética?
2. Vuelva a formular los problemas anteriores tratando de eliminar las fallas que se en-
contraron.
3. Redacte cinco problemas que tengan las características presentadas en la sección 3.3,
utilizando tal vez el esquema presentado en No. 1 .puede redactarlo es preciso evaluar las
características ya estudiadas. Para facilitar la evaluación se presenta una lista de preguntas
a continuación.
Aplicación 3
Ahora se pretende definir bien un problema que sirva para llevar a cabo una investigación
que se realizará más adelante en el curso. Se seguirá un proceso a fin de perfeccionar los
intereses y las dudas para llegar a un problema que sea manejable, a la vez que sea signi-
ficativo. Se presenta una estructura para efectuar dicho perfeccionamiento. Si Ud. prefiere
usar otra manera para perfeccionar el problema, favor de conversarlo con el profesor.
3. Las preguntas, dudas e inquietudes que se. Tienen con respecto al área secundaria
a) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
b) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
c) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
d) -----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------
4. Ahora hay que plantear con mucho cuidado el problema que se desea investigar.
Después de redactarlo es preciso evaluar la característica ya estudiadas. Para
facilitar la evaluación se presenta una lista de preguntas a continuación
------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------
SI NO
6. Subraye la (s) palabra (s) del problema que implica la interpretación de datos.
Generalmente cuando una persona confronta un problema trata de- adivinar, sugerir o
especular una respuesta. Esta respuesta sugerida se llama hipótesis. Otra manera de
conceptualizar este tipo de respuesta es considerarlo como una especulación, o conjetura,
sobre las diferencias, las relaciones y las causas. Por ejemplo, si una máquina de escribir
eléctrica no funciona, debido a que se tienen conocimientos de la causa y el efecto de la
electricidad, se puede formular la hipótesis que la máquina no está enchufada. Si resulta
que sí está enchufada, se puede formular otra hipótesis por el estilo de: la corriente está
cortada. Si comprobamos que sí hay corriente, tal vez formulemos la hipótesis que el
interruptor no funciona o que el motor se ha quemado. Así, seguimos formulando
hipótesis y comprobándolas hasta resolver el problema.
Es indudable que los problemas educativos son mucho más complejos que el asunto de la
máquina de escribir, pues generalmente involucran a seres humanos. Sin embargo, el pro-
ceso de formular y comprobar hipótesis, y luego aceptarlas, modificarlas o rechazarlas, es
muy parecido.
Cabe señalar la diferencia entre un objetivo y una hipótesis. Un objetivo de investigación
indica lo que el investigador pretende lograr en vez de lo que imagina que sean las
relaciones entre variables. A veces, en las investigaciones descriptivas se especifican los
objetivos en vez de las hipótesis. Por ejemplo, una encuesta de los deseos de los
profesores universitarios de hacer estudios de postgrado, puede comprobar una hipótesis
semejante a la que sigue: "No existen diferencias significativas entre los deseos de los
profesores universitarios de varias facultades de hacer estudios de postgrado". En este
tipo de estudio también se puede
Compartir de la afirmación de objetivos tales como: "Los objetivos de esta investigación
son:
1. estudiar los deseos que tengan los profesores universitarios de las distintas
facultades de hacer estudios de postgrado,
2. y si se encuentran diferencias, tratar de identificar los factores que influyen en las
diferencias observadas."
Otra posible confusión que es preciso evitar es la que hay entre una hipótesis y una ob-
servación. Una observación se refiere a lo que se ha encontrado. Si un investigador nota
que la mayoría de los alumnos de una escuela son indígenas, esto es una observación. Tal
vez de esas observaciones se va a inducir una hipótesis informal sobre las dificultades que
los alumnos tienen con un curriculum en español. Es decir, se va a especular algo sobre la
relación que puede haber entre las características étnicas y el manejo del lenguaje.
Después de comprobar esta hipótesis específica, con más observaciones, tal vez se llegue a
una hipótesis más general sobre la relación entre el lenguaje y el aprendizaje.
Una hipótesis de investigación debe tener ciertas características:
De los problemas que aparecen en la sección 3.3 se pueden derivar hipótesis como las
siguientes:
* El estado nutricional de un niño y su rendimiento académico se relacionan
positivamente. Variable independiente: el estado nutricional
* Los alumnos aprenden más de los profesores que tienen títulos universitarios.
* Existe una relación positiva entre la ciase socioeconómica y el rendimiento escolar
* Los niños tienen actitudes hacia las matemáticas que son mejores de las que tienen
las niñas
* Los alumnos aprenden más de profesores entusiastas.
* El método de experiencia de lenguaje es más eficaz que el método que fonética.
Existen dos formas principales de hipótesis: la forma direccional y la forma nula. La forma
direccional se llama también hipótesis de investigación o de trabajo. Las hipótesis que se
mostraron en la sección anterior tienen la forma direccional. Generalmente, el
investigador usa la forma direccional para expresar lo que espera lograr mediante su in-
vestigación.
Las hipótesis nulas también se llaman hipótesis estadísticas. Las hipótesis nulas indican
que no existe una diferencia significativa entre las variables. Se presentan cuando son
necesarias en el test estadístico que se aplica. Vale la pena enfatizar que las hipótesis nulas
generalmente no expresan la mejor conjetura del investigador sobre la relación entre las
variables. Al principio parece que no tuviera sentido expresar una hipótesis nula que
afirma que no hay una relación cuando el investigador cree que sí la hay. Para evitar esta
dificultad algunos investigadores afirman una hipótesis de investigación que expresa lo
que esperan lograr mediante la investigación y luego, si es necesario, una hipótesis nula en
unión del test estadístico que van a usar.
Algunos autores insisten en que una hipótesis nula no es simplemente una afirmación que
hace negativa una hipótesis positiva de investigación. Por ejemplo, del problema "¿Qué
relación tiene el entusiasmo de los maestros con el rendimiento de los alumnos?" se
desarrolló la hipótesis de investigación: "Los alumnos aprenden más de los profesores
entusiastas.' La hipótesis nula en este caso podría ser: "No existe una diferencia
significativa entre el rendimiento de los alumnos que tienen profesores entusiastas y los
que tienen profesores no entusiastas." La hipótesis expresada en forma negativa que
indica que "los alumnos no aprenden más de profesores entusiastas" no es precisamente
una hipótesis nula.
Una variable puede definirse como cualquier condición o característica que puede tomar
más de un valor y por lo tanto está sujeta a la medición. Las variables de una investigación
son muy importantes porque se miden y se relacionan para determinar las causas y los
efectos, o las asociaciones. Algunos investigadores reconocen hasta diez o más tipos de
variables, mientras que otros mencionan solamente dos. Tal vez sea posible transigir e
identificar cinco tipos de variables: independientes, dependientes, moderadoras, de
control y extrañas.
Quizás una consideración de las variables que contienen algunas de las hipótesis que
aparecen en la sección 4.1 ayude a aclarar la diferencia entre las variables independientes
y las dependientes.
* El estado nutricional de un niño y su rendimiento académico se relacionan
positivamente.
Variable independiente: el estado nutricional.
Figura 4.4.1
A veces, en lugar de tratar de medir como variable moderadora algunos factores que
pueden influir en la variable dependiente, el investigador trata de cancelar o neutralizar el
efecto que tales factores puedan tener con la relación entre la variable independiente y la
variable dependiente. Tales factores, cancelados o neutralizados, se llaman variables de
control.
* La inteligencia y el rendimiento se correlacionan entre los varones
Variable independiente: o la inteligencia o el rendimiento
Variable de control: sexo
* Entre los niños de la clase baja mejor rendimiento académico en áreas
urbanas que en las áreas rurales Variable independiente: urbana versus
rural. Variable dependiente: rendimiento; rendimiento Variable de
control: clase social.
* El rendimiento académico de los niños de la clase baja mejora más de lo
clase mejora el de los niños de la clase media cuando el profesor usa
recompensa para reforzar los esfuerzos de los niños Variable de control:
reforzamiento esfuerzos.
* Los administradores que requieren mucha estructura organizacional son
más eficientes en las organizaciones recientes fundadas de lo que son
los administradores que no requieren mucha estructura organizacional.
1. Consideraciones teóricas.
* ¿Se relaciona la variable con la teoría; en que se basa el estudio?
* ¿Puede influir en las interpretaciones: prácticas y en las aplicaciones?
* ¿Cuán probable es que se llegue a ejercer influencia?
2. Consideraciones de diseño.
* ¿Cómo se relacionan las decisiones respecto a las variables, con el deseo de
maximizar la validez interna, a través de un diseño adecuado?
3. Consideraciones prácticas.
* ¿Cuán difícil es tratarla como variable moderadora en vez de como variable de
control?
* ¿Existen los recursos necesarios para tratarla como variable de control?
* ¿Cuánto control hay sobre la situación experimental?
Todas las variables que puedan tener alguna influencia sobre la variable dependiente, y
que no sean identificadas como variables independientes, moderadoras o de control, son
variables extrañas. Muchos estudios pierden su valor debido a la influencia de variables
extrañas. En un estudio de la relación entre la cantidad de tareas asignadas y el
rendimiento de alumnos, si no se mide si los alumnos realizan las tareas, ni la calidad de su
desempeño, esos factores pueden ser variables extrañas que expliquen las diferencias en
la variable dependiente. Uno de los propósitos principales de los diseños experimentales
es el control directo de variables extrañas o el control indirecto a través de procesos
aleatorios. Algunos investigadores denominan a las variables de control como variables
extrañas controladas y a las variables extrañas como variables extrañas no controladas.
A continuación, en la Figura 4.6.1, se presenta un esquema que refleja la relación de ' los
tipos de variables mencionadas anteriormente.
Hernández, Pablo. Introducción a la Investigación Educativa, San José, Costa Rica: Centro
Multinacional de Investigación Educativa, 1978.
Kline, David. Planning Education for Development: Volume III Research Methods for
Whitney, Frederick L. Elementos de Investigación, Educational Planning, Harvard
University Center for Studies in Education and Development, 1980.
Leedy, Paul D. Practical Research: Plannir and Design, New York: MacMillan, 197'
2. Para cada uno de los problemas del No. 1 del Ejercicio 3 redacte dos posibles hipótesis
de investigación.
3. Redacte las hipótesis nulas para las hipótesis de investigación del No. 2.
A B
a) Variable independiente- 1)Efecto
b) Variable dependiente- 2)Evitado
c) Variable moderadora 3) Amenaza
d) Variable de control 4)Causa
e) Variable extraña 5)Modificadora
10. Considere la siguiente hipótesis de Tuckman (1978, p. 75): Con la edad como cons-
tante, los zurdos que reciben entrenamiento preceptuó-motor rinden mejor en tareas de
la coordinación ojo mano que los zurdo que no han tenido ese entrenamiento, mientras
que tales diferencias no se manifiesto; entre los que usan la mano derecha.
Indique la variable independiente, dependiente, moderadora, y de control.
MODULO 5
EVALUACIÓN CRÍTICA DE LA INVESTIGACIÓN
A continuación se presenta una pauta de evaluación que puede servir como guía. En los
módulos anteriores ya se ha presentado una explicación de algunos de los puntos de la
pauta. Después de la pauta, se encuentra una explicación de los otros puntos.
Cada ítem de la pauta puede calificarse con un numeral del 0 al 3 o con la letra N. 0 = no se
cumplió; 1 = se cumplió muy vagamente; 2 = se cumplió implícitamente; 3 = se cumplió
explícitamente-, N = el ítem no es aplicable al estudio. Se puede calcular un promedio de
calificación dividiendo el puntaje total por el número de ítems que son aplicables al
estudio. Hay que tratar ese promedio con cuidado para que no haya posibilidad de que se
diga que cada ítem es igual a los demás.
I. El Marco Conceptual
A. Se presentan citas o hechos aceptados que fundamentan el problema.
B. Se indica la importancia práctica o teórica del problema.
C. Se plantea el problema en forma concisa y clara.
D. Se indican el alcance y los límites del problema.
E. Las hipótesis se relacionan con el problema.
F. Las hipótesis se enuncian de modo que puedan ser comprobadas.
G. Se ofrecen definiciones operativas de las variables y de otros términos
importantes.
H. Se identifican todas las variables significativas que se relacionan con el problema.
A. Sesgos premeditados
1. El investigador mantiene la neutralidad científica, en vez de tratar de probar su
punto de vista.
2. El investigador evita un uso excesivo de expresiones emotivas.
Un sesgo es una influencia o un efecto indebido o injusto; algo así como, una inclinación
hacia alguna forma de prejuicio. A veces se manifiesta como una tendencia a errar en una
sola dirección, o como una intención de influenciar o alterar.
Borg y Gall (1983, pp. 201-207) identificaron cuatro tipos de sesgos:
1) Sesgos premeditados,
2) Sesgos no premeditados,
3) Sesgos de muestreo, y
4) Sesgos del observador.
Además de los posibles sesgos que confunden los resultados de una investigación, existen
otras influencias que pueden alterar los resultados.
El Efecto Hawthorne
Quizás la más famosa de tales influencias es el llamado "Efecto Hawthorne". Fue
descubierto en los años veinte, durante una investigación en una fábrica del pueblo de
Hawthorne, en el estado de Nueva York. Resulta que la productividad en la fábrica
aumentó cuando la intensidad de la luz. Luego, cuando se disminuyó la intensidad de la
luz, la productividad siguió aumentando. En experimentos posteriores cambios que se
introdujeron en los períodos de descanso y en las horas de trabajo dicen como resultado
un aumento en la productividad. Aparentemente, en el ambiente ocurrido de trabajo de
esa fábrica, la pura de que se estaba realizando una investiga ocasionó aumentos en la
productividad, actualmente, el efecto Hawthorne se refiere a cualquier situación en la cual
el hecho de participar en una investigación mejora el rendimiento de los participantes.
5.4 La Contaminación
Borg y Gall (1983, pp. 224 -225) seña; dos tipos de contaminación: '
1) La contaminación del experimenta
y
2) La contaminación estadística
La Contaminación Estadística
Existe la posibilidad de contaminación estadística cuando los sujetos del
grupo de control llegan a estar en contacto con los sujetos del grupo
experimental o con el tratamiento.
Si se investiga el rendimiento que resulta al emplear dos métodos distintos
de enseñanza con los dos grupos en cuestión, y estos estudian juntos en la
tarde, los resultados se contaminación Otro tipo de contaminación
estadística ocurre cuando se mide la correlación, entre dos medidas,
cuando una de las medida ya es un factor importante que influye sobre la
otra. Cuando en un estudio se encuentra una correlación alta entre
inteligencia capacidad para reconocer la definición, ciertas palabras, dicha
correlación está contaminada porque la capacidad para definir palabras
forma una parte significativa de la mayoría de los test de inteligencia.
Leedy, Paul D. Practical Research: Planning and Design, New York: MacMillan, 1974.
Rosenthal, Robert y Jacobson, Lenore. Pigmalion in the Classroom; New York: Holt,
Rinehart and Winston-, 1968.
a) El grupo experimental
b) El grupo de control
c) La pérdida de sujetos
d) Ninguna de las respuestas anteriores es correcta.
8. Si los alumnos del grupo de control estudian junto con los alumnos del
grupo experimental, existe la posibilidad de que haya
a) Sesgos del observador
b) Contaminación estadística
c) Sesgos premeditados
d) Todas las respuestas anter iores son correctas
MODULO 6
EL MUESTREO
6.1 Introducción a los Conceptos de Población y Muestra
La Población Meta
La población meta es el conjunto de per sonas, cosas o sucesos con
respecto al cual el investigador desea generalizar los resultados de su
investigación. Una población meta puede ser grande y corresponder a un
área geográfica muy amplia o puede ser pequeña y pro ceder de un área
muy restringida. Una consi deración de los siguientes ejemplos deberá
mostrar los tip os de posibilidades que hay: to dos los alumnos de enseñanza
media en Lati noamérica, los supervisor es de una región, los desertores de
las escuelas primarias de la ca pital, los profesores de matemática -en las
escuelas normales de un país o los alumnos cie gos de escuelas rurales
oficiales.
Si se trata de una población amplia, aumen ta la validez externa y las
posibilidades de generalizar los resultados con confianza. Al mismo tiempo,
suele ser difícil sacar una muestra representati va de una población amplia
y esto requiere que la muestra sea grande. Si la población es más
restringida, es más fácil sa car la muestra, pero serán menores las
posibilidades de generalizar los resultados.
La Población Accesible
Es bastante difícil sacar una muestra y a la vez recabar los datos para
realizar un estudio que abarque a todos los alumnos de enseñan za
media.de Latinoamérica. Por lo tanto, el investigador muchas veces saca su
muestra de lo que se llama la población accesible. En este caso, tal vez, la
población accesible se rían todos los alumnos de enseñanza media de un
país, de una región, o de una ciudad. Generalmente, aunque se saca la
muestra de una población accesible, se desea generalizar los resultados
con relación a la población me ta. Es decir, la generalización que el
investigador quiere hacer requiere que se lleven a cabo dos pasos
importantes: 1) Generalizar de la muestra a la población accesible y lue go
2) Generalizar de la población accesible a la población meta.
Los número s 659, 911 y 988 no se seleccio naron porque son mayores que
534, que es el número d e elementos que contiene el cua dro de muestreo.
Obviamente, las circunferen cias indican los números que son útiles y los
números rayados quedan fuera del rango correspondiente.
Con este método de formar una muestra, no puede ha ber sesgos del
investigador. Generalmente, lo difícil de este método es en contrar un
cuadro de muestreo que conten ga e identifique, sin ambigüedad, a cada
elemento de la población.
6.3 Otras Muestras Probabilísticas
Se saca una muestra total de 400 de las 1200 escuelas, se encuentran las
siguientes cantidades en cada subgrupo:
Tabla. 6.3.1
Un Plan de Muestreo Estratificado
3. El número de alumnos
Muestra Población
Particular, Urbana Grande 20% 80 240
Particular, Urbana Pequeña 30% 120 360
Particular, Urbana Grande 5% 20 60
Particular, Urbana Pequeña 5% 20 60
Oficial, Urbana Pequeña 16% 64 192
Oficial, Urbana Grande 14% 56 168
Oficial, Urbana Pequeña 5% 20 60
Oficial, Urbana Grande 5% 20 60
Bibliografía 6
Babbie, Earl R. Survey Research Methods, Belmont, Calif.: Wadsworth Publishing, 1973.
Para cada uno de los siguientes ítemes sub raye la respuesta más apropiada.
a) La población accesible
a) La población meta
b) La muestra aleatoria
c) La muestra sistemática
2. La razón principal para utilizar una muestra tiene que ver con
a) Los recursos de tiempo y din ero
b) Su carácter representativo
c) Los problemas de sesgos
d) El uso de métodos estadísticos
7. En general, ¿cuál de los siguientes tipos de muestras requiere que se cuente con menos
recursos de tiempo y dinero?
a) Una muestra aleatoria simple
b) Una muestra sistemática
c) Una muestra estratificada
d) Una muestra por conglomerados
10. ¿Cuál de las siguientes condiciones implica la necesidad de contar con una muestra
que sea más grande que la mínima que se n quiere?
a) El uso de una muestra aleatoria simple
b) Una población meta muy homogénea
c) Cuando se espera obtener diferencia mínimas
d) Cuando no hay muchas variables extrañas
Ejercicio 6
Población
Procedimiento Para seleccionar la Muestra
a) Todos los alumnos de primer grado de
Todos los alumnos de una ciudad pequeña
un país
Los primeros 50 estudiantes que salen de la
b) Los 25000 estudiantes de la universidad Facultad de
nacional.
Humanidades después de las 9, el lo. De abril.
c) Los 25000 estudiantes de la universidad
nacional Los primeros 50 estudiantes que salen de una
cafetería a las 10, el lo. de abril. Cada
d) Los 25000 estudiantes de la universidad quingentésimo nombre de la nómina de
nacional. estudiantes.
e) Los 25000 estudiantes de la universidad Usar una tabla de números aleatorios para
nacional.
seleccionar a 50 estudiantes.
f) Todos los estudiantes de ingeniería de Los estudiantes que cursan el último
la universidad nacional. semestre de ingeniería electrónica.
g) Todos los supervisores del
3. Se desea sacar una muestra estratificada de 300 profesores de educación primaria de una
población meta de los 25000 profesores de un país. Determine el número de sujetos que se
necesitan en cada subgrupo, si se encuentran los siguientes porcentajes. Un 20o/o son
hombres y un 80o/o son mujeres. Un 6O0/0 de los hombres tiene menos de cinco años de
experiencia y un 40o/o tiene más de cinco. Un 30o/o de las mujeres tiene menos de cinco
años de experiencia y un 70o/o de las mujeres tiene más de cinco.
7. Presente un procedimiento para obtener una muestra de los alumnos de quinto año de
primaria de su país. Justifique el tipo y el tamaño de la misma. ¿Cómo sería posible medir el
carácter representativo de la muestra?
A Q U Í
MODULO 7
EL USO DE TEST
La Confiabilidad
Un test es confiable si se obtienen los mismos resultados cada vez que se administra. Es
decir, si los resultados que se obtienen son consistentes. Un amigo confiable siempre actúa
de la misma forma ante una misma situación. Un test confiable siempre da los mismos
resultados bajo las mismas condiciones. Si un test de inteligencia indica que el C.I. de
Juanito es de 120 y al administrarle otra vez el mismo test, bajo las mismas condiciones, el
La Validez
Un test es válido si realmente llega a medir lo que pretende medir. Cuando existe una
relación directa entre una característica y su medición, generalmente no hay problemas de
validez. Por ejemplo, una regla da una medida válida de altura porque hay una relación
directa entre la regla y la altura. Sin embargo, esa misma regla no puede dar una medida
válida de peso. No existe dicha relación directa entre la inteligencia y un test, ni entre la
mayoría de las características que desean medirse en la investigación educativa y los tests
que se aplican. Por lo tanto, la validez es una característica que es difícil de medir.
Por consiguiente, un test que sea válido a la vez será confiable. Si un test siempre llega a
medir lo que se pretende medir, sus resultados serán consistentes. Un test confiable no es
siempre válido, porque existe la posibilidad de que aunque sí mida con consistencia, no
llegue a medir lo que se pretende medir. Es común usar un ejemplo con blancos (Figura
7.1.1) para demostrar el sentido de confiabilidad y validez y a la vez la relación que existe
entre las dos.
La Objetividad
Un test es objetivo si los sesgos de carácter humano no han entrado en la elaboración del
mismo, ni influyen en su administración. Si al administrar y calificar un test ocurre que dos
personas que han usado el mismo test para medir el mismo fenómeno han obtenido
resultados distintos, el test no podría considerarse objetivo. Por ejemplo, un test de
El Interés Si un test es interesante y agradable es más fácil conseguir sujetos que estén
dispuestos a tomarlo. Por supuesto, lo que le resulte interesante a una persona, tal vez no lo
sea así para otra. En general, hay que cerciorarse de que el test no tenga ítems confusos y
de que no sea demasiado pesado para los sujetos a quienes se aplicará.
7.2 La Confiabilidad
Ya se indicó que la confiabilidad (o fiabilidad) de un test tiene que ver con su consistencia.
Ningún test es completamente confiable, es decir, ninguna medida se duplica siempre con
exactitud. La confiabilidad de un test es sumamente importante si éste se utiliza para
determinar algo concreto sobre el futuro de un individuo. Tuckman (1978, p. 161) ha
identificado ocho factores que pueden contribuir a que un test no sea confiable, a saber:
1) El conocimiento previo de la forma que tiene el test,
2) El cansancio,
3) La tensión emocional,
4) Las condiciones físicas de la sala en donde se administra el test,
5) La salud de la persona que toma el test,
6) Las fluctuaciones de la memoria humana,
7) La práctica o experiencia que la persona que está tomando el test tiene con respecto
a lo que el test va a medir y
7.3 La Validez
Un test que tiene validez realmente mide lo que se afirma que se puede medir mediante el
mismo. Un manual para la aplicación de un test comercial debe contener información sobre
la validez del mismo test. Suelen encontrarse uno o más tipos de validez, los cuales han sido
identificados por un comité de la Asociación Norteamericana de Sicología:
1) La validez del contenido,
2) La validez predictiva,
3) La validez concurrente,
4) La validez de constructo.
La validez predictiva
A veces la validez predictiva y la validez concurrente se denominan conjuntamente como la
validez basada en criterios. La validez predictiva trata de establecer que un test sí puede
predecir el desempeño posterior de una persona según criterios previamente establecidos.
Por ejemplo, si existe un test de aptitud académica que se usa para controlar el ingreso a
una universidad, entonces se desea saber si ese test verdaderamente predice el éxito
La validez de constructo
Un constructo puede definirse como un concepto sicológico que no se puede observar
directamente y, por lo tanto, se infiere de efectos observables en la conducta. La
inteligencia, la dignidad, la creatividad, la hostilidad y la ansiedad son ejemplos de
constructos. La validez de constructo tiene que ver con la relación que el puntaje obtenido
en el test tiene con una manifestación de conducta que se supone constituye la base del
constructo. A continuación se presentan algunos ejemplos dé las posibles maneras para
averiguar la validez de constructo que tienen ciertos tests-.
1. Un test de creatividad puede compararse con los juicios emitidos por expertos acerca
de lo que los sujetos han producido con creatividad.
2. Un test de la dignidad puede compararse con la manifestación de conducta que
implica dignidad (tal como hablar enérgicamente para defenderse, tomar decisiones
importantes, etc.).
3. Un test de hostilidad en los niños puede compararse con los actos de hostilidad
contra otros niños.
7.4 Los Tests Estandarizados
Los tests estandarizados generalmente se tests basados en normas. Es decir, el punta que
obtenga un sujeto o el promedio qi obtenga un grupo se compara con los puntajes que
obtenga un grupo normativo apropiado. Los tests basados en criterios, (o test de dominio),
en vez de comparar a un sujeto con otro, indican el rendimiento en termine absolutos.
Mediante la aplicación de test basados en criterios es posible averiguar porcentaje de
objetivos específicos que i sujeto domina y determinar los que no domina. Es decir, es
posible averiguar, con algo de precisión, exactamente cuánto de lo que debe saber,
realmente sabe. Es común seleccionar un porcentaje de ítems correcto generalmente 80o/o
ó 90o/o, para identifica un grupo que domina la materia y otro que no la domina.
Los tests basados en normas tratan de distinguir entre los sujetos, y por lo tanto,
desarrollarlos, es necesario eliminar ítems que son demasiado fáciles. Se busca la
variabilidad entre los sujetos. En un test basado en criterios los ítemes permanecen según
su pertinencia, no según los resultados que se obtienen. Si un método de enseñanza es
bueno casi todo el mundo debe obtener un 100o/ en un test basado en criterios.
Debido a esas diferencias entre los propósitos que tienen los dos tipos de tests, los metodos
que se examinaron en la sección 7.2 n son adecuados para averiguar exactamente 1
confiabilidad de un test tasado en criterio: Una manera de averiguar la confiabilidad d
dichos tests es aplicarlos empleando dos formas distintas, en los mismos sujetos, y verificar
si estos mismos sujetos están en el grupo que domina y en el que no domina. En le tests
basados en criterios la validez del contenido es muy importante.
Se prepara un borrador
"El borrador del test debe incluir todas decisiones que se hayan tomado en las etapas
anteriores. En general, es necesario incluir más ítemes del número que se desea, porque es
Se evalúa el borrador
Uno de los propósitos de la evaluación de un borrador de un test de rendimiento es
identificar los ítemes "buenos" y los ítemes "malos". Los ítemes buenos son los que
discriminan entre los sujetos buenos y malos, y los que tienen el grado debido de dificultad.
Primero, hay que administrar el borrador a un grupo piloto. Luego se sigue un proceso de
análisis de ítemes. Existen varias maneras de efectuar un análisis de ítemes. Si hay muchos
ítemes y muchos sujetos es más conveniente usar una computadora para realizar un análisis
de ítemes. A continuación se presenta un posible método manual:
A. Basándose en el puntaje total, se identifican dos subgrupos:
a) El 2 7 % que haya obtenido puntajes más altos y
b ) El 2 7 % que haya obtenido puntajes más bajos. (Algunos expertos usan un tercio
en vez de 2 7 % ) .
B. Para cada ítem se identifica el número de los sujetos que
a. Haya obtenido puntajes altos, y
b. El número de ellos que haya obtenido puntajes bajos y que haya contestado
correctamente.
Contando con esos datos, será posible calcular el índice de dificultad y el índice de
discriminación de cada ítem. La dificultad se define básicamente como la proporción de
individuos que contestan correctamente el ítem. También es posible usar subgrupos para
calcular la dificultad. El índice de discriminación mide cómo un ítem distingue entre per-
sonas que han obtenido un puntaje alto total y las que han obtenido un puntaje total bajo.
Como ejemplo simplificado, considere un test de 10 ítemes, que se va a aplicar a 100 sujetos
Se revisa
Con base en la experiencia obtenida en la prueba piloto y los resultados que rinde la
evaluación, hay que revisar el borrador. A veces se hace necesario repetir las etapas de
evaluación y revisión varias veces antes de obtener un test adecuado.
En cada uno de los siguientes ítemes subraye la respuesta que mejor caracteriza su
reacción.
1) Hoy en día es fácil evitar la influencia de las computadoras. Definitivamente SI Sí
Indeciso No Definitivamente NO
2) Cualquier persona puede entender fácilmente las computadoras. Definitivamente SI
Sí Indeciso No Definitivamente NO
5) Las computadoras van a desplazar los trabajos de bajo nivel y a reemplazarlos con
trabajos que requieren adiestramiento especial.
Definitivamente SI Sí Indeciso No Definitivamente
NO
13) Las computadoras aíslan a las personas porque evitan la interacción social normal
entre los usuarios.
Definitivamente SI Sí Indeciso No Definitivamente N0
14) Las computadoras crearán tantos trabajos como los que van a eliminar.
Definitivamente SI Sí Indeciso No Definitivamente
NO
15) Las computadoras son herramientas, tales como los martillos y los tornos.
Definitivamente SI Sí Indeciso No Definitivamente
NO
17) Es posible diseñar un sistema computacional que proteja la seguridad de los datos.
Definitivamente SI Sí Indeciso NO Definitivamente NO
La relación que existe entre lo que mide cada ítem y lo que mide el test en su totalidad.
6) Se seleccionan alrededor de 20 ítemes que tengan un alto coeficiente de correlación.
7) Se organizan los ítemes .seleccionados en orden aleatorio. Se incluyen instrucciones
claras.
La escala debe estar lista para administrársele a la muestra que participará en la investi-
gación.
1) Se recaban muchas opiniones (por lo menos 100) acerca del modo de pensar o de la
actitud que se desea investigar. Es necesario evitar juicios sobre hechos. Cada ítem
debe representar la opinión de alguien. Debe buscarse una gama de opiniones, e
incluir algunas de carácter moderado.
2) Se escribe cada opinión en una hojita por separado.
3) Se selecciona un grupo de jueces (entre 10 y 100) para calificar cada ítem entre 1 y 11
(o entre 0 y 13). Una calificación de 1 indica que el ítem es una afirmación muy
negativa o desfavorable sobre la variable de la escala. Una afirmación neutral debe
recibir un 6 y una afirmación muy positiva, un 11. Por supuesto hay que considerar
toda la gama del 1 al 11. Es importante recalcarles a los jueces que deben calificar o
clasificar el ítem, y no indicar en qué medida ellos están personalmente de acuerdo
o en desacuerdo. El método de calificación más conocido es tener once cajas
numeradas del 1 al 11, e ir colocando cada hojita en la caja correspondiente.
4) Se rechazan las opiniones que reciben calificaciones muy diversas.
5) Se calcula la media (o mediana) de las calificaciones que recibió cada ítem que se
selecciona para tener su valor. Por ejemplo, si de 30 jueces un ítem recibe 9 diez
veces, 10 diez veces, y 11 diez veces; su valor es 10.
6) Se seleccionan alrededor de 2 5 ítemes que representan un rango de valores del 1 al
11
7) Se organizan los ítemes en un orden aleatorio.
8) Se administra el instrumento con instrucciones de que los sujetos indiquen con cuáles
ítemes están de acuerdo.
9) Se califica a cada sujeto con la medií de los ítemes con los cuales está de acuerdo
10) Las escalas de Thurstone se utilizan meno que las escalas de Likert debido a que es
pre caso contar con la cooperación de buenos juez ese para poder elaborarlas.
¿Qué le parecen las computadoras? Coloque una X en una de las 7 rayitas que hay entre
cada pareja de adjetivos.
Las Computadoras
Mala _____________________buena
Correcta________________ incorrecta
Injusta________ _______ justa
Amistosa_________________ inamistosa
Pertinente _________________ impertinente
Fría ______________________ calurosa
Confusa ___________________ clara
Aburrida __________________ interesante
Nótese que no todos los adjetivos positivos están colocados en el mismo lado y que algunos
de los adjetivos no se relacionan directamente con las computadoras. Se coloca una mezcla
de adjetivos positivos v negativos en cada columna para evitar que el sujeto responda
siguiendo un patrón, como pensar en su respuesta. Algunos no tienen que ver directamente
con las computadoras porque al usa un diferencial semántico se pretende obtener
impresiones generales.
La calificación se obtiene como la media del 1 al 7 para cada ítem. El 1 indica lo más
negativo y el 7 lo más positivo.
Después de definir el propósito de la escala es posible crear las parejas de adjetivos
apropiados.
Existen otros métodos para desarrollar escalas de actitudes y opiniones. El lector a quien le
interese averiguar otros métodos debe referirse a la literatura sobre medición sicológica. En
inglés, el compendio tal vez más conocido de ejemplos de escalas de actitudes lo constituye
la obra de Shaw y Wright (1967).
Bibliografía 7
Borg, Walter R. y Gall, Meredith D. Educational Research: And Introduction, New York:
Longman, 1983.
Buros, Oscar K. The Eighth Mental Measure ment Yearbook, Highland Park, NJ-. Gry-
phon Press; 1978.
Henerson, Marlene E.; Morris, Lynn Lyons; y Fitz-Gibbon, Carol Taylor. How to Measure
Attitudes, Beverly Hills: Sage, 1978.
Hopkins, Charles D. Understanding Educational Research, Columbus, Ohio: Merril,
1980.
Shaw, M.E. y Wright, J.M. Scales d; for the Measurement of Attitudes, New York:
McGraw-Hill, 1967.
Ejercicio 7
3. Un investigador quiere comparar dos métodos para enseñar a leer. Tiene a su alcance un
test de rendimiento de lectura cuyo manual indica una correlación de .7 3 entre los puntajes
obtenidos en el test y las notas finales.
a) ¿Qué tipo de validez es?
b) ¿Qué tipo de validez es la más apropiada en este caso? ¿Por qué?
5. En cada una de las siguientes situaciones indique si se debe usar un test de grupo o un
test individual y justifique por qué.
a) Un investigador quiere indagar sobre la rapidez con que los alumnos del quinto grado
primario pueden resolver las cuatro operaciones aritméticas.
b) Un investigador quiere indagar sobre la comprensión que los alumnos, con serios
problemas de aprendizaje, tienen de las cuatro operaciones aritméticas.
E) La Validez.
a) ¿Qué tipo de validez es la más apropiada en este caso? ¿Por qué?
b) ¿Qué tipo de datos sobre validez se presentan?
c) ¿Qué opina Ud. sobre los datos de validez?
F) La Objetividad
a) ¿Le parece que hubo sesgos durante su desarrollo? Explique.
b) ¿Existe la posibilidad de que hubo sesgos en la administración?
c) Explique.
d) ¿Existe la posibilidad de que hubo sesgo en la calificación? Explique.
MODULO 8
LA PRESENTACIÓN Y EL ANILISIS ESTADISTICICO DE LOS DATOS
Existen varias maneras de clasificar los datos. Tal vez la más común sea clasificarlos según la
escala o el nivel de medición, a saber:
1) El nivel nominal,
2) El nivel ordinal,
3) El nivel de intervalo y
4) El nivel de razón.
El nivel nominal
Se puede decir que el nivel nominal (o cardinal) involucra un proceso de nombrar, en vez de
medir. Se trata de basar la asignación de números .solamente en la clasificación de las
observaciones. Algunos ejemplos del nivel nominal son el número de nombres y mujeres, el
número de niños de alto y bajo rendimiento y el número de personas de la clase baja, media
y alta. Se pueden considerar muchas variables independientes del nivel nominal porque las
mismas se dividen en dos grupos: el grupo experimental y el grupo de control, o un grupo
que tiene una característica y otro que no la tiene.
Se pueden distinguir tres tipos de datos nominales: las dicotomías artificiales, las dicotomías
verdaderas y las categorías.
Existe una dicotomía cuando una variable tiene solamente dos posibles valores. Muchas
veces se forman dicotomías artificiales partiendo de datos continuos. Por ejemplo, dividir un
grupo de alumnos en dos: los que rinden excepcionalmente y aquellos cuyo rendimiento es
inferior; probablemente significa escoger dos puntajes y afirmar que todos aquellos que
hayan obtenido un puntaje más elevado de lo que se considera un puntaje alto, son
alumnos de alto rendimiento, mientras que todos los que hayan obtenido un puntaje
inferior son alumnos de rendimiento bajo. Esto es artificial porque es necesario establecer
un punto arbitrario al hacer la división.
El sexo generalmente se considera como una dicotomía verdadera. No es necesario
establecer un punto arbitrario para distinguir entre hombres y mujeres. Asistir a un curso o
no, probablemente sea una dicotomía verdadera, pero a veces en tales situaciones existe un
tercer grupo que asistió solamente a parte del curso y, por lo tanto, puede ser distinto a los
otros dos grupos.
En el caso de una categoría, ésta simplemente tiene más de dos divisiones. Algunas
categorías que se encuentran comúnmente en las investigaciones educativas son los grados
y los niveles de educación, las clases socioeconómicas, la religión, los niveles de escalafón y
los tipos de nombramientos.
El nivel ordinal
Los datos ordinales implican un orden de personas u objetos. En vez de simplemente
clasificar a los niños como extrovertidos o introvertidos, es posible ordenarlos según su
grado de extroversión. El nivel ordinal de un dato es su posición relativa con respecto a los
otros datos de su conjunto. Los datos que comprende el nivel ordinal no son absolutos ni
existe la necesidad de indicar el grado de las diferencias que hay entre los niños, solamente
el orden en que se encuentran. En la investigación educativa es bastante común pedirles a
los sujetos que ordenen un conjunto de características o de personas según su importancia
o su calidad, sin darle un puntaje absoluto a cada una de ellas.
El nivel de intervalo
Tal vez la mayoría de los datos que se obtienen en las investigaciones educativas son de
nivel de intervalo. Los datos de intervalo indican, el intervalo o distancia que hay entre los
puntajes obtenidos. Dichos ciatos también se denominan datos continuos. Los datos de
intervalo tienen todas las características que tienen los datos del nivel ordinal, además de
ser iguales las unidades. Muchos consideran que el C.I. es un ejemplo de una medición el
nivel de' intervalo. La diferencia de un C.I. de 90 y uno de 100 es la misma que la diferencia
entre 120 y 130. Si se ordenan los integrantes de un grupo según su inteligencia, no se
puede afirmar que la diferencia entre el 10o. y el 20o. es la misma que la. Diferencia entre el
30o. y el 40o.
Existe cierta controversia con respecto a si muchas de las mediciones de la investigación
educativa, como la de los puntajes obtenidos en un test para determinar el C.I., la de los
resultados de tests de rendimiento y la de las escalas de actitudes e intereses son del nivel
ordinal o del nivel de intervalo. Esto constituye un asunto importante, porque la aplicación
de varias técnicas estadísticas requiere que se utilicen datos de intervalo.
Es posible sumar y restar los datos de intervalo, pero no es válido referirse a los unos y a los
otros como múltiplos o razones. Por ejemplo, no puede afirmarse que una persona con un
C.I. de 140 tiene dos veces la inteligencia de una persona con un C.I. de 70.
Tal vez la mayoría de los datos de intervalo de las investigaciones educativas la constituyen
los puntajes de varios tipos de tests. En su forma original (puntajes brutos o burdos) y sin
contar con otra información, resulta difícil interpretar los puntajes. Si un alumno ha
obtenido 58 de 80 puntos, no sabemos de inmediato si su rendimiento es bajo, regular, ni
siquiera si es bueno. La interpretación del puntaje por un alumno suele depender del
rendimiento de los demás o de los deseos del alumno mismo. Para facilitar la interpretación
de los puntajes, se calculan puntajes derivados, tales como los equivalentes de edad, los
equivalentes de grado, los percentiles y los puntajes estandarizados.
Los equivalentes de edad y de grado dependen de las normas del test. Se establecen las
normas a través de un proceso de administración de, un test a una muestra grande (una
muestra de estandarización) y de estudio de los resultados, a fin de determinar el promedio
El nivel de razón
Las mediciones del nivel de razón solamente se encuentran en las ciencias
físicas y no así en las ciencias de la conducta. Dichas mediciones tienen lo
que se llama un cero absoluto. Se puede hablar de un peso de 0 como la
ausencia completa de pesó. Sin emb argo, no se puede hablar de un puntaje
de 0 como una ausencia completa de inteligencia o conocimientos. Es
posible que los datos de razón se refieran unos a otros como múltiplos o
razones. Se puede decir que una persona que mide 2 metros es dos veces
más alta que una persona que mide 1 metro. No es posible decir que una
persona con un puntaje de 100 sabe dos veces más que una persona con 50.
8.3 La Presentación de Datos
El Uso de Tablas
Si los datos son muchos, cabe la posibilidad de que sean difíciles de
interpretar, si se presentan de una forma no ordenada. Por ejemplo, en la
Tabla 8.3.1 se presentan los puntajes obtenidos en un test de rendimiento
de historia. Tal vez, oculta entre eso s datos no ordenados, haya alguna
información importante relacionada con una hipótesis. Un primer paso al
Tabla 8.3.1
TABLA 8.3.3
La Distribución de Frecuencias con Datos Agrupados
Por ejemplo, Puntajes Frecuencia no se sabe si
los cuatro 91-100 4 valores entre
91 y 100 son 81-90 8 todos más
próximos, al 71-80 15 91, o al 100,
o están 61-70 11 dispersos
entre 91 v 51-60 5 100.
Witte (1980: 41-50 6 17) sugirió
siete pautas 31-40 1 para
"minimizar las
irregularidades y ambigüedades" en el formato de una tabla de distribución
de frecuencias con datos agrupados. Dichas sugerencias se encuentran en la
Tabla8.3.4.
La figura 8.3.1 histograma que muestra los obtenidos como resultado del test de
rendimiento de historia que se han presentado en las tablas anteriores
Figura 8.3.1 Un Histograma
Tabla 8.3.6
Número de Docentes que Trabajan en Escuelas de Nivel Medio
Figura 8.3.4
¿Está de acuerdo a adoptar un texto nuevo?
SI NO
Respuestas
SI NO
Respuestas
Distribución A Distribución B
7 30
7 7
6 6
5 5
4 4
2 2
Media=5.1 Media=8.4
C) Dos conjuntos muy distintos pueden tener la misma media.
Distribución A Distribución B
90 55
50 50
10 45
Media = 50 Media = 50
La mediana
La mediana es el valor central de una distribución de datos. Ya se ha visto
(en la sección 8.2) que es igual al percentil de 50.
La mediana tiene ciertas ventajas :
A. Puede deducirse de un simple examen de los datos, si están en orden.
B. No la afectan los valores de los términos extremos de una distribución de
datos.
C. Puede determinarse sin conocer el valor particular de cada término.
También tiene algunas desventajas :
A. No puede determinarse por medio de una fórmula matemática.
(Muchos paquetes de programas estadísticos de computadoras
calculan la mediana, pero en general las calculadoras no pueden
calcular una mediana).
B. Los datos deben haberse ordenado para poder encontrarla.
C. Si hay mucha variación en los datos, es posible que la mediana no
refleje bien la realidad.
Tabla 8.5.1
Dos Distribuciones con las Mismas Medias y Medianas
Distribución A Distribución B
90 60
80 60
70 60
60 60
50 50
40 40
30 40
20 40
10 40
Media=50 Media=50
La Desviación Estándar
La medida de variabilidad preferida es la desviación estándar (o desviación
típica). Se usan todos los datos de una distribución para calcularla. La
desviación estándar puede considerarse como un promedio de las distancias
a que están los datos de la media. La media es una posición y la desviación
estándar es el promedio de las distancias a que está esa posición. Entre los
símbolos que se usan para indicar una desviación estándar se encuentran la
letra s y la letra griega sigma (o ) •
Figura 8.6.2
La Relación entre el Porcentaje de los Datos y las Desviaciones Estándar con
la Curva Normal
Figura 8.6.3
Fi g ur a 8 .6 .4 La C ur v a N o r mal co n M ed ia s
I g ua le s y De s vi ac io ne s Es tá nd ar
Di st i nt as
8.7 La Correlación
Las estadísticas descriptivas, tales como la media y la desviación estándar
sirven para dar información acerca de una variable. Si se desea obtener
información sobre la relación entre dos o más variables, una manera de
conseguirlos es mediante una correlac ión. Puede ser que un investigador
tenga interés en la relación entre el C.I. y el rendimiento matemático de un
grupo de alumnos. Una correlación puede proporcionar información sobre
dicha relación. El valor mismo que indica el grado de correlación se llam a
coeficiente de correlación. Un coeficiente tiene un rango posible de -1.00
hasta +1.00. El signo ( - o+) indica la dirección que toma la relación y el
número indica su magnitud. El signo + indica una relación positiva. Es decir
una relación en que la medi da alta de una variable implica que la otra tiene
una medida alta también. Por ejemplo, se espera que haya una correlación
positiva entre el C.I. y el rendimiento, el peso y la estatura, la edad de los
niños y la estatura, el nivel de educación y el ingres o anual. En una relación
negativa la medida alta de una variable implica que la otra tiene una medida
baja. Por ejemplo, generalmente existe una correlación negativa entre el C.I.
y el tiempo que es necesario para resolver problemas matemáticos, el
tiempo de práctica y los errores dactilograficos, fumar y el índice de
longevidad. Entre algunas variables no suele existir ninguna o poca relación,
lo cual se indica mediante una correlación de aproximadamente 0.00. Por
ejemplo, no hay mucha correlación entre el C.I. y el peso, el tamaño de
calzado y la actitud hacia la escuela; el rendimiento escolar y una afición a
comer chicharrones.
Una Grafica de Dispersión
Una manera gráfica de averiguar algo sobre la correlación entre dos
variables es por medio de una gráfica (o diagrama) de dispersión. Cuando
existen dos variables, el conjunto de los valores de una de las variables suele
llamarse X y el conjunto de la otra Y. En una gráfica con un eje "x" y un eje
"y" es posible hacer una gráfica con los pares de valores. En la Figura 8.7.1 se
indican algunas posibilidades.
Tabla 8.7.2
Materiales 60 77 9
Método tradicional 60 71 8
Los alumnos a quienes se les enseña con el método que utilizaba materiales
concretos, tienen un promedio de rendimiento que es más alto que la
muestra de alumnos con el método tradicional. El investigador se verá en la
necesidad de preguntarse: "¿Sucedió la diferencia por azar? Si me dedico a
estudiar otras muestras, ¿voy a encontrar los mismos resultados? Si llego a
inferir que hay una difere ncia verdadera entre las dos muestras, ¿cuál es la
probabilidad de que tal in ferencia sea falsa?'
Existen tests de significación que permiten darle respuesta a preguntas
semejantes a algunas de las anteriores. Los conceptos importantes en torno
a los test s de significación son:
1) La hipótesis nula,
2) El nivel de significación,
3) El error de decisión,
4) El poder estadístico y
5) Los tests de una y dos colas.
La Hipótesis Nula
En la sección 4.2 ya se mencionó que una hipótesis nula indica que no existe
una diferencia s ignificativa entre las variables y que dicha hipótesis nula es
necesaria al realizar un test estadístico. En el ejemplo de los métodos de
enseñanza una posible hipótesis nula sería: "No existe una diferencia
significativa entre el rendimiento de los alumno s a quienes se les enseña
siguiendo un método que emplea materiales concretos v el de los que se les
enseña siguiendo un método tradicional". El investigador realiza un test de
significación para averiguar si es posible rechazar la hipótesis nula. Si el te st
de significación indica que existe una diferencia signi ficativa, entonces el
Universidad de San Carlos de Guatemala. 120
investigador puede rechazar la hipótesis nula. Sin embargo, si el citado test
indica que una diferencia semejante puede presentarse con frecuencia
debido solamente al azar, el investigador debe aceptar la hipótesis nula.
El Nivel de Significación
Un test de significación proporciona lo que se llama un nivel de significación
que puede usarse para decidir si se rechaza o se acepta la hipótesis nula. El
nivel de significación generalmente se expresa como un decimal, es decir,
0.05, 0.01, 0.001, etc. Un nivel de 0.05 implica que hay menos de 5
posibilidades entre 100 de que la diferencia sucederá si en realidad no
existe una diferencia entre las poblaciones. En este caso, se dic e que la
diferencia tiene un nivel de significación de punto cero cinco. Si tiene un
nivel de punto cero uno (0.01),'existe menos de una posibilidad entre 100 de
que la diferencia sucede ría aún cuando no existe una diferencia entre las
poblaciones.
Considerando el ejemplo de los dos mé todos de enseñanza, si se averigua
que la diferencia entre las medias de 77 y 71 tiene un nivel de significación
de 0.05, eso implica que existen menos de 5 posibilidades entre 100 de que
en dos muestras de la población de a lumnos del primer grado primario
pueda haber tal diferencia. Otra manera de considerarlo es: con muestras de
60 sujetos, cuyas medias son 77 y 71 y sus desviaciones estándar de 9 y 8
existen menos de 5 posibilidades entre 100 de que ocurra una diferencia t an
grande si las medias de la población son iguales y por lo tanto podemos
llegar a la conclusión de que las medias de población sí son distintas.
En el ejemplo anterior ambas muestras son de la población de alumnos del
primer grado. El investigador desea saber si el tipo del método de enseñanza
es algo que divide al grupo en dos poblaciones distintas. Como se explicó en
el párrafo anterior, un nivel de significación de 0.05 indica que hay menos
de 5 posibilidades entre 100 de que las medias de dos muestras de esa
población tengan una diferencia tan - grande. Por lo tanto se puede inferir
que en realidad es probable que el tipo de método de enseñanza contribuye
a formar dos poblaciones distintas.
Sin embargo, si se consideran otros ejemplos, la situación pued e ser
distinta. Si un in vestigador quisiera estudiar la diferencia en cuanto a
habilidad matemática entre niños y niñas, podría pensar desde el principio
el hecho de que hay dos poblaciones distintas. Una hipótesis nula implica
que las dos poblaciones tie nen la misma media. Basándose en un test de
significación, el investigador puede aceptar la hipótesis nula o rechazarla.
Después de rechazarla, se puede sugerir que las medias de las poblaciones
correspondientes no son iguales.
A veces, un nivel de signifi cación se presenta con la letra p. Por ejemplo, un
nivel de 0.05 puede aparecer en esta forma: p< 0.05. Además, algunas veces
el nivel de significación se le llama nivel alfa.
Una pregunta importante que debe hacerse un investigador es: ¿Qué nivel
de significación debe utilizarse? Aunque los niveles de 0.05 y 0.01 son los
más comunes en la investigación y evaluación educativa, tal vez una
respuesta razonable a la pregunta sería: depende de la situación. Si se trata
El Error de Decisión
En realidad, un test de significación nunca proporciona una certeza a un
investigador. Es decir, nunca se sabe a ciencia cierta si hay una diferencia o
no. Siempre existe la posibilidad de equivocarse, o de cometer errores.
Si se rechaza la hipótesis nula porque se ha alcanzado un nivel determinado
de significación, todavía existe la posibilidad de que no haya una diferencia
real. Si no existe una diferencia a pesar de lo que indica el test, esto implica
que se ha cometido un error de Tipo L
Si el investigador acepta la hipótesis nula y si de hecho existe una
diferencia, se ha co metido un error de Tipo II.
En la Tabla 8.8.1 se indican los cuatro resultados posibles cuando un
investigador toma una decisión con respect o a una hipótesis nula.
Es más probable que ocurra un error de Tipo I si se selecciona un nivel de
0.05 en vez de uno de 0.01. Por otra parte, es más proba ble encontrar un error
de Tipo II cuando el nivel es más exigente. Al seleccionar un nivel de significación,
el investigador puede considerar qué tipo de error seda el más gra ve.
A veces al error de Tipo I se le denomina como error alfa. Asimismo, el error
de Tipo II se conoce también como error beta.
El Poder Estadístico
El concepto del poder estadístico de un test tiene relación con el concepto
del error de decisión. El poder estadístico que tiene un test estadístico es la
probabilidad de rechazar una hipótesis nula que sea falsa. Se puede
conceptualizar el poder estadíst ico como la capacidad que tiene un test para
evitar el error de Tipo II. Los métodos para medir el poder estadístico son
muy técnicos.
La Tabla 8.8.1
La Relación entre el Error de Tipo I y el Error de Tipo II
Tabla 8.10.1
Una ventaja del ANOVA es que permite que se considere una variable
moderadora. Tal vez el investigador crea que el sexo del alumno influye en
el éxito de los distintos métodos que se emplean en el ejemplo de la Tabla
8.10.1. La Tabla 8.10.2 presenta los resultados obtenidos por los mismos
grupos, separados según el sexo.
El ANOVA que se realiza en este caso es para dos factores que son el método
y el sexo. Hay tres niveles de métodos y dos de sexo. Por lo tanto, en este
caso puede llamarse un ANOVA de 3X2. Un ANOVA para dos factores también
se conoce como un ANOVA para clasificación doble.
Un ANOVA tiene como resultado lo que se llama un valor o razón F. Existen
tablas que se usan para averiguar la significación de los valores F, dados los
grados de libertad,
8.11 El Ji Cuadrado
NIÑOS NIÑAS
Grupo Media Desviación Grupo Media Desviación Estándar
Estándar
Método A 74.1 10.1 Método A 66.5 10.4
Método B 76.6 10.8 Método B 77.0 9.1
Método C 72.8 8.7 Método C 82.0 10.1
Weinberg, Sharon L. y Goldberg, Kenneth P. Estadística Básica para las Ciencias Sociales,
México: Nueva Editorial Interamericana, 1982.
Witte, Robert S. Statistics, New York: Holt, Rinehart and Winston, 1980.
a) La media
b) La mediana
c) La moda
d) Ninguna de las respuestas anteriores es correcta
10. ¿Cuál de las siguientes pautas es la más importante para elaborar una
tabla de frecuencia con datos agrupados?
a) Tener entre 10 y 20 intervalos
11. Si se supone que los resultados de un test hecho a nivel nacional tienen
una distribución normal, y si la media es de 60 y la desviación estándar es de
10; entonces aproximadamente dos tercios de ellos tienen sus puntajes
entre
a) 50 y 80
b) 40 y 80
c) 55 y 65
d) 50 y 70
15. Para aplicarla fórmula del producto momento de Pearson los datos
a) Deben ser del nivel ordinal o nominal
b) Deben ser observaciones apareadas del mismo conjunto de sujetos
c) De una variable deben tener una relación curvilineal con los datos de la
otra
d) Todas las respuestas anteriores son correctas
16. La gráfica que se usa para averiguar algo sobre la correlación entre dos
variables se llama
a) Un histograma
b) Un polígono de frecuencias
c) Una gráfica de dispersión
d) Ninguna de las respuestas anteriores es correcta
19. El test estadístico que compara las frecuencias que se han encontrado
con las frecuencias que se espera que ocurran al azar es
a) El ANO VA
b) El Ji Cuadrado
c) El Test-t
d) El Test-U de Mann-Whitney
20. Se puede analizar el efecto de una variable moderadora con
a) Un Ji Cuadrado
Ejercicio 8
7. La media del C.I. de un curso es de 115 y la desviación estándar de 20. Para los que
toman otro curso los datos correspondientes son 100 y 5. ¿A cuál de los grupos que
tomaron un curso debe ser más fácil enseñarle? ¿Por qué?
13. Si se desea desarrollar un método para predecir el éxito que tendrán algunos
estudiantes universitarios, interesa más saber ¿cuál es el coeficiente del producto momento
de Pearson o la regresión?
14. Un investigador usa un test de significación para comprobar la hipótesis nula con
respecto a la relación entre dos grupos.
a) Si resulta que existe solamente una posibilidad entre un millón de que la diferencia que
se encuentra entre los dos grupos pudiera existir al azar entre las poblaciones
correspondientes ¿se debe aceptar o se debe rechazar la hipótesis nula?
b) Si resulta que existe una posibilidad entre cinco que una diferencia semejante pudiera
existir al azar entre las poblaciones correspondientes ¿se debe aceptar o se debe
rechazar la hipótesis nula?
a) ¿p<0.05?
b) ¿p<0.05?
c) ¿p<0.01?
d) ¿p<0.01?
17. Defina
a) Error de Tipo I y
b) Error de Tipo II.
19. Si un investigador desea comprobar las diferencias entre las medias de cuatro grupos
20. Un profesor de historia administró un pre test a dos clases y los resultados fueron
equivalentes. Realizó su labor docente para un grupo por medio de presentaciones de
carácter tradicional. Con el otro grupo puso en práctica un método a base de indagación.
¿Cómo puede él comprobar si existen diferencias significativas entre los resultados del pre-
test y el post-test?
21. Un investigador desea comparar la eficacia de tres métodos para enseñar ortografía.
Selecciona aleatoriamente tres grupos de alumnos que se aparean según su C.I., los
puntajes obtenidos en un pre-test de ortografía y su rendimiento escolar en general. ¿Qué
test de significación debe aplicar?
22. Si un investigador desea comparar las medias de dos muestras, pero teme que no le
den todas las condiciones necesarias ¿Qué test debe usar?
M O D UL O 9
La selección de la muestra
La población meta debe tener la información que se busca. I so parece obv io, pero no
siempre es fácil identificar quien tiene la información que se I nunca y si está dispuesto a
proporcionarla. Se puede pensar que los directores de escuelas saben cómo se s eleccionan
los profesores, pero posiblemente sea el Ministerio de Educación el que ¿e encarga de
seleccionar a los profesores.
Vale la pena enfatizar, otra vez, que es preferible seleccionar una muestra aleatoria. Si se
desea examinar las diferencias entre las respuestas obtenidas de varios subgrupos, una
muestra estratificada es la más adecuada. Si faltan recursos de tiempo y dinero, tal vez el
uso de una muestra por conglomerados sea lo más indicado.
La redacción de los ítemes
La redacción de los ítemes de un cuestionario es algo sumamente importa nte. Si no se
pregunta exactamente lo que se desea, las respuestas no proporcionarán la información
deseada. Si parecen estar redactados de una manera descuidada, los sujetos no les van a
dar importancia y tal v ez ni los contesten. Existen varios formatos para redactar los ítemes.
recibido____________________________________________________________________
____________________________________________________________________
Nombre del Curso-------------------------------------------------------------------------------------------------
--------------------------------------------------------------------------------------------
Institución__________________________________________________________________
____________
Duración Fechas
Años Meses De A
________________________________________________________________________
Existen muchos factores que el investigador debe considerar al redactar los ítemes de un
cuestionario. A continua ción se especifican algunos de los más importantes.
L a c l a r i d a d . Sobra decir que es necesario redactar los ítemes sin cometer errores
gramaticales. Además, es importante evitar las ambigüedades. Esto, a veces, resulta difícil
porque el investigador está tan embebido en su trabajo que no se percata de la ambigüedad
de lo que está diciendo. Por ejemplo, el ítem "¿Cuál es su opinión de la Guía Curricular?" se
podría contestar así: "¿Qué Guía Curricular?" Para cerciorarse de que la pregunta se ha
expresado con claridad, a veces se hace necesario definir algunos términos que son poco
comunes o que tienen varios sentidos. D ebe evitarse el uso de la jerga profesional. Hay que
tener cuidado con los adjetivos y los adverbios que no tienen el mismo sentido para todo.
"Frecuentemente", "la mayoría", "generalmente", y "pocos" pueden interpretarse de
maneras muy distintas.
Tener c u i d a d o con los ítemes d e carácter negativo . Existe la posibilidad de que la
persona que responde no se fije en el carácter negativo del ítem y que por consiguiente
responda como si el mismo tuviera una forma positiva. También surgen dificultades cuando
es necesario responder con un "sí" o un "no" a un ítem de carácter negativo. Considere el
siguiente ítem de una escala de Likert:
Alguien a quien le parece que es imposible que una persona común y corriente entienda el
funcionamiento de las computadoras, tal vez responda con un sí o tal vez responda con un
no.
Aunque las calculadoras son instrumentos muy útiles, en las escuelas no se debe permitir su
uso.
_____ Sí ______________ No
Cada uno de los dos ejemplos consta de dos partes. Un sujeto puede estar de acuerdo con
una parte y no así con la otra, o puede estarlo con ambas, o con ninguna de las dos. Si un
ítem contiene la palabra "y" o dos cláusulas, el investigador debe cerciorarse de que no se
trata de un ítem doble.
E v i t a r t é r m i n o s q u e i m p l i c a n s e s g o s . El mencionar el nombre de una persona
respetada puede sesgar la respuesta. Por ejemplo,"¿Está Ud. de acuerdo con el plan del
Ministro de crear una unidad de capacitación dentro del Ministerio?" El sujeto puede
responder según su opinión del Ministro, en vez de lo que piensa acerca de la unidad de
capacitación. Un ejemplo de un ítem que indica cuál es la respuesta deseada podría ser:
"¿Todos los patriotas están de acuerdo en que se le dé más énfasis al Día de la
Independencia?"
Instrucciones claras y a la vez breves . Las instrucciones deben ser claras, pero tan breves
como sea posible. Las instrucciones largas, aunque sean muy precisas, no resultan prácticas
y los sujetos ni se toman e l trabajo de leerlas.
Una organización lógica . La organización del cuestionario debe seguir una secuencia lógica.
Una forma de hacer esto es reunir todos los ítemes que están relacionados entre sí. Otra
manera es reunir todos los ítemes que tengan la mism a forma de respuesta. En general, tal
vez sea mejor empeza r con ítemes generales e ir avanzando hacia los ítemes más
específicos.
Empezar con ítemes fáciles . Cuando así sea posible los ítemes iníciales deben ser
interesantes, no intimidantes y fáciles de contestar.
Los ítemes y las páginas deben enumerarse . Los ítemes no deben dividirse entre dos
páginas. Generalmente, un ítem no debe dividirse entre el final de una página y el principio
de la siguiente.
Los pasos a seguir al realizar una investigación por entrevista son muy semejantes a Tos
pasos que se dan al emplear un cuestionario. Primeramente, se define el propósito de la
entrevista y se identifica la muestra. Debido al alto costo de las investigaciones por
entrevista, hay una tendencia a utilizar muestras pe -quenas; por lo tanto, existe el riesgo
de que la muestra no sea representativa. Si es posible, es aconsejable procurar que los
sujetos se comprometa n a brindar su cooperación antes d e empezar a realizar las
entrevistas. Si hay algunos que no desean participar, será necesario seleccionar otros de
una manera aleatoria y tratar de averiguar si las personas que se rehúsan a participar,
tienen características distintas que implican que la muestra resulte sesgada.
La guía para realizar la entrevista es análoga a un cuestionario. La misma proporciona fas
preguntas que el entrevistador debe hacer y la secuencia que debe seguir al hacerlas.
Pueden identificarse tres tipos de entrevistas, a sabe r:
1) Las estructuradas,
2) Las semiestructuradas y
3) Las no estructuradas.
Si el investigador cree que los individuos de su población meta, que tienen teléfono,
representan bien a la población, entonces tal vez una entrevista por teléfono sea
aconsejable. Una entrevista por teléfono puede tener todas las ventajas de una entrevista
personal, además de las siguientes:
1) Es menos costoso que una entrevista personal. Incluso, si nadie contesta, no hay
ningún costo y se puede llamar en otra oportunidad.
2) A veces es posible usar una población accesible más amplia.
3) Es más fácil comunicarse por teléfono con algunas personas que se mantienen muy
ocupadas, que concertar una cita con ellas.
4) Es más fácil supervisar a los entrevista-dores cuando están entrevistando por
teléfono desde un lugar central. De este modo es más sencillo controlar la calidad de
las entrevistas y cerciorarse de que los entrevistadores realmente las han realizado
todas.
5) Son muy útiles cuando son posteriores a una entrevista personal. Durante tales
entrevistas es posible indicar a los sujetos que dentro de algunas semanas se les
llamará a fin de averiguar si han sucedido algunos cambios en la situación que se
está estudiando mediante la entrevista. '
6) Existe la posibilidad de que el entrevistador use una microcomputadora para registrar
las respuestas. El uso de una computadora con un programa apropiado puede dar la
seguridad de que el entrevistador registrará las respuestas donde corresponde y que
preguntará solamente los ítemes correspondientes. Esto de preguntar solamente los
4) ¿Qué falla tiene el siguiente ítem de un cuestionario? "El Ministerio debe invertir
menos en su computadora para aumentar los sueldos",
a) Es demasiado largo
b) Es un ítem doble
c) No está claro
d) No tiene falla
8) El rapport es
a) Un tipo de entrevista persona
b) Una relación de amistad y confianza
c) Un tipo de cuestionario
d) Una manera de evitar sesgos
9) El uso de una grabadora durante una entrevista
a) Preguntas directas
b) Preguntas indirectas
c) Afirmaciones
d) Hechos
e) Opiniones
f) Preguntas predeterminadas
g) Preguntas adaptadas a las respuestas
h) Respuestas cortas
i) Respuestas de escala
j) Respuestas tabuladas
k) Respuestas ordenadas
l) Respuestas de listas de selección y
m) Respuestas categóricas
2. Identifique las fallas en los siguientes ítems y escrib a una versión mejor de cada
uno de ellos:
A. El Ministerio debe estipular que se dedique menos tiempo a la literatura y más
tiempo a las artes manuales.
B. Los profesores no deben aplicar el castigo corporal.
C. Todo profesor que sea dedicado debe trabajar horas extras.
D. La reforma educativa cumplió sus objetivos.
3. Considere la siguiente guía de entrevista que elaboraron Borg y Gafi (1 983, pp.
462-463), la cual se puede usar para averiguar hasta qué punto una muestra de
padres de familia siente satisfacción con una escuela determinada:
1) ¿Cuántos niños tiene usted?
2) ¿Cuántos años tiene cada uno de ellos?
3) ¿A cuál(es) escuela(s) asisten ellos?
4) ¿Por cuánto tiempo han asistido a la(s) escuela(s)?
5) ¿Qué es lo que más le gusta acerca de la(s) escuela(s) donde asisten?
6) ¿Qué es lo que menos la gusta?
7) ¿Qué tipo de contactos ha tenido usted con los profesores de sus hijos?
Aplicación 9
Historias Orales
Las historias orales pueden consistir en entrevistas extensas con una persona que
ha tenido mucho que ver con un fenómeno educativo. Este método sería muy útil
para estudiar un programa que ha tenido el mismo director por muchos años, o
para estudiar un fenómeno semejante al que presentan las escuelas unitarias.
La Observación Participante
Está de más decir que, en la observación participante el i nvestigador participa en
las actividades del grupo que está estudiando. La definición cl ásica de la
observación participante es la de Kluckholm (1940, p. 331) y la considera como un
proceso Consistente y sistemático de compartir, en todo lo que le permitan las
circunstancias, las actividades de la vida, y, en ocasiones, los intereses y afectos de
un grupo de personas. Tiene como propósito la obtención de datos acerca de la
conducta, a través de un contacto, directo y en términos de aquellas situaciones
específicas en las cuales la distorsión producida en los resultados por el efecto del
investigador, como agente exterior, es mínima.
Es importante destacar esta frase: "en todo lo que le permitan las circunstancias."
A tal extremo es la participación completa, que nadie se apercibe de que se le está
observando. Por el contrario, en el caso de la observación, ésta es obvia y hay
solamente la participación que hace falta para obtener la confianza del grupo, o
para establecer "rapport "con él. La observación participante facilita una com-
prensión total del grupo (incluso de asuntos que se mantienen más o menos en un
plano de reservas y ofrece un gran número de oportunidades para observar.
Aunque la participación completa tal vez sea la más eficaz, ésta puede ocasionar
algunos problemas. Entre los problemas que pueden surgir están: el problema ético
que involucra el engaño y lo que podría suceder si el grupo llega a descubrir que
está siendo observado, la dificultad de poder registra r los acontecimientos, los
posibles cambios que pueden ocurrir a causa de la presencia de otra persona, la
pérdida de objetividad al sentir empatía hacia el grupo y la dificultad (o quizás
imposibilidad) de replicar al estudio.
La Observación No Participante
La investigación no participante no tiene las mismas ventajas que tiene la
observación participante, sin embargo sus desventajas son menores. El observador
Universidad de San Carlos de Guatemala. 156
puede dedicarse tanto a observar como a anotar los acontecimientos a la vez. No
obstante, la presencia de un observador no participante puede cambiar aún más la
situación. Si la observación no participante se realiza en forma disimulada, pueden
surgir problemas éticos.
La Investigación Etnográfica
La investigación etnográfica es un método prestado directamente de la
antropología y en el campo de la educación se usa generalmente para estudiar l o
que sucede en el aula. El propósito de la etnografía es proporcionar una descripción
analítica y profunda de un grupo. Una de las características que define la
etnografía es que el etnógrafo no parte de una hipótesis. A partir de un marco
teórico va anotando todo lo que sucede y de la información así obtenida podrá
formular hipótesis para explicar lo que ha observado. Otro investigador empleando
métodos asociativos o experimentales puede tratar de comprobar las hipótesis que
han sido generadas por el etnógrafo. A veces el investigador, en calidad de
etnógrafo, puede ser un observador participante algunas veces o puede ser un
observador no participante en otras ocasiones.
El Análisis de Documentos
En vez de estudiar directamente a los seres humanos, es posible hacerlo
indirectamente a través de lo que escriben o dicen, o a través de los rastros o
signos que ellos dejan.
Aunque su nombre lo indica, es conveniente señalar algunos posibles ejemplos de
análisis de documentos. Las políticas que se siguen en un Mini sterio de Educación
se pueden estudiar haciendo un análisis de las guías curriculares que se han
publicado. El investigador puede desarrollar un sistema de calificaciones
examinando el énfasis que se le da a cada asignatura y las metodologías que se han
utilizado. En los Estados Unidos de Norteamérica se han realizado análisis de textos
de matemática para averiguar qué actitudes tienen los autores hacia las mujeres y
hacia las minorías étnicas. Para desarrollar un diccionario de términos educativos
español-inglés, se puede empezar con un análisis de documentos para encontrar la
frecuencia con que se usan varios términos educativos en español.
Como se podrá apreciar, a veces se hace necesario usar métodos de muestreo para
realizar el análisis de documentos y desarrollar procedimientos para codificar la
información que se está tratando de obtener. En los últimos años el uso de la
computadora ha facilitado mucho algunos aspectos del análisis de documentos. Un
término más amplio es el análisis de contenidos en el cual se puede incluir
cualquier tipo de comunicación.
Las técnicas que se emplean para el registro de los datos que se obtienen en las
investigaciones de indagación naturalística son muy importantes. Borg y Gall (1983,
pp. 468-471) han sugerido que, aunque continuamente se están desarrollando
nuevas técnicas, las mismas se pueden clasificar en cuatro categorías:
1) el registro de duración
2) el registro de frecuencias
3) el registro de intervalos y .
4) la observación continúa.
El Registro de Duración
Con cualquier instrumento semejante a un cronómetro se puede medir e ir
anotando la duración de alguna manifestación conductual. En algunas
investigaciones se ha estudiado, tanto la cantidad de tiempo que el profesor habla,
como la cantidad de tiempo que los alumnos hablan. También se puede registrar el
tiempo que emplea el profesor para hacer distintos tipos de preguntas y
presentaciones para realizar otras actividades. Si hay más de un observador
registrando la duración.de alguna manifestación conductual, será posible calcular lo
El Registro de Frecuencias
Si la duración de una manifestación conductual es muy breve, o ésta no ti ene
ninguna importancia, es posible ir registrando con cuanta frecuencia ocurre, ya sea
en una hoja de cuentas o empleando un contador manual. En esta forma se puede
ir registrando el número de veces que un alumno levanta la mano o que un profes or
elogia a un alumno. Si un tipo de comportamiento sucede con mucha frecuencia, es
probable que un sólo observador puede ir registrando con cuánta frecuencia
ocurrió un comportamiento determinado. Si acaso ocurren varios tipos de
comportamientos con tan poca frecuencia que no hay forma de que sucedan a la
misma vez, con la práctica un observador que haya sido debidamente adiestrado,
podrá ir registrando la frecuencia con que ocurre más de un tipo de
comportamiento. Cuando hay más de un observador registrando con cuánta
frecuencia ocurre determinado comportamiento, se hace posible averiguar si hay
acuerdo entre los observadores. Si se trata de la observación de un sólo
comportamiento, se puede calcular la razón entre los res ultados obtenidos por los
observadores. Cuando se registra con qué frecuencia ocurre más de un
comportamiento, se puede calcular un coeficiente de correlación.
El Registro de Intervalos
Algunos investigadores han desarrollado sistemas para observar el comportamiento
dentro de un intervalo determinado. Por ejemplo, es posible observar a un sujeto
cada diez segundos o cada minuto, con el fin de ir anotando si se está comportando
de alguna manera específica.
La Observación Continua
En vez de anotar las formas de comportamiento predeterminadas, el observador
puede observar una situación o un sujeto y tratar de ir anotando todo lo que está
pasando. Generalmente, escribe lo que se llama un protocolo, el cual no es más que
un relato en orden cronológico de todo lo que hace un sujeto en una situación
determinada. Dicha situación puede ser una clase, una reunión, un grupo de
trabajo, etc. En el protocolo tal vez sea posible notar ciertos patrones que luego se
pueden estudiar empleando uno de los otros métodos que se utilizan para registrar
observaciones.
Escribir protocolos es algo muy difícil. El observador tiene que ser muy hábil para
observar y entender los posibles patrones de conductas que puedan surgir del
análisis del protocolo. El análisis de protocolos es un tipo de análisis de
documentos.
1. El comportamiento verbal
Este tipo de comportamiento lo constituye, por supuesto, lo que se expresa
verbalmente. La observación puede registrarse en un protocolo o por medio de una
2. El comportamiento no verbal
El proceder del sujeto es lo que consideramos comportamiento no verbal. En esta
categoría pueden incluirse las expresiones faciales, la dirección de la mirada y la
forma en que él mira, cómo mueve el cuerpo, cómo se sienta, etc.
3 El comportamiento espacial
La forma en que un sujeto hace algo tiene que ver con el comportamiento espacial.
Se acerca o se aleja de algo o de alguien, si usa la fuerza o no la usa, si actúa con
rapidez o con lentitud.
4. El comportamiento lingüístico
Este tipo de comportamiento está representado por la forma de expresarse. Tiene
que ver con el tono de voz que la persona usa y su estilo de hablar.
El Uso de Microcomputadoras
Actualmente las microcomputadoras pueden facilitar y agilizar el registro de datos
obtenidos mediante la observación. Existen programas que facilitan el registro de la
En los últimos años se ha venido notando en el mundo en desarrollo que hay mucho
interés en un tipo de investigación que combina tres cosas: la investigación, la
educación-aprendizaje y la acción. La investigación participativa ha sido usada
como componente importante de algunos proyectos de educación de adultos, con
miras a mejorar las condiciones de vida y promover la justicia social. L a misma
comprende una interacción democrática entre los investigadores formales y las
personas entre las cuales la investigación se realiza. Dado su ambiente natural, tal
vez sea posible considerarla como un tipo de indagación naturalística. Si el lector
tiene interés especial en la investigación participativa, debe consult ar las
publicaciones que al respecto ha hecho el Centro Regional de Educación de Adultos
y Alfabetización Funcional para América Latina (CREFAL) en Pátzcuaro, Michoacán,
México.
Para cada uno de los siguientes ítemes subraye la respuesta más apropiada.
5. La investigación etnográfica
a) Depende de métodos estadísticos
b) Es útil para formular hipótesis
c) Implica observación participante
d) Todas las respuestas anteriores son correctas
Ejercicio 10
Aplicación 10
Si su problema requiere que se lleve a cabo una investiga ción por indagación
Naturalística, identifique el tipo de indagación Naturalística que estima que es
conveniente emplear, diseñe la guía de observación y planifique el entrenamiento
de los observadores.
Tabla 11.3.1
Fuentes de Invalidez al Usar Diseños Pre-Experimentales
El Diseño de Pre-test Post-test con un Solo Grupo permite hacer algo de comparación
al aplicar un pre-test y un post-test. La representación gráfica del diseño es así: 01 X 02
Aunque tal vez se pueda usar este diseño, si es que no hay otra manera de realizar un
estudio, existen aún más amenazas a su validez. La historia y la maduración pueden influir
en los resultados; algo puede suceder, ya sea a los sujetos o bien dentro del grupo de ellos.
El uso de tests y la instrumentación pueden causar problemas si los sujetos aprenden algo al
tomar el pre-test que les puede ayudar en el post-test o si las fallas en los mismos tests son
causas de las diferencias aparentes. No existe forma alguna de determinar si los resultados
Universidad de San Carlos de Guatemala. 169
pueden generalizarse con respecto a toda una población o si tienen que ver solamente con
la muestra.
La Comparación de Grupos Estáticos permite hacer una comparación entre dos grupos,
pero sin que al principio se sepa cuál es la relación entre los dos grupos, debido a la falta de
asignación aleatoria de sujetos a los grupos y a la ausencia de un pre-test. Se puede ilustrar
el diseño como aparece a continuación-.
XI O
-------
X2 O
A O XO A O X1 O
AO O o A O X2 O
Se presentan dos gráficas porque la primera indica que el grupo de control no recibe ningún
tratamiento y la segunda indica que el grupo de control recibe un tratamiento distinto.
Este diseño permite que se usen más grupo
A OX1 O A O X1 O
A O X2 O A O X2 O
o
AO O A O X3 O
Aunque se considera que el uso de un pre-test es muy importante a veces no existe un pre-
test adecuado o se teme que el pre-test va a influir en el tratamiento experimental. En
dichos casos hay que considerar el diseño de sólo un post-test con un grupo de control.
El uso de la selección aleatoria y de un grupo de control elimina la mayoría de las amenazas
a la validez interna. La falta de un pre-test implica la posibilidad de mortalidad. A-
Para evitar el efecto reactivo del pre-test y, a la misma vez, la posibilidad de mortalidad, se
puede considerar el diseño de cuatro grupos de Solomon. Este diseño es como una
combinación de los otros dos métodos. La representación gráfica del diseño es así:
A OX O A OX1 O
A O O A O X2 O
A x O o A X1 O
A O O A X 2O
El test de significación estadística que es apropiado para emplearse con el diseño de cuatro
grupos de Solomon es un análisis de varianza (ANOVA) de 2X2. Las dos variables
independientes son el tratamiento experimental y el hecho de recibir o no el pre-test. De
este modo es posible averiguar si el tratamiento ha sido eficaz y si ha habido interacción
entre el pre-test y el tratamiento.
Aunque controla mejor las amenazas a la validez, no se puede decir que el diseño de cuatro
grupos de Solomon es el "mejor" diseño. Una desventaja que tiene es que requiere que se
use el doble de la cantidad de sujetos. A veces es difícil conseguir tantos sujetos y siempre
se requieren más recursos de tiempo y dinero. Si es la opinión del investigador que no existe
mucha posibilidad de un efecto reactivo del pre-test, tal vez el diseño de pre-test post-test
con un grupo de control sea el "mejor". Si el investigador opina que la mortalidad no
presenta un problema y que no es necesario ni posible administrar un pre-test, el Diseño de
solo un post-test con un Grupo de Control es el "mejor".
Con este diseño se controlan tres factores que no se controlan con el diseño de pre-test
post-test con un solo grupo de control: la maduración, el uso de tests y la regresión.
Desafortunadamente la historia sigue siendo un problema porque todavía existe la posibi-
lidad de que algo pueda ocurrir entre el último pre-test y el primer post-test que, no siendo
parte del tratamiento, influye en los resultados. La instrumentación puede ser un problema,
sobre todo si el investigador cambia de instrumento durante el estudio. Por supuesto que, si
existe la posibilidad de interacción entre el pre-test y el tratamiento habiendo administrado
un solo pre-test, con varios pre-tests es aún más probable.
A manera de ejemplo sencillo de este diseño, se puede considerar un estudio de actitudes.
El uso de varios pre-tests antes del tratamiento puede ayudar a cerciorarse de que las
actitudes no están sufriendo cambios sin el tratamiento. A la vez, es obvio que aumenta el
peligro de que los pre-tests mismos puedan influir en los cambios.
La Figura 11.5.1 presenta algunos de los posibles patrones de los resultados obtenidos
utilizando un diseño de serie de tiempo. El patrón A representa una situación donde el
tratamiento produce ningún efecto. Los cambios están sucediendo en forma natural y el
tratamiento no produce cambios en el patrón. Los patrones B y C indican situaciones donde
el tratamiento sí ejerce influencia. La influencia es más fuerte en el patrón B. El patrón D
muestra cambios alrededor del tratamiento, pero como ocurrieron otros cambios en el
patrón, es difícil decir que el tratamiento fue lo que causó ese cambio.
O X1
O X O O O X1 O O X1 O
O X2
O O O O X2 O O X2 O
O
O O X3 O
X1 X2
O O X3 O
X2 X3
O O X1 O
X3 X1
O O X2 O
Hay tres grupos y tres tratamientos. Cada grupo recibe los tratamientos en un orden
distinto aplicándosele un post-test después de cada tratamiento. Para analizar los
resultados es posible comparar los resultados obtenidos por cada grupo después de cada
tratamiento, con Cada uno de los otros grupos, después de cada tratamiento.
El punto débil más notable de este diseño es que cabe la posibilidad de que haya interacción
entre los tratamientos. Por lo tanto, se usa al aplicar tratamientos de tal naturaleza que, si
se usa uno de ellos, esto no influye mucho en los resultados que se obtengan con los otros.
Los diseños correlaciónales y comparativos causales son más bien tipos de investigación
descriptiva en vez de ser de índole experimental. Se incluyen aquí con el objeto de señalar
en qué se diferencian de la investigación experimental. Cabe la posibilidad de que el
principiante confunda estos dos diseños entre sí y con los diseños experimentales. Tal vez
un diseño correlacionar se confunde con un comparativo causal porque al utilizar cualquiera
de los dos el investigador no manipula la variable independiente y hay que tener el mismo
El Diseño Correlacional
El diseño correlacional no es muy complicado. Involucra que se use el coeficiente de
correlación para determinar si existe una relación entre dos o más variables.
Tabla 11.6.1
Las Diferencias-entre los Estudios Correlaciónales y los Estudios Comparativos Causales
Un Diseño Correlacional
Un Diseño Comparativo Causal
Por lo general, solamente un grupo y dos o Por lo general, dos grupos y una variable
más variables Se usan comparaciones
Se usan correlaciones
Para cada uno de los siguientes ítems subraye la respuesta más apropiada.
6. Para averiguar algo sobre el efecto que ha producido el pre-test se puede usar un diseño
a) De pre-test post-test con un grupo de control
b) De serie de tiempo
c) De cuatro grupos de Solomon
d) Contrabalanceado
7. A O X O
A O O es una representación gráfica de un diseño
a) Contrabalanceado
b) De sólo un post-test con un grupo de control
c) De la comparación de grupos estáticos
d) De pre-test post-test con un grupo de control
11. Una de las ventajas principales que tiene un diseño correlaciona! es que
a) Permite comprobar de las relaciones de causa y efecto
b) Evita los problemas que ocasiona el efecto reactivo de un pre-test
c) Permite estudiar la relación que existe entre varias variables
d) Facilita el uso de un grupo de control
Universidad de San Carlos de Guatemala. 179
12. Una de las desventajas que tiene un diseño comparativo causal es que
a) No permite que se use un grupo de control
b) No permite que se usen estadísticas inferenciales
c) No permite que se confíe mucho en la comprobación de si hay relaciones de causa y
efecto
d) Todas las respuestas anteriores son correctas.
Ejercicio 11
1. Considere el siguiente ejemplo sugerido por Borg y Gall (1983, p. 160): Un investigador
desea determinar el efecto que tiene un programa especial de lectura sobre el rendimiento
en lectura de los marginados de un barrio pobre. Será un estudio longitudinal que empezará
cuando ingresen al segundo grado y terminará cuando egresen del tercer grado. Identifica a
50 niños que no pueden leer bien al terminar el primer grado. Estos niños reciben el
programa especial. Selecciona aleatoriamente a otros 50 niños en la misma escuela y del
mismo grado, para que sirvan de grupo de control. Administra un test de lectura a ambos
grupos al principio del segundo grado y al final del tercero. Al final hay 27 niños en el
programa especial y 36 en el grupo de control.
Identifique y explique las posibles amenazas a la validez interna del experimento.
2. Indique cinco situaciones en las cuales un pre-test no sería factible.
Aplicación 11
Si el problema que se estudia requiere que se lleve a cabo una investigación experimental,
identifique el tipo de diseño que Ud. estima que es conveniente utilizar y dé las razones por
las cuales a Ud. le parece que se debe usar.
La Utilidad
1. La identificación de los beneficiarios Deben identificarse todas las personas que vayan a
estar afectadas por la evaluación.
2. La credibilidad del evaluador El evaluador debe ser una persona capaz y fidedigna.
3. El alcance y la selección de la información Las preguntas a las cuales responde la
evaluación deben ser pertinentes con respecto a las personas a quienes la misma afectará.
4. La interpretación del valor Las bases para efectuar la interpretación y emitir los juicios de
valor deben describirse claramente.
5. La claridad del informe El informe debe redactarse de forma tal que todos los usuarios
puedan entenderlo fácilmente.
6. La diseminación del informe Los informes de evaluación deben llegar a todas las manos
debidas.
7. El momento oportuno de presentar el informe El informe debe completarse
oportunamente.
8. El impacto de la evaluación Una evaluación debe realizarse de forma tal que motive la
acción de los usuarios.
La Viabilidad
9. Los procedimientos prácticos Los procedimientos que se siguen para realizar una
evaluación deben ser prácticos y no deben interferir demasiado con las actividades de las
personas involucradas.
10. La viabilidad política Es necesario tener la cooperación de todas las personas afectadas
y evitar que cualquier grupo subvierta el proceso de evaluación.
11. La eficacia económica Los beneficios de la evaluación deben justificar el costo del mismo.
La Propiedad
12. La obligación formal Las obligaciones de todos los individuos involucrados en la
evaluación deben aparecer especificados en un documento escrito y firmado.
13. Los conflictos de interés Si surgen conflictos de interés, hay que tratarlos abierta y
honestamente.
14. La divulgación completa y franca Los informes de una evaluación deben ser sinceros y
correctos.
15. El derecho del público a saber El público tiene derecho de saber si eso no causa problemas
legales o éticos,
16. Los derechos que tienen los sujetos humanos Los derechos y el bienestar de las personas
involucradas en una evaluación deben protegerse.
17. Las interacciones humanas Los evaluadores deben respetar el valor y la dignidad de las
personas involucradas en una investigación.
18. Los informes equilibrados Los aspectos positivos y negativos de lo que se evalúa deben
aparecer en el informe.
19. El uso apropiado de los fondos Los gastos de una evaluación deben efectuarse en forma
prudente y responsable.
Existen muchos fenómenos educativos que sirven de objetos de la evaluación educativa. Borg y
Gall (1983, p. 742) presentaron una lista "que sugiere el rango de fenómenos educativos que
han sido objeto de la investigación evaluativa:"
1) Los métodos de instrucción (por ejemplo, las presentaciones por parte de los
catedráticos, la enseñanza personalizada, la enseñanza por indagación, el uso de
materiales concretos en la enseñanza de matemática y los métodos no tradicionales de
la enseñanza de lectura)
2) Los materiales curriculares (por ejemplo, los textos, las guías curriculares, los programas
de radio y de televisión)
3) Los programas (por ejemplo, los programas bilingües, los programas de educación no
formal, los programas de capacitación en servicio y preservicio para docentes y los
programas preescolares)
4) Las organizaciones (por ejemplo, las escuelas experimentales, las agencias
internacionales, los departamentos de un ministerio de educación, las escuelas
particulares subvencionadas por el gobierno)
5) Los educadores (por ejemplo, los profesores, los promotores, los directores de escuelas,
los supervisores, los voluntarios)
Existen varios modelos para realizar evaluaciones educativas. Hay ciertos modelos que pueden
considerarse opuestos a otros modelos, mientras que hay algunos que traspasan los linderos de
tos demás.
La evaluación del individuo tal vez sea el tipo de evaluación más común. En ella generalmente
usan tests para comparar la inteligencia o el rendimiento de un individuo con las normas de un
grupo o con criterios especificados. Actualmente, en muchos lugares se pone énfasis en la
evaluación de la eficiencia y la eficacia del personal docente y administrativo de planteles
educativos. Para este propósito se han desarrollado varios tipos de cuestionarios.
Durante los años cuarenta, Ralph Tyler tuvo una influencia significativa en la evaluación
curricular que todavía se hace notar. Tyler insistió en que el currículo debía organizarse según
objetivos específicos y que el éxito de un programa debía medirse según la medida en que se
hayan logrado dichos objetivos. Muchos de los modelos modernos para realizar evaluaciones se
basan en los objetivos del programa.
El modelo CIPP
El modelo CIPP fue desarrollado por Daniel Stufflebeam y sus colegas para ayudar en el proceso
de la toma de decisiones en torno a los programas. CIPP es una sigla que indica los
componentes del modelo: la evaluación del Contexto, la evaluación de los Insumos, la
evaluación de los Procesos y la evaluación de los Productos.
La evaluación del Contexto empieza con el análisis de las necesidades en una situación
educativa. Es decir, ella constituye un intento de averiguar cuáles son las diferencias entre las
condiciones actuales y las condiciones que se desean. Después de haber identificado las
necesidades, se hace necesario desarrollar objetivos que indiquen cómo satisfacer dichas
necesidades.
La evaluación de los Insumos pretende identificar los recursos y las estrategias que hay
disponibles para alcanzar los objetivos del programa. Además de identificar la disponibilidad de
los recursos y las estrategias, el evaluador de Insumos tiene que considerar si el uso de los
mismos resultará factible dada la realidad de la situación.
La evaluación de los Productos puede considerarse como una evaluación sumativa. La misma
proporciona medidas del logro de los objetivos que quizás faciliten la toma de decisiones con
respecto a la continuación y a la modificación del programa.
La evaluación responsiva
En la evaluación responsiva se intenta identificar algunos de los intereses y las preocupaciones
que tienen las personas que han sido afectadas por un programa, los cuales suelen escapar a
una evaluación basada en objetivos:
1) ¿Son realmente importantes y aceptados los objetivos?
2) ¿Cuáles son los intereses y las influencias ocultas que varios individuos y grupos tienen
con respecto al programa?
3) ¿Cabe la posibilidad de que una evaluación formal sea más perjudicial que beneficiosa?
4) ¿Cómo es posible trabajar eficazmente con las personas involucradas en el programa?
Los métodos que utiliza un evaluador responsivo tienden a ser más informales y subjetivos que
los métodos tradicionales. El primer paso de una evaluación responsiva es la identificación de
las personas afectadas por la evaluación e interesadas en ella y de los factores políticos que
entrarán en juego al realizar la evaluación. El segundo paso es la identificación de. Los
La evaluación de contradicción
La evaluación de contradicción se modela a manera de un tribunal. Un equipo de evaluadores
desempeña el papel del 'abogado defensor" y otro equipo el de "fiscal acusador". Los
"abogados" tratan de demostrar que el programa ha sido un éxito y destacan sus hallazgos
positivos. Los "fiscales" indican las fallas y los problemas que ha tenido el programa. Después
de recabar los datos pertinentes y preparar sus presentaciones, se efectúa una audiencia. Las
personas encargadas de la toma de decisiones sobre el programa hacen las veces de "juez".
Aunque este es un proceso interesante que asegura que se presenten varios puntos de vista y
hayan varias fuentes de datos, tiene dos posibles desventajas: requiere de mucho tiempo y
dinero y si uno de los equipos es más capaz que el otro, los "jueces" pueden tomar una decisión
inadecuada.
GAY, L. R. Educational Research: Competencies for Analysis and Application, Columbus, Ohio:
Charles E. Merril Publishing, 1981.
Kline, David. Planning Education for Development: Volume III Research Methods for
Educational Planning, Harvard University: Center for Studies in Education and Development,
1980.
Morris, Lynn; Fitz-Gibbon, Carol; y Hener-son, Marlene. Program Evaluation Kit,Beverly Hills:
Sage, 1978.
Nilo, Sergio. "La Evaluación de los Aspectos Cualitativos en los Proyectos de Sector
Educación", Washington: Organización de Estados Americanos, 1983.
Popham, W. James. Educational Evaluation, Englewood Cliffs, New Jersey: Prentice-Hall,1975.'
Scriven, Michael. "Goal-Free Evaluation", en School Evaluation: The Politics and Process, ed.
Ernest House, Berkeley.- McCut-chan, 197 3.
Stufflebeam, Daniel L. Educational Evaluation and Decisión, Itasca, Illinois: F. E. Peacock,
1971.
Para cada uno de los siguientes ítems subraye la respuesta más apropiada.
1. La evaluación educativa es
a) Útil en la toma de decisiones educativas
b) Una valoración formal de un fenómeno educativo
c) Un tipo de investigación educativa
d) Todas las respuestas anteriores son correctas
3. Una evaluación que se realiza mientras un programa se está desarrollando es una evaluación
a) Formativa
b) Sumativa
c) De los efectos reales
d) De contradicción
8. La investigación responsiva
a) Demanda mucho control experimental
b) Se concentra mucho en los intereses y las preocupaciones de las personas
afectadas por la investigación
c) Ofrece un método muy objetivo
d) Todas las respuestas anteriores son correctas
Ejercicio 12
1. Explique en sus propias palabras las semejanzas y las diferencias que hay
entre la investigación y la evaluación.
Aplicación 12
Si el problema que Ud. está investigando requiere que se lleve a cabo una
investigación evaluativa, identifique el tipo de evaluación
Que Ud. estima conveniente que se realice y diseñe la evaluación.
Como explicó Pérez Álvarez (1978, p. 148): "Nadie investiga para sí mismo, se
investiga para los demás, para todos'. Un informe debe comunicar en forma
clara y precisa los pasos que el investigador realizó para resolver su problema
de investigación. La investigación educativa es un proceso acumulativo. Es el
informe el que permite que los demás investigadores puedan replicar y
extender los resultados obtenidos por sus colegas. Es decir, mediante la
elaboración del informe, el investigador puede contribuir a aumentar los
conocimientos sobre el proceso educativo. También es a través de un informe
que un investigador puede influir en la práctica educativa y en la toma de
decisiones sobre el avance de la educación.
Se puede considerar que toda investigación tiene tres etapas fundamentales:
1) La planificación
2) La realización y
3) La elaboración de un informe.
Cada una de esas etapas requiere que se tengan distintas aptitudes. Tal vez
haya la tendencia de hacer énfasis en la segunda etapa. Sin embargo, las otras
dos son sumamente importantes también. En el Módulo 2 se destacó lo
importante que es la planificación, etapa en la cual se elabora el plan de la
investigación. En el presente módulo se presentaran algunas consideraciones
que facilitan la elaboración de un informe. El investigador tendrá que elaborar
un informe que sea aprop iado para los propósitos de la investigación y de los
destinatarios. Habrá de seguir un esquema y un formato que faciliten la
presentación de la información.
Hay otro aspecto importante que considerar al redactar un informe, el cual
queda fuera del alcance del presente módulo. El mismo tiene que ver como las
cuestiones de estilo general, tales como: la ortografía y la gramática correcta,
las oraciones completas y los párrafos bien organizados, la claridad y la
precisión de lenguaje y una secuencia coherente .
13.2 Los Tipos de Informe
Informes a organizaciones
Si una organización nacional o internacional provee respaldo financiero para
una investigación, generalmente exige que se le presente un informe final.
Tales organizaciones suelen tener pautas a seguir en la preparación del
informe. También suelen encargarse de la publicación y diseminación del
informe.
La Sección Preliminar
1. La Carátula
2. Los Agradecimientos (si acaso los hay)
3. La Tabla de Contenidos
4. La Lista de Tablas (si acaso las hay)
5. La Lista de Figuras (si acaso las hay)
I. El Marco Conceptual
A. Los Antecedentes del Problema
B. La Importancia del Problema
C. El Planteamiento del Problema
D. El Alcance y los Límites del Problema
Las secciones I, II y III del informe final generalmente se parecen mucho a las
del plan inicial. A veces hay que hacer modificaciones debido a los cambios que
ocasionó la prueba piloto o a los que surgieron durante la realización de la
investigación. El resumen de la literatura relacionada al problema que se
incluye en la subsección de "Los Antecedentes del Problema'' debe ampliarse.
En los Estados Unidos "El Marco Teórico" suele presentarse como una
subsección de "Los Supuestos" en la sección de "El Marco Conceptual" y el
segundo capítulo se dedica a un resumen de la literatura respectiva.
Para obtener mayor información sobre las secciones I, II y III, el lector puede
releer el Módulo 2. A continuación se presentan algunos detalles sobre las
demás secciones.
La Sección Preliminar
La universidad, organización o revista a la cual se dirige el informe debe
proporcionar información sobre el formato de la carátula, los agradecimientos,
la tabla de contenidos y las listas de figuras. Si se trata de un artículo para una
revista, la sección preliminar generalmente se limita al título, al nombre del
autor, y tal vez, al puesto que desempeña este último.
La parte más importante de la carátula es el título de la investigación. El título
debe ser breve, pero a la vez debe proporcionar suficiente información
específica que le permita, a cualquier persona que lo lea, decidir si el tema
está relacionado con su área de interés. Por ejemplo, un títul o como "Un
Experimento que Compara un Método Deductivo e Inductivo con la Matemática
del Quinto Grado" tiene una longitud' razonable y proporciona alguna
información sobre el propósito de la investigación. Un título como "La
Enseñanza de la Matemática" es muy vago. Por el contrario, algo como "Un
Estudio de las Diferencias en Rendimiento Escolar de los Alumnos de Quinto
Grado del Nivel Primario Utilizando un Método Deductivo o un Método
Inductivo" es demasiado largo y tiene demasiada información superflua.
Los Resultados
Se presentan los resultados para comprobar las hipótesis o para lograr los
objetivos. Por lo tanto es una buena idea organizar los resultados con relación
a las hipótesis o los objetivos. Debe indicarse cuáles instrumentos estadísti cos
se utilizaron, dando una justificación para haber empleado los mismos. Es
decir, hay que indicar el "cómo" y el "por qué" del análisis estadístico.
Si se ha aplicado un test estadístico para comprobar una hipótesis, el
investigador tendrá que tener cuidado con el lenguaje que emplee en el
informe. Un test estadístico no puede probar una hipótesis en un sentido
estricto. Solamente puede servir para comprobarlas, en el sentido que la
respalda. Aunque la diferencia en el lenguaje parece mínima, si el investigador
afirma que probó la hipótesis estará exagerando un poco lo que realmente ha
logrado.
Borg y Gall (1983, p. 8 69) sugirieron los siguientes pasos para organizar y
presentar los resultados:
1. Tabular los datos.
2. Estudiar las tablas cuidadosamente.
3. Notar los resultados importantes.
4. Usar las tablas como una base de organización.
5. Redactar el texto.
En la sección 8.3 se i ncluyeron varias técnicas para desarrollar tablas y gráficas
para presentar los datos. En el texto mismo, después de cada tabla o gráfica, el
investigador debe destacar los resultados importantes. No es necesario que
repita en el texto toda la información que ya se ha presentado en una tabla o
gráfica. Cada tabla y cada gráfica debe contener la información necesaria para
poder interpretarlas, como por ejemplo, el tipo de estadísticas, una descripción
de cada variable y el número de sujetos.
A veces, durante la realización del análisis estadístico, surge algún otro análisis
posible, que no se había previsto. El investigador puede proceder a realizar tal
análisis e incluir en él los resultados suplementarios que obtenga.
La escritura a máquina del informe debe corresponder a las normas que hayan
establecido la universidad, la organización o la revista correspondiente. No es
difícil encontrar algunos manuales o guías para la elaboración de trabajos
académicos, los cuales pro porcionan las normas relacionadas con el formato
que ha de seguir un informe. Una lista de algunos formatos aparece al final de
este modulo.
A continuación se presentan algunas normas que son más o menos estándares y
que pueden servir en los casos en que no se dispone de una guía para presentar
informes. Debe tener presente que, en cualquiera de los casos, la consistencia
es la norma más importante.
Tipografía
Se recomienda más el uso del tipo pica que tiene diez caracteres por pulgada.
En la mayoría de los casos, se usa doble espacio, dejando triple espacio entre
los párrafos. El tipo debe estar limpio y la cinta en buenas condiciones.
Márgenes
Se puede fijar el margen derecho a 10 espacios (1 pulgada), el margen
izquierdo a 15 espacios (1.5 pulgadas) y el margen superior y el inferior de 6
líneas (1 pulgada). Véase la Figura 13.4.1. La primera página de un capítulo, o
de un informe corto debe tener un margen superior de 9 líneas (1.5 pulgadas).
Sangría
Las distintas fuentes indican que cada párrafo debe comenzar con una sangría
entre cinco y ocho espacios. Es
necesario seleccionar una
sangría entre cinco y ocho espacios
y usarla
consistentemente.
Figura 13.4.1
Según Chávez (1979, p. 34): "Todos los egresados del programa encontraron
trabajo."
Encabezamientos
Si el informe está dividido en capítulos, cada uno de ellos debe llevar un título
centrado, escrito a mayúscula cerrada. El título de un informe corto debe ser
presentado en la misma forma. Sin un informe necesita varios
encabezamientos, éstos deben presentarse de la siguiente manera.
Referencias
Ya se mencionó en la sección anterior que un informe debe incluir las
referencias que se han citado en una sección intitulada "Referencias", y que si
se incluyen las obras que se han consultado, puede llamarse bibliografía. La
mayoría de los manuales para la redacción de informes tienen muchos detalles
sobre la forma de presentar las citas bibliográficas. A continuació n se
presentan algunas normas que sirven en casos sencillos.
En el caso de libros, hay que indicar el autor, el título completo del mismo, el
lugar y la fecha de publicación. Por ejemplo,
Si una cita lleva más de una línea, las líneas que siguen deben llevar una
sangría de tres espacios.
Las citas para los artículos de revistas deben incluir el nombre del autor, el
título completo del mismo, el nombre de la revista, el volumen y número, la
fecha de publicación y la (s) página (s) correspondiente (s). Por ejemplo:
Pescador, José Ángel. "El Efecto Redistributivo del Gasto en Educación Superior
en México," Revista del Centro de Estudios Educativos , vol. VII, no. 3, 1977,
pp. 57-78.
La cita de una tesis es más sencilla. Consta del nombre del autor, el título
completo de la misma, entre paréntesis el propósito de la tesis, el nombre de la
institución y la fecha. Por ejemplo:
Acosta Hoyos, Luis Eduardo. Guía Práctica para la Investigación y Redacción de Inmes,
Buenos Aires: Biblioteca del Educador Contemporáneo, 1975.
American Psychological Association. Publication Manual, Washington: The association, 1974.
Asti Vera, Armando. Metodología de la Investigación, Buenos Aires: Kapelusz, 1973.
Azafeifa, Isaac Felipe. Guía para la Investigación y Desarrollo de un Tema, San José: Editorial
Universidad de Costa Rica, 1979.
Best, John W. Cómo Investigaren Educación, Madrid: Ediciones Morata, 1974.
Borg, Walter R. y Gall, Meredith D. Educational Research: An Introduction, New York. Longman,
1983.
Carreño Huerta, Fernando. La Investigación Bibliográfica: Breve Guía para la Confección de
Trabajos Escritos, México, Grijalbo, 1975.
Comes, Prudenci. Técnicas de Expresión, Barcelona: CikosTau, 1974.
Hopkins, Charles D. Understanding Educational Research, Columbus, Ohio: Merril, 1980.
Leedy, Paul D. Practical Research: Planning and Design, New York: MacMillan, 1974.
Linton, Marigold. Manual Simplificado de Estilo, México: Trillas, 1978.
Pardinas, Felipe. Metodología y Técnicas de Investigación en Ciencias Sociales, México. Siglo
XXI, 1970.
Pérez Álvarez, Felipe. Las Investigaciones Exploratorias y Descriptivas en las Ciencias de la
Educación, Buenos Aires: Librería del Colegio, 1978.
Standop, Ewald. Cómo Preparar Monografías e Informes, Buenos Aires: Kapelusz, 1976.
Para cada uno de los siguientes ítemes sub raye la respuesta más apropiada.
1. ¿Cuál de los siguientes tipos de informe suele ser más largo y detallado?
a) un artículo de revista
APÉNDICE B
GLOSARIO
CEE: Centro de Estudios Educativos (México).
CENSO: Es la enumeración compleja de todos los elementos de una POBLACIÓN.
CIDE: Centro de Investigación y Desarrollo de la Educación (Chile).
COEFICIENTE DE CORRELACIÓN : Simplemente indica una relación o asociación
que hay entre dos o más variables.
CONFIABILIDAD: Existe cuando se obtienen los mismos resultados cada vez que
se administra un test.
CONSTRUCTO: Es un concepto psicológico que no se puede observar
directamente y, por lo tanto, se infiere de efectos observables de la conducta.
CONTAMINACIÓN DEL EXPERIMENTADOR: Es la influencia que ejercen los
conocimientos previos que el experimentador tiene de los sujetos que van a
participar en una investigación.
CONTAMINACIÓN ESTADÍSTICA : Puede presentarse cuando los sujetos del
GRUPO DE CONTROL llegan a estar en contacto con los sujetos del GRUPO
EXPERIMENTAL.
CORRELACIÓN: Es una manera de conseguir información sobre la relación que
hay entre dos o más variables.
CUADRO DE MUESTREO : Es una lista que contiene los elementos que integran
la POBLACIÓN.
CURVA NORMAL: El polígono de frecuencias de una distribución normal. Tiene
la forma simétrica de una campana, donde la mayoría de los puntajes se
agrupan cerca de la media.
DATOS DEL NIVEL DE RAZÓN : Tienen todas las características de los datos del
nivel ordinal, además de ser iguales las distancias entre las unidades.
DATOS DEL NIVEL NOMINAL : Involucran un proceso de nombrar en vez del de
medir. Se trata de basar la asignación de números solamente en la clasificación
de las observaciones.
DATOS DEL NIVEL ORDINAL : Implican un orden de personas u objetos. Dan la
posición relativa de los datos con respecto a los otros datos de su m i m o
conjunto.
Universidad de San Carlos de Guatemala. 204
DATOS DEL NIVEL DE RAZÓN: Es posible que se refieran los unos a los otros
como múltiplos o razones. Dichas mediciones tiene n lo que se llama un cero
absoluto.
DEDUCCIÓN: Es un método de llegar a conclusiones partiendo de
generalizaciones. Fue desarrollado por Aristóteles.
DISEÑO COMPARATIVO CAUSAL : Es un diseño que pretende determinar la razón
para que exista una diferencia en tre grupos de individuos. También es
conocido como un DISEÑO EXPOS FACTO.
DISEÑO CONTRABALANCEADO : Es un diseño cuasi -experimental en el cual todos
los grupos reciben los mismos tratamientos, pero en un orden distinto,
aplicándose un post -test después de cada tratamiento.
DISEÑO CORRELACIÓNAL: Es un diseño para determinar si existe, y hasta qué
grado, una relación entre dos o más variables.
DISEÑO DE CUATRO GRUPOS DE SOLOMON : Un diseño experimental con cuatro
grupos formados aleatoriamente. Dos grupos rec iben un pre-test y los otros
dos no. Uno de los grupos recibe un tratamiento experimental, el mismo que
recibe uno de los grupos que no recibe el pre -test. Los cuatro grupos reciben
un post-test.
DISEÑO DE GRUPO DE CONTROL NO EQUIVALENTE: Un diseño cuasi -
experimental con por lo menos dos grupos, ambos reciben un pre -test, uno
recibe un tratamiento experimental y ambos reciben un post -test.
DISEÑO DE PRE-TEST POST-TEST CON UN GRUPO DE CONTROL : Es un diseño
experimental con por lo menos dos grupos seleccionados aleatoriamente.
Ambos grupos reciben un pre -test, un grupo recibe un tratamiento especial y
ambos reciben un post -test.
DISEÑO DE SERIE DE TIEMPO : Es un diseño cuasi -experimental que aplica un
pre-test varias veces, luego un tratamient o experimental seguido por varios
post-tests.
DISEÑO DE SOLO UN POST -TEST CONUN GRUPO DE CONTROL : Un diseño
experimental con por lo menos dos grupos seleccionados aleatoriamente. Un
grupo recibe un tratamiento experimental y ambos grupos reciben un post-test.
DISEÑO EX POS FACTO : (véase DISEÑO COMPARATIVO CAUSAL).
DESVIACIÓN ESTÁNDAR: Puede considerarse como un promedio de las
distancias a que los datos están de la media. También es conocida como
DESVIACIÓN TÍPICA.
DESVIACIÓN TÍPICA : (véase DESVIACIÓNESTÁNDAR).
DIFERENCIAL SEMÁNTICO : Es una escala de actitudes que pide que un individuo
responda hacia algo, según un conjunto de adjetivos bipolares. También es
conocido como una ESCALA DE OSGOOD. DEFINICIÓN OPERACIONAL DE
VARIABLES: Son definiciones esp eciales que indican una manera de medir o
encontrar los valores de las VARIABLES.
EFECTO HAWTHORNE: Se refiere a cualquier situación en la cual el hecho de
participar en una investigación mejora el rendimiento de los participantes. Este
efecto se presenta en el GRUPO EXPERIMENTAL
TEST: Es cualquier instrumento que se usa para medir las diferencias entre los individuos, según
una o más dimensiones.
TEST BASADO EN CRITERIOS: En vez de comparar un sujeto con otro» indica el rendimiento en
términos absolutos. También es conocido como un TEST DE DOMINIO.
TEST DE APTITUD: Pretende predecir la capacidad que una persona debe tener en un área
específica. Mide el posible rendimiento o aprovechamiento.
TEST DE DOMINIO: (véase TEST BASADO EN CRITERIOS).
TEST DE SIGNIFICACIÓN: Se usa para determinar si existe o no una diferencia significativa entre
dos o más medias a un nivel de significación seleccionado.
TEST ESTANDARIZADO: Generalmente se refiere a los tests que se elaboran y se publican
comercialmente, los cuales están basados en normas. También es conocido como TEST
NORMALIZADO.
TEST NORMALIZADO: (véase TEST ESTANDARIZADO).