Está en la página 1de 40

Suscríbete a DeepL Pro para poder traducir archivos de mayor tamaño.

Más información disponible en www.DeepL.com/pro.

Métodos interactivos frente a métodos tradicionales: Un estudio de


seis mil estudiantes sobre los datos de las pruebas de mecánica para
los cursos de introducción a la física*.
Richard R. Hakea)
Departamento de Física, Universidad de Indiana, Bloomington, Indiana 47405

Se informa de un estudio de los datos previos y posteriores a la prueba utilizando el


test de diagnóstico de mecánica de Halloun-Hestenes o el más reciente Inventario de
Conceptos de Fuerza para 62 cursos de introducción a la física con un número total de
estudiantes N = 6542. Se obtiene un análisis consistente sobre diversas poblaciones de
estudiantes en escuelas secundarias, colegios y universidades si se toma como medida
aproximada de la eficacia media de un curso en la promoción de la comprensión
conceptual la ganancia media normalizada <g>. Esta última se define como la relación
entre la ganancia media real (%<post> - %<pre>) y la ganancia media máxima posible
(100 -
%<pre>). Catorce cursos "tradicionales" (T) (N = 2084) que hicieron poco o ningún uso
de los métodos de participación interactiva (IE) lograron una ganancia media <g> T-ave =
0,23 0,04 (desviación estándar). Por el contrario, cuarenta y ocho cursos (N = 4458) que
hicieron un uso sustancial de los métodos de IE lograron una ganancia media <g> IE-ave
= 0,48 0,14 (desviación estándar), casi dos desviaciones estándar de <g> IE-ave por
encima de la de los cursos tradicionales. Resultados para 30
(N = 3259) de los 62 cursos anteriores en la prueba básica de mecánica de resolución de
problemas de Hestenes-Wells implican que las estrategias de IE mejoran la capacidad de
resolución de problemas. Los resultados de las pruebas conceptuales y de resolución de
problemas sugieren firmemente que el uso en el aula de los métodos de EI puede
aumentar la eficacia de los cursos de mecánica mucho más allá de lo que se obtiene en la
práctica tradicional.

I. INTRODUCCIÓN
Últimamente se ha hecho un esfuerzo considerable por mejorar los cursos de introducción a
la física, especialmente después de 1985, cuando Halloun y Hestenes1 publicaron un cuidadoso
estudio en el que se utilizaron pruebas masivas antes y después del curso de los estudiantes de
los cursos de introducción a la física basados en el cálculo y no basados en el cálculo en la
Universidad Estatal de Arizona. Sus conclusiones fueron: (1) "...la cualidad inicial del
estudiante,
................................................................................creencias de sentido común sobre el movimiento
y....(its).causas tienen un gran efecto en el rendimiento en
física, pero la instrucción convencional sólo induce un pequeño cambio en esas creencias".
...................................................................................................................................... (2) "Teniendo en
cuenta las grandes diferencias en los estilos de enseñanza de los cuatro profesores(involucrados en
................... el estudio).la adquisición de conocimientos básicos con la instrucción convencional es
esencialmente independiente
del profesor". Estos resultados eran coherentes con los resultados anteriores de muchos
investigadores en la enseñanza de la física (véanse las refs. 1 - 8 y sus citas) que sugerían que los
cursos tradicionales de introducción a la física para estudiantes pasivos, incluso los impartidos
por los instructores más talentosos y populares, impartían poca comprensión conceptual de la
mecánica newtoniana.
1
¿Hasta qué punto ha tenido éxito el reciente esfuerzo por mejorar los cursos de introducción a
la física? En este artículo se presenta un estudio de todos los resultados cuantitativos de las
pruebas previas y posteriores que conozco (a tiempo para incluirlos en este informe) y que
utilizan la prueba original de diagnóstico de mecánica de Halloun-Hestenes (MD),1a el más
reciente Inventario del Concepto de Fuerza (FCI),9a,b y la prueba de resolución de problemas de
mecánica

* Aceptado para su publicación en el American Journal of Physics. Los comentarios y críticas serán
bienvenidos en R.R. Hake, 24245 Hatteras St., Woodland Hills, CA, USA 91367,
<hake@ix.netcom.com>.

2
Prueba de referencia (MB)10 . Tanto el MD como el FCI se diseñaron como pruebas de
comprensión conceptual de la mecánica newtoniana por parte de los estudiantes. Una de sus
virtudes más destacadas es que las preguntas indagan en la comprensión conceptual de los
conceptos básicos de la mecánica newtoniana de una forma comprensible para el novato que
nunca ha tomado un curso de física, y al mismo tiempo lo suficientemente rigurosa para el
iniciado.
La mayoría de los físicos probablemente estarían de acuerdo en que una puntuación baja en
el examen FCI/MD indica una falta de comprensión de los conceptos básicos de la mecánica. Sin
embargo, recientemente ha habido argumentos en contra11 y a favor12 sobre si una puntuación
alta en el FCI indica la consecución de un concepto de fuerza unificado. No obstante, incluso los
detractores han admitido que "el FCI es uno de los tests de física más fiables y útiles de los que
disponen actualmente los profesores de introducción a la física "11a y que el FCI es "el
mejor test disponible actualmente paraevaluar la eficacia de la enseñanza en
A la espera de que se cumplan las peticiones de desarrollo de mejores pruebas11 o de mejores
análisis de las pruebas existentes,12 el presente estudio de los resultados publicados1a,8a,9a,13,14
y no publicados15a,b en las aulas puede contribuir a una mejora adicional muy necesaria en la
enseñanza de la mecánica introductoria a la luz de la experiencia práctica.

II. MÉTODO Y OBJETIVO DE LA ENCUESTA


A partir de 1992, solicité que se me enviaran los datos de las pruebas previas y posteriores
del FCI y los datos del MB posteriores a la prueba en charlas en numerosos coloquios y
reuniones y en envíos por correo electrónico en las redes PHYS-L y PhysLrnR. 16 Este modo de
solicitar datos tiende a preseleccionar los resultados que están sesgados a favor de los cursos
destacados que muestran ganancias relativamente altas en el FCI. Cuando se obtienen ganancias
relativamente bajas (como ocurre a menudo), a veces se mencionan de manera informal, pero
normalmente no se publican ni se comunican, excepto por aquellos que (a) desean utilizar los
resultados de un curso "tradicional" en su institución como línea de base para sus propios datos,
o (b) poseen una objetividad y un distanciamiento científicos inusuales. Afortunadamente, varios
de estos últimos aportaron datos a la presente encuesta sobre cursos en los que se utilizaron
métodos de participación interactiva pero se obtuvieron ganancias relativamente bajas. De estos
casos se han extraído algunas sugerencias (Sección VII) para aumentar la eficacia del curso. 17
Algunos pueden pensar que la presente encuesta presenta un muestreo negativamente
sesgado de los cursos tradicionales, una actitud que se sabe que cambia tras la lectura de los
resultados de las pruebas locales del FCI. 18 Hay que subrayar que todos los datos de los cursos
tradicionales antes y después de las pruebas que he conocido a tiempo para incluirlos en este
informe se muestran en la Fig. 1. No cabe duda de que existen más datos de este tipo, pero no se
comunican porque las ganancias son vergonzosamente mínimas.
A efectos de clasificación y análisis de la encuesta, defino:
(a) Los métodos de "participación interactiva" (EI) son aquellos diseñados, al menos en
parte, para promover la comprensión conceptual a través de la participación
interactiva de los estudiantes en actividades directas (siempre) y prácticas
(normalmente) que producen una retroalimentación inmediata a través de la
discusión con los compañeros y/o los instructores, todo ello según las descripciones
de su literatura;
(b) Los cursos "tradicionales" (T) son los que, según los instructores, hacen poco o
ningún uso de los métodos de EI, y se basan principalmente en clases pasivas,
3
laboratorios de recetas y exámenes de problemas algorítmicos;
(c) Los cursos "Interactive Engagement" (IE) son aquellos que, según los
instructores, hacen un uso sustancial de los métodos de IE;

4
(d) ganancia media normalizada <g> para un curso como la relación entre la ganancia
media real <G> y la ganancia media máxima posible, es decir,
<g> %<G>/ %<G> max
( %<Sf> - %<Si>) /(100 - %<Si .............................................. >),(1)
donde <Sf> y <Si> son las medias finales (post) y las iniciales (pre) de la clase;
(e) Cursos de "alta g" como aquellos con (<g>) > 0,7;
(f) Los cursos "medio-g" son aquellos con 0,7 > (<g>) > 0,3;
(g) Los cursos de "baja g" son aquellos con (<g>) < 0,3.

La presente encuesta abarca 62 cursos introductorios en los que se inscribieron un total de


6.542 estudiantes que utilizaron los exámenes conceptuales MD o FCI, y (en los casos en los que
estaba disponible) la prueba básica de mecánica (MB) para la resolución de problemas. Los
resultados de la encuesta para los exámenes conceptuales y de resolución de problemas se
presentan a continuación en forma de gráficos. En un documento complementario,17a destinado
a ayudar a los instructores en la selección y aplicación de métodos probados de IE, tabulo,
discuto y hago referencia a los métodos y materiales particulares que se emplearon en cada uno
de los 62 cursos de la encuesta. También se tabulan en la ref. 17a se encuentran los datos de cada
curso: el nombre del instructor y la institución, el número de estudiantes matriculados, las
puntuaciones de las pruebas previas y posteriores, las desviaciones estándar cuando están
disponibles, y las ganancias normalizadas. La información de la encuesta se obtuvo de cuentas
publicadas o de comunicaciones privadas. Estas últimas suelen incluir las respuestas de los
instructores a un cuestionario de encuesta15c en el que se pedía información sobre el método de
las pruebas previas y posteriores, los resultados estadísticos, la institución, el tipo de estudiantes,
las actividades de los estudiantes y la experiencia educativa, la perspectiva, las creencias, la
orientación, los recursos y los métodos de enseñanza del instructor.
Como en cualquier investigación científica, el sesgo en el detector puede aprovecharse si se
establecen los objetivos de investigación adecuados. No pretendemos acceder a la eficacia media
de los cursos de introducción a la mecánica. En su lugar, tratamos de responder a una pregunta
de considerable interés práctico para los profesores de física: ¿Puede el uso en el aula de los
métodos de IE aumentar la eficacia de los cursos de mecánica introductoria mucho más allá de
lo que se consigue con los métodos tradicionales?

5
III. RESULTADOS DE LAS PRUEBAS CONCEPTUALES
A. Gráfico de ganancia frente a la prueba previa - Todos los datos

80 1.00

Ganancia
frente a la
Alta-g HS COLL UNIV
prueba previa
Compromiso interactivo
60 0.70 Tradicional
-•

% 0.60 -
< -
• <<g>>
-• 48IE
G 40 Medio-g •

-• -
ai 0.48 - •
-
• <<g>>
• - -- •
n --
• ••
14T

••• •
> -
-

-
• -
- •-
• -
• • - -
-•• •
0.30 - • -• - •
• -
20 - • • ••

0.23 -•
-•
-• •
-•
• ••• -
- •
Bajo- • -• •
g - •
-
• -


<g>= |slope| = <Gain> / Max. Posible
<Ganancia>
0
20 60 80100
40 % <Pretest>
Fig. 1. Puntuación de %<Ganancia> frente a %<Pretest> en las pruebas conceptuales de Diagnóstico
Mecánico (DM) o Inventario de Conceptos de Fuerza (FCI) para 62 cursos con un total de N = 6542
estudiantes: 14 cursos tradicionales (T) (N = 2084) que hicieron poco o ningún uso de los métodos de
participación interactiva (IE), y 48 cursos IE
(N = 4.458) que hicieron un uso considerable de los métodos de IE. Líneas de pendiente para la media de los
14 cursos T
Se muestran los cursos <<g>> 14T y 48 IE <<g>> 48IE, como se explica en el texto.

Para aumentar la fiabilidad estadística (Sec. IV) de los promedios de los cursos, en la Fig. 1
sólo se han representado los que tienen una matrícula N > 20, aunque en algunos casos de
instrucción y población estudiantil bastante homogénea (AZ-AP, AZ-Reg, PL92-C, TO, TO-C)
se incluyeron cursos o secciones con menos de 20 estudiantes en un promedio ponderado por
número de estudiantes. Los códigos de los cursos como "AZ-AP" con las correspondientes
inscripciones y puntuaciones se tabulan y se referencian en la ref.
6
17a. Al evaluar las puntuaciones de FCI, MD y MB debe tenerse en cuenta que la
puntuación de adivinación aleatoria para cada una de estas pruebas de elección múltiple de
cinco alternativas es del 20%. Sin embargo, los pensadores completamente no newtonianos
(si pueden al mismo tiempo leer y comprender las preguntas) pueden tender a puntuar por
debajo del nivel de adivinación aleatoria debido a los potentes distractores generados por la
entrevista. 1a,12a
Hay que tener en cuenta que para cualquier punto de curso particular (<G'>, <Si'>) en el
gráfico de <G> vs <Si> de la Fig. 1, el valor absoluto de la pendiente de una línea que conecta
(<G'>, <Si'>) con el punto
(<G> = 0, <Si> = 100) es sólo el parámetro de ganancia <g'> para ese curso en particular. Las
regularidades para los cursos con un amplio rango de puntuaciones medias en el pretest [18 <
(<Si>) < 71] y con diversas poblaciones de estudiantes en escuelas secundarias, colegios y
universidades son dignas de mención:

(a) Todos los puntos de los 14 cursos T (N = 2084) caen en la región Low-g. Los datos17a arrojan
<<g>> 14T = 0,23 0 ..................................................................... ,04sd(2a)
Aquí y abajo, las caretas dobles "<<X>> NP" indican un promedio de promedios, es
decir, un promedio de <X> sobre N cursos de tipo P, y sd desviación estándar [no
confundir con el error experimental aleatorio o sistemático (Sec. V)].

(b) El 85% (41 cursos, N = 3741) de los 48 cursos de EI se encuentran en la región


media-g y el 15% (7 cursos, N = 717) en la región baja-g. En general, los datos17a
arrojan
<<g>> 48IE = 0,48
.................................................................................................... 0,14sd.(2b
)
Las líneas de pendiente <<g>> de la Ec. (2a,b) se muestran en la Fig. 1.

(c) Ningún punto del recorrido se encuentra en la región "High-g".

Deduzco de las características a, b, c que se puede obtener un análisis consistente sobre


diversas poblaciones de estudiantes con estados de conocimiento iniciales muy variados, como se
mide por <Si>, tomando la ganancia media normalizada <g> como una medida aproximada de la
eficacia de un curso para promover la comprensión conceptual. Esta inferencia se ve reforzada
por el hecho de que la correlación de <g> con
<Si> para los 62 cursos de la encuesta es un muy bajo +0,02. Por el contrario, la puntuación
media tras la prueba <Sf> y la ganancia media <G> son menos adecuadas para comparar la
eficacia de los cursos en diversos grupos, ya que sus correlaciones con <Si> son,
respectivamente, +0,55 y -0,49. Cabe señalar que se esperaría una correlación positiva de <Sf>
con <Si> en ausencia de instrucción.
Asumiendo, entonces, que <g> es una medida válida de la efectividad del curso en la
promoción de la comprensión conceptual, parece que los presentes cursos de compromiso
interactivo son, en promedio, más del doble de efectivos en la construcción de conceptos
básicos que los cursos tradicionales ya que <<g>> IE = 2.1
<<g>> T. La diferencia
7
<<g>> 48IE - <<g>> 14T = ................................................ 0,25(2c)

es de 1,8 desviaciones estándar de <<g>> 48IE y de 6,2 desviaciones estándar de <<g>> 14T, lo
que recuerda a lo observado al comparar la instrucción impartida a los alumnos en grupos
grandes con la instrucción individual. 19

8
0.5

0.4
Fr
ac
ci 0.3
ón
d
e 0.2
c
ur
s 0.1
o
s
0.0
0.08
<g>
0.12
0.16 de la ganancia media normalizada <g>: las barras oscuras (rojas) muestran la fracción de 14
Fig. 2. Histograma
cursos tradicionales (N = 2084), y las barras claras (verdes) muestran la fracción de 48 cursos de compromiso
0.2= 4458), ambos dentro de bins de anchura g> = 0,04 centrados en los valores <g> mostrados.
interactivo (N

0.24
La figura 2 muestra la distribución <g> para los cursos tradicionales (T) y los de compromiso
0.28 (IE) trazados en la figura 1. Ambas distribuciones se desvían de la forma gaussiana
interactivo
simétrica, pero esto no invalida la caracterización de la dispersión de los datos por la desviación
estándar.
0.32
Las anchuras de las distribuciones de <g> están evidentemente relacionadas con (a) las
0.36
fluctuaciones estadísticas de <g> asociadas con las anchuras de las distribuciones de las
puntuaciones antes y después de la prueba, según sus desviaciones estándar, más (b) las
0.4
variaciones de curso a curso en los "errores sistemáticos", más (c) las variaciones de curso a
curso0.44
en la eficacia de la pedagogía y/o la implementación. Utilizo el término "errores
sistemáticos" para referirme a que, para un solo curso, los errores afectarían a las puntuaciones
0.48
de las pruebas de forma sistemática, aunque dichos errores pudieran afectar a diferentes cursos
de forma más o menos aleatoria. Las fluctuaciones estadísticas y los errores sistemáticos en <g>
0.52 más adelante en la Sec. V. Los estudios de caso17a de los cursos de IE en la parte
se discuten
baja 0.56
de la distribución de IE sugieren fuertemente que esta parte está relacionada con "c" en el
sentido de que varios problemas de implementación son evidentes: por ejemplo formación
insuficiente
0.6 de los instructores que se inician en los métodos de EI, falta de comunicación a los
estudiantes de la naturaleza de la ciencia y el aprendizaje, falta de incentivos para que se tomen
0.64las actividades de EI, escasez de preguntas de examen que prueben el grado de
en serio
comprensión conceptual inducido por los métodos de EI, y uso de los métodos de EI sólo en
0.68
componentes aislados de un curso.
0.72

9
B. Gráficos de ganancia frente a la prueba previa para institutos, colegios y universidades
Las Figuras 3a,b,c muestran gráficos separados de G vs Si para las 14 escuelas secundarias (N =
1113), 16 universidades
(N = 597), y 32 cursos universitarios (N = 4832). Aunque las puntuaciones medias ponderadas
por N de las matrículas aumentan con el nivel20 [<Si> HS = 28%, <Si> C = 39%, <Si> U = 48%
(44% si se omiten las puntuaciones atípicamente altas de Harvard)], en otros aspectos estos tres
gráficos son muy similares al gráfico de la Fig. 1 para todos los cursos. Para los institutos,
colegios y universidades (a) los cursos T consiguen ganancias bajas cercanas a la media <<g>>
T14 = 0,23; (b) los cursos IE son casi igual de eficaces: <<g>> 10IE(HS) = 0,55 0,11sd, <<g>>
13IE(C) = 0,48 0,12sd, y <<g>> 25IE(U) =
0,45 0,15sd (0,53 0,09sd si el promedio omite los 6 cursos atípicos de la universidad Low-g).

80 1.00

Ganancia frente a la prueba


Alta-g previa - Escuelas secundarias
Compromiso interactivo
60 Tradiciona
0,70ELM-Hon
-•
l

%
0.60 • BC-Hon
<
• GS-Hon95
G Medio-g
ai 40 -•
• LT-Hon

n GS-Hon
• 95Reg
-

MW-Hon
> RM • 94Reg

- BC-Reg • CL-Reg

0.30
AZ-Reg
20
AZ-Hon
Bajo-
g Chicago- AZ-AP
Reg

<g>= |slope| = <Gain> / Max. Posible


<Ganancia>
0
20 6080 100
40 % <Pretest>
Fig. 3a. Puntuación de %<Ganancia> frente a %<Pretest> en las pruebas conceptuales de Diagnóstico
Mecánico (DM) o Inventario del Concepto de Fuerza (FCI) para 14 cursos de secundaria con un total de
N = 1113 estudiantes. En esta figura y en las siguientes, los códigos de los cursos, las inscripciones y las

10
puntuaciones están tabuladas y referenciadas en la ref. 17a.

11
La Fig. 3a muestra que, en el caso de las escuelas secundarias, se obtienen mayores g para
los cursos de honor que para los regulares, lo que coincide con las observaciones de Hestenes et
al. 9a La diferencia entre estos dos grupos es percibida de manera diferente por los distintos
instructores y puede depender de la escuela: "la principal diferencia es la actitud "9a; "difieren
en su capacidad de utilizar representaciones cuantitativas de los datos para extraer
generalizaciones conceptuales....la motivación es.... sólo una parte de la diferencia "21; "ambos
grupos... .............................................................................. (están)... muy motivados....las
principales diferencias....(son).sus habilidades algebraicas, el grado de
Los problemas de motivación pueden ser especialmente graves para los alumnos de los cursos
de EI, a los que no les gusta apartarse de los métodos tradicionales a los que se han
acostumbrado y con los que sus notas, si no su comprensión, han prosperado. 23-26

80
1.00
Ganancia frente a la prueba
previa - Colegios
Compromiso interactivo
Alta-g
Tradiciona
60
0.70 l

% 0.60

< • M-PD92b

G 40 • M-PD93
Medio-g -•
ai M-PD92a
• TO-C
n • M-PD94 • M-PD95b-C
> • PL92-C
• A
- M-PD95a-C

0.30 DB-C - • M-Co95c-C

20 • M-PD94-C
M93
Low-g- • M94-C
-•
LF92 -•
M92-C
<g>= |slope| = <Gain> / Max. Posible
<Ganancia>
0
20 60 80100
40 % <Pretest>
Fig. 3b. Puntuación de %<Ganancia> frente a %<Pretest> en las pruebas conceptuales MD o FCI para
16 cursos universitarios con un total de N = 597 estudiantes. El código del curso "-C" indica un curso
basado en el cálculo.

12
Las inscripciones para los cursos universitarios de la Fig. 3b están en el rango de 20 a 61, por
lo que las fluctuaciones estadísticas asociadas a los "errores aleatorios" (Sec. V) podrían ser
relativamente importantes. Sin embargo, las variaciones en <g> para los once cursos del Monroe
Community College (M) han sido explicadas17a por Paul D'Alessandris27 como debidas a
diferencias en los estudiantes o en la instrucción: por ejemplo, "Con respecto a las....<g>
diferencias en.las dos secciones de física basada en el cálculo en 1995, M-
PD95b-C....<g> = 0,64....fue un curso nocturno y M-PD95a-C....<g> = ......... 0,47.fue un curso
diurno.
La diferencia en la población estudiantil entre la escuela nocturna y la diurna es la diferencia
entre la noche y el día. Los estudiantes nocturnos tienen una media de entre 7 y 10 años más, son
mucho más maduros y dedicados, posiblemente porque todos se están pagando sus estudios. El
material didáctico y el método son los mismos para ambos grupos. El material didáctico
...................................................................................... cambia cada semestre (espero que para
mejor).M-PD94-C tenía <g> = 0,34 (este era el
primera vez que utilizaba mis materiales en una clase basada en el cálculo). M-PD95a-C tenía
<g> = 0,47, y en el otoño de 1995....no se incluyó en esta encuesta porque N = 15...... tenía una
<g> de 0,63. Este cambio no es, esperemos, una fluctuación aleatoria sino que se debe a los
cambios en el cuaderno de trabajo. Todos estos eran cursos diurnos". Este seguimiento de la <g>
con los cambios en el método o la implementación de la IE, también observado en la Universidad
de Indiana17a aumenta la confianza en el uso de la <g> como indicador de la eficacia del curso
en la construcción de conceptos básicos.

13
80 1.00

Ganancia frente a la prueba


previa - Universidades
Alta-g Compromiso interactivo
Tradicional
60 0.70

% 0.60
<
IU95F -
G 40 • IU94S
ai Medio-g IU93S -
• IU95S
n ASU-VH105C
• ASU-MW105-C
> -
• IUpre93
CP-RK-Regb-C

• OS95-C - CP-RK-Hon-C
Mich(De)-C - - -
• -
• •
0.30 Mich(Ft)1-C •
ASU-HH-C
-
- EM:
20 Bajo- ASU
Mich(Ft)2-C - - • CP-RK-Rega-C
95-C
UL-RM95S-C •
g Mich(Ft)4 - - - 94-C
- • UL-RM95Su-C
• -• •• 93-C
Mich(Ft)3 -

• • ASU1-C
• • ASU2-C 91-C
UML94-C 90-C
- CP-C -
UML93-C UL94F-C • -• OS92-C •
<g>= |slope| = <Gain> / Max. Posible
<Ganancia>
0
20 6080100
40 %< Pre-prueba> Fig.
3c. Puntuación de %<Ganancia> frente a %<Pretest> en las pruebas conceptuales MD o FCI para 32
cursos universitarios con un total de N = 4832 estudiantes. El código de curso "-C" indica un curso
basado en el cálculo.

En el caso de los cursos universitarios (Fig. 3c), seis de los cursos de IE se encuentran en la
región de nivel bajo-g - como se ha indicado anteriormente, los estudios de casos detallados17a
sugieren fuertemente que los problemas de implementación son los responsables. Diez17a de los
cursos de IE en la región Media-g tienen inscripciones superiores a 100 y cuatro tienen
inscripciones superiores a 200 - OS95-C: 279; EM94-C: 216; IU95S: 209; IU95F: 388. Todos los
N > 200
Los cursos28a;29a;30c,d intentan llevar los métodos de EI a las masas de forma rentable mediante
(a) la instrucción colaborativa entre pares31,32 y (b) el empleo de estudiantes universitarios para
aumentar el personal docente (Sec. VII).

14
El trabajo en el Estado de Ohio forma parte de un esfuerzo departamental continuo y
concertado, que comenzó en 1993 y en el que participa activamente alrededor del 30% del
profesorado. 28a El objetivo a largo plazo es inducir una mejora sistémica muy necesaria (véase
el punto para OS92-C en la Fig. 3c) en la eficacia de todos los cursos introductorios. El curso de
introducción a la física con mayor número de alumnos en el Estado de Ohio, que nos ocupa, está
diseñado para estudiantes de ingeniería. En este curso hay un peso inusual
énfasis en "utilizar el lenguaje simbólico con comprensión para resolver problemas
complejos". Además de "a" y "b", arriba, se hace uso de (1) Estudios de casos generales
(OCS),28b Conjuntos de problemas de aprendizaje activo (ALPS)28b con problemas ricos en
contexto,32 y simulaciones interactivas con hojas de trabajo; 28a todo ello en "conferencias"
interactivas (llamadas "Reuniones de sala grande");
(2) resolución cooperativa en grupo de problemas ricos en contexto y ejercicios de
representación múltiple en "recitaciones" (llamadas "Small Room Meetings"); (3) un
enfoque de indagación con preguntas cualitativas y problemas de experimentación28c en
los laboratorios.
Harvard añade a "a" y "b" pruebas conceptuales,29b,c una página web del curso muy
completa,29c y la comunicación por ordenador entre estudiantes e instructores,29c,33.
La Universidad de Indiana añade a "a" y "b": Laboratorios SDI8,13,34,35; Pruebas de
Conceptos29,36; resolución cooperativa de problemas en grupo en los "recitativos "32,37,38;
comunicación por ordenador entre los estudiantes y los instructores39; Minute Papers37,40;
enseñanza en equipo30c,d; una evaluación diagnóstica de los estudiantes a mitad de curso sobre
todos los aspectos y componentes del curso13,41; un cuestionario de antecedentes
académicos8a,13 que permite a los instructores familiarizarse personalmente con las
aspiraciones y la preparación de cada estudiante entrante; un "Foro de Física" atendido por
profesores y estudiantes de posgrado durante 5-8 horas al día donde los estudiantes
introductorios pueden encontrar ayuda en cualquier momento38; la codificación por
colores8a,13,34 de los vectores de desplazamiento, velocidad, aceleración y fuerza en todos los
componentes del curso; y el uso de acrónimos de calificación34e para aumentar la eficiencia de
la calificación de los deberes (e.g., NDC no es dimensionalmente correcto).
IV. RESULTADOS DE LAS PRUEBAS MECÁNICAS DE REFERENCIA
La prueba de referencia de mecánica está diseñada para medir aspectos más cuantitativos de
la comprensión del alumno que el FCI. Suele administrarse sólo como postest. La Figura 4
muestra un gráfico de la puntuación porcentual media en el postest de Mecánica (MB) de
resolución de problemas frente a la puntuación porcentual media en el postest del FCI para todos
los datos disponibles. 17a La línea sólida es un ajuste por mínimos cuadrados a los puntos de
datos. Las dos puntuaciones muestran una correlación positiva extremadamente fuerte con un
coeficiente r = + 0,91. Esta relación no es irracional porque el examen MB (a diferencia de la
mayoría de los exámenes tradicionales de física de problemas algorítmicos) requiere
comprensión conceptual además de cierta habilidad matemática y pensamiento crítico. Por lo
tanto, el examen MB es más difícil para el estudiante medio, como también indica el hecho de
que los promedios de MB tienden a estar aproximadamente un 15% por debajo de los promedios
de FCI, es decir, la línea de ajuste de mínimos cuadrados es casi paralela a la diagonal (%MB =
%FCI) y aproximadamente un 15% de puntos por debajo de ella. 42
A veces se objeta que los problemas de la prueba MB no exploran suficientemente las
capacidades más avanzadas, como las que se requieren para los problemas conocidos como
15
"rico en contexto "32; "experimento "28c; "sin objetivo" 27b; "fuera del laboratorio "34c; o
Fermi. Por otro lado, algunos instructores objetan que ni los problemas de MB ni los indicados
anteriormente son problemas "reales" porque son algo diferentes de los "problemas de Halliday-
Resnick". Teniendo en cuenta las diferencias de perspectiva, es posible que pase algún tiempo
antes de que se disponga de una prueba de resolución de problemas más aceptada.

16
EM:
95-C
80 94-C
<%MB POST> frente a <%FCI 93-C
POST> 91-C -
90-C -

-

TO-C - •
• CP-RK-Hon-C
- -
• CP-RK-Regb-C
MW-Hon • • ¿M-PD95b-C?
< 60 ASU-VH105-C -
-

- IU94S
• M-PD93
% -•
GS-Hon95
CP-RK-Rega-C
¿M-PD95a-C? - •
M ¿M-PD94?
••
M-PD92b
IU93S
B UML94-C -• • BC-Hon
ASU2-C -
P UML93-C - • GS-Hon
os • CP-C -
• ASU-MW105-C
tt 40 • ¿M94C

es Diagonal M93 •
- ?
AZ-AP

t>
AZ-Reg
HS COLL UNIV
Inter. Engag.
Tradiciona
20 l

2040 6080100
<%FCI Posttest>
Fig. 4. Puntuaciones medias tras la prueba de mecánica de resolución de problemas (MB) frente a las de la
prueba conceptual de FCI para todos los cursos de este estudio de los que se dispone de datos: treinta
cursos (instituto, colegio y universidad) en los que se inscriben un total de N = 3259 estudiantes (ref. 17a).
La línea sólida es un ajuste por mínimos cuadrados a los puntos de datos. La línea discontinua es la
diagonal que representa la igualdad de puntuaciones en las pruebas MB y FCI. Los cursos del Monroe
Community College (M) con una designación "?" tenían NMB > NFCI no coincidentes porque algunos
estudiantes que tomaron el MB no tomaron también la prueba previa del FCI, como se indica en la ref. 17a.
Si se excluyen estos puntos "?" de los análisis, el coeficiente de correlación "r" cambia en menos de un
0,1% y el cambio en la posición de la línea de ajuste por mínimos cuadrados es casi imperceptible en la
escala de esta figura.
La Figura 4 muestra que los cursos de IE generalmente muestran tanto promedios de FCI
como promedios de MB más altos que los cursos tradicionales, especialmente cuando la
comparación se hace para cursos con poblaciones de estudiantes similares, por ejemplo, Cal Poly
[CP-C vs (CP-RK-Rega-C, CP-RK-Regb-C, y
CP-RK-Hon-C)]; Harvard (EM90-C vs EM91,93,94,95-C); Monroe Community College (MCC)
[M93 vs otros cursos con prefijo M]; escuelas secundarias de Arizona [(AZ-Reg & AZ-AP) vs
MW-Hon].
Por lo tanto, parece que la capacidad de resolución de problemas aumenta (y no se sacrifica,
como algunos creen) cuando se hace hincapié en los conceptos. Esto concuerda con las

17
observaciones de Mazur29b y con los resultados de Thacker et al43 , que muestran que, en el
Estado de Ohio, los estudiantes de educación primaria que siguen un curso basado en la
indagación obtienen mejores resultados que los estudiantes matriculados en cursos
convencionales de física para ingenieros, tanto en un problema de síntesis como en un problema
de análisis.

18
V. ERRORES EN LA GANANCIA NORMALIZADA
A. Fluctuaciones estadísticas ("errores aleatorios")
Las anchuras de las distribuciones de las puntuaciones antes y después de la prueba,
caracterizadas por sus desviaciones estándar (7 a 21% del número total de preguntas del
examen17a) son bastante grandes. En la mayoría de los casos, estas anchuras no son el
resultado de un error experimental, sino que reflejan principalmente las diferentes
características de los alumnos. Si una multiplicidad de comprensiones, habilidades, destrezas y
actitudes afectan al rendimiento en el examen y éstas varían aleatoriamente entre los
estudiantes, entonces se produce una desviación estándar casi gaussiana.
distribución se esperaría para un N alto. Redish44 llama a esto "el principio de individualidad o
"linewidth"". Los grandes anchos de línea crean incertidumbres de "error aleatorio" en los
promedios previos y posteriores a la prueba y, por lo tanto, fluctuaciones estadísticas ("errores
aleatorios") <g> en las ganancias medias normalizadas <g>. He calculado <γ> de la manera
convencional45,46 para los 33 cursos de la encuesta para los que se dispone de desviaciones.
17a Para este subconjunto :
<<g>> T9 = 0,24 0 ............................................................. ,03sd,(3a)
<<g>> IE24 = 0,50 0 ............................................................. ,12sd,(3b)
similares a los promedios y desviaciones estándar para todos los datos como se indica en la
Ecuación (2a,b). Las medias de los errores aleatorios <(<g>)> para el subconjunto son
<(<g>)> T9 = 0,04 0............................................................ ,02sd,(4a)
<(<g>)> IE24 = 0,04 0 ............................................................. ,02sd(4b)
Según la interpretación habitual,45 si sólo hay errores aleatorios, la desviación estándar de un
promedio de promedios, Ec. (3), debería ser más o menos igual que la incertidumbre de una media
cualquiera, Ec. (4). (Para un ejemplo numérico, véase la ref. 45b.) Esto sugeriría que, para el
subconjunto, la dispersión (sd = 0,03) en la distribución de <g> T puede explicarse principalmente
por errores aleatorios [<(<g>)> , mientras que la dispersión (sd = 0.12) en la distribución de <g> IE
se debe a errores aleatorios [<(<g>)> IE24 = 0,04 más otros factores: variación de curso a curso en el
error sistemático, y variación de curso a curso en la eficacia de la pedagogía y/o implementación.
B. Error sistemático
Aparte de la controversia anteriormente mencionada11,12 sobre la interpretación de una
puntuación alta de FCI, las críticas a las pruebas de FCI a veces tienen que ver con dificultades
percibidas como (1) ambigüedades en las preguntas y falsos positivos aislados (respuestas
correctas por razones equivocadas); y variables no controladas en las condiciones de las
pruebas como (2) la enseñanza a la prueba y la filtración de preguntas de la prueba,
(3) la fracción de tiempo del curso dedicada a la mecánica, (4) la motivación de los
estudiantes después y antes de la prueba, y (5) los efectos Hawthorne/John Henry. 47
Para los cursos IE y T, se esperaría que la influencia de los errores "2'' a "5" variara de un
curso a otro de manera más o menos aleatoria, lo que daría como resultado un "ruido" de error
sistemático en los gráficos de ganancia vs. pretest que contienen datos de muchos cursos.
Aunque la magnitud de este ruido es difícil de estimar, contribuye a la amplitud de las
distribuciones <g> especificadas en la Ecuación (2). El análisis de los errores aleatorios anterior
sugiere que el ruido de error sistemático y las variaciones de curso a curso en la efectividad de la
pedagogía y/o la implementación contribuyen de manera más importante a la anchura de la

19
distribución <g> IE que a la anchura de la distribución <g> T.

20
Por supuesto, es posible que los errores sistemáticos, aunque varíen de un curso a otro,
puedan, por término medio, sesgar positivamente las ganancias del IE para aumentar la
diferencia
<<g>> IE48 - <<g>> T14. A continuación considero cada uno de los errores sistemáticos indicados
anteriormente.
1. Ambigüedades en las preguntas y falsos positivos aislados
El uso de una versión revisada9b del FCI con menos ambigüedades y una menor
probabilidad de falsos positivos ha tenido poco impacto17a en el IE <g> medido en las
universidades de Indiana y Harvard. Además, (a) los datos de las entrevistas9a,12a sugieren que
las ambigüedades y los falsos positivos son relativamente raros, (b) se esperaría que estos errores
sesgaran los cursos de IE y T más o menos por igual y, por tanto, tuvieran poca influencia en la
diferencia <<g>> 48IE - <<g>> 14T.
2. Enseñar para el examen y la fuga de preguntas del examen.
Teniendo en cuenta la naturaleza elemental de las preguntas del FCI, para los cursos de IE tanto la
media
<<g>> 48IE = 0,48 0,14, y el máximo <g> = 0,69 son decepcionantemente bajos, y están por
debajo de los que cabría esperar si la enseñanza de la prueba o la fuga de preguntas de la
prueba48 fueran influencias importantes.
De los 48 conjuntos de datos17a de cursos de IE (a) 27 fueron suministrados por los
encuestados a nuestras solicitudes de datos, de los cuales 22 (81%) iban acompañados de un
cuestionario de encuesta completado, (b) 13 han sido discutidos en la literatura, y (c) 5 son
cursos de la Universidad de Indiana de los que tengo conocimiento de primera mano. Todos los
encuestados indicaron que creían haber evitado "enseñar para el examen" al responder a la
pregunta "¿En qué medida cree que pudo evitar "enseñar para el examen(s)" (es decir, repasar
experimentos, preguntas o problemas idénticos o casi idénticos a los ítems del examen)?"
Asimismo, los informes publicados sobre los cursos del grupo "b" y mi propio conocimiento de
los cursos del grupo "c" sugieren una ausencia de "enseñanza para el examen" en el sentido
restringido indicado en la pregunta. (En el sentido más amplio, todos los cursos de IE "enseñan
para el examen" hasta cierto punto, si esto significa enseñar para que los estudiantes
comprendan los conceptos básicos de la mecánica newtoniana, tal como se examinan en las
pruebas FCI/MD. Sin embargo, este es el sesgo que intentamos medir).
No ha habido pruebas de filtración de preguntas del test en los resultados del postest de
Indiana (por ejemplo, desajustes significativos para estudiantes individuales entre las
puntuaciones del FCI y otras calificaciones del curso). Hasta ahora sólo ha habido un informe9a
de tal filtración en la literatura - como se indica en la ref. 17a, los datos sospechosos fueron
eliminados de la encuesta.
3. Fracción del tiempo del curso dedicado a la mecánica
Se pueden hacer comparaciones para los cursos T e IE dentro de la misma
institución donde la fracción f = tm/ts del tiempo de clase tm dedicado a la mecánica
(incluyendo la conservación de la energía y el momento) con respecto al tiempo total del
semestre (o equivalente al semestre) ts es aproximadamente la misma:

Arizona State (f = 0,8): <<g>> IE2 - <<g>> T3 = 0,47 - 0,24 = 0,23;


Cal Poly (f =1.0): <<g>> IE3 - <<g>> T1 = 0,56 - 0,25 = 0,31;
Harvard (f = 0,6): <<g>> IE4 - <<g>> T1 = 0,56 - 0,27 = 0,29;
21
Monroe Com. Coll. (MCC), no calc. (f = 0,8): <<g>> IE4 - <<g>> T1 = 0,55 - 0,22 = 0,33;
MCC, cálculo (f = 1,0): <<g>> IE4 - <<g>> T1 = 0,47 - 0,22 = 0,25; y
Estado de Ohio (f = 0,7): <<g>> IE1 - <<g>> T1 = 0,42 - 0,18 = 0,24.

22
Así, se mantiene una diferencia sustancial <<g>> IE - <<g>> T donde el factor tiempo
es igual.
Que la diferencia de ganancia no es muy sensible a la fracción del tiempo del curso que se
dedica a la mecánica en el rango común en los cursos introductorios puede verse también en el
hecho de que las diferencias citadas anteriormente son bastante similares entre sí a pesar de las
diferencias en f, y
(b) la diferencia <<g>> IE48 - <<g>> T14 = 0,25 que caracteriza toda la encuesta, a pesar de
que f varía entre los cursos de la encuesta. Las respuestas al cuestionario que cubren 22 de los
cursos de la encuesta indicaron que f oscilaba entre 0,7 y 1,0 con una media de 0,9 0,1sd .
4. Motivación de los estudiantes después y antes de la prueba
Como se indica en el apartado "2", de los 48 conjuntos de datos17a correspondientes a los
cursos de IE, 27 fueron suministrados por quienes respondieron a nuestras solicitudes de datos,
de los cuales 22 iban acompañados de un cuestionario de encuesta cumplimentado. Las
respuestas a la pregunta "¿Contó el postest de FCI como parte de la nota final de su curso? En
caso afirmativo, indique el factor de ponderación aproximado" fueron "No" (50% de los 22
cursos encuestados); "Normalmente no" (9%); "Sí, alrededor del 5%" (23%); "Sí, factor de
ponderación inferior al 10%" (9%); Sin respuesta, 9%. Para los 11 cursos en los que no se
ofrecieron incentivos de calificación
<<g>> IE11= 0,49 0,10sd, cerca de la media <g> de los 48 cursos de IE de la encuesta
<<g>> IE48 = 0,48 0,14sd. Por lo tanto, parece dudoso que la motivación por el grado posterior
a la prueba sea un factor significativo para determinar la ganancia normalizada.
En cuanto al pretest, el crédito de la nota es, por supuesto, inapropiado, pero <g> puede
elevarse artificialmente si no se induce a los estudiantes49 a tomarse el pretest en serio. Todos
los instructores encuestados respondieron "Sí" a la pregunta del formulario de la encuesta
"¿Cree usted que sus estudiantes se esforzaron seriamente en el pretest del FCI?" Asimismo, los
informes publicados de los cursos no encuestados y mi propio conocimiento de los cursos en
Indiana sugieren que los estudiantes sí se tomaron en serio el pretest.
5. Efectos de Hawthorne/John Henry47
Estos efectos pueden producir beneficios a corto plazo asociados a (a) la atención especial
(más que el valor intrínseco del tratamiento) que se presta a un grupo de prueba de la
investigación (efecto Hawthorne), o (b) el deseo de un grupo de control de superar el
rendimiento de un grupo de prueba competidor (efecto John Henry). Es de esperar que estos
beneficios disminuyan cuando el tratamiento se aplique como rutina a largo plazo a un gran
número de sujetos. Entre los cursos de EI, los efectos Hawthorne deberían ser relativamente
pequeños en los cursos en los que los métodos de EI se han empleado durante muchos años en la
enseñanza regular de cientos de estudiantes: cinco cursos de 1994-5 en el Monroe Community
College27
(N =169) ; cuatro cursos de 1993-5 en la Universidad de Indiana30,34 (N = 917); y tres cursos de
1993-5 en Harvard29 (N = 560). Para estos 12 cursos <<g>> IE12 = 0,54 0,10sd,
aproximadamente lo mismo que el
<<g>> IE29 = 0,51 0,10sd promedio de los 29 cursos de IE (excluyendo los 7 cursos atípicos de
baja g) para los cuales, en promedio, los efectos Hawthorne eran más probables. Es posible que
los alumnos se beneficien de la atención especial que se les presta en la enseñanza regular de EI
a largo plazo, pero este beneficio es intrínseco a la pedagogía y no debería clasificarse como
efecto Hawthorne. No consideraré los efectos John Henry porque cualquier corrección por ellos
23
sólo disminuiría <<g>> T14, y por tanto aumentaría la diferencia <<g>> 48IE - <<g>> 14T.
Aunque no parece posible realizar una estimación cuantitativa fiable de la influencia de los
errores sistemáticos en las condiciones actuales de la encuesta, los argumentos expuestos en los
puntos "1" a "5" y la uniformidad general de los resultados de la encuesta sugieren que es
extremadamente improbable que el error sistemático desempeñe un papel significativo en la
diferencia de casi dos desviaciones estándar observada en la media

24
ganancias normalizadas de los cursos T e IE que se muestran en la Ec. (2c) y en la Fig. 1.
Por lo tanto, concluimos que esta diferencia refleja principalmente la variación en la
eficacia de la pedagogía y/o la implementación.

VI. IMPACTO DE LA INVESTIGACIÓN FÍSICO-EDUCATIVA


Todos los métodos de compromiso interactivo utilizados en los cursos de la encuesta fueron
estimulados de un modo u otro por la investigación en educación física (PER)51,52 y la ciencia
cognitiva. 44,53 Es significativo que de los 12 cursos de IE9a,c;21;27;29;30b,c,d;54-56 que
lograron ganancias normalizadas g >
0,60 (véanse las Figs. 1,3), el 67% fueron impartidos, al menos en parte, por personas que habían
dedicado una atención considerable al PER, a juzgar por su publicación de artículos o libros
revisados por pares sobre ese tema [lo mismo puede decirse del 48% de los 36 cursos de IE con
(<g>) < 0,6]. También cabe destacar que de los 12 cursos de IE con g > 0,60, el 42% utilizó
textos27a,52b,54,55 basados en el PER [lo mismo puede decirse del 19% de los 36 cursos de IE
con (<g>) < 0,6]. Parece, pues, que el PER ha dado resultados muy positivos en el aula.
Para los 48 cursos de compromiso interactivo de la Fig. 1, la clasificación en términos de
número de cursos de IE que utilizan cada uno de los métodos más populares es - Instrucción
colaborativa entre pares (CPI)31,32: 48 (todos los cursos); Laboratorios basados en
microordenadores (MBL)57: 35; Pruebas de concepto29: 20; Modelado14,58: 19; Conjuntos de
problemas de aprendizaje activo (ALPS)28b o Estudios de casos generales (OCS)28b: 17; texto
basado en la educación física o sin texto: 13; y Laboratorios de inducción al diálogo socrático
(SDI)8,13,34:
9. [Para simplificar, los cursos combinados17a en un "curso" [TO (8 cursos), TO-C (5 cursos) e
IUpre93 (5 cursos) se cuentan como un curso cada uno]. La clasificación en términos de número
de estudiantes que utilizan cada método es: IPC: 4458 (todos los alumnos); MBL: 2704; Pruebas
de Concepto: 2479; SDI: 1705; OCS/ALPS: 1101; Modelización: 885; texto basado en la
investigación o sin texto: 660.
En un artículo complementario se presenta un desglose detallado de las estrategias de
instrucción, así como de los materiales y sus fuentes para cada uno de los 48 cursos de EI de
este estudio. 17a Los métodos de EI suelen ser interdependientes y pueden combinarse para
potenciar los puntos fuertes de cada uno y modificarse para adaptarse a las condiciones y
preferencias locales (especialmente fácil si se dispone de materiales
electrónicamente27a,29c,34c para facilitar el copiado, pegado y corte). Todas estas estrategias de
EI, que han demostrado ser relativamente eficaces en las pruebas previas y posteriores a gran
escala, merecen ser consideradas por los profesores de física que desean mejorar sus cursos,
por los investigadores de la educación física y por los diseñadores de nuevos cursos de
introducción a la física. 58c,59

VII. SUGERENCIAS PARA MEJORAR EL CURSO Y LA ENCUESTA


Aunque los 48 cursos de compromiso interactivo de las Figs. 1 - 3 parecen, en promedio, ser
mucho más efectivos que los cursos tradicionales, ninguno se encuentra en la región High-g y
algunos incluso en la región Low-g característica de los cursos tradicionales. Esto es
especialmente preocupante si se tiene en cuenta la naturaleza elemental y básica de las preguntas
de las pruebas del Inventario de Conceptos de Fuerza y del Diagnóstico de Mecánica. (Muchos
25
instructores se niegan a colocar tales preguntas en sus exámenes, pensando que son "demasiado
simples". 18) Como se indicó anteriormente, los estudios de casos17a de los cursos de IE de nivel
bajo sugieren fuertemente la presencia de problemas de implementación. No se llevaron a cabo
estudios detallados similares para los cursos de IE de nivel medio, pero la experiencia personal
con los cursos de Indiana y las comunicaciones con la mayoría de los instructores de IE en este
estudio sugieren que eran comunes problemas de implementación similares, aunque menos
graves (Sec. IIIA).

26
Por lo tanto, no parece haber balas mágicas entre los tratamientos de EI de este estudio y
parece que es necesario seguir trabajando tanto en su contenido como en su aplicación. Como
se argumenta con más detalle en la ref. 17a, este estudio y otros trabajos sugieren que pueden
producirse mejoras mediante, por ejemplo, (a) el uso de métodos de EI en todos los
componentes de un curso y una estrecha integración de todos los
Estos componentes60; (b) una cuidadosa atención a los factores de motivación y la provisión de
incentivos de grado para tomar en serio las actividades de EI; (c) la administración de exámenes
en los que un número sustancial de las preguntas prueban el grado de comprensión conceptual
inducido por los métodos de EI; (d) el aumento económico del personal docente/entrenador por
estudiantes de grado y postdoctorales34b,61; (e) la educación de aprendizaje de los instructores
nuevos en los métodos de EI8,34b;
(f) el reconocimiento temprano y la intervención positiva para los estudiantes potenciales de bajo
rendimiento62; (g) el enfoque explícito en los objetivos y métodos de la ciencia2,52,63
(incluyendo un énfasis en las definiciones operativas2,8a,13,34,52b); (h) una atención más
personal a los estudiantes por medio de la instrucción informática mediada por humanos en
algunas áreas64,65; (i) nuevos tipos de cursos58c,59; (j) avances en la investigación de la
educación física y la ciencia cognitiva. En términos más generales, un proceso de rediseño
(descrito por
Wilson y Daviss66 y emprendida en las refs. 34 y 67) de uso continuo a largo plazo en el aula,
retroalimentación, evaluación, análisis de investigación y revisión parece ser necesario para una
reforma educativa sustantiva.
Los estándares y la medición son muy necesarios en la enseñanza de la física68 y son
componentes vitales del proceso de rediseño. En mi opinión, la presente encuesta es un paso en
la dirección correcta, pero las mejoras en futuras evaluaciones podrían lograrse mediante (en
orden aproximado de facilidad de implementación) (1) la estandarización de las prácticas de
administración de pruebas48,49; (2) el uso de un cuestionario de encuesta15c refinado y afinado a
la luz de la presente experiencia; (3) un uso más extendido de las pruebas
estandarizadas9b;10;50a-c,57c por parte de los instructores individuales para supervisar el
aprendizaje de sus estudiantes; (4) la observación y el análisis de las actividades en el aula por
parte de evaluadores independientes59a; (5) solicitud de información anónima a una amplia
muestra aleatoria de profesores de física; (6) desarrollo y uso de versiones nuevas y mejoradas de
los tests FCI y MB, tratadas con la confidencialidad del MCAT,48 (7) uso de tests conceptuales
E&M,69 y cuestionarios que evalúen las opiniones de los estudiantes sobre la ciencia y el
aprendizaje63; y (8) reducción de la posible influencia de la enseñanza según el test, extrayendo
las preguntas de los tests de forma que las preguntas específicas sean desconocidas para el
instructor. 68

27
VIII. RESUMEN Y CONCLUSIÓN
Catorce cursos tradicionales (T) (N = 2084) que hicieron poco o ningún uso de los métodos
de participación interactiva (IE) lograron una ganancia media <<g>> 14T = 0,23 0,04. Por el
contrario, cuarenta y ocho cursos IE (N = 4458) que hicieron un uso sustancial de los métodos IE
lograron una ganancia media <<g>> 48IE = 0,48 0,14. Es muy poco probable que los errores
sistemáticos desempeñen un papel importante en la diferencia de casi dos desviaciones estándar
en las ganancias normalizadas de los cursos T e IE.
Un gráfico de las puntuaciones medias del curso en la prueba de base de mecánica de
resolución de problemas de Hestenes/Wells frente a las del Inventario de Conceptos de Fuerza
conceptual muestra una fuerte correlación positiva con un coeficiente r = + 0,91. La
comparación de los cursos de EI con los tradicionales implica que los métodos de EI mejoran la
capacidad de resolución de problemas.
Los resultados de las pruebas conceptuales y de resolución de problemas sugieren
claramente que el uso de estrategias de EI puede aumentar la eficacia del curso de mecánica
mucho más allá de lo que se obtiene con los métodos tradicionales.

Epílogo
Este estudio indica que los denodados esfuerzos recientes por reformar la enseñanza de la
física introductoria, iluminados por la ciencia cognitiva y la investigación en educación física,
han dado resultados muy positivos en el aula. Sin embargo, la historia70-75 sugiere la
posibilidad de que tales esfuerzos tengan un impacto poco duradero. Esto sería muy
desafortunado, teniendo en cuenta el imperativo actual de (a) educar más eficazmente a los
estudiantes de ciencias76 y a los profesionales formados en ciencias,77 y (b) elevar el nivel
terriblemente bajo de conocimientos científicos78,79 entre la población general.
El progreso hacia estos objetivos debería aumentar nuestras posibilidades de resolver los
monumentales problemas intensivos en ciencia80-86 (económicos, sociales, políticos y
medioambientales) que nos acosan, pero una mejora importante de la enseñanza de la física a
escala nacional requerirá probablemente (1) la cooperación de instructores, departamentos,
instituciones y organizaciones profesionales,87 (2) el uso a largo plazo en el aula, la
retroalimentación, la evaluación, el análisis de la investigación y el rediseño de los métodos de
participación interactiva. 66

AGRADECIMIENTOS
Este trabajo recibió apoyo parcial de la subvención DUE/MDR9253965 de la NSF. Mi más
profunda gratitud a los profesores que proporcionaron el inestimable consejo, las sugerencias del
manuscrito y los datos inéditos que hicieron posible este informe (véase la ref. 17a para los
detalles de su trabajo): Albert Altman, Dewayne Beery, Les Bland, Don Boys, Ben Brabson,
Bernadette Clemens-Walatka, Paul D'Alessandris, Randall Knight, Priscilla Laws, Cherie
Lehman, Eric Mazur, Roger Mills, Robert Morse, Piet Molenaar, Tom O'Kuma, Gregg
Swackhamer, Lou Turner, Alan Van Heuvelen, Rick Van Kooten, Mojtaba Vazari, William
Warren y Paul Zitzewitz. He recibido sugerencias adicionales de Amit Bhattacharyya, Ernie
Behringer, Sister Marie Cooper, Steve Gottlieb, Ibrahim Halloun, John Hardie, David Hammer,
Charles Hanna, David Hestenes, Don Lichtenberg, Tim Long, Joe Redish, Rudy Sirochman,
Steve Spicklemire, Richard Swartz, Jack Uretsky y Ray Wakeland. Doy las gracias a dos árbitros
de la AJP por sus críticas constructivas que han mejorado considerablemente el manuscrito. Este
trabajo nunca se habría completado sin el estímulo y los consejos de Arnold Arons, David
28
Hestenes, William Kelly y Ray Hannapel.

29
a) Correo electrónico: <hake@ix.netcom.com>
1. (a) I. Halloun y D. Hestenes, "The initial knowledge state of college physics students", Am. J. Phys.
53, 1043-1055 (1985); las correcciones de la prueba de diagnóstico de mecánica se dan en la ref. 14; (b)
"Common sense concepts about motion," ibid. 53, 1056-1065 (1985).
2. A.B. Arons, A Guide To Introductory Physics Teaching (Wiley, 1990); reimpreso con pequeñas
actualizaciones en Teaching Introductory Physics (Wiley, 1997). Este último libro también contiene
Homework and Test Questions for Introductory Physics Teaching (Wiley, 1994) junto con una nueva
monografía "Introduction to Classical Conservation Laws".
3. F. Reif, "Educational Challenges for the University", Science 184, 537-542 (1974); "Scientific
approaches to science education", Phys. Today 39(11), 48-54 (1986).
4. D. Hestenes, "Wherefore a Science of Teaching", Phys. Teach. 17, 235-242 (1979).
5. J. Clement, "Students' preconceptions in introductory mechanics", Am. J. Phys. 50, 66-71 (1982).
6. M. McClosky, "Intuitive Physics", Sci. Am. 248(4), 122-130 (1983).
7. L.C. McDermott, "Research on conceptual understanding in mechanics", Phys. Today 37(7), 24-32
(1984).
8. R.R. Hake, Universidad de Indiana, (a) "Promoting student crossover to the Newtonian world", Am J.
Phys. 55, 878-884 (1987); (b) "My Conversion To The Arons-Advocated Method Of Science Education",
Teaching Education 3(2), 109-111 (1991).
9. (a) D. Hestenes, M. Wells y G. Swackhamer, Arizona State University, "Force Concept Inventory",
Phys. Teach. 30, 141-158 (1992). El FCI es muy similar al anterior test de Diagnóstico de Mecánica y
los resultados pre/post usando el primero son muy similares a los del segundo. (b) I. Halloun, R.R.
Hake,
E.P. Mosca, y D. Hestenes, Force Concept Inventory (Revisado, 1995) en ref. 29b. (c) Gregg
Swackhamer, Glenbrook North High School (pública), comunicación privada, 4/96.
10. D. Hestenes y M. Wells, "A Mechanics Baseline Test", Phys. Teach. 30, 159-166 (1992).
11. (a) D. Huffman y P. Heller, "¿Qué mide realmente el inventario del concepto de fuerza?" Phys.
Teach. 33, 138-143 (1995); (b) P. Heller y D. Huffman, "Interpreting the Force Concept Inventory: A
Reply to Hestenes and Halloun," ibid. 33, 503, 507-511 (1995).
12. (a) D. Hestenes e I. Halloun, "Interpreting the Force Concept Inventory: A Response to March
1995 Critique by Huffman and Heller", Phys. Teach. 33, 502, 504-506 (1995); (b) I. Halloun y D.
Hestenes, "The Search for Conceptual Coherence in FCI data," preprint, 1996.
13. S. Tobias y R.R. Hake, Universidad de Indiana, "Professors as physics students: ¿Qué pueden
enseñarnos?" Am. J. Phys. 56, 786-794 (1988).
14. I. A. Halloun y D. Hestenes, Arizona State University, "Modeling instruction in mechanics", Am.
J. Phys. 55, 455-462 (1987). El punto ASU-HH-C de la Fig. 3c corresponde al "Grupo de prueba nº 3".
15. R.R. Hake, (a) "Assessment of Introductory Mechanics Instruction", AAPT Announcer 23(4), 40
(1994); (b) "Survey of Test Data for Introductory Mechanics Courses", ibid. 24(2), 55 (1994); (c)
"Mechanics Test Data Survey Form", 15 páginas, copias disponibles bajo petición. La lista de
estrategias y recursos para la enseñanza de la física del formulario puede ser útil.
16. PHYS-L y PhysLrnR son redes de profesores de física e investigadores de educación física,
respectivamente. Alan Cairns da instrucciones para suscribirse a estos y otros grupos de discusión
por correo electrónico en <http://www-hpcc.astro.washington.edu/scied/physics/physlists.html>.

30
17. R.R. Hake, (a) "Interactive engagement methods in introductory mechanics courses," preprint, 5/97,
disponible bajo petición; (b) "Evaluating conceptual gains in mechanics: A six-thousand student survey
of test data," Proceedings of the 1996 International Conference on Undergraduate Physics Education
(College Park, MD, en prensa); en ese trabajo se omitieron de la media de EI los 7 cursos de EI de baja
intensidad, considerados con problemas de implementación según los comentarios de los instructores,
para obtener
<<g>> 41IE = 0,52 0,10sd. Ahora creo que es preferible el tratamiento actual.
18. E. Mazur, "Pensamiento cualitativo vs. cuantitativo: ¿Estamos enseñando lo correcto?" Optics and
Photonics News 3, 38 (1992).
19. B.S. Bloom, "The 2 Sigma Problem: The Search for Methods of Group Instruction as Effective as
One-to-One Tutoring", Educational Researcher 13(6), 4-16 (1984): "Utilizando la desviación estándar
(sigma) de la clase de control (convencional), se descubrió normalmente que el alumno medio bajo tutoría
estaba .................................................................................................... aproximadamente dos desviaciones
estándar por encima de la media de la clase de control.El proceso de tutoría demuestra
que la mayoría de los alumnos tienen el potencial de alcanzar este alto nivel de aprendizaje. Creo que una
tarea importante de la investigación y la instrucción es buscar formas de lograrlo en condiciones más
prácticas y realistas que la tutoría individual, que es demasiado costosa para la mayoría de las sociedades
a gran escala.
Este es el problema de "2 sigma"".
20. A.M. Saperstein, Phys. Teach. 33, 26-27 (1995) ha analizado los datos de la ref. 9a para concluir
que las puntuaciones del FCI en el pretest aumentan en torno a un 3 - 4% por año en los últimos años
de la adolescencia simplemente debido a la experiencia vital (no a la instrucción formal).
21. Bernadette Clemens-Walatka, Sycamore High School (pública), comunicación privada, 3/96.
22. Lou Turner, Western Reserve Academy, comunicación privada, 3/96. La Western Reserve Academy
es una escuela preparatoria privada selectiva coeducativa.
23. Priscilla Laws, Dickinson College, "Calculus-Based Physics Without Lectures", Phys. Today 44(12),
24-31 (1991); "Millikan Lecture 1996: Promoting active learning based on physics education research in
introductory physics courses", Am. J. Phys. 65, 13-21 (1997).
24. Don Boys, Univ. de Michigan (Flint), comunicación privada, 8/94; M. Vaziri y D. Boys
"Improving the Introductory Mechanics Course", AAPT Announcer 24(2), 81 (1994).
25. D.E. Meltzer y K. Manivannan, "Promoting Interactivity in Physics Lecture Classes", Phys. Teach.
34, 72-76 (1996).
26. E. Cullota, "The Calculus of Educational Reform", Science 255, 1060-1062 (1992);
27. Paul D'Alessandris, Monroe Community College (MCC), (a) comunicaciones privadas 11/94,
5/95, 3/96, 4/96; utilizó sus propios libros de trabajo basados en la investigación de la educación física
(disponibles en
<FTP@eckert.acadcomp.monroecc.edu>) en lugar de un texto del curso. En el MCC no se dieron
incentivos de calificación por el rendimiento en el FCI postest. (b) P. D'Alessandris, "The Development
of Conceptual Understanding and Problem-Solving Skills through Multiple Representations and Goal-
less Problems", AAPT Announcer 24(4), 47 (1994). El MCC es una universidad de dos años de
admisión abierta que "atrae" a los
............................................................................................................................................................ urban
os. ........................................................................................................................................................
pobres, suburbanos y rurales todo lo demás".
28. Alan Van Heuvelen, curso de cálculo en la Universidad Estatal de Ohio, (a) comunicación privada,
4/96. En la Universidad Estatal de Ohio no se incentivó el rendimiento en el FCI posterior a la prueba. (b)
A. Van Heuvelen, "Overview, Case Study Physics", Am. J. Phys. 59, 898-907 (1991). (c) "Experiment
Problems for Mechanics", Phys. Teach. 33, 176-180 (1995).

31
29. Eric Mazur, Universidad de Harvard, curso basado en el cálculo para estudiantes de ciencias (pero no de
física),
(a) comunicaciones privadas, 5/95, 4/96; (b) Peer Instruction: A User's Manual (Prentice Hall, 1997),
contiene el FCI revisado de 1995. (c) Para los datos de evaluación, el programa del curso, información
sobre Classtalk y ejemplos de Pruebas de Concepto, véase <http://galileo.harvard.edu/>.

32
30. Datos no publicados de cursos de la Universidad de Indiana no basados en el cálculo para
estudiantes de ciencias (pero no de física), en los que se inscriben principalmente estudiantes de
medicina y profesionales de la salud: (a) IU93S, R.R.Hake, primavera de 1993;
(b) IU94S R.R. Hake, primavera de 1994; utilizó el texto y el libro de trabajo de Reif basados en la
educación física y la investigación (ref. 52b); (c) IU95S: R. Van Kooten, R.R. Hake, F.M. Lurie y L.C.
Bland, primavera de 1995; (d) IU95F: L.C. Bland, B.B. Brabson, R.R.Hake, J.G. Hardie y E. Goff,
otoño de 1995. En Indiana, el postest de la FCI cuenta normalmente con la mitad de la nota del
examen final (alrededor del 12% de la nota final del curso).
31. D.W. Johnson, R.T. Johnson y K.A. Smith, Cooperative Learning: Increasing College Faculty
Instructional Productivity (George Washington University, 1991).
32. P. Heller, R. Keith, S. Anderson, "Teaching problem solving through cooperative grouping, Part 1:
Group vs individual problem solving", Am. J. Phys. 60, 627-636 (1992); P. Heller y M. Hollabaugh
"Teaching problem solving through cooperative grouping, Part 2: Designing problems and structuring
groups", ibídem, p. 637-644.
33. Classtalk. un sistema de comunicación en el aula utilizado en Harvard y otras instituciones, es analizado
por
J.C. Webb, G.R. Webb, R Caton y F. Hartline, "Collaborative Learning and Insights on Students'
Thinking: Computer Technology Offers New Possibilities for Large Classes", AAPT Announcer
24(4), 64 (1994).
34. R.R. Hake (a) "Socratic Pedagogy in the Introductory Physics Lab," Phys. Teach. 30, 546-552
(1992); (b) "Socratic Dialogue Labs in Introductory Physics", en Proceedings of the 1995 Conference
on New Trends in Physics Teaching, ed. por J. Slisko (Univ. de Puebla; Puebla, México, en prensa). (c)
Para un resumen de los trabajos recientes y una lista actualizada de los materiales de la IDE disponibles
electrónicamente (por ejemplo, manuales, guías para el profesor, ejemplos de exámenes de laboratorio,
listas de preparación de equipos), véase <http://carini.physics.indiana.edu/SDI/> o póngase en contacto
con R. R. Hake en <hake@ix.netcom.com>. Ref. 34a y SDI Labs #1-3 (versiones de 10/93) están
disponibles en el CD-ROM InfoMall de Fuller-Zollman. (d) A. Bhattacharyya, R.R. Hake, R.
Sirochman, "Improving Socratic Dialogue Inducing (SDI) Labs", AAPT Announcer 25(2), 80 (1995).
(e) Se puede solicitar una hoja de la Guía de Acrónimos de Calificación.
35. (a) J.L. Uretsky, "Using 'Dialogue Labs' in a Community-College Physics Course", Phys. Teach. 31,
478-481 (1993); (b) N. C. Steph, "Improving the Instructional Laboratory with TST and SDI Labs:
Mixing, Matching, and Modifying Ideas", AAPT Announcer 21(4), 61 (1991). (Herramientas TST para
el pensamiento científico).
36. La implementación de la prueba de concepto en la Universidad de Indiana se discute en la ref. 17a.
37. A. Roychoudhury, D. Gabel y R.R. Hake, "Inducing and Measuring Conceptual Change in
Introductory-Course Physics Students", AAPT Announcer 19(4), 64 (1989).
38. En Indiana, el profesor H.O. Ogren puso en marcha tanto la resolución de problemas en grupo
en los recitales como el "Foro de Física".
39. First Class, que se utiliza ampliamente en las clases con gran número de alumnos en la
Universidad de Indiana, permite debates electrónicos en el tablón de anuncios, el intercambio de
archivos y la colaboración entre estudiantes e instructores.
40. C. Schwartz, trabajo inédito que describe la invención por parte de este físico de los "Minute
Papers" tal y como los describe R.C. Wilson, "Improving Faculty Teaching", J. of Higher Ed. 57(2),
196-211 (1986) y comunicación privada. Para una discusión, véase la ref. 17a .
41. R.R. Hake y J. C. Swihart, "DIagnostic Student COmputerized Evaluation of Multicomponent
Courses (DISCOE)" Teaching and Learning (Indiana University), enero de 1979, disponible bajo
petición.

33
42. La figura 4 muestra dos puntos que son atípicos, ya que se encuentran cerca de la diagonal con una
puntuación media de MB sólo unos puntos por debajo de la puntuación media de FCI: (1) ASU-VH105-
C para el curso de Física 105 de Van Heuvelen para estudiantes desfavorecidos de preingeniería en la
Universidad Estatal de Arizona, (2) UML94-C para
El curso basado en el cálculo de Albert Altman en UMass (Lowell). Estos puntos pueden explicarse en
términos de características inusuales del curso: Los métodos de Van Heuvelen están orientados a la
resolución de problemas, mientras que las clases de Altman contienen un porcentaje relativamente alto
(alrededor del 30%) de personas que no son nativas del inglés, cuyas puntuaciones en el FCI pueden verse
reducidas artificialmente por las dificultades lingüísticas. El hecho de que el otro punto de UML93-C esté
cerca de la línea de ajuste por mínimos cuadrados puede explicarse por el hecho de que en 1993 (a
diferencia de 1994) no se concedió ningún crédito de grado por el rendimiento en el examen MB, a pesar
de que el examen MB requiere la "intolerable labor de pensamiento" en mucha mayor medida que el FCI.
(En 1993 y 1994 se concedió crédito de grado en la UML por el rendimiento en el postest del FCI).
43. B. Thacker, E. Kim, K. Trefz y S.M. Lea, "Comparing problem solving performance of physics
students in inquiry-based and traditional introductory physics courses", Am. J. Phys. 62, 627-633
(1994).
44. E.F. Redish, "Implications of cognitive studies for teaching physics", Am. J. Phys. 62, 796-803
(1994).
45. Véase, por ejemplo, (a) J.R. Taylor, Introduction to Error Analysis (University Science Books,
1982), especialmente las páginas 87-89 y 126-130; (b) L. Kirkup, Experimental Methods (Wiley, 1994),
especialmente las páginas 85-87. Estos métodos convencionales no son estrictamente aplicables porque
las distribuciones de las puntuaciones antes y después de la prueba tienden a apartarse de los gaussianos;
nuestra experiencia es que las puntuaciones después de la prueba del FCI suelen estar sesgadas
negativamente (efecto techo).
46. Para simplificar, dejemos que Sf> x y Si> ψ, de modo que la Ec. (1) se convierta en <g> = (x - y)/(C -
y), donde C es el número de preguntas del examen y x e y son el número medio de respuestas correctas
en los exámenes posteriores y previos. El tratamiento convencional (por ejemplo, ref. 45) considera que
el error aleatorio x es la "desviación estándar de la media". Esto no es más que la sdx dividida por la raíz
cuadrada del número de mediciones N. Así, x = sdx /N1/2 e y = sdy /N1/2. Si se piensa en medir xa, xb,
xc ,xn para muchos conjuntos n (digamos
106) de N estudiantes (todos extraídos aleatoriamente de la misma enorme población hipotética
homogénea) y luego tomar la media de xa, xb, xc ,xn para definir el valor "verdadero" x(true) de x,
entonces se puede
68% de confianza en que xa se encuentra dentro de x de x(verdadero). Con esta definición de x (y de
forma similar para y), el tratamiento convencional especifica entonces <g> = {[(g>/x)x)]2+
[(g>/y)y)]2}1/2. Aquí g>/x = 1/(C - y) y g>/y = (x - C)/(C - y)2 . Todo esto supone que los errores
separados asociados a x e y son aleatorios e independientes, y son lo suficientemente pequeños como
para poder tratarlos como diferenciales. Para los datos analizados actualmente, la media, el mínimo y el
máximo de x = 2,0%, 0,6% y 3,5% de C; y
= 2,0%, 0,4% y 3,8% de C.
Como sugiere R.E. Mills, los errores aleatorios son algo menores si se toma la media de g para un
curso como g(ave) (1/N) j gj = (1/N) j (postj - prej)/(C - prej). En la práctica, para N > 20, g(ave) suele
estar dentro del 5% de <g>. La ecuación (1) y la definición anterior de g(ave) implican que [g(ave) - <g>]
es proporcional a la media ponderada de las desviaciones (prej - <prej>). Dado que la media de
(prej - <prej>) es cero, una baja [g(ave) - <g>] implica una baja correlación entre gj y prej (Si)j para los
estudiantes individuales, al igual que hay una baja correlación entre <g> y <Si> para los cursos, como se
discute justo encima de la Ec. (2c).
47. Véase, por ejemplo, R.E. Slavin, Research Methods in Education (Allyn and Bacon, 2ª ed., 1992).

34
48. Es lamentable que el valor de evaluación nacional de pruebas estandarizadas arduamente construidas
y validadas, como el FCI y el MB, se esté erosionando gradualmente por la distribución de las respuestas
a los estudiantes en algunas instituciones. El peligro de la filtración de preguntas es especialmente grave
si las puntuaciones del FCI/MB después del examen se utilizan para determinar parte de la calificación
final del curso. En Indiana, el examen FCI se realiza siempre y se denomina "examen de mecánica de
diagnóstico" en un intento de blindar ref. 9a. Recogemos todas las pruebas previas y posteriores de los
estudiantes y ninguna se devuelve. Las puntuaciones de los pre y post tests se publican por ID, pero las
preguntas y respuestas no se publican, ni se difunden, ni se muestran como animaciones informáticas.
Después de la prueba posterior, los instructores están dispuestos a discutir las preguntas de FCI/MB en
privado con cualquier estudiante, pero las claves de las respuestas no se publican. Dado que existen
muchas fuentes (ref. 17a) de buenas preguntas conceptuales, no es necesario recurrir a las pruebas
estandarizadas para obtener preguntas que se utilicen para la discusión y las pruebas ordinarias en clase.
Los estudiantes de Indiana entienden que el FCI debe ser tratado igual que el MCAT, y hay poca
insatisfacción. Debido a la mencionada dispersión de las respuestas en algunas instituciones, y al hecho
de que las pruebas FCI y MB se publicaron en la literatura abierta, es posible que su vida útil no se
prolongue más de un año. Se necesitan urgentemente nuevas y mejores pruebas (tratadas con la
confidencialidad del MCAT) a tiempo para una calibración contra el FCI original o revisado. Los pasos
necesarios en el laborioso proceso de construcción de pruebas de física de opción múltiple válidas y
fiables se han discutido en las refs. 1a, 9a y 50.
49. En Arizona (ref. 1a) e Indiana (ref. 8) se explica a los estudiantes que sus puntuaciones en el pretest
no contarán para la calificación del curso, pero se les devolverá de forma confidencial y les ayudará tanto
a ellos como a sus instructores a conocer el grado y el tipo de esfuerzo que requieren para entender la
mecánica.
50. (a) R.J. Beichner, "Testing student interpretation of kinematics graphs", Am. J. Phys. 62, 750-762
(1994); (b) S.J. Sobolewski, "Development of Multiple-Choice Test Items", Phys. Teach. 34, 80-82
(1996); (c) W. Pfeiffenberger, A.M. Zolandz y L. Jones, "Testing Physics Achievement: Trends over
Time and Place", Phys. Today 44(9), 30-37 (1991); (d) G.J. Aubrecht, "Is There a Connection Between
Testing and Teaching?" J. Coll. Sci. Teach. 20, 152-157 (1991); G.J. Aubrecht y J.D. Aubrecht,
"Constructing Objective Tests", Am. J. Phys. 51, 613-620 (1983).
51. Para una visión general de la investigación en educación física véase, por ejemplo, (a) Toward a
scientific practice of science education, ed. por M. Gardner, J.G. Greeno, F. Reif, A.H. Schoenfeld, A.
diSessa y E. Stage (Erlbaum, 1990); (b) Research in Physics Learning: Theoretical Issues and Empirical
Studies, R. Duit, F. Goldberg y H. Niedderer, eds. (Institute for Science Ed., Kiel, 1992); (c) A. Van
Heuvelen "Learning to think like a physicist: A review of research-based instructional strategies", Am. J.
Phys. 59, 891-897 (1991);
(d) A. B. Arons, "Generalizations to be drawn from results of research on teaching and learning" en
Thinking Physics for Teaching, ed. por C. Bernardini, C. Tarsitani y M. Vicintini (Plenum, 1995);
(e) D. Hammer, "More than misconceptions: Múltiples perspectivas sobre el conocimiento y el
razonamiento de los estudiantes, y un papel adecuado para la investigación educativa", Am. J. Phys. 64,
1316-1325 (1996).
52. F. Reif, (a) "Millikan Lecture 1994: Understanding and teaching important scientific thought
processes", Am. J. Phys. 63, 17-32 (1995); (b) Understanding Basic Mechanics (Text, Workbook, and
Instructor's Manual) (Wiley, 1994).
53. J. Mestre y J. Touger, "Cognitive Research--What's in It for Physics Teachers?" Phys. Teach. 27,
447-456 (1989).
54. Randall Knight, California Polytechnic State University (San Luis Obispo), comunicaciones
privadas 4/94, 3/96; utilizó su propio texto Physics: A Contemporary Perspective (Addison-Wesley,
1997).
55. A.L. Ellermeijer, B. Landheer, P.P.M. Molenaar, "Teaching Mechanics through Interactive Video and
a Microcomputer-Based Laboratory", 1992 NATO Amsterdam Conference on Computers in Education,
Springer Verlag, en prensa; comunicaciones privadas de P.P.M. Molenaar, 6/94, 4/96. Utilizó la

35
investigación en física-educación basada en J.A. Dekker, Motion (en holandés) (Univ. de Amsterdam,
1990).

36
56. Thomas O'Kuma, Lee College, (a) comunicación privada, 5/95, 4/96. Lee es una universidad de dos
años de admisión abierta con una mayoría de estudiantes de familias de ingresos bajos o medios. Tiene
más de un 30% de minorías, más de un 56% de mujeres, una edad media de 29 años y (según O'Kuma)
es bastante típica de la mayoría de los colegios comunitarios de dos años.
57. (a) R.F. Tinker, "Computer Based Tools: Rhyme and Reason", en Proc. Conf. Computers in Physics
Instruction, ed. por E. Redish y J. Risley (Addison-Wesley, Reading, MA, 1989), pp. 159-168;
(b) R.K. Thornton y D. R. Sokoloff, "Learning motion concepts using real-time microcomputer-based
laboratory tools", Am. J. Phys. 58, 858-867 (1990); (c) D.R. Sokoloff, P.W. Laws y R.K. Thornton, "Real
Time Physics, A New Interactive Introductory Lab Program", AAPT Announcer 25(4), 37 (1995).
58. (a) I. A. Halloun y D. Hestenes, "Modeling instruction in mechanics", Am. J. Phys. 55, 455-462 (1987);
(b) D. Hestenes, "Toward a modeling theory of physics instruction", ibid. 55, 440-454 (1987);
"Modeling Games in the Newtonian World", ibid. 60, 732-748 (1992). (c) M. Wells, D. Hestenes y G.
Swackhamer, "A modeling method for high school physics instruction", ibid. 63, 606-619 (1995),
<http://modeling.la.asu.edu/modeling.html>.
59. Véase, por ejemplo, (a) J.S. Rigden, D.F. Holcomb y R. DiStefano, "The Introductory University
Physics Project", Phys. Today 46(4), 32-37 (1993). R. DiStefano, "The IUPP Evaluation: What we were
trying to learn and how we were trying to learn it", Am. J. Phys. 64, 49-57 (1996); "Preliminary IUPP
results: Student reactions to in-class demonstrations and to presentations of coherent themes", ibíd. , 64,
58-68 (1996). (b) R.P. Olenick, "C3P (Comprehensive Conceptual Curriculum for Physics)", AAPT
Announcer 26(2), 68 (1996), <http://phys.udallas.edu>. Otras citas aparecen en la ref. 17a.
60. R.R. Hake, "Towards Mastery of Newtonian Mechanics by the Average Student" (Hacia el dominio de la
mecánica newtoniana por el estudiante medio), Anunciador de la AAPT
24(1), 23 (1994).
61. He comprobado que los mejores estudiantes de física, tras un aprendizaje adecuado, se encuentran entre
los mejores instructores de IE, evidentemente porque sus mentes están más cerca de las de los estudiantes y
ellos mismos han luchado recientemente para entender los conceptos de física introductoria. Así pueden
apreciar mejor la naturaleza y la magnitud de los obstáculos intelectuales y las formas de superarlos. Los
estudiantes de grado tienen además la ventaja de que su empleo es relativamente barato. Los estudiantes
postdoctorales también se han ofrecido como instructores de laboratorio, ya que a menudo están motivados
para buscar experiencia con métodos educativos avanzados con el fin de calificarse mejor para las
oportunidades de trabajo en el mercado en expansión para los profesores educativamente eficaces. Como
futuros profesionales, los estudiantes de grado, postgrado y postdoctorado tienen la oportunidad de introducir
métodos interactivos en la enseñanza de las ciencias a todos los niveles.
62. R.R. Hake, R. Wakeland, A. Bhattacharyya y R. Sirochman, "Assessment of Individual Student
Performance in an Introductory Mechanics Course", AAPT Announcer 24(4), 76 (1994). Los gráficos de
dispersión de las ganancias (postest - pretest) frente a las puntuaciones del pretest para todos los
estudiantes de una clase delinean los estudiantes de g relativamente alto (g bajo) para los que el curso fue
(no fue) eficaz. Discutimos varias pruebas de diagnóstico (mecánicas,
matemáticas y visualización espacial) que se les da a los estudiantes entrantes y que podría utilizarse para
reconocer posibles
"bajos" e iniciar así una intervención útil.
63. I. Halloun, "Views About Science and Physics Achievement: The VASS Story", Proceedings of the
1996 International Conference on Undergraduate Physics Education (College Park, MD, en prensa);
E.F. Redish, R.N. Steinberg y J.M. Saul, "The Distribution and Change of Student Expectations in
Introductory Physics", ibídem; I. Halloun y D. Hestenes, "Interpreting VASS Dimensions and Profiles",
Sci. and Ed., en prensa.
64. Véase, por ejemplo, (a) A. A. diSessa, "The Third Revolution in Computers and Education", J. Res. in
Sci. Teach. 24, 343-367 (1987); (b) J.J. Kaput, "Technology and Mathematics Education" en Handbook of
Research on Mathematics Teaching and Learning, D.A. Grouws, ed. (MacMillan, 1992). (MacMillan, 1992);
(c) R.D. Pea, "Augmenting the Discourse of Learning with Computer-Based Learning Environments", en
Computer-Based Learning Environments and Problem Solving, ed. por E. DeCorte, M.C. Linn, H. Mandl y L.
37
Verschaffel (NATO ASI Series, serie F, vol. 84); (d) E. Redish y J. Risley, eds., Proc. Conf. Computers in
Physics Instruction (Addison-Wesley, 1989).

38
65. (a) R. Bird y R.R. Hake, "Force Motion Vector Animations on the Power Mac, "AAPT Announcer
25(2), 80 (1995); (b) R.R. Hake y R. Bird, "Why Doesn't The Water Fall Out Of The Bucket? Concept
Construction Through Experiment, Discussion, Drawing, Dialogue, Writing, and Animations", ibid.
25(2), 70 (1995).
66. K.G. Wilson y B. Daviss, Redesigning Education (Henry Holt, 1994); una mina de oro de
valiosas referencias. Véase también en <http://www-physics.mps.ohio-state.edu/~kgw/RE.html>.
67. L. C. McDermott, (a) "Millikan Lecture 1990: Lo que enseñamos y lo que se aprende: Cerrando la
brecha", Am. J. Phys. 59, 301-315 (1991); (b) L.C. McDermott, P.S. Shaffer y M.D. Somers, "Research as
a guide for teaching introductory mechanics: Una ilustración en el contexto de la máquina de Atwood",
ibídem, 62, 46-55 (1994).
68. F. Reif, "Comentario de un invitado: Normas y mediciones en física - ¿Por qué no en la enseñanza de
la física?" Am. J. Phys. 64, 687-688 (1996).
69. (a) C.J. Hieggelke, D. Maloney, T. O'Kuma y A. Van Heuvelen, "Electric and Magnetic Concept
Inventory", AAPT Announcer 26(2), 80 (1996); (b) P.V. Engelhardt y R.J. Beichner, "Determining and
Interpreting Students' Concepts of Resistive Electric Circuits", ibíd. 26(2), 80-81 (1996).
70. A. B. Arons, "Uses of the Past: Reflections on United States Physics Curriculum Development, 1955 to
1990", Interchange 24(1&2), 105-128 (1993); "Improvement of Physics Teaching in the Heyday of the
1960's", en Conference on the Introductory Physics Course on the occasion of the retirement of Robert
Resnick, Jack Wilson, ed. (Wiley, 1997), p. 13-20. (Wiley, 1997), p. 13-20.
71. L. C. McDermott, "A perspective on teacher preparation in physics and other sciences: The need for
special science courses for teachers", Am. J. Phys. 58, 734-742 (1990).
72. C. Swartz, "The Physicists Intervene", Phys. Today 44(9), 22-28 (1991): "Durante más de 150
años, los físicos estadounidenses han hecho incursiones en la enseñanza de las ciencias en la escuela
primaria y secundaria. Sus novedosos enfoques han funcionado normalmente, pero los resultados han
sido siempre efímeros". "(Cursiva nuestra.)
73. S. Tobias, "Comentario de un invitado: La reforma de la enseñanza de las ciencias: ¿Qué es lo que
falla en el proceso?" Am. J. Phys. 60, 679-681 (1992); Revitalizing Undergraduate Science: Why Some
Things Work and Most Don't (Research Corporation, 1992).
74. S.B. Sarason, The Predictable Failure of Educational Reform (Jossey-Bass, 1990); Revisiting
"The Culture of The School and The Problem of Change" (Teachers College Press, 1996).
75. G. Holton, "A Nation at Risk, Revisited" en The Advancement of Science and its Burdens (Univ.
de Cambridge Press, 1986).
76. W.P. Wolf, "¿Se está adaptando la enseñanza de la física a un mundo cambiante?" Phys.
Today 47(10), 48-55 (1994).
77. S. Tobias, "'Science-Trained Professionals' - A New Breed for the New Century", J. Sci. Ed.
Technol. 5, 167-169 (1996).
78. La "alfabetización científica", tal y como se utiliza aquí, no significa el conocimiento de los
"hechos" de la ciencia, tal y como se mide en algunas "pruebas de alfabetización científica", sino más
bien la comprensión de los métodos, la historia y las limitaciones de la ciencia; la relación de la
ciencia con la sociedad y con otras disciplinas; y un conocimiento práctico de la ciencia en al menos
algunas áreas que permita una mayor autoeducación cuando surja la necesidad. Véase Arons, ref. 2, p.
289-290, para un análisis más completo.
79. G. Holton, "The Anti-Science Phenomenon" (y sus citas) en Science and Anti-Science (Harvard
University Press, 1993); Einstein, History, and Other Passions: The Rebellion Against Science at the
End of the Twentieth Century (Addison Wesley, 1996).
80. R. Marshall y M. Tucker, Thinking for a Living (Basic Books, 1992).

39
81. A.A. Bartlett, "Reflections on Sustainability, Population Growth, and the Environment"
(Reflexiones sobre la sostenibilidad, el crecimiento de la población y el medio ambiente), Population
and Environment 16(1), 5-34 (1994).
82. M. Gell-Mann, El quark y el jaguar: Adventures in the Simple and the Complex (W.H.
Freeman, 1994), cap. 22, pp. 345 - 366.
83. G.E. Brown, "New Ways of Looking at US Science and Technology", Phys. Today 47(9), 31-35
(1994).
84. R.W. Schmitt, "Public Support of Science: Searching for Harmony", Phys. Today 47(1), 29-33
(1994).
85. "Shaping the Future: New Expectations for Undergraduate Education in Science, Mathematics,
Engineering, and Technology", Advisory Committee to the NSF Directorate for Education and Human
Services, 1996, disponible en <http://www.ehr.nsf.gov/EHR/DUE/documents/review/96139/start.htm>
o como copia impresa solicitándola a <undergrad@NSF.gov>.
86. "Prepararse para el siglo XXI: The Education Imperative", National Research Council, 1997,
disponible en <http://www2.nas.edu/21st>.
87. R.C. Hilborn, "Physics at the Crossroads: Innovation and Revitalization in Undergraduate Physics -
Plans for Action", informe sobre una conferencia de la AAPT en College Park de 9/96; "Guest
Comment: Revitalizar la física de grado - ¿Quién lo necesita?" Am. J. Phys. 65, 175-177 (1997).

40

También podría gustarte