Está en la página 1de 54

Traducido del inglés al español - www.onlinedoctranslator.

com

Uso del tiempo de clase por parte de los maestros y rendimiento de los estudiantes†

Simon Burgess, Universidad de Bristol


Shenila Rawal, Asociación de Oxford para la investigación y el análisis de la educación
Eric S. Taylor, Universidad de Harvard y NBER

noviembre 2022

Estudiamos las elecciones de los maestros sobre cómo distribuir el tiempo de clase en diferentes
actividades educativas, por ejemplo, lectura, discusión abierta o práctica individual. Nuestros datos
provienen de escuelas secundarias en Inglaterra, específicamente clases anteriores a los exámenes GCSE.
Los estudiantes obtienen mejores calificaciones en matemáticas cuando su maestro dedica más tiempo
de clase a la práctica y evaluación individual. Por el contrario, los estudiantes obtienen una puntuación
más alta en inglés si hay más discusión y trabajo con los compañeros de clase. La distribución del tiempo
de clase predice los puntajes de las pruebas independientemente de la calidad de la instrucción del
maestro durante las actividades. Estos resultados sugieren oportunidades para mejorar el rendimiento
de los estudiantes sin cambios en las habilidades de los maestros.

JEL n.° I21, J24


Diputado: simon.burgess@bristol.ac.uk . Rawal: shenilarawal@aol.com . taylor:
eric_taylor@harvard.edu . En primer lugar, agradecemos a la Fundación Nuffield por el generoso apoyo
financiero de este análisis y a la Fundación Education Endowment por el apoyo del experimento original
que recopiló los datos. Gracias por los comentarios y consejos a Anna Vignoles, Ellen Greaves, Hans
Sievertsen, Julie Cohen y Matthew Burgess, y al Departamento de Educación por acceder a la Base de
datos nacional de alumnos.
Las elecciones y habilidades de los maestros afectan la vida de sus estudiantes. Los estudiantes

asignados a maestros más efectivos aprenden más rápido y, como resultado, obtienen un mayor éxito en

la edad adulta. Sin embargo, aunque la evidencia muestra continuamente diferencias en las

contribuciones de los maestros a los resultados de sus alumnos, la evidencia sobre por qué esas

contribuciones difieren sigue siendo escasa. En particular, todavía sabemos poco sobre el papel de las

prácticas de instrucción. Aquí, "prácticas" es una abreviatura de las elecciones que hacen los maestros

sobre cómo enseñar, y la medida en que llevan a cabo con éxito esas elecciones. Las prácticas están

limitadas por las habilidades de enseñanza, pero no son sinónimo de habilidades.1

En este artículo examinamos datos novedosos sobre las prácticas de los docentes, combinados

con las puntuaciones de las pruebas posteriores de sus alumnos. Estudiamos a profesores y alumnos de

escuelas secundarias públicas (estatales) de Inglaterra. Específicamente, las clases de matemáticas e

inglés previas a los exámenes del Certificado General de Educación Secundaria (GCSE) generalmente se

toman a los 16 años. Los datos sobre las prácticas se recopilaron durante las observaciones en el aula

realizadas por otros maestros que trabajan en la misma escuela. Describimos varios resultados

empíricos, algunos nuevos para la literatura sobre la economía de los docentes y la enseñanza.

Nuestro enfoque principal son las elecciones de los maestros sobre cómo distribuir el tiempo de clase

en diferentes actividades educativas. Primero, los maestros toman decisiones diferentes. Algunos maestros

pasan gran parte del tiempo de clase utilizando la instrucción directa tradicional, incluidas las conferencias y el

uso de libros de texto, mientras que otros maestros dedican más tiempo de clase a los estudiantes que trabajan

con sus compañeros de clase o practican individualmente. Para nuestro estudio,

1Jackson, Rockoff y Staiger (2014) revisan la literatura sobre docentes. Los maestros y las escuelas no son
únicos en este sentido. Como Syverson (2011) revisa, la evidencia de muchos sectores e industrias
muestra grandes diferencias en la productividad entre empresas, plantas, etc., pero las causas de esas
diferencias solo se comprenden parcialmente. Algunas causas potenciales intuitivas, como las "prácticas
de gestión", reciben menos atención en la literatura porque son difíciles de medir y probar (cuasi)
experimentalmente (sobre la gestión, consulte Bloom y van Reenen 2007, Bloom et al. 2013 y Bloom et al.
2015 para escuelas). Las prácticas docentes son igualmente difíciles de medir y de manipular
(cuasi-)experimentalmente.

1
los observadores del salón de clases registraron cuál de las doce actividades de instrucción usó el

maestro y durante cuánto tiempo de clase. Los observadores simplemente registraron qué

actividades estaban sucediendo sin juzgar la idoneidad o la calidad de la actividad. La lista de

actividades, que se muestra en la tabla 1, incluye cosas como "exposición o dictado", "enseñanza

uno a uno" y "discusión abierta entre los estudiantes y el maestro". A modo de ejemplo, más de un

tercio de los docentes de nuestros datos utilizaron la actividad "discusión abierta..." durante la

mayor parte o todo el tiempo de clase, pero una cuarta parte de los docentes no utilizaron ninguna

"discusión abierta...". diferentes actividades, esas opciones no están relacionadas en gran medida

con la materia que se enseña (inglés o matemáticas) o con las características de los estudiantes en

la clase.

En segundo lugar, las elecciones de los maestros son (potencialmente) importantes para el

rendimiento de sus alumnos. Los estudiantes obtienen mejores calificaciones en los exámenes de matemáticas

cuando su maestro dedica más tiempo de clase a la práctica y evaluación individual. En la clase de matemáticas

típica (promedio), el maestro asigna "parte del tiempo" a la evaluación y la práctica. En una clase en la que el

profesor dedica "la mayor parte del tiempo" a la práctica y la evaluación, las puntuaciones del GCSE son 0,08σ

más altas que las de la clase típica (σ = desviaciones estándar de la puntuación de la prueba del alumno). Para

los exámenes de inglés, por el contrario, los estudiantes obtienen mejores puntajes cuando pasan más tiempo

trabajando y hablando con sus compañeros de clase, con ganancias previstas similares en magnitud a las

matemáticas.

Necesitamos interpretar este resultado cuidadosamente. A modo de comparación, observamos

que los documentos innovadores sobre prácticas de gestión y desempeño empresarial (Bloom y van

Reenen 2007, Bloom et al 2013) tienen la misma estructura que este documento: preguntar a los agentes

(gerentes/profesores) sobre sus acciones (prácticas de gestión). /uso del tiempo en el aula) y relacione

esto con los resultados (desempeño de la empresa/rendimiento de los alumnos). El problema tanto para

esos documentos como para este documento es hasta qué punto podemos controlar los factores de

confusión que afectan la medida de resultado. En nuestro caso, la principal preocupación se omite en las

habilidades del maestro: los estudiantes aprenden más porque sus maestros son más hábiles y los

maestros más hábiles eligen diferentes actividades de instrucción. Este tipo de

2
la preocupación por las variables omitidas a nivel docente limita las afirmaciones causales en muchos

estudios de docentes, incluso cuando los estudiantes se asignan aleatoriamente a los docentes (p. ej.,

Kane et al. 2011, Taylor 2018, Aucejo et al. 2020).

De hecho, nuestros datos nos permiten recorrer un largo camino hacia la eliminación de

este problema porque tenemos una medida de la eficacia de la instrucción de los maestros. Los

observadores calificaron la calidad de la enseñanza que observaron utilizando una rúbrica

detallada, el Marco para la Enseñanza (Danielson 2007). Estas calificaciones de eficacia educativa

miden una combinación de habilidades y esfuerzo en diez tareas de enseñanza, juzgadas contra un

estándar normativo definido por la rúbrica. Por ejemplo, una de las diez tareas es “usar técnicas de

cuestionamiento y discusión” (ver tabla 2).

El control de la eficacia de la instrucción del maestro nos da nuestro tercer resultado: las

actividades de instrucción que elige un maestro predicen el rendimiento de sus alumnos

independientemente de sus habilidades de enseñanza. Encontramos los mismos patrones: el tiempo para

la práctica individual y la evaluación beneficia los puntajes de matemáticas, y la interacción entre pares

beneficia los puntajes de inglés. Las estimaciones puntuales son de un cuarto a un tercio más pequeñas,

pero siguen siendo educativamente significativas y estadísticamente significativas en los niveles

convencionales. Estos resultados sugieren que, independientemente de las habilidades o el esfuerzo del

maestro, algunos enfoques de la instrucción en el aula tienen más éxito que otros para promover el

aprendizaje de los estudiantes. Este resultado es quizás la contribución más novedosa de este artículo. El

supuesto identificador de una interpretación causal es que nuestra medida de la eficacia de la instrucción

del maestro captura las habilidades del maestro que están correlacionadas con sus elecciones de

actividades de instrucción y el rendimiento de los estudiantes. Incluso si persiste algún grado de sesgo de

variable omitida, nuestras estimaciones tienen un argumento causal mucho más sólido que las

estimaciones existentes que omiten por completo las habilidades de los docentes.

En cuarto lugar, las calificaciones de efectividad de la instrucción de un maestro también predicen

puntajes de rendimiento más altos. Un estudiante asignado a un maestro del cuartil superior, medido por

índices de eficacia, obtendrá una puntuación de aproximadamente 0,08σ más alta que un estudiante similar

asignado a un maestro del cuartil inferior. Esa diferencia es aproximadamente de la misma magnitud que la

3
diferencia predicha por el uso que hacen los maestros del tiempo de clase para practicar matemáticas o para la

interacción entre pares en inglés.

Estas relaciones entre las prácticas de los maestros y los puntajes de los exámenes de los

estudiantes son significativas desde el punto de vista educativo y económico. Una mejora de 0,08σ es

aproximadamente un tercio de la desviación estándar en las contribuciones totales de los docentes a las

puntuaciones del GCSE (Slater, Davies y Burgess 2011). Las mejoras en las puntuaciones del GCSE

también predicen los ingresos futuros y la asistencia a la universidad (Mcintosh 2006, Hayward, Hunt y

Lord 2014, Hodge, Little y Weldon 2021).

Este artículo hace dos contribuciones a la literatura. Nuestra principal contribución es

demostrar la relación entre la elección de actividades educativas de un maestro y el rendimiento de

sus alumnos, incluso condicionado a su eficacia educativa. Muchos artículos miden las diferencias

entre los profesores en con qué eficaciaellos hacen su trabajo; Las calificaciones de las rúbricas de

observación en el aula son bastante comunes (ver Jackson, Rockoff y Staiger 2014 para una

revisión). Pocos documentos tienen medidas que puedan distinguir entre lo que los maestroshacer

en el trabajo decon qué eficaciaellos lo hacen. Los ejemplos más cercanos a este artículo, de los que

tenemos conocimiento, son Aslam y Kingdon (2011) y Taylor (2018). Ambos documentos distinguen

entre las actividades de instrucción y las habilidades de los docentes, y ambos usan esas medidas

para predecir los puntajes de los exámenes de los estudiantes, pero las medidas y los escenarios

son bastante diferentes a los de este documento.

Esta primera contribución tiene implicaciones importantes para los docentes y los administradores de

docentes que trabajan para mejorar la escolarización. A menudo, el enfoque en las escuelas, y entre los

investigadores, es mejorar las habilidades de los docentes. A menudo, esas habilidades son difíciles de aprender,

como manejar el mal comportamiento de los estudiantes o hacer preguntas efectivas en clase. Los resultados de

este artículo sugieren, por ejemplo, que los estudiantes aprenderían más matemáticas si los maestros

simplemente dedicaran más tiempo de clase a la práctica individual, incluso sin un cambio en las habilidades de

los maestros.

Una segunda contribución son las nuevas estimaciones de la correlación entre las calificaciones de las

rúbricas de observación (calificaciones de la eficacia de la instrucción) y las pruebas de los estudiantes.

4
puntuaciones. Varios estudios anteriores reportan la misma correlación, y nuestras estimaciones son

similares en magnitud (por ejemplo, Kane et al. 2011, Kane y Staiger 2012, Kane et al. 2013). Aún así,

nuestras estimaciones son novedosas en algunos aspectos. Primero, son de escuelas secundarias en

Inglaterra. Las estimaciones existentes provienen casi en su totalidad de escuelas primarias y secundarias

de los Estados Unidos; una excepción es Araujo y coautores (2016) que estudian las clases de jardín de

infantes en Ecuador. En segundo lugar, los observadores de nuestro estudio tenían poca formación en

comparación con estudios anteriores. Los observadores suelen recibir mucha más capacitación, que a

menudo incluye pruebas para asegurar la confiabilidad entre evaluadores. En tercer lugar, las

calificaciones de las rúbricas pueden depender de las actividades de instrucción utilizadas durante la

visita del observador. Podemos controlar las actividades de instrucción al estimar la correlación con los

puntajes de las pruebas de los estudiantes.

En la siguiente sección describimos a los maestros, estudiantes y escuelas en nuestro

estudio. La Sección 2 se enfoca en nuestras medidas de actividades educativas y efectividad

educativa, y las diferencias observadas en las elecciones y habilidades de los maestros. En la

Sección 3 examinamos la relación entre las prácticas de los docentes y los puntajes de las pruebas

de rendimiento de sus alumnos. Concluimos en la sección 4.

1. Configuración y muestra

Estudiamos a maestros que trabajan en escuelas secundarias públicas (estatales) en

Inglaterra y enseñan matemáticas e inglés a estudiantes de 10 y 11 años (aproximadamente entre

14 y 16 años). Nuestra medida del rendimiento estudiantil son los exámenes GCSE, que los

estudiantes toman al final del año 11. Nuestras medidas de prácticas docentes, tanto actividades

educativas como eficacia educativa, provienen de observaciones en el aula realizadas por maestros

compañeros de trabajo.

Los datos de observación del salón de clases se recopilaron como parte de un experimento de

campo previo en los años escolares 2014-15 y 2015-16. Los detalles completos y los resultados del

experimento se describen en Burgess, Rawal y Taylor (2021). Las escuelas de tratamiento comenzaron un

nuevo programa de observación entre maestros. En cada uno de los tratamientos

5
escuelas, algunos maestros siempre fueron los observadores, algunos siempre los observados, y

algunos participaron en ambos sentidos. Las escuelas fueron asignadas aleatoriamente a

tratamiento o control, y los maestros fueron asignados aleatoriamente a roles de observador y

observado. La Sección 2 describe los datos recopilados en las observaciones entre pares. Si bien los

maestros se calificaron entre sí, el programa no implicó ningún incentivo (formal) ni consecuencias

vinculadas a esos puntajes.

Todos los datos de los estudiantes provienen de la Base de datos nacional de alumnos (NPD) del

gobierno del Reino Unido, incluidos los puntajes de los estudiantes individuales de los exámenes del

Certificado general de educación secundaria (GCSE). Al final del año 11, los estudiantes toman los

exámenes GCSE en varias materias, pero en este documento solo usamos puntajes de matemáticas e

inglés. Los exámenes GCSE son importantes para los estudiantes; por ejemplo, los puntajes influyen en

las admisiones a la universidad. Y los GCSE predicen ganancias futuras (Mcintosh 2006, Hayward, Hunt y

Lord 2014, Hodge, Little y Weldon 2021). Además de los puntajes de GCSE, los datos de NPD brindan

puntajes de exámenes anteriores de los estudiantes, datos demográficos y medidas de exposición a la

pobreza en sus familias y vecindarios.

El NPD no recopila datos que vinculen a los estudiantes con sus maestros específicos. Durante el

experimento de observación entre pares, las escuelas proporcionaron listas de clases que usamos para vincular

a estudiantes y maestros. Las listas utilizan códigos de identificación de maestros enmascarados que,

lamentablemente, no podemos vincular con ningún otro dato sobre maestros individuales.

Nuestra muestra de estudio incluye 251 maestros en 32 escuelas y poco más de 7,000

estudiantes que fueron enseñados por esos maestros y para quienes tenemos los puntajes de las

pruebas GCSE. Para matemáticas tenemos 5.211 alumnos y 136 profesores, y para inglés 4.301 y

1202. Los datos de observación en el aula fueron recopilados por 231 maestros compañeros

diferentes.

La selección en esta muestra involucró tres pasos. Primero, las escuelas se ofrecieron como voluntarias para

participar en el nuevo experimento del programa de observación entre pares. el equipo de investigación

2Esto se debe a que es más probable que los maestros de matemáticas sean observados, no porque tengamos puntajes
diferenciales en los exámenes de los estudiantes.

6
contactó a casi todas las escuelas secundarias públicas (estatales) de alta pobreza en Inglaterra y las

invitó a participar en el experimento.3Las escuelas no fueron seleccionadas en base a los puntajes de las

pruebas de los estudiantes. En segundo lugar, la mitad de las escuelas de voluntarios fueron asignadas

aleatoriamente al programa de tratamiento. En tercer lugar, dentro de cada una de las escuelas de

tratamiento, se seleccionó una muestra aleatoria de maestros para observarlos y calificarlos. Cuarto, los

maestros elegían si participar o no. Por lo tanto, nuestra muestra de 32 escuelas y 251 docentes es en

parte seleccionada al azar y en parte autoseleccionada.

La Tabla 3 proporciona una descripción de nuestra muestra. Las escuelas invitadas a participar en el

experimento fueron seleccionadas intencionalmente por tener altos índices de pobreza, y esa selección inicial se

refleja en las filas de IDACI y comidas escolares gratuitas de la tabla 3. Poco más del 40 por ciento de los

estudiantes son, o alguna vez han sido, elegibles para recibir alimentos gratuitos. comidas escolares,

sustancialmente más altas que el promedio nacional. La comparación entre las columnas de la tabla 3

proporciona alguna información sobre la autoselección de maestros en nuestra muestra.

2. Medidas de prácticas docentes

Las observaciones en el salón de clases revelaron diferencias significativas entre los maestros tanto en

las actividades de instrucción que los maestros eligieron usar en clase como en las calificaciones basadas en

rúbricas de la efectividad de la instrucción de los maestros. En esta sección describimos la variación en las

prácticas y la eficacia. En la siguiente sección relacionamos las medidas de los maestros con los puntajes de las

pruebas de los estudiantes.

Los datos de observación se recopilaron durante casi 2700 visitas a las aulas, donde un

observador calificó a uno de sus compañeros maestros. Las visitas solían durar entre 15 y 20

minutos. El maestro típico (mediano) fue observado ocho veces durante dos años (IQR 4-15). El

maestro típico fue puntuado por tres compañeros observadores diferentes (IQR 2-5). Todos los

maestros recibieron capacitación sobre la rúbrica y otros aspectos del programa.

3Para este propósito, las “escuelas de alta pobreza” eran aquellas escuelas donde el porcentaje de estudiantes elegibles para
comidas escolares gratuitas estaba por encima de la media de Inglaterra.

7
Sin embargo, la capacitación fue breve en comparación con la capacitación que han recibido los

observadores en otros estudios y entornos (p. ej., Kane et al. 2011, Kane et al. 2013).

2.1 Actividades de instrucción

Para medir las opciones de actividades educativas de los maestros, se les dio a los

observadores una lista de actividades y se les pidió que registraran la frecuencia con la que se

usaba cada actividad. Es importante destacar que los observadores pares registraron solo la

frecuencia de la actividad durante su visita; no se pidió a los observadores que evaluaran la calidad

o la adecuación de la actividad. La lista completa de doce actividades se muestra en la tabla 1,

incluidas cosas como “discusión abierta entre los niños y el maestro” y “uso de la pizarra por parte

del maestro”. Los observadores podían elegir entre cinco opciones: nada (0), muy poco (1), algunas

veces (2), la mayor parte del tiempo (3), tiempo completo (4). La lista de actividades y el instrumento

fueron adaptados del proyecto SchoolTELLS (Kingdon, Banerji y Chaudhary 2008).

Los profesores toman decisiones bastante diferentes sobre cómo pasar el tiempo de clase. La

Figura 1 muestra las doce diferentes actividades de instrucción y la frecuencia de su uso. Por ejemplo, en

más de un tercio de las clases, los observadores registraron “discusiones abiertas entre los niños y el

maestro” durante la mayor parte o la totalidad del tiempo de clase. Sin embargo, en una cuarta parte de

las clases, la "discusión abierta..." era muy rara o estaba completamente ausente. Los maestros estaban

divididos de manera similar sobre "los niños que hacen el trabajo escrito solos". Un ejemplo contrastante

es el uso de un libro de texto, que se registró como raro o ausente en casi nueve de cada diez clases.

Los patrones de las actividades de instrucción son bastante similares en las clases de

matemáticas e inglés. La correlación entre sujetos en la frecuencia media de actividades es de 0,96. La

figura A1 del apéndice muestra la figura 1 por separado por tema. Sin embargo, esta similitud en el uso

del tiempo no significa que las actividades contribuyan a los puntajes de los exámenes de matemáticas e

inglés de los estudiantes de la misma manera, como mostramos en la sección 3.

Algunos grupos de actividades de instrucción están correlacionados. La Tabla 4 muestra la

matriz de correlación para las doce actividades. Algunas actividades pueden ser complementarias

8
insumos para el aprendizaje de los estudiantes, mientras que otras actividades pueden ocurrir

simultáneamente por razones prácticas. Examinar las correlaciones, junto con la sustancia de las

actividades, sugiere una oportunidad para alguna reducción de dimensión.

Nuestro análisis se centra en cuatro grupos de actividades de instrucción. Primero, un

grupo que llamamos “interacción entre estudiantes y compañeros”, combinando las actividades 1 y

2, que involucran a los estudiantes interactuando entre sí (y con el maestro). Segundo, “instrucción

personalizada”, combinando las actividades 3-4, que involucran atención personalizada del maestro

a los estudiantes. Tercero, “práctica y evaluación”, que combina las actividades 5 a 7, que implican

la práctica y la evaluación de los estudiantes. Cuarto, “instrucción directa”, que combina las

actividades 8-11, que involucran lectura tradicional y otra instrucción directa.

La Tabla 5 describe las elecciones de los maestros usando estos cuatro grupos de actividades. El grupo

de actividades más común es “interacción entre estudiantes” con una media de 1,7, donde un 2 es “parte del

tiempo” en una escala de 0 “nada” a 4 “tiempo completo”. El menos común es la “instrucción directa” con una

media de 1,2. En la sección 3, mostramos que estos cuatro tipos de actividades predicen las calificaciones de los

estudiantes de manera muy diferente en matemáticas en comparación con las de inglés.

La simplificación implica compensaciones. Nuestra agrupación divide las doce

actividades en categorías mutuamente exclusivas y exhaustivas que son relativamente

sencillas. La contrapartida es que estos grupos simples ignoran la variación en cómo se

correlacionan las actividades dentro y entre grupos. Para complementar el agrupamiento

simple, mostramos en el Apéndice C que los resultados del documento son robustos al uso

del análisis de componentes principales para la reducción de dimensiones.

2.2 Eficacia de la instrucción


Para medir la efectividad de la instrucción de los maestros, los observadores calificaron a

los observadores usando una rúbrica estructurada conocida comoMarco para la enseñanza(

Danielson 2007, FFT). La rúbrica es ampliamente utilizada por los sistemas escolares y en la

investigación (por ejemplo, Kane et al. 2011, Taylor y Tyler 2012, Kane et al. 2013, Bacher-Hicks et al.

9
2017). Los maestros fueron calificados en diez tareas de instrucción separadas (o "estándares" en la

jerga de FFT), que se enumeran en la columna de la izquierda de la tabla 2. Para cada tarea, la

rúbrica incluye descripciones detalladas de los comportamientos observados que deben calificarse

como " enseñanza “altamente efectiva”, “efectiva”, “básica” e “ineficaz”. En la tabla 2 reproducimos

las descripciones de “efectivo” como ejemplo. La rúbrica completa se proporciona en el apéndice B.

Los observadores pares asignaron una puntuación del 1 al 12 a cada uno de los diez elementos de la rúbrica.

En la mayoría de los entornos, la rúbrica FFT se califica del 1 al 4 correspondiente a las cuatro

descripciones. En este estudio, los observadores fueron capacitados para usar 1-3 para "ineficaz",

4-6 para "básico", 7-9 para "eficaz" y 10-12 para "altamente eficaz". Así, por ejemplo, un observador

que sintiera que el maestro era "efectivo" podría elegir una puntuación de 7, 8 o 9, donde 7 sugiere

"efectivo" pero más cercano a "básico" y 9 sugiere "efectivo" pero más cercano a "altamente".

eficaz."

Los maestros difieren en la efectividad de la instrucción, según la calificación de sus

compañeros de trabajo. Para ser claros, en este contexto, la "eficacia de la instrucción" es una medida de

las acciones observables de un maestro en el aula. Si bien usamos la palabra "eficacia", estas

calificaciones también podrían describirse como medidas de "desempeño laboral". Las calificaciones

reflejan una combinación de las habilidades y el esfuerzo de un maestro aplicado a tareas de enseñanza

específicas, juzgadas contra un estándar normativo definido por la rúbrica.

La Figura 2 muestra un histograma de calificaciones a nivel de elemento en el panel superior,

agrupando las diez tareas. El puntaje más común es 10 de 12, otorgado en casi el 25 por ciento de las

calificaciones; pero las puntuaciones de 8, 9, 11 y 12 tienen cada una entre el 10 y el 15 por ciento de las

calificaciones. Muy pocos maestros obtienen una calificación de 3 o menos ("ineficaz").

4Estas diez tareas puntuadas (o estándares) se dividen en dos "dominios" de "ambiente del aula" e
"instrucción". Estos dos dominios se califican durante las observaciones en clase, y durante el
experimento de evaluación por pares solo se calificaron estos dos dominios. La rúbrica FFT también
incluye varios estándares en otros dos dominios, "planificación" y "evaluación", que se califican en base a
conversaciones con el maestro y una revisión de los materiales.

10
El sesgo en la figura 2 refleja en parte el sesgo de indulgencia, que es una característica común

de las calificaciones de desempeño laboral de los docentes (Weisberg et al. 2009, Kraft y Gilmour 2017) y

en muchas otras ocupaciones (Prendergast 1999). El sesgo de indulgencia puede ser más probable en

nuestro entorno donde los observadores y los observados trabajaron juntos en la misma escuela como

compañeros. Alternativamente, la naturaleza de bajo riesgo de las observaciones de los pares puede

haber hecho que las calificaciones resultantes sean más precisas. Y la escala de 12 puntos les dio a los

evaluadores una forma de diferenciar entre la enseñanza "altamente efectiva". Al final, mientras que las

calificaciones se agrupan en la parte superior de la escala en nuestros datos, hay más variación de lo que

es típico de las observaciones en el aula y mucho menos efecto techo de lo que es típico.5

Para cada una de las diez tareas de instrucción, la tabla 6 informa la calificación media y la

desviación estándar. Los observadores calificaron a los maestros más alto, en promedio, por "manejo del

comportamiento de los estudiantes" (media 9.4) y más bajo por "uso de la evaluación" (media 8.5). En

general, los maestros fueron calificados como más efectivos en las tareas del entorno del salón de clases

que en las tareas de instrucción. El “uso de la evaluación” también mostró las mayores diferencias en la

efectividad entre docentes (desviación estándar 2.2). Los maestros fueron más similares en "comunicarse

con los estudiantes" (desviación estándar 1.9).

Las calificaciones de efectividad de la instrucción de un maestro en todas las tareas están fuertemente

correlacionadas. La correlación promedio en la calificación entre dos tareas cualesquiera es 0,70, con un rango

de 0,55 a 0,86. La matriz completa de correlaciones por pares se muestra en el cuadro A1 del apéndice. La

correlación entre tareas refleja en parte el hecho de que las verdaderas habilidades y esfuerzos subyacentes

están correlacionados. De hecho, 0,70 puede subestimar la correlación en las habilidades o el esfuerzo, ya que

se observa a los docentes brevemente y con poca frecuencia al introducir el error de medición clásico. La

correlación también surge en parte porque las calificaciones de las diez tareas

5La figura A2 del apéndice muestra un histograma de los mismos datos que el panel A de la figura 2, pero donde las
calificaciones del 1 al 12 se colapsan en la escala más común del 1 al 4. Los efectos de sesgo y techo son, como era de
esperar, mucho más fuertes.

11
son dados por un observador. Sin embargo, utilizando solo la variación dentro del observador, la

correlación por pares promedio sigue siendo 0,60, con un rango de 0,44 a 0,79.

En la práctica, entonces, las calificaciones de las rúbricas miden principalmente una dimensión

general de la eficacia de la instrucción. La tabla A2 del apéndice muestra los resultados de un análisis de

componentes principales de las calificaciones a nivel de ítem. El primer componente principal es

efectivamente el promedio simple de los diez elementos de la tarea, y ese promedio simple explica las

tres cuartas partes de la variación en las calificaciones a nivel de elemento. A modo de comparación, el

primer componente principal de los elementos de actividades de instrucción explica solo el 13 por ciento

de los datos de actividades. Este patrón de correlaciones entre calificaciones coincide con estudios

previos que utilizan la rúbrica de observación FFT.6

Dadas estas correlaciones, nos enfocamos en un puntaje único para la efectividad de la

instrucción: el promedio simple de las diez calificaciones de la rúbrica FFT. El panel inferior de la

figura 2 muestra un histograma de estos puntajes promedio, con un puntaje promedio para cada

visita de observación de pares.

Una nota final sobre la medición de las prácticas docentes. Las diferencias entre los

profesores pueden reflejar en parte las diferencias en los estudiantes a los que enseñan. Los

maestros pueden elegir diferentes actividades de instrucción para estudiantes con diferentes

necesidades académicas. O los estudiantes con diferentes necesidades pueden ser asignados

a maestros en base a la efectividad de instrucción del maestro o el uso de actividades. Tales

elecciones o asignaciones intencionales pueden o no mejorar el éxito de una escuela (Duflo,

Dupas y Kremer 2011, Ballatore y Sestito 2017, Aucejo et al. 2020, Graham et al. 2021).

Alternativamente, los juicios de los observadores del aula pueden verse influenciados por los

estudiantes de la clase durante la visita (Campbell y Rondfeldt 2018). Sin embargo, en el

contexto de este artículo, encontramos poca evidencia de una relación entre

6En tres estudios previos en escuelas de EE. UU., las calificaciones de los diez ítems de FFT están correlacionadas entre 0,72 y 0,88
(Kane y Staiger 2012, Ho y Kane 2013, Gitomer et al. 2014, ICPSR nd, comunicación personal de Andrew Ho, 3 de mayo de 2019).
Kane et al. (2011) reporta resultados de componentes principales similares. Sin embargo, en nuestros datos, los niveles de
calificación son consistentemente más altos en todos los elementos, alrededor de 0,9 puntos en la escala de 4 puntos, y nuestras
calificaciones tienen una variación más alta, alrededor de un 30 por ciento más grande.

12
las características de los estudiantes (puntajes de exámenes anteriores, exposición a la pobreza, etc.) y las

opciones de actividades de instrucción de sus maestros o la eficacia de la instrucción calificada (tabla A3

del apéndice).

3. Prácticas docentes y rendimiento estudiantil

Pasamos ahora a la relación entre las prácticas docentes y el rendimiento de los estudiantes. Como

detallamos en esta sección, los estudiantes obtienen mejores calificaciones en matemáticas cuando su maestro

asigna más tiempo de clase a la práctica y evaluación de los estudiantes. Por el contrario, los estudiantes

obtienen mejores calificaciones en inglés cuando los maestros dedican más tiempo a que los estudiantes

trabajen y hablen entre ellos en clase. Estas relaciones, entre las actividades de instrucción en clase y el

rendimiento de los estudiantes, se mantienen incluso controlando la eficacia de la instrucción del maestro. Los

estudiantes también obtienen puntajes más altos cuando su maestro tiene una calificación más alta en la

efectividad de la instrucción.

3.1 Estimación
Nuestra estrategia de estimación comienza con un modelo estadístico convencional de los puntajes de las

pruebas de los estudiantes:

      =        +            +     +         , (1)


dónde        es el puntaje GCSE estandarizado para estudiantes  en tema   (matemáticas o

inglés) impartido por el profesor  en el año escolar previo a los GCSE.7el vector     

representa puntajes o medidas tomadas de las observaciones del maestro en el aula

,y descrito en la sección 2. Nuestro interés es estimar  .el vector        incluye

varios controles adicionales: estudiante  's propios puntajes de exámenes anteriores en matemáticas e inglés;

7Estrictamente hablando el  índice en        y        es redundante porque, en nuestros datos, cada estudiante es
asignado a un solo profesor por asignatura y así   =   (    ).mantenemos el  índice para facilitar la exposición. Los puntajes
de los estudiantes están estandarizados (media 0, sd 1) por materia y año escolar dentro de nuestra muestra de análisis.

13
las medias de clase y las desviaciones estándar de los dos puntajes de prueba anteriores,

omitiendo  ; y varios otros estudiantes observables.8El    término representa efectos fijos sujetos.

Nuestras estimaciones preferidas de  también dan cuenta de las diferencias entre los observadores. Sobre la

base de la especificación 1, ajustamos:

        =          +            +     +     +           , (2)


dónde      son las puntuaciones dadas al profesor  por observador  .La adición del observador

efectos fijos,    , controla las diferencias entre los observadores en sus expectativas, prácticas,

experiencia, etc.9Para estimar la especificación 2, primero creamos un nuevo conjunto de datos con  

duplicados de cada registro de pareja alumno-profesor,      ,en los datos originales,

dónde    es el número de observadores que puntuaron maestro  .A estos nuevos datos nos

añade el      puntuaciones.10Entonces estimamos 2 ponderaciones por1⁄    ; por lo tanto, cada estudiante-

pareja de maestros,      ,se le da el mismo peso independientemente del número de observadores que calificaron

al maestro  .A lo largo del informe, informamos estimaciones de error estándar robustas de clúster, donde los

clústeres son maestros  .

Reportamos estimaciones de  separados por tema. Estimamos la especificación 2 pero

permitimos todos  y  los términos sean diferentes según el tema. Efectos fijos del observador,    ,

siguen siendo sujetos cruzados para nuestros resultados principales, pero esos resultados son robustos para el

uso de efectos fijos observador por sujeto (equivalentemente, estimando 2 por separado por sujeto).

3.2 Actividades de instrucción en clase y resultados de las pruebas de los estudiantes

Los diferentes maestros eligen distribuir el tiempo de clase de diferentes maneras (clase,

discusión en grupo, práctica individual, etc.) y esas diferentes actividades de instrucción explican en parte

las diferencias en los puntajes de las pruebas de los estudiantes. Como las estimaciones en la tabla

8Los puntajes de las pruebas anteriores son puntajes de Key Stage 2 (KS2). Las otras características son el género, alguna vez
elegible para comidas escolares gratuitas, puntaje IDACI, mes de nacimiento y el año en que el estudiante tomó los GCSE.
También incluimos un indicador de si la escuela está en Londres.
9Estas diferencias de los observadores pueden incluir, por ejemplo, diferencias entre los observadores en su
sentido de lo que constituye "medir la comprensión de los estudiantes" o "trabajo no docente", o los umbrales
entre "algunas veces" y "la mayor parte del tiempo".
10Cuando  observa  más de una vez, usamos las medidas o puntajes promedio de  en      . Similarmente,
para    en la ecuación 1 usamos el promedio de todos los observadores.

14
En el panel A de 7 columnas 1, los estudiantes obtienen una puntuación más alta en los GCSE de

matemáticas cuando el enfoque de su maestro incluye más tiempo para la práctica y la evaluación

individuales. Aumentar el tiempo para "práctica y evaluación" en una desviación estándar predice

puntajes de prueba de matemáticas 0.068σ más altos. En la clase de matemáticas típica (promedio), el

maestro asigna "parte del tiempo" a la evaluación y la práctica. En una clase en la que el profesor dedica

"la mayor parte del tiempo" a la práctica y la evaluación, esperaríamos que las puntuaciones fueran

aproximadamente 0,08σ más altas que las de la clase típica.11Por el contrario, las otras actividades de

clase son predictores mucho más débiles de las puntuaciones de matemáticas.

Sin embargo, para los GCSE de inglés, los estudiantes obtienen una puntuación más alta cuando el tiempo de

clase incluye una mayor interacción del estudiante con sus compañeros de clase. El coeficiente de "interacción entre

estudiantes y compañeros" es 0.053σ para predecir los puntajes de las pruebas de inglés (tabla 7, columna 1, panel B),

aproximadamente tan grande como lo es "práctica y evaluación" para matemáticas. Pero otras actividades no son

fuertes predictores de los puntajes de inglés, de hecho, más tiempo en las otras actividades puede conducir a puntajes

más bajos en las pruebas.

La relación entre las actividades de instrucción y el rendimiento de los estudiantes es

económica y educativamente significativa. Una mejora de 0,08σ es aproximadamente un tercio de

la desviación estándar entotalcontribuciones de los maestros a los puntajes de las pruebas de los

estudiantes.12Una diferencia de 0,08σ también es aproximadamente la diferencia entre ser

asignado a un maestro de primer año o un maestro de quinto año (ver Jackson, Rockoff y Staiger

2014 para una revisión reciente). Una ganancia de 0.08σ también es similar a la ganancia de

11Como se muestra en la tabla 5, la media matemática para "práctica y evaluación" es 1,73, donde 2 es "parte del
tiempo". La desviación estándar es 0,086, por lo que un cambio de un punto de escala de 2 "algunas veces" a 3 "la mayor
parte del tiempo" sería aproximadamente 0,068σ/0,86 = 0,08σ.
12Slater, Davies y Burgess (2011) estiman que la desviación estándar de las contribuciones de los maestros a las
puntuaciones del GCSE es de 0,272 desviaciones estándar de los estudiantes. Esta estimación proviene de escuelas
secundarias de inglés y cursos GCSE, como en nuestro estudio actual, aunque la muestra de Slater, Davies y Burgess
(2011) es más amplia. Para obtener un resumen general de las estimaciones sobre la distribución del valor agregado de
los docentes, consulte Jackson, Rockoff y Staiger (2014) y Hanushek y Rivkin (2010), aunque muchas estimaciones de esas
estimaciones provienen de escuelas primarias y secundarias en los Estados Unidos. La estimación de 0,272 puede ser
mayor que otras estimaciones en parte porque los estudiantes suelen pasar dos años con su profesor de GCSE.

15
agregando 2-3 semanas de instrucción al año escolar (Sims 2008, Fitzpatrick,
Grissmer y Hastedt 2011, Aucejo y Romano 2016).
Las estimaciones en la columna 1 de la tabla 7 por sí solas no son suficientes para concluir que más

práctica y evaluación provocan puntuaciones más altas en matemáticas per se, o que una mayor interacción de

los estudiantes provoca puntuaciones más altas en inglés. Ciertamente, es plausible que los estudiantes

aprendan más o menos debido a cómo sus maestros distribuyen el tiempo de clase. Sin embargo, no podemos

descartar una explicación alternativa: que los estudiantes aprenden más o menos debido a otra cosa que hacen

sus profesores, y que esa otra cosa está simplemente correlacionada con la elección de actividades de

instrucción por parte del profesor. Esta preocupación por las variables omitidas a nivel docente también limita

las afirmaciones causales en otras investigaciones similares, incluso cuando los estudiantes se asignan

aleatoriamente a los docentes (p. ej., Kane et al. 2011, Taylor 2018, Aucejo et al. 2020).

Una importante variable potencial omitida es la habilidad o el esfuerzo del maestro.

El hecho de que una determinada actividad educativa beneficie o no el aprendizaje de los

estudiantes debería depender, al menos en cierta medida, de la habilidad o el esfuerzo del

maestro en esa actividad específica. Considere, por ejemplo, las “interacciones entre

estudiantes”, que incluyen debates abiertos entre la clase. Tal vez esta actividad contribuya a

un mayor rendimiento en inglés pero no en matemáticas, como en la tabla 7, porque los

profesores de inglés son más hábiles (o se esfuerzan más en) “usar técnicas de preguntas y

debate”. Quizás los profesores de matemáticas asignan más tiempo de clase a la “práctica y

evaluación” porque son mejores en esas tareas.

Probamos este posible sesgo, al menos parcialmente, agregando calificaciones de efectividad

de la instrucción como controles y examinando si los coeficientes de las actividades de instrucción

cambian y cómo cambian. Como se discutió anteriormente, nuestra medida de la efectividad de la

instrucción es una combinación de habilidades y esfuerzo de enseñanza.

Compare las columnas 1 y 3 de la tabla 7. Para matemáticas, la estimación puntual para

"práctica y evaluación" se reduce aproximadamente un tercio a 0.047σ, pero sigue siendo significativa, y

no podemos rechazar el valor nulo de que no ha cambiado desde 0.068σ. La estimación puntual de

dieciséis
“instrucción directa” casi se duplica a 0.023σ. Esto sería consistente con que las clases sean más

productivas cuando el maestro es más hábil en matemáticas (ver, por ejemplo, Taylor 2018). Para el

inglés, al igual que para las matemáticas, la estimación del punto clave sobre la "interacción entre

estudiantes y compañeros" se reduce en aproximadamente una quinta parte, pero sigue siendo

significativa desde el punto de vista educativo. Los coeficientes negativos de “instrucción personalizada” y

“práctica y evaluación” aumentan en valor absoluto y se estiman con mayor precisión.

Estos resultados sugieren que, independientemente de las habilidades o el esfuerzo del maestro,

algunos enfoques de la instrucción en el aula tienen más éxito que otros para promover el aprendizaje de los

estudiantes. Los resultados también sugieren que la naturaleza de esa actividad más efectiva puede depender

de la materia que se enseña. Este resultado es quizás la contribución más novedosa de este artículo a la

literatura. Son raras las investigaciones que combinan tanto las medidas de las actividades de instrucción como

las medidas de las habilidades del maestro para predecir los puntajes de las pruebas de los estudiantes. Los más

cercanos, de los que tenemos conocimiento, son Aslam y Kingdon (2011) y Taylor (2018).

Una segunda amenaza potencial para la interpretación causal proviene de las variables omitidas a

nivel de estudiante, que surgen de cómo los estudiantes son asignados a los maestros. Sin embargo, la amenaza

de las características de los estudiantes que no se observan es probablemente mucho menor que la amenaza de

las características de los maestros que no se observan. Nuestras estimaciones controlan los puntajes de las

pruebas anteriores de los estudiantes, la distribución de los puntajes anteriores de los compañeros, los

antecedentes de los estudiantes y los efectos fijos de la escuela. Una limitación es que nuestros puntajes de

exámenes anteriores son el examen Key Stage 2 tomado cinco años antes de los exámenes GCSE, no el año

escolar inmediatamente anterior. Evidencia bien conocida, de Kane y Staiger (2008), Chetty, Friedman y Rockoff

(2014) y otros, sugiere que es plausible suponer que las asignaciones de estudiantes a maestros son ignorables,

en el sentido de inferencia causal, condicional en resultados de exámenes de años anteriores. . Está menos claro

cómo se degradan los beneficios de los controles de puntuación retrasados con retrasos más largos, aunque

un trabajo reciente en Angrist et al. (en prensa) sugiere razones para el optimismo.

Como enfoque alternativo, las columnas con números pares en la tabla 7 usan efectos fijos de

estudiantes. Las estimaciones puntuales son más pequeñas, se reducen a la mitad o dos veces.

17
tercios Aún así, se mantiene el mismo patrón: las matemáticas se benefician del tiempo de clase para la práctica y

evaluación individual, el inglés se beneficia de la interacción entre estudiantes y compañeros.

Las estimaciones de la variable dependiente rezagada y las estimaciones de los

efectos fijos de los estudiantes proporcionan límites sobre la influencia del sesgo de la

variable omitida a nivel de los estudiantes, como el rendimiento no observado del año

anterior. Correctamente purgado de cualquier sesgo que surja de la clasificación no aleatoria

de estudiantes a profesores, el coeficiente de “práctica y evaluación” para matemáticas estaría

entre 0,015σ y 0,047σ, por ejemplo. Las estimaciones de efectos fijos de los estudiantes serán

correctas, en el sentido específico de evitar cualquier sesgo de las características omitidas de

los estudiantes, solo si las asignaciones de estudiantes y maestros para matemáticas e inglés

se basan en la misma información. De lo contrario, las estimaciones de FE del estudiante

probablemente sean demasiado pequeñas. Las asignaciones de matemáticas e inglés se

realizan al mismo tiempo, por lo que la escuela dispone de la misma información para ambas

decisiones.13

3.3 Calificaciones de la eficacia de la enseñanza y puntajes de las pruebas de los estudiantes

Las calificaciones de efectividad de la enseñanza basadas en rúbricas también predicen los puntajes

de las pruebas GCSE de los estudiantes. En la columna 5 de la tabla 7, el coeficiente estimado de la puntuación

FFT es 0,077σ para matemáticas y 0,040σ para inglés. Imagine dos estudiantes: el primer estudiante está

asignado a un maestro del cuartil superior, según lo medido por la rúbrica FFT, y el segundo a un maestro del

cuartil inferior. El primer estudiante obtendrá una puntuación más de 0,10 σ más alta que el segundo estudiante

en los GCSE de matemáticas (o 0,05 σ en inglés).

Varios estudios previos también informan la correlación entre los puntajes FFT de los maestros y los puntajes

de las pruebas de los estudiantes. Nuestras estimaciones de las escuelas secundarias inglesas están en línea con las

estimaciones existentes. Estudiantes de maestros y estudiantes más jóvenes en los Estados Unidos

13Rothstein (2010) argumenta convincentemente en contra del uso de efectos fijos de estudiantes para estudiar a los
maestros de escuela primaria, el escenario más común en la literatura. El requisito de que las escuelas usen la misma
información se viola fácilmente cuando la estrategia de efectos fijos de los estudiantes usa observaciones durante varios
años para un estudiante determinado.

18
Unidos, pero utilizando datos y regresiones similares, los artículos anteriores informan coeficientes

en la puntuación FFT de 0.08-0.09σ (Kane et al. 2011) y 0.05-0.11σ (Kane et al. 2013). La última cita

es del gran proyecto Métodos de Enseñanza Efectiva (MET, por sus siglas en inglés), que incluía

medir la enseñanza usando otras rúbricas de observación además de FFT, y en general las otras

rúbricas también predijeron puntajes de prueba de manera similar (Kane y Staiger 2012). Un

estudio similar de maestros y niños de jardín de infantes en Ecuador encontró coeficientes de

0.05-0.07σ para la rúbrica CLASS (Araujo et al. 2016). Por el contrario, las calificaciones

(relativamente) subjetivas de los maestros por parte de los líderes escolares son menos predictivas

de las calificaciones de los estudiantes (Jacob y Lefgren 2008, Rockoff y Speroni 2010, Rockoff et al.

2012).

Nuestras estimaciones se distinguen de dos maneras, incluso si son similares en magnitud a las

estimaciones anteriores. Primero, los observadores pares tenían poca capacitación en comparación con

estudios anteriores. En estudios anteriores, los docentes fueron observados y calificados por

investigadores o administradores escolares que reciben una capacitación sustancial y, a menudo, se

someten a pruebas de confiabilidad antes de realizar las evaluaciones.14En segundo lugar, las

calificaciones de las rúbricas pueden depender de las actividades de instrucción utilizadas durante la

visita del observador. Por ejemplo, una calificación de las “técnicas de discusión y preguntas” de un

maestro puede ser más exacta o precisa si la clase dedica más tiempo a la discusión grupal. Podemos

controlar las actividades de instrucción. Compare las columnas 5 y 3 de la tabla 7. El coeficiente de las

calificaciones de efectividad es bastante similar, ya sea que controlemos o no la combinación de

actividades durante la clase observada.

3.4 Resultados adicionales

El Apéndice C analiza varios resultados adicionales que resumimos brevemente aquí.

Primero, como prueba de robustez, utilizamos el análisis de componentes principales para

reducir la dimensionalidad de los datos de la actividad educativa. Luego repita el

14A veces, los evaluadores se conocen como "evaluadores de pares", pero "compañeros" se refiere al hecho de que el evaluador
había sido (recientemente) un maestro de clase. El rol de evaluador es un trabajo especializado distinto con una capacitación
sustancial.

19
análisis en la tabla 7, reemplazando los cuatro grupos de actividades con cinco puntajes de

componentes principales. Los resultados muestran los mismos patrones sustantivos que la tabla 7;

los patrones sustantivos no son un artefacto de cómo combinamos los datos de actividad. Por

ejemplo, en inglés, el cuarto componente principal es el predictor sobresaliente. Este componente,

que denominamos “trabajo en grupo versus trabajo individual”, aumenta en actividades en las que

los estudiantes interactúan con sus compañeros de clase y disminuye en actividades en las que los

estudiantes trabajan solos o uno a uno con el maestro.

En segundo lugar, el grado en que las calificaciones de la eficacia de la instrucción predicen el

crecimiento de los logros de los estudiantes depende de los resultados de los estudiantes.previologro.

Como se muestra en la tabla A4 del apéndice, la correlación—entre los puntajes de GCSE de los

estudiantes y las calificaciones de efectividad de los maestros—se reduce a medida que aumentan los

puntajes de las pruebas anteriores del estudiante. Este resultado de heterogeneidad apunta a una

literatura estrechamente relacionada: qué prácticas docentes mejoran mejor el rendimiento de los

estudiantes bien pueden depender de las características de los estudiantes en el aula (Lazear 2001,

Lazear 2006, Duflo, Dupas y Kremer 2011, Aucejo et al. 2020 , Graham et al. 2021). Sin embargo, en

contraste con las calificaciones de efectividad, la correlación entre las actividades de instrucción y los

puntajes de GCSE no cambia con el rendimiento previo de los estudiantes. Por ejemplo, en las clases de

inglés, la interacción entre estudiantes y compañeros no es más o menos efectiva para los estudiantes

con un rendimiento previo más bajo.

4. Conclusión

Este artículo describe varios resultados que contribuyen a responder la pregunta en curso: ¿Qué

implica realmente la enseñanza efectiva? ¿O qué prácticas de enseñanza son importantes para el

rendimiento de los estudiantes? Estudiamos las prácticas docentes y los logros de los estudiantes en las

escuelas secundarias públicas (estatales) de Inglaterra.

Nuestro enfoque principal son las elecciones de los maestros sobre cómo distribuir el

tiempo de clase en diferentes actividades educativas. Los observadores del aula registraron cuánto

tiempo de clase se dedicaba a diferentes actividades de instrucción, por ejemplo, "abrir

20
discusión entre niños y maestra” y “uso de pizarra por parte de la maestra”. Los

observadores simplemente registraron qué actividades estaban sucediendo sin juzgar la

idoneidad o la calidad de la actividad.

En resumen, encontramos que las elecciones de actividades educativas de los maestros predicen

puntajes posteriores de rendimiento de sus estudiantes. En las clases de matemáticas, por ejemplo, los

estudiantes obtienen puntajes más altos con maestros que dan más tiempo para la práctica individual. En la

clase de matemáticas típica (promedio), el maestro asigna "parte del tiempo" a la evaluación y la práctica. En una

clase en la que el profesor dedica "la mayor parte del tiempo" a la práctica y la evaluación, las puntuaciones del

GCSE son 0,08σ más altas que las de la clase típica (σ = desviaciones estándar de la puntuación de la prueba del

alumno). Para los exámenes de inglés, por el contrario, más tiempo trabajando con compañeros de clase predice

puntajes más altos.

Los educadores e investigadores bien podrían ser escépticos de que el simple uso del tiempo prediga

las puntuaciones de los estudiantes, ya que es probable que los maestros varíen en la eficacia con la que llevan a

cabo diferentes actividades. Nuestros datos, tanto con el uso del tiempo como con las medidas de efectividad,

brindan una rara oportunidad de probar la hipótesis de ese escéptico. Cuando controlamos las calificaciones de

eficacia de la instrucción, el uso del tiempo de clase aún predice el rendimiento de los estudiantes. La

implicación práctica es que los estudiantes probablemente ganarían (o perderían) con los cambios en las

actividades de instrucción, incluso si las habilidades del maestro no cambiaran.

También encontramos que las calificaciones basadas en rúbricas de la eficacia de la instrucción

también predicen el rendimiento de los estudiantes. Un estudiante asignado a un maestro del cuartil superior,

medido por índices de eficacia, obtendrá una puntuación de aproximadamente 0,08σ más alta que un estudiante

similar asignado a un maestro del cuartil inferior. Las observaciones en el aula y las rúbricas no son nuevas para

las escuelas ni para los investigadores en educación. Aún así, nuestros datos son novedosos en algunos

aspectos. Lo más notable es que nuestros datos de observación fueron recopilados por compañeros maestros,

el observador y el observado eran compañeros de trabajo en la misma escuela, y los observadores recibieron

poca capacitación, mucha menos capacitación de la que a menudo se describe como necesaria para

observaciones "válidas" o "confiables". Al final, encontramos que las calificaciones de los pares sobre la eficacia

de la instrucción predicen al menos tan bien como se ha documentado en otros estudios. Par

21
la observación puede ser un enfoque factible y efectivo para aprender sobre las diferencias en la

enseñanza, incluso con poca capacitación adicional para los observadores.

Una forma de pensar en la magnitud de nuestras estimaciones es preguntarse qué significaría una

mejora de 0,08σ en las puntuaciones de GCSE para el futuro de un estudiante. De hecho, los puntajes de GCSE

son quizás más relevantes para el futuro de los estudiantes, en comparación con las pruebas a edades más

tempranas, porque los GCSE llegan al final de la educación obligatoria y también informan sobre las admisiones

a la universidad. En un nuevo análisis, Hodge, Little y Weldon (2021) estiman que un aumento de una desviación

estándar, 1σ, en los puntajes promedio de GCSE predice un aumento de alrededor del 20 por ciento en las

ganancias de por vida (VPN a los 16 años). Por lo tanto, a partir de 0,08σ, predeciríamos un aumento del 1,6 % en

los ingresos de por vida, o alrededor de 7500 libras esterlinas en valor actual a los 16 años.

22
Referencias

Angrist, J., Hull, P., Pathak, PA y Walters, C. (en prensa). “Valor escolar creíble-
agregado con loterías escolares suscritas”.Revista de Economía y
Estadística.
Aucejo, Esteban, Patrick Coate, Jane Cooley Fruehwirth, Sean Kelly y Zachary
Mozenter. (2020). "Efectos de coincidencia en el mercado laboral docente:
eficacia docente y composición del aula". Hoja de trabajo.
Aucejo, Esteban M., and Teresa Foy Romano. (2016). “Evaluar el efecto de
días de escuela y ausencias en el rendimiento de la puntuación de la prueba”,Revista de economía de la
educación 55, 70-87.

Araujo, M. Caridad, Pedro Carneiro, Yyannú Cruz-Aguayo and Norbert Schady.


(2016). “Calidad de los maestros y resultados de aprendizaje en el jardín de infantes”.
Revista trimestral de economía, 131(3), 1415-1453.

Aslam, Monazza y Geeta Kingdon. (2011). “¿Qué pueden hacer los maestros para educar a los alumnos?
¿logro?"Revista de Economía de la Educación, 30(3), 559-574
Bacher-Hicks, Andrew, Mark J. Chin, Thomas J. Kane y Douglas O. Staiger.
(2019). “Una evaluación experimental de tres medidas de calidad docente: valor
agregado, observaciones en el aula y encuestas de estudiantes”.Revista de Economía de
la Educación, 73, 101919.

Ballatore, Rosario María, and Paolo Sestito. (2016). “Tratar con el estudiante
heterogeneidad: estrategias de implementación del currículo y rendimiento estudiantil”. Banco
de Italia Temi di Discussione (Documento de trabajo) No. 1081.

Bloom, Nicholas y John Van Reenen. (2007). “Medir y explicar


Prácticas de gestión entre empresas y países”.Revista trimestral de
economía, 122(4), 1351–1408.
Bloom, Nicholas, Benn Eifert, Aprajit Mahajan, David McKenzie y John
Roberts. (2013). “¿Importa la gestión? Evidencia de la India”.Revista
trimestral de economía, 128(1), 1–51.
Bloom, Nicholas, Renata Lemos, Raffaella Sadun y John Van Reenen. (2015).
“¿Importa la gestión en las escuelas?”Diario Económico, 125(584), 647-674.
Burgess, Simon, Shenila Rawal y Eric S. Taylor. (2021). “Maestro compañero
Observación y puntajes de las pruebas de los estudiantes: evidencia de un experimento de
campo en las escuelas secundarias de inglés”.Revista de Economía Laboral, 39(4), 1155-1186.

23
Campbell, Shanyce L. y Matthew Ronfeldt. (2018). “Evaluación observacional
de maestros: ¿Midiendo más de lo que esperábamos?”Revista de investigación educativa
estadounidense, 55(6), 1233–1267.

Chetty, Raj, John N. Friedman y Jonah E. Rockoff. (2014). “Medición de la


impactos de los docentes I: valor agregado de los docentes y resultados de los estudiantes en
la edad adulta”.Revista Económica Estadounidense, 104(9), 2593-2632.

Danielson, Charlotte. (2007).Mejorar la práctica profesional: un marco para


enseñando. Asociación para la Supervisión y Desarrollo Curricular,
Alejandría, VA.
Duflo, Esther, Pascaline Dupas y Michael Kremer. (2011). “Efectos de pares, maestro
incentivos y el impacto del seguimiento: Evidencia de una evaluación aleatoria en
Kenia”.Revista Económica Estadounidense, 101(5), 1739-1774.

Fitzpatrick, Maria D., David Grissmer y Sarah Hastedt. (2011). "Qué


la diferencia que hace un día: estimar las ganancias de aprendizaje diarias durante el jardín de
infantes y el primer grado usando un experimento natural”.Revista de economía de la educación 30,
269-279.

Gitomer, Drew, Courtney Bell, Yi Qi, Daniel McCaffrey, Bridget K. Hamre y


Roberto C. Pianta. (2014). “El desafío educativo para mejorar la calidad de la
enseñanza: lecciones de un protocolo de observación en el aula”.Registro del Colegio
de Maestros, 116(6), 1–20.
Graham, Bryan S., Geert Ridder, Petra Thiemann y Gema Zamarro. (2021).
“Asignación de maestro a salón de clases y rendimiento de los estudiantes”. Hoja de trabajo.

Hanushek, Eric A. y Steven G. Rivkin. (2010). “Generalizaciones sobre el uso


medidas de valor agregado de la calidad del maestro”.Revista Económica Estadounidense, 100
(2), 267-271.
Hayward, Hugh, Emily Hunt y Anthony Lord. (2014).El valor económico de
calificaciones intermedias clave: estimación de los rendimientos y ganancias de
productividad de por vida para GCSE, niveles A y aprendizajes.Departamento de
Educación Informe DFE-RR398A.Londres: Departamento de Educación.

Ho, Andrew D. y Thomas J. Kane. (2013).La confiabilidad del aula


Observaciones del Personal Escolar.Seattle, WA: Fundación Bill y Melinda
Gates.
Hodge, Louis, Allan Little y Matthew Weldon. (2021).Logro de GCSE y
ganancias de por vida.Informe de Investigación del Departamento de Educación.

24
ICPSR. (Dakota del Norte). “Medidas de Enseñanza Efectiva: 3c - Datos Base: Nivel de ítem
Puntuaciones observacionales, 2009-2011 Descripción de variables y frecuencias”.
ICPSR 34346.

Jackson, C. Kirabo, Jonah E. Rockoff y Douglas O. Staiger. (2014). "Maestro


efectos y políticas docentes”.Revista Anual de Economía, 6(1), 801-825.

Jacob, Brian A. y Lars Lefgren. (2008). “¿Pueden los directores identificar


maestros? Evidencia sobre evaluación subjetiva del desempeño en educación”.
Revista de Economía Laboral, 26(1), 101-136.
Kane, Thomas J., Daniel F. McCaffrey, Trey Miller y Douglas O. Staiger.
(2013).¿Hemos identificado maestros efectivos? Validación de medidas de
enseñanza efectiva mediante asignación aleatoria.Seattle, WA: Fundación Bill y
Melinda Gates.
Kane, Thomas J. y Douglas O. Staiger. (2008). “Estimar los impactos de los maestros en
rendimiento estudiantil: una evaluación experimental”. Documento de trabajo NBER núm.
14607.

Kane, Thomas J. y Douglas O. Staiger. (2012).Recopilación de comentarios para


Enseñanza: combinación de observaciones de alta calidad con encuestas de estudiantes y
ganancias de rendimiento.Seattle, WA: Fundación Bill y Melinda Gates.

Kane, Thomas J., Eric S. Taylor, John H. Tyler y Amy L. Wooten. (2011).
"Identificación de prácticas efectivas en el aula utilizando datos de rendimiento de los
estudiantes".Revista de Recursos Humanos, 46(3), 587-613.

Kingdon, Geeta, Rukmini Banerji R y PK Chaudhary. (2008).EscuelaTELLS


Encuesta de escuelas primarias rurales en Bihar y Uttar Pradesh, 2007–08.Londres:
Instituto de Educación, Universidad de Londres.

Kraft, MA y Gilmour, AF (2017). “Revisando el efecto del widget: Profesor


las reformas de evaluación y la distribución de la eficacia docente”.Investigador
Educativo, 46(5), 234-249.
Lazear, Edward P. (2001). “Producción educativa”.Revista trimestral de
Economía, 116(3), 777-803.
Lazear, Edward P. (2006). “Exceso de velocidad, terrorismo y enseñanza para la prueba”.
Revista trimestral de economía, 121(3), 1029-1061.
MacIntosh, Steven. (2006). “Análisis adicional de los retornos a la educación y
cualificaciones vocacionales."Boletín de Oxford de Economía y Estadística, 68(2),
225-251.

25
Prendergast, C. (1999). “La provisión de incentivos en las empresas”.Diario de Economía
literatura, 37(1), 7-63.
Rockoff, Jonah E. y Cecilia Speroni. (2010). "Subjetivo y objetivo
evaluaciones de la eficacia docente”.Revista Económica Estadounidense, 100(2),
261-266.

Rockoff, Jonah E., Douglas O. Staiger, Thomas J. Kane y Eric S. Taylor. (2012).
“Información y evaluación de empleados: evidencia de una intervención
aleatoria en escuelas públicas”.Revista Económica Estadounidense, 102(7),
3184-3213.

Rothstein, J. (2010). “Calidad docente en la producción educativa: seguimiento, decadencia,


y rendimiento estudiantil”.Revista trimestral de economía, 125(1), 175-214.

Sims, David P. (2008). “Respuestas estratégicas a las medidas de responsabilidad escolar: es


todo en el tiempo.”Revista de Economía de la Educación, 27, 58-68.

Slater, Helen, Neil M. Davies y Simon Burgess. (2012). “¿Importan los maestros?
Midiendo la variación en la efectividad de los maestros en Inglaterra”.Boletín de
Oxford de Economía y Estadística, 74(5), 629-645.

Syverson, Chad. (2011). “¿Qué determina la productividad?”Diario de Economía


literatura, 49(2), 326-265.
Taylor, Eric S. (2018). “Habilidades, tareas laborales y productividad en la docencia: Evidencia
de un ensayo aleatorio de prácticas de instrucción”.Revista de Economía Laboral, 36(
3), 711-742.

Taylor, Eric S. y John H. Tyler. (2012). “El efecto de la evaluación en el maestro


actuación."Revista Económica Estadounidense, 102(7), 3628-3651.

Weisberg, D., Sexton, S., Mulhern, J., Keeling, D., Schunck, J., Palcisco, A. y
Morgan, K. (2009).El efecto widget: Nuestro fracaso nacional para reconocer y actuar
sobre las diferencias en la efectividad de los docentes.Nueva York; El Proyecto Nuevo
Maestro.

26
Medir la comprensión de los estudiantes 24 28 48

Debate abierto entre alumnos y profesor. 25 38 38

Uso de pizarra blanca por parte del profesor. 32 36 32

Los estudiantes están haciendo el trabajo escrito solos. 38 36 26

Los estudiantes están trabajando en grupos. 54 26 19

Pasar tiempo especial para ayudar a los estudiantes débiles. 38 44 18

Lectura o dictado 52 35 13

Asignar tareas o trabajos de clase a los estudiantes 69 20 11

Enseñanza uno a uno 52 38 10

Estudiantes copiando de la pizarra 68 27 5

Profesor usando un libro de texto durante las actividades de enseñanza 88 7 5

Se dedica a labores no docentes 88 8 4

0 20 40 60 80 100
Porcentaje de clases

Nada o muy poco Algo de tiempo La mayoría o todo el tiempo

Figura 1—Frecuencia de las actividades de instrucción

Nota: Para cada actividad, la barra roja (izquierda) es la proporción de clases donde hubo “ninguna” o “muy poca” actividad. La barra azul
(derecha) es la proporción de clases en las que la actividad estaba ocurriendo "la mayor parte del tiempo" o "a tiempo completo". La barra
blanca (del medio) es "algunas veces". Las proporciones son de 2.687 observaciones, cada una de las cuales es la visita de un compañero
observador.  a la clase del maestro  .

27
(A) Puntuaciones a nivel de ítem

(B) Promedio de las puntuaciones de los ítems

Figura 2—Distribución de las calificaciones de efectividad de la instrucción

Nota: El panel A muestra un histograma de las 23 047 puntuaciones a nivel de ítem registradas en los diez ítems de la rúbrica. El panel B muestra un
histograma de 2687 puntajes promedio. Cada una de las 2687 observaciones es la visita de un compañero observador  a la clase del maestro  .El eje x es
el promedio simple de las puntuaciones de los diez ítems para una visita de observación dada, ignorando las puntuaciones de los ítems faltantes.

28
Tabla 1—Actividades de instrucción

Actividades utilizadas por los observadores Grupo de actividades

1. Debate abierto entre alumnos y profesor Interacción entre estudiantes y compañeros

2. Los estudiantes están trabajando en grupos.

3. Enseñanza uno a uno Instrucción personalizada

4. Pasar tiempo especial para ayudar a los estudiantes débiles

5. Los estudiantes están haciendo trabajos escritos solos Práctica y evaluación

6. Medir la comprensión de los estudiantes (p. ej., a través de


una evaluación escrita u oral)

7. Asignar tareas o trabajos de clase a los estudiantes

8. Lectura o dictado (transacción unidireccional, el Instrucción directa


maestro hablaba y los estudiantes escuchaban)

9. Estudiantes copiando de la pizarra

10. Uso de la pizarra por parte del docente

11. El maestro estaba usando un libro de texto durante las


actividades de enseñanza (uso de ejemplos del texto,
tomando referencias del texto, leyendo las líneas del capítulo)

12. Dedicado a trabajos no docentes (mantenimiento de


registro, preparación de datos, preparación de
formatos, etc.)

Nota: Lista de actividades adaptada del proyecto SchoolTELLS (Kingdon, Banerji y Chaudhary 2008). La agrupación de
actividades en la columna de la derecha se describe en el texto.

29
Tabla 2—Estándares de la rúbrica y descripción asociada de “Efectivo”

Dominio 1. Entorno del aula

1.a Las interacciones en el aula, tanto entre el maestro y los estudiantes


Creando un Ambiente como entre los estudiantes, son educadas y respetuosas, reflejan
de Respeto y Relación calidez y cariño en general, y son apropiadas para las diferencias
culturales y de desarrollo entre los grupos de estudiantes.

1.b La cultura del salón de clases se caracteriza por altas expectativas para la
Establecer una cultura para el mayoría de los estudiantes y un compromiso genuino con la materia tanto
aprendizaje por parte del maestro como de los estudiantes, con el maestro
demostrando entusiasmo por el contenido y los estudiantes demostrando
orgullo por su trabajo.

1.c Se pierde poco tiempo de enseñanza debido a las rutinas del salón de clases
Gestión del aula y los procedimientos para las transiciones, el manejo de los útiles y el
Procedimientos desempeño de las tareas no docentes, que ocurren sin problemas. El
trabajo en grupo está bien organizado y la mayoría de los estudiantes se
involucran productivamente mientras trabajan sin supervisión.

1.d Los estándares de conducta parecen ser claros para los estudiantes, y el
Estudiante administrador maestro monitorea el comportamiento del estudiante contra esos
Comportamiento estándares. La respuesta del maestro al mal comportamiento de los
estudiantes es consistente, proporcionada, apropiada y respeta la dignidad
de los estudiantes.

1.e El salón de clases es seguro y el aprendizaje es accesible para todos


Organización Física los estudiantes; el profesor se asegura de que la disposición física
Espacio sea adecuada para las actividades de aprendizaje. El docente hace un
uso eficaz de los recursos físicos, incluida la tecnología informática.

30
Tabla 2 (cont.)—Estándares de la rúbrica y descripción asociada de “Efectivo”

Dominio 2. Instrucción

2a Las expectativas de aprendizaje, las instrucciones y los procedimientos, y las


comunicarse con explicaciones del contenido son claras para los estudiantes.
Estudiantes Las comunicaciones son precisas y apropiadas para las culturas y los
niveles de desarrollo de los estudiantes. La explicación del contenido por
parte del maestro es estructurada, clara y precisa y se conecta con el
conocimiento y la experiencia de los estudiantes. Durante la explicación
del contenido, el maestro se enfoca, según corresponda, en las
estrategias que los estudiantes pueden usar cuando trabajan de forma
independiente e invita a la participación intelectual de los estudiantes.

2b La mayoría de las preguntas del maestro provocan una


Uso de preguntas y respuesta reflexiva, y el maestro da suficiente tiempo para que
Técnicas de discusión los estudiantes respondan. Todos los estudiantes participan en
la discusión, y el maestro se hace a un lado cuando
corresponde.

2c Las actividades y asignaciones, los materiales y las agrupaciones de


Involucrar a los estudiantes en estudiantes son completamente apropiados para los resultados de
Aprendiendo aprendizaje y las culturas y niveles de comprensión de los estudiantes.
Todos los estudiantes están comprometidos en un trabajo de alto nivel de
rigor. La estructura de la lección es coherente, con un ritmo adecuado.

2d La evaluación se usa regularmente en la enseñanza, a través de la autoevaluación


Uso de la evaluación o la evaluación por parte de los estudiantes, el seguimiento del progreso del
aprendizaje por parte del maestro y/o los estudiantes, y la retroalimentación de
alta calidad para los estudiantes. Los estudiantes son plenamente conscientes de
los criterios de evaluación utilizados para evaluar su trabajo y lo hacen con
frecuencia.

2e El maestro promueve el aprendizaje exitoso de todos los estudiantes,


Demostrar flexibilidad y haciendo los ajustes necesarios a los planes de lecciones y
capacidad de respuesta acomodando las preguntas, necesidades e intereses de los
estudiantes.

Nota: Adaptado deMarco para la enseñanza(Danielson 2007).

31
Tabla 3—Características descriptivas

Escuelas
con cualquier

Experimento observado Observado


escuelas maestro Profesores
(1) (2) (3)

Puntaje previo de inglés 0.006 0.009 0.039


(1.00) (1.00) (0.98)
Puntuación previa en matemáticas 0.007 0.008 0.058
(1.00) (1.00) (0.97)
Femenino 0.487 0.488 0.480
IDACI 0.276 0.279 0.314
(0.17) (0.17) (0.18)
Alguna vez comidas escolares gratuitas 0.398 0.402 0.426
Mes de nacimiento (1-12) 6.569 6.579 6.581
(3.42) (3.42) (3.39)
escuela de londres 0.162 0.164 0.180

Nota: Medias y desviaciones estándar (entre paréntesis) para las muestras descritas por los encabezados de las columnas.

32
Tabla 4—Correlaciones entre actividades de instrucción

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)
1. Debate abierto entre alumnos y profesor 1
2. Los estudiantes están trabajando en grupos. 0.19 1
3. Enseñanza uno a uno 0.01 0.11 1
4. Pasar tiempo especial para ayudar a los estudiantes débiles 0.08 0.14 0.39 1
5. Los estudiantes están haciendo trabajos escritos solos - 0.09 - 0,12 0,17 0,14 1
6. Medir la comprensión de los estudiantes 0.24 0.17 0.09 0.17 0.22 1
7. Asignar tareas o trabajos de clase a los estudiantes 0.08 0.14 0.09 0.14 0.20 0.23 1
8. Lectura o dictado - 0.09 - 0.11 - 0,04 -0,08 0,04 -0,02 0,12 1
9. Estudiantes copiando de la pizarra 0.00 - 0.06 - 0,01 0,01 0,07 0,03 0,12 0,31 1
10. Uso de la pizarra por parte del docente 0.05 - 0.08 - 0,03 0,00 0,00 0,13 0,09 0,29 0,33 1
11. Uso de un libro de texto durante las actividades de enseñanza - 0,04 0,04 0,07 0,05 0,10 0,04 0,15 0,10 0,19 0,04 0,00 0,07 0,08 0,05 1
12. Comprometidos en trabajos no docentes 0,20 0,08 0,26 0,07 0,13 0,05 0.20

Nota: Correlaciones del uso del tiempo de clase entre doce actividades de instrucción, netas de los efectos del observador. Cada una de las 2687 observaciones es la visita de un compañero
observador   a la clase del maestro  .Los observadores registraron el uso del tiempo en cinco categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4)
tiempo completo. Antes de estimar las correlaciones, primero calculamos observador  's media para cada elemento y restar esa media de todos los puntajes  asignado para ese artículo.

33
Tabla 5—Actividades de instrucción

Matriz de correlación Media (desviación estándar)

agrupados agrupados Matemáticas Inglés


(1) (2) (3) (4) (5) (6) (7)

Instrucción directa 1 1.23 1.36 1.06


(0.71) (0.72) (0.66)
Interacción entre estudiantes y compañeros 0.17 1 1.68 1.71 1.66
(0.93) (0.91) (0.94)
Instrucción personalizada 0.21 0.31 1 1.44 1.52 1.34
(0.92) (0.91) (0.92)
Práctica y evaluación 0.37 0.28 0.35 1 1.58 1.73 1.38
(0.91) (0.86) (0.95)

Nota: Medias y desviaciones estándar (columnas 5-7) para, y correlaciones entre (columnas 1-4), uso del tiempo de clase en cuatro grupos de
actividades de instrucción, descritos por etiquetas de fila. Esta tabla utiliza una muestra de 2687 observaciones. Cada una de las 2687
observaciones es la visita de un compañero observador  a la clase del maestro  .Cada una de las cuatro medidas (filas) es en sí misma el
promedio de varios puntajes de nivel de elemento registrados por observadores pares, como se describe en el texto. El uso del tiempo se mide
en categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4) tiempo completo.

34
Tabla 6—Clasificaciones de eficacia de la instrucción

agrupados Matemáticas Inglés


(1) (2) (3)

Media general 9.09 9.15 9.00


(1,75) (1,80) (1,69)

Ambiente de clase promedio 9.27 9.35 9.17


(1,84) (1,88) (1,78)
1a. Crear un ambiente de respeto y compenetración 9.32 9.35 9.28
(2,04) (2,09) (1,97)
1b. Establecer una cultura para el aprendizaje. 9,20 9,25 9,13
(2,01) (2,04) (1,96)
1c. Gestionar los procedimientos del aula. 9.24 9.31 9.14
(2.04) (2.06) (2.01)
1d. Manejar el comportamiento de los estudiantes 9.41 9.42 9.41
(2,05) (2,12) (1,96)
1e. Organización del espacio físico. 9.13 9.29 8.87
(2.18) (2.14) (2.23)

Promedio de instrucción 8.90 8.94 8.86


(1,83) (1,87) (1,77)
2a. Comunicarse con los estudiantes 9.29 9.31 9.25
(1,91) (1,95) (1,85)
2b. Uso de técnicas de preguntas y debate. 8.77 8.80 8.72
(2.17) (2.16) (2.18)
2c. Involucrar a los estudiantes en el aprendizaje 8.99 9.03 8.93
(2.00) (2.09) (1.86)
2d. Uso de la evaluación 8.50 8.53 8.46
(2.21) (2.19) (2.23)
2e. Demostrando flexibilidad y capacidad de respuesta. 8,83 8,78 8,90
(2.05) (2.08) (2.01)

Nota: Medias y desviaciones estándar (entre paréntesis), usando una muestra de 2687 observaciones en la columna 1. Cada una de las 2687
observaciones es la visita de un observador par  a la clase del maestro  .Las muestras de las columnas 2 y 3 son 1.510 y 1.177 respectivamente.
Para cada uno de los diez elementos enumerados anteriormente, los observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3
ineficaz, 4 a 6 básico, 7 a 9 eficaz y 10 a 12 muy eficaz. Los tres puntajes promedio anteriores son la media de los puntajes de nivel de elemento
relevantes, ignorando los puntajes faltantes.

35
Tabla 7—Actividades educativas y puntajes de rendimiento estudiantil

(1) (2) (3) (4) (5) (6)


(A) Matemáticas

Actividades de instrucción
Instrucción directa 0.012 0.006 0.023 0.009
(0.016) (0.007) (0.015) (0.007)
Interacción entre estudiantes y compañeros 0.020 0.007 0.002 0.001
(0.013) (0.006) (0.014) (0.008)
Instrucción personalizada 0.004 0.003 0.003 0.003
(0.019) (0.008) (0.019) (0.008)
Práctica y evaluación 0,068** 0.023** 0.047* 0.015+
(0.019) (0.008) (0.019) (0.008)

Eficacia educativa 0.070** 0.024* 0.077** 0.026**


(0.018) (0.010) (0.017) (0.010)

(B) Inglés
Actividades de instrucción
Instrucción directa - 0.018 - 0.024+ - 0.009 - 0.019
(0.020) (0.013) (0.019) (0.012)
Interacción entre estudiantes y compañeros 0.053** 0.028** 0.043** 0.024**
(0.016) (0.009) (0.016) (0.009)
Instrucción personalizada - 0.021 - 0.011 - 0.026+ - 0.014
(0.013) (0.009) (0.014) (0.009)
Práctica y evaluación - 0.024 - 0.015 - 0.030+ - 0.021+
(0.016) (0.011) (0.017) (0.012)

Eficacia educativa 0.039+ 0.027* 0.040* 0.026*


(0.021) (0.011) (0.019) (0.010)

Estudiante covariables √ √ √
Estudiante efectos fijos √ √ √

Nota: Estimaciones puntuales y conglomerados (profesor  )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una
con la misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Cada columna
informa estimaciones de una sola regresión. La variable dependiente es un puntaje de prueba para el estudiante  en tema   (matemáticas o
inglés) medido en unidades de desviación estándar del estudiante. Las variables independientes clave, las filas en la tabla, son puntajes de
observación para el estudiante.  'profesor  en tema  ,dónde   =   (    ).Los puntajes de los maestros se miden en unidades de desviación estándar
del maestro. Maestro  'Las puntuaciones no varían entre los estudiantes, pero sí entre los observadores.  quien determinaba las puntuaciones.
Los datos utilizados para ajustar cada regresión son estudiantes  por profesor   (sujeto equivalente  )por observador  ,pero cada uno    el par se
pondera por igual, es decir, se pondera1/    dónde    es el número de observadores  Quien anoto
maestro  .Todas las especificaciones incluyen observador  efectos fijos y variables indicadoras por sujeto. Las “covariables del estudiante” incluyen
controles para el estudiante  's puntajes de exámenes anteriores en ambas materias, género, elegibilidad para comidas escolares gratuitas, puntaje
IDCACI, mes de nacimiento, año de examen y escuelas en Londres. Todas las especificaciones incluyen controles para la media de la clase y la desviación
estándar de las puntuaciones anteriores en ambas materias. Cuando falta una covariable, la completamos con cero e incluimos un indicador = 1 para
falta en la característica dada.
+ indica p<0,10, * 0,05 y ** 0,01

36
Apéndice A: Figuras y tablas adicionales

(A) Matemáticas

Medir la comprensión de los estudiantes 17 30 53

Uso de pizarra blanca por parte del profesor. 25 37 39

Debate abierto entre alumnos y profesor. 24 41 35

Los estudiantes están haciendo el trabajo escrito solos. 33 37 30

Pasar tiempo especial para ayudar a los estudiantes débiles. 35 45 20

Los estudiantes están trabajando en grupos. 53 27 20

Lectura o dictado 50 36 15

Asignar tareas o trabajos de clase a los estudiantes sesenta y cinco 21 14

Enseñanza uno a uno 49 41 11

Estudiantes copiando de la pizarra 62 31 7

Profesor usando un libro de texto durante las actividades de enseñanza 86 9 5

Se dedica a labores no docentes 87 9 4

0 20 40 60 80 100
Porcentaje de clases de matemáticas

Nada o muy poco Algo de tiempo La mayoría o todo el tiempo

(B) Inglés

Medir la comprensión de los estudiantes 33 24 43

Debate abierto entre alumnos y profesor. 26 33 41

Uso de pizarra blanca por parte del profesor. 41 36 24

Los estudiantes están haciendo el trabajo escrito solos. 44 35 21

Los estudiantes están trabajando en grupos. 56 26 18

Pasar tiempo especial para ayudar a los estudiantes débiles. 43 42 15

Lectura o dictado 56 33 11

Enseñanza uno a uno 56 34 10

Asignar tareas o trabajos de clase a los estudiantes 75 18 7

Se dedica a labores no docentes 89 6 5

Profesor usando un libro de texto durante las actividades de enseñanza 91 6 4

Estudiantes copiando de la pizarra 76 22 2

0 20 40 60 80 100
Porcentaje de clases de inglés

Nada o muy poco Algo de tiempo La mayoría o todo el tiempo

Figura A1 del apéndice—Frecuencia de las actividades de instrucción, por tema

Nota: Para cada actividad, la barra roja (izquierda) es la proporción de clases donde hubo “ninguna” o “muy poca” actividad. La barra azul
(derecha) es la proporción de clases en las que la actividad estaba ocurriendo "la mayor parte del tiempo" o "a tiempo completo". La barra gris
(del medio) es "algunas veces". El panel A es para clases de matemáticas, y las proporciones son de 1510 observaciones, cada una de las cuales
es la visita de un compañero observador k a la clase de un profesor de matemáticas j. El panel B es para las clases de inglés y se basa en 1177
observaciones.

37
Apéndice figura A2—Distribución de calificaciones de efectividad de instrucción,
puntajes a nivel de ítem, escala de 4 puntos

Nota: Histograma de las 23 047 puntuaciones a nivel de elemento registradas en los diez elementos de la rúbrica. Esta figura muestra los mismos datos a
nivel de ítem que el panel A de la figura 2, excepto que la escala de puntajes de 12 puntos se ha reducido a una escala de 4 puntos: los puntajes 1-3 en el
panel A se convierten en puntajes de 1 en el panel B, 4-6 se convierten en 2, 7-9 se convierten en 3 y 10-12 se convierten en 4.

38
Tabla A1 del apéndice: correlaciones entre las calificaciones de eficacia de la instrucción

(1a) (1b) (1c) (1d) (1e) (2a) (2b) (2c) (2d) (2e)
1a. Crear un ambiente de respeto y compenetración 1
1b. Establecer una cultura para el aprendizaje 0.86 1
1c. Manejar los procedimientos del salón de clases 0.79 0.81 1
1d. Manejar el comportamiento de los estudiantes 0.79 0.80 0.82 1
1e. Organización del espacio físico 2a. 0.68 0.68 0.69 0.67 0.74 0.76 1 0.72 0.71 0.65 0.65 0.67
Comunicarse con los estudiantes 0.63 0.61 0.55 0.75 0.73 0.77 0.71 1 0.72 0.61 0.79 0.76
2b. Usar técnicas de cuestionamiento y discusión 2c. 0.62 0.65 0.63 0.59 0.58 0.66 0.68 0.72 0.70 1 0.71 0.66
Involucrar a los estudiantes en el aprendizaje 0.66 0.62 0.62 1
2d. Uso de la evaluación 1
2e. Demostrando flexibilidad y capacidad de respuesta. 1

Nota: Correlaciones de las calificaciones de eficacia de la instrucción basadas en rúbricas entre diez tareas, utilizando una muestra de 2687 observaciones. Cada una de las 2687 observaciones es la
visita de un observador par  a la clase del maestro  .Los observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3 ineficaz, 4 a 6 básica, 7 a 9 eficaz y 10 a 12 muy eficaz.

39
Tabla A2 del apéndice—Componentes principales de las calificaciones de la eficacia de la instrucción

Neto de observador
unidades originales efectos fijos
Componente Componente
1 2 1 2
(1) (2) (3) (4)
Peso en componente
1a. Crear un ambiente de respeto y compenetración 1b. 0.33 - 0,27 0.33 - 0,28
Establecer una cultura para el aprendizaje. 0.33 - 0,23 0.34 - 0,25
1c. Manejar los procedimientos del salón de clases 0.32 - 0,34 0.32 - 0,37
1d. Manejar el comportamiento de los estudiantes 0.32 - 0,37 0.32 - 0,38
1e. Organización del espacio físico 2a. Comunicarse 0.29 - 0,30 0.27 - 0,20
con los estudiantes 0.33 0.16 0.33 0.18
2b. Usar técnicas de cuestionamiento y discusión 2c. 0.30 0.44 0.30 0.44
Involucrar a los estudiantes en el aprendizaje 0.33 0.22 0.33 0.21
2d. Uso de la evaluación 0.30 0.39 0.29 0.41
2e. Demostrando flexibilidad y capacidad de respuesta. 0.31 0.33 0.31 0.32

valor propio 7.43 0,69 6.60 0.78


Proporción de variación explicada 0.74 0.07 0,66 0.08

Nota: Análisis de componentes principales de las calificaciones de eficacia educativa basadas en rúbricas entre diez tareas, utilizando una
muestra de 2687 observaciones. Cada una de las 2687 observaciones es la visita de un observador par  a la clase del maestro  .Los
observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3 ineficaz, 4 a 6 básica, 7 a 9 eficaz y 10 a 12 muy eficaz. El cuerpo principal de
la tabla informa las cargas de los componentes, donde las cargas son los pesos asignados a cada elemento (filas) al calcular la puntuación de
un componente determinado (columnas). Las columnas 1-2 informan los componentes 1-2 utilizando índices de efectividad no ajustados,
según lo registrado por el observador  .Las columnas 3 y 4 informan los componentes 1 y 2 utilizando índices de efectividad netos de los
efectos fijos del observador. Para las columnas 3-4, antes del análisis de componentes principales, primero calculamos el observador  's media
para cada elemento y restar esa media de todos los puntajes  asignado para ese artículo.

40
Tabla A3 del apéndice—Características, actividades y calificaciones de los estudiantes

Clase
st.desv. Siempre libre

Prueba previa prueba previa Mes de escuela IDACI


puntaje puntaje Femenino nacimiento comidas puntaje

(1) (2) (3) (4) (5) (6)


(A) Actividades educativas, matemáticas

Instrucción directa 0,002 0,006 - 0,004 (0,039) 0.000 0.002 - 0,006**


(0,018) (0,009) (0.042) (0.008) (0.002)
Interacción entre estudiantes y compañeros - 0,033 0,017 - 0,002 (0,045) 0.010 - 0.012 0.002
(0,020) (0,009) (0.044) (0.011) (0.002)
Instrucción personalizada - 0,026 - 0,014 0,014+ - 0.051 0.003 0.001
(0,029) (0,019) (0,007) (0.039) (0.007) (0.002)
Práctica y evaluación - 0,029 0,011 0,007 (0,031) 0.110** 0.008 - 0.001
(0,019) (0,007) (0.037) (0.009) (0.003)
(B) Eficacia educativa, matemáticas
Eficacia educativa 0.057+ 0.001 0.005 0.016 - 0.008 - 0.001
(0,034) (0,016) (0,011) (0.036) (0.009) (0.002)
(C) Actividades de instrucción, inglés
Instrucción directa 0,022 - 0,008 - 0,012 (0,043) - 0.060 - 0,010 - 0,006+
(0,019) (0,010) (0.050) (0,011) (0,003)
Interacción entre estudiantes y compañeros 0,018 0,026 - 0,013 (0,035) - 0.036 - 0,011 - 0,005
(0,017) (0,008) (0.044) (0.012) (0.003)
Instrucción personalizada - 0,024 - 0,014 0,005 (0,031) 0.034 0.009 0.003
(0,015) (0,009) (0.035) (0.009) (0.002)
Práctica y evaluación - 0,069+ 0,025 - 0,026** - 0,043 (0,040) 0.007 0.002
(0,019) (0,009) (0,051) (0.008) (0.003)
(D) Eficacia educativa, inglés
Eficacia educativa 0,073* - 0,006 0,012 0,033 (0,036) - 0,006 - 0,005+
(0,016) (0,009) (0,047) (0,010) (0,003)

Nota: Estimaciones puntuales y conglomerados (profesor  )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una con la
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Cada columna dentro de cada panel
informa los resultados de una regresión separada. Todos los detalles de la estimación son los mismos que para la tabla 7 con estas excepciones: La
variable dependiente, descrita en el encabezado de cada columna, es una característica de referencia del estudiante.   o estudiante  's compañeros de
clase para la materia  .Los únicos controles son los efectos fijos del observador y el tiempo en el "trabajo no docente" para los paneles A y C.

+ indica p<0,10, * 0,05 y ** 0,01

41
Apéndice tabla A4—Diferencias por puntajes de exámenes anteriores de los estudiantes

agrupados Matemáticas Inglés


(1) (2) (3) (4) (5) (6)

(A) Calificación de la eficacia de la instrucción


Eficacia educativa 0.060** 0.074** 0.039*
(0.014) (0.017) (0.019)
Eficacia educativa - 0,027* -0,023* -0,030* -0,028+ - 0.016 - 0.008
* puntaje de prueba anterior (0,011) (0,012) (0,015) (0,016) (0.015) (0.014)

(B) Actividades de instrucción


Instrucción directa - 0.003 0.013 - 0.017
(0.012) (0.015) (0.020)
Instrucción directa - 0,008 -0,002 -0,025 -0,012 (0,011) 0.001 0.002
* puntaje de prueba anterior Interacción (0,011) (0,016) (0,016) 0,034** (0.015) (0.012)
entre estudiantes y compañeros 0.019 0.053**
(0.010) (0.014) (0.016)
Interacción entre estudiantes y compañeros - 0.001 - 0,006 0,002 0.001 - 0,001 - 0,006
* puntaje de prueba anterior (0.013) (0.014) (0.020) (0.022) (0.013) (0.012)
Instrucción personalizada - 0.004 0.006 - 0.022
(0.012) (0.019) (0.014)
Instrucción personalizada - 0,005 -0,010 -0,008 -0,009 -0,001 -0,006 (0,013) (0,014)
* puntaje de prueba anterior (0,021) (0,023) (0,016) (0,015) 0,020
Práctica y evaluación 0.070** - 0.024
(0.014) (0.019) (0.016)
Práctica y evaluación - 0,009 -0,007 -0,025 -0,026 (0,014) 0.005 0.004
* puntaje de prueba anterior (0,015) (0,023) (0,025) (0.014) (0.014)

Efectos fijos del profesor √ √ √

Nota: Estimaciones puntuales y conglomerados (profesor  )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una con la
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Todos los detalles de la estimación
son los mismos que para la columna 5 de la tabla 7 con estas excepciones: Interactuamos con el maestro  's índice de eficacia de instrucción o uso de
actividades de instrucción con el estudiante  's puntaje de prueba anterior en materia  ,recordar   =   (    ).En columnas con números pares, también
incluimos profesor  efectos fijos
+ indica p<0,10, * 0,05 y ** 0,01

42
Apéndice B: Rúbrica de eficacia de la instrucción

DOMINIO 1: EL AMBIENTE DEL AULA


Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)

Las interacciones en el aula,


Las interacciones en el aula, Las interacciones en el aula,
Las interacciones en el aula, tanto entre el profesor y
tanto entre el profesor y los tanto entre el profesor y los
tanto entre el profesor y estudiantes y entre
alumnos como entre alumnos como entre
estudiantes y entre estudiantes, son altamente
estudiantes, son negativos, estudiantes, son generalmente
1a Creando un estudiantes, son corteses y respetuosa, reflejando
inapropiados o insensibles a la apropiados y libres de conflicto,
Ambiente respetuosos, reflejan calidez y genuina calidez y cariño y
cultura de los estudiantes. pero pueden reflejar muestras
de respeto cariño en general, y son sensibilidad a las culturas y
antecedentes, edades y ocasionales de
y relación apropiados para la cultura y niveles de desarrollo de los
niveles de desarrollo insensibilidad o falta de capacidad
el desarrollo estudiantes. Estudiantes
Las interacciones de los estudiantes se de respuesta a las diferencias
diferencias entre grupos de ellos mismos aseguran un alto
caracterizan por el sarcasmo, las culturales o de desarrollo entre los
estudiantes. niveles de civismo entre
humillaciones o el conflicto. estudiantes.
los miembros de la clase.

Los intentos del maestro por crear La cultura del aula se


Los altos niveles de energía de los
una cultura para el aprendizaje son caracteriza por una alta
El ambiente del salón de clases transmite estudiantes y la pasión de los maestros
parcialmente exitosos, con poco expectativas para la mayoría
una cultura negativa para el aprendizaje, por la materia crean una cultura de
compromiso del maestro con el estudiantes y genuinos
1b caracterizada por un bajo compromiso de aprendizaje en la que todos comparten
tema, modesto compromiso con la materia por
Estableciendo un los maestros con la materia, bajas la creencia en el
expectativas para el rendimiento de los parte del profesor y
Cultura para expectativas para el rendimiento de los importancia de la materia y
estudiantes y poco orgullo de los estudiantes, con el profesor
Aprendiendo estudiantes y poco o ningún orgullo por el todos los estudiantes se
estudiantes en el trabajo. Tanto el demostrando entusiasmo por el
trabajo de los estudiantes. mantienen en alto
maestro como los estudiantes parecen contenido y los estudiantes
estándares de desempeño
estar solo "haciendo los movimientos". demostrando orgullo por su
que han interiorizado.
trabajo.

43
DOMINIO 1: EL AMBIENTE DEL AULA (cont.)
Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)

Se pierde mucho tiempo de El tiempo de enseñanza se


Se pierde poco tiempo de
enseñanza debido a la ineficacia Se pierde algo de tiempo de maximiza debido a rutinas de
enseñanza debido al aula
rutinas de clase y enseñanza porque las rutinas y los clase eficientes y fluidas y
rutinas y procedimientos para
procedimientos para transiciones, procedimientos del aula para procedimientos. Estudiantes
transiciones, manejo de suministros
manejo de suministros y desempeño las transiciones, el manejo de contribuir al funcionamiento
1c Gestión y desempeño de tareas no docentes,
de funciones no docentes. Los suministros y el desempeño de fluido del aula
Aula que ocurren sin problemas. El
estudiantes que no trabajan con el funciones no docentes son solo rutinas y procedimientos para
Procedimientos trabajo en grupo está bien
maestro no participan parcialmente efectivos. Los transiciones, manejo de suministros
organizado y la mayoría de los
productivamente en el aprendizaje. estudiantes en algunos grupos son y desempeño de deberes no
estudiantes se involucran
Poca evidencia de que los participando productivamente sin instructivos. Los estudiantes en
productivamente mientras trabajan
estudiantes conozcan o sigan las la supervisión del maestro. grupos asumen la responsabilidad
sin supervisión
rutinas establecidas. de la productividad.

Los estándares de conducta son


claros, con evidencia de la
Los estándares de conducta parecen participación de los estudiantes en
No hay evidencia de que se
Parece que el maestro ha ser claros para los estudiantes, y el su establecimiento. El seguimiento
hayan establecido
hecho un esfuerzo para maestro monitorea el del profesor al estudiante.
estándares de conducta, y
establecer estándares de comportamiento del estudiante el comportamiento es sutil y
1d Gestión hay poca o ninguna
conducta para los estudiantes. El maestro contra esos estándares. El maestro preventivo, y la respuesta del
Alumno seguimiento del estudiante
intenta, con resultados desiguales, respuesta al estudiante maestro al estudiante
Comportamiento comportamiento. Respuesta a
monitorear el comportamiento de los el mal comportamiento es el mal comportamiento es sensible a las
el mal comportamiento del estudiante es
estudiantes y responder al mal consistente, proporcionado, necesidades individuales de los estudiantes y
represivo o irrespetuoso de la dignidad
comportamiento de los estudiantes. apropiado y respeta la dignidad respeta la dignidad de los estudiantes. Los
del estudiante.
de los estudiantes. estudiantes toman un papel activo en el
seguimiento de las normas de
comportamiento.

44
DOMINIO 1: EL AMBIENTE DEL AULA (cont.)
Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)

El salón de clases es seguro y el


El salón de clases es seguro y el
aprendizaje esencial es El salón de clases es seguro y el
entorno físico garantiza el
El entorno físico no es seguro accesible para la mayoría de los aprendizaje es accesible para todos
aprendizaje de todos los
o algunos estudiantes no estudiantes; el uso que hace el maestro los estudiantes; el maestro
estudiantes, incluidos aquellos
tienen acceso a de los recursos físicos, incluyendo asegura que el arreglo físico
1e Organización con necesidades especiales. Los
aprendiendo. Hay una tecnología informática, es sea apropiado para las
Físico estudiantes contribuyen al uso o
mala alineación entre los moderadamente eficaz. El actividades de aprendizaje. El
Espacio adaptación del entorno físico para
disposición física de muebles maestro puede intentar docente hace un uso eficaz de
avanzar
y recursos y las actividades modificar el físico los recursos físicos, incluidos
aprendiendo. La tecnología se usa
de la lección. arreglo para adaptarse a las actividades de los informáticos.
hábilmente, según corresponda a la
aprendizaje, con limitaciones tecnología.
lección.
eficacia.

45
DOMINIO 2: ENSEÑANZA

Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)

Las expectativas de aprendizaje, las


instrucciones y los procedimientos, y
las explicaciones del contenido son
claras para los estudiantes. El
Las expectativas de aprendizaje, las
profesor vincula el
instrucciones y los procedimientos, y las
propósito instructivo de la
explicaciones del contenido son claras
lección al más amplio
para los estudiantes.
plan de estudios. La oralidad y la
Las comunicaciones son
escritura del profesor.
precisos y apropiados para las
Las expectativas de aprendizaje, las Las expectativas de aprendizaje, las la comunicación es clara y
culturas y los niveles de
instrucciones y los procedimientos, y instrucciones y los procedimientos y las expresiva, apropiada a las
desarrollo de los estudiantes. La
las explicaciones del contenido no explicaciones del contenido se aclaran culturas de los estudiantes y
explicación del contenido por
están claras o son confusas para los después de la confusión inicial; el niveles de desarrollo y se
2a parte del docente es
estudiantes. El lenguaje hablado o lenguaje hablado o escrito del maestro anticipa a posibles conceptos
Comunicado estructurada, clara y
escrito del maestro contiene errores es correcto pero puede no ser erróneos de los estudiantes. El
con Estudiantes precisa y se conecta con el
o es completamente apropiado para las La explicación del contenido por
conocimiento y la experiencia de
inapropiado para las culturas de los culturas o niveles de desarrollo de los parte del docente es minuciosa y
los estudiantes. Durante el
estudiantes o los niveles de estudiantes. clara, desarrollando
explicación del contenido, el
desarrollo. comprensión conceptual a
profesor se centra, como
través de un andamiaje
apropiado, sobre estrategias que los
claro y conexión con
estudiantes pueden usar cuando
intereses de los estudiantes.
trabajan de forma independiente e
Los estudiantes contribuyen a
invita a la participación intelectual de
ampliar el contenido
los estudiantes.
explicando conceptos a sus
compañeros y sugiriendo
estrategias que se pueden
utilizar.

46
DOMINIO 2: ENSEÑANZA (cont.)

Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)

La mayoría de las preguntas del


Algunas de las preguntas del maestro Las preguntas reflejan alto
Las preguntas del maestro son de bajo maestro provocan una respuesta
provocan una respuesta reflexiva, pero expectativas y son
desafío cognitivo o inapropiadas, lo reflexiva, y el maestro da suficiente
2b usando la mayoría son de bajo nivel, planteadas culturalmente y
que provoca una participación limitada tiempo para que los estudiantes
Cuestionamiento y en forma rápida. evolutivamente
de los estudiantes y la recitación en respondan. Todos los estudiantes
Discusión sucesión. Los intentos del adecuado. Estudiantes
lugar de participan en la discusión, y el
Técnicas maestro de involucrar a todos los formule muchas de las preguntas
discusión. Unos pocos estudiantes maestro se hace a un lado cuando
estudiantes en la discusión solo de alto nivel y asegúrese de que se
dominan la discusión.
tienen un éxito parcial. escuchen todas las voces.
adecuado.

Las actividades y asignaciones, los Los estudiantes, a lo largo de la


Las actividades y asignaciones, los
materiales y las agrupaciones de lección, son altamente
Las actividades y asignaciones, los materiales y las agrupaciones de
estudiantes están parcialmente intelectualmente involucrados en
materiales y las agrupaciones de estudiantes están totalmente
apropiado para los resultados de un aprendizaje significativo y hacer
estudiantes son inapropiados para los apropiado para los resultados de
aprendizaje o de los estudiantes contribuciones materiales a las
resultados de aprendizaje o las culturas aprendizaje y de los estudiantes.
2c participación culturas o niveles de comprensión, actividades, grupos de estudiantes
o los niveles de comprensión de los culturas y niveles de comprensión.
Estudiantes en lo que resulta en un nivel intelectual y materiales. La lección se adapta
estudiantes, lo que genera poca Todos los estudiantes están
Aprendiendo moderado. según sea necesario a las
participación intelectual. La lección no comprometidos en un trabajo de
compromiso. La lección tiene una necesidades de los individuos, y el
tiene una estructura claramente alto nivel de rigor. La estructura de
estructura reconocible pero no se
definida o tiene un ritmo deficiente. la lección es
mantiene completamente y está la estructura y el ritmo permiten
coherente, con el ritmo
marcada por incoherencias. la reflexión y el cierre del
adecuado.
ritmo estudiante.

47
DOMINIO 2: ENSEÑANZA (cont.)

Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)

La evaluación se utiliza de manera


La evaluación se usa ocasionalmente La evaluación se usa regularmente en la sofisticada en la enseñanza, a través de
La evaluación no se utiliza en la en la enseñanza, a través de un enseñanza, a través de la autoevaluación la participación de los estudiantes en el
enseñanza, ya sea a través del seguimiento del progreso del o la evaluación por parte de los establecimiento de los criterios de
seguimiento del progreso por parte del aprendizaje por parte del maestro y/o estudiantes, el seguimiento del progreso evaluación, la autoevaluación o la
profesor o de los alumnos, o los estudiantes. La retroalimentación a del aprendizaje por parte del maestro y/o evaluación por parte de los estudiantes,
2d Uso de retroalimentación adecuada a los estudiantes es desigual, y los los estudiantes, y la retroalimentación de el seguimiento del progreso tanto por
Evaluación estudiantes. Los estudiantes no son estudiantes conocen solo algunos de alta calidad para los estudiantes. Los parte de los estudiantes como del
conscientes de los criterios de evaluación los criterios de evaluación utilizados estudiantes son plenamente conscientes maestro, y retroalimentación de alta
utilizados para evaluar su trabajo, ni para evaluar su trabajo. Los de los criterios de evaluación utilizados calidad para los estudiantes de una
participan en la autoevaluación o la estudiantes ocasionalmente evalúan su para evaluar su trabajo y lo hacen con variedad de fuentes. Los estudiantes
evaluación por pares. . propio trabajo o el de sus compañeros. frecuencia. usan auto-
evaluación y seguimiento para
dirigir su propio aprendizaje.

El maestro aprovecha la
oportunidad para mejorar
aprendizaje, basándose en
El maestro se adhiere al plan de El maestro intenta modificar la un evento espontáneo o
la lección, incluso cuando un lección cuando es necesario y El docente promueve el intereses de los estudiantes, o
cambio mejoraría la lección o responder a las preguntas de aprendizaje exitoso de todos los ajusta y diferencia con éxito la
2e abordaría la falta de interés de los alumnos, con un éxito estudiantes, haciendo instrucción para abordar los
demostrando los estudiantes. El maestro hace moderado. El ajustes según sea necesario a los malentendidos individuales de
Flexibilidad y a un lado al estudiante. el maestro acepta planes de lecciones y los estudiantes. El
Sensibilidad preguntas; cuando los estudiantes responsabilidad por el éxito de los estudiante complaciente el maestro asegura la
experimentan dificultades, el estudiantes, pero sólo tiene un preguntas, necesidades y el éxito de todos los estudiantes
maestro culpa a los estudiantes oa repertorio limitado de intereses. mediante el uso de un extenso
su entorno familiar. estrategias a las que recurrir. repertorio de enseñanza
estrategias y solicitar
recursos adicionales de la
escuela o la comunidad.

Nota: Adaptado deMarco para la enseñanza(Danielson 2007).

48
Apéndice C: Actividades de instrucción, componentes principales

Nuestro análisis principal divide las doce actividades de instrucción en cuatro categorías

mutuamente excluyentes y exhaustivas (como en las tablas 1, 5 y 7). Una caracterización alternativa son

los componentes principales de los doce elementos de actividad. La tabla C1 del apéndice muestra los

detalles de los componentes principales, y la tabla C2 del apéndice usa los puntajes de los componentes

para predecir los puntajes de GCSE de los estudiantes de manera similar a la tabla 7.

Hay compensaciones entre los dos enfoques. Los pesos complejos en el enfoque de

los componentes principales capturan (potencialmente) dimensiones latentes más matizadas

de la práctica docente. La desventaja es que los componentes principales son más difíciles de

describir con palabras. Por lo tanto, advertimos que las conclusiones sustantivas no deberían

depender de la "corrección" de las etiquetas abreviadas que adjuntamos a los componentes

principales. Por el contrario, los cuatro grupos simples son sencillos de entender, pero usan

menos variación en cómo se correlacionan las actividades.

La puntuación de cada componente principal es un promedio ponderado de las doce

actividades. Los pesos se muestran en el cuadro C1 del apéndice. Los primeros cinco componentes

principales juntos explican un poco más de la mitad de la variación en los datos de las actividades de

instrucción; cada uno de los cinco explica individualmente del 9 al 13 por ciento. Por construcción, las

puntuaciones de los componentes principales no están correlacionadas entre sí.1

Usamos las siguientes etiquetas para las puntuaciones de los componentes principales,

aunque otros pueden elegir etiquetas alternativas. (1) “Interacción estudiante-maestro”. El puntaje

de este componente aumenta en la cantidad de tiempo de clase en el que el maestro y los

estudiantes interactúan.2(2) “Grupos más pequeños versus toda la clase”. Esta puntuación aumenta

en actividades individuales y de grupos pequeños, y disminuye en actividades de toda la clase. (3)

“Práctica versus instrucción”. Esta puntuación está aumentando en los estudiantes.

1Antes de estimar los componentes principales, primero cambiamos la escala de los datos del elemento de actividades. Los
observadores registran la frecuencia de una actividad en una escala de 0 a 4 con 0 "ninguna" del tiempo a 4 "tiempo completo"
durante la observación. Para cambiar la escala, dividimos cada uno de los doce elementos por la suma de los elementos. Así, los
ítems reescalados miden la proporción de toda la actividad registrada por el observador.
2Con fines expositivos, invertimos el signo de los componentes (1), (2) y (3).

49
evaluación y práctica, y disminución en la instrucción, especialmente instrucción individualizada. (4)

“Trabajo en grupo versus trabajo individual”. Este puntaje aumenta en el tiempo en que los

estudiantes interactúan con sus compañeros de clase y disminuye en el tiempo en que los

estudiantes trabajan solos o uno a uno con el maestro. (5) “Aprendizaje guiado por el maestro”.

Esta puntuación aumenta al medir la comprensión y ayudar a los estudiantes débiles, y el uso de la

pizarra, y disminuye en la discusión abierta, los niños que trabajan solos y las conferencias

unidireccionales.

Los componentes principales de las actividades de instrucción sí predicen los puntajes de las pruebas

de los estudiantes, como se muestra en la tabla C2 del apéndice. Para los GCSE ingleses, el cuarto componente

principal se destaca de los demás. El coeficiente para el componente cuatro es 0,05σ, mientras que todas las

demás estimaciones son inferiores a 0,01σ y están lejos de ser estadísticamente significativas. Nuestra etiqueta

abreviada para el componente cuatro es “trabajo en grupo versus trabajo individual”; está aumentando en

actividades donde los estudiantes interactúan con sus compañeros de clase y disminuyendo en actividades

donde los estudiantes trabajan solos o uno a uno con el maestro.

Tanto el enfoque de los componentes principales, en el cuadro C2 del apéndice, como el

agrupamiento más simple de actividades, en el cuadro 7, terminan en una conclusión sustantiva similar

para predecir los puntajes de las pruebas de inglés. Ambos enfatizan actividades donde los estudiantes

interactúan con sus compañeros de clase. Pero estas no son dos pruebas independientes, y la similitud

general no debería sorprender. Ambos enfoques combinan actividades basadas en la misma matriz de

correlación del cuadro 4. Aún así, las ponderaciones de los componentes principales, que se muestran en

el cuadro C1 del apéndice, son bastante diferentes del enfoque del cuadro 7, que pondera los elementos

por igual pero en grupos mutuamente excluyentes y exhaustivos.

Las puntuaciones del GCSE de Matemáticas se predicen, en primer lugar, por el tercer

componente principal. Nuestra etiqueta abreviada para este componente es "práctica versus

instrucción". Este patrón es consistente con el enfoque de grupos simples en la tabla 7. De hecho,

(i) el tercer componente “práctica versus instrucción” está correlacionado 0.81 con (ii) la diferencia

“práctica y evaluación” menos “instrucción personalizada” en el simple grupos

50
El quinto componente principal también predice los puntajes de matemáticas de los

estudiantes. Los coeficientes estimados para los componentes tercero y quinto son similares en

magnitud y precisión. El tercero explica el 11 por ciento de la variación en los datos del elemento de

actividad, pero el quinto explica casi tanto como el 8 por ciento. El quinto componente sugiere que

en los datos de actividades se esconde una perspectiva adicional potencial. Sin embargo, el quinto

componente principal es difícil de describir con palabras. Nuestro mejor intento de una descripción

parsimoniosa es "aprendizaje guiado por el maestro".

Para resumir, las actividades de instrucción que los maestros eligen usar en sus clases explican

en parte el crecimiento de los logros de los estudiantes. En matemáticas, los estudiantes obtienen

mejores calificaciones cuando dedican más tiempo a la práctica y evaluación de los estudiantes. En inglés,

los estudiantes puntúan más alto cuando pasan más tiempo trabajando y hablando con sus compañeros

de clase. Estos patrones son robustos a la forma en que combinamos actividades en grupos o

componentes. Nuestras conclusiones tampoco se basan en las descripciones abreviadas que usamos

para grupos o componentes.

51
Apéndice tabla C1—Componentes principales de las actividades de instrucción

Componente
1 2 3 4 5
(1) (2) (3) (4) (4)
Peso en componente
1. Discusión abierta entre los niños y el maestro - 0,43 0.12 0.05 0.27 - 0,45
2. Los niños están trabajando en grupos - 0.11 - 0,26 - 0.02 0,61 0.14
3. Enseñanza uno a uno 0.04 - 0.29 0,55 - 0,15 - 0.22
4. Pasar tiempo especial para ayudar a los estudiantes débiles - 0.10 - 0,20 0.51 - 0.22 0.42
5. Los niños están haciendo trabajos escritos solos 0.20 - 0,26 - 0,26 - 0,54 - 0,35
6. Medir la comprensión de los estudiantes - 0,32 - 0.19 - 0,54 - 0.09 0.19
7. Asignar tareas o trabajos de clase a los niños 0.38 - 0.08 - 0.22 0.12 0.22
8. Lectura o dictado 0.14 0.51 0.06 0.04 - 0,34
9. Niños copiando de la pizarra 0.29 0.48 0.09 0.03 0.14
10. Uso de la pizarra por parte del docente - 0.24 0.42 - 0.04 - 0,31 0.43
11. Uso de un libro de texto durante las actividades de enseñanza 0.39 - 0.06 0.07 0.27 0.15
12. Comprometidos en trabajos no docentes 0.44 - 0,12 - 0,14 0.01 - 0.07

valor propio 1.55 1.48 1.34 1.27 1.06


Proporción de variación explicada 0.13 0.12 0.11 0.11 0.09

Nota: Análisis de componentes principales del uso del tiempo de clase entre doce actividades de instrucción, utilizando una muestra de 2.687
observaciones. Cada una de las 2687 observaciones es la visita de un compañero observador  a la clase del maestro  .Los observadores registraron el uso
del tiempo en cinco categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4) tiempo completo. Antes del
análisis de componentes principales, primero volvimos a escalar los datos, dividiendo cada uno de los doce puntajes de 0 a 4 elementos por la suma de
los puntajes de los elementos de la observación. El cuerpo principal de la tabla informa las cargas de los componentes, donde las cargas son los pesos
asignados a cada elemento (filas) al calcular la puntuación de un componente determinado (columnas).

52
Apéndice tabla C2—Actividades de instrucción y puntajes de rendimiento de los estudiantes,
enfoque de componentes principales

(1) (2) (3) (4)


(A) Matemáticas

Actividades de instrucción
1. “Interacción alumno-profesor” 0.022 0.013 - 0,002 0,006
Más tiempo en el que el profesor y los alumnos interactúan (0.020) (0.009) (0.020) (0.008)

2. “Grupos más pequeños versus toda la clase” 0.019 0.007 0.008 0.006
Más tiempo en actividades individuales y de grupos pequeños, menos (0.015) (0.006) (0.015) (0.007)
tiempo en actividades de toda la clase
3. “Práctica vs instrucción” 0.039* 0.008 0.028+ 0.005
Más tiempo para la evaluación y práctica de los estudiantes, menos tiempo para (0.016) (0.006) (0.016) (0.006)
la instrucción, especialmente la instrucción individualizada
4. “Trabajo en grupo vs trabajo individual” - 0,014 0,001 -0,020 -0,001
Más tiempo en el que los estudiantes interactúan con sus compañeros de (0.014) (0.008) (0.013) (0.008)
clase, menos tiempo trabajando solos o uno a uno con el maestro
5. “Aprendizaje guiado por el maestro” 0,048** 0,019** 0,041** 0.017*
Más tiempo usando la pizarra y ayudando a los estudiantes, menos (0,014) (0,007) (0,013) (0.007)
tiempo trabajando solo y dando conferencias unidireccionales.

Eficacia educativa 0.071** 0.022*


(0.018) (0.009)

(B) Inglés
Actividades de instrucción
1. “Interacción alumno-profesor” - 0.009 0.012 -0.018 0.008 (0.013)
(0.008) (0.012) (0.007) 0.007 0.006
2. “Grupos más pequeños versus toda la clase” 0.001 0.003 (0.012) (0.007) (0.012)
(0.007) 0.006 0.007 0.002 0.005
3. “Práctica vs instrucción” (0.011) (0.006) (0.011) (0.006)
0,047** 0,022** 0,045** 0,023**
4. “Trabajo en grupo vs trabajo individual” (0,011) (0,006) (0,012) (0,006) 0,003
0,002 0,003 -0,000 (0,014) (0,009)
5. “Aprendizaje guiado por el maestro” (0,014) (0,009)

Eficacia educativa 0.044* 0.025*


(0.021) (0.011)

Estudiante covariables √ √
Estudiante efectos fijos √ √

Nota: Estimaciones puntuales y conglomerados (profesor  )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una con la
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Todos los detalles de estimación son
los mismos que para la tabla 7 con una excepción: reemplazamos los cuatro grupos de actividades de instrucción con cinco puntajes de componentes
principales.
+ indica p<0,10, * 0,05 y ** 0,01

53

También podría gustarte