Está en la página 1de 50

El Economic Journal, 113 (Febrero), F64-F98. Real Sociedad Económica de 2003.

Publicado por Blackwell Publishing, 9600 Garsington Road, Oxford OX4 2DQ, UK
y 350 Main Street, Malden, MA 02148, USA.

El fracaso de las políticas de enseñanza basado en los insumos*

Eric A. Hanushek,

En un esfuerzo para mejorar la calidad de las escuelas, los gobiernos alrededor


del mundo han aumentado considerablemente los recursos destinados a ellos.
Concentrándose en los insumos e ignorando los incentivos dentro de las
escuelas, los recursos han dado poco en el camino de la mejora general en el
logro estudiantil. Este documento proporciona una revisión de los EE.UU. y la
evidencia internacional sobre la eficacia de tales políticas de entrada. A
continuación, contrasta el impacto de los recursos con que las variaciones en la
calidad de los maestros que no están sistemáticamente relacionadas con
recursos escolares. Por último, alternativa se describen las políticas de
incentivos por rendimiento.

Intereses académicos y de política en el mejoramiento de las escuelas ha


seguido directamente desde el reconocimiento de la importancia de la
formación de capital humano, tanto para los individuos como para la sociedad.
Gran parte de la motivación viene de análisis teórico y empírico de la relación
entre los ingresos, la productividad y el crecimiento económico y la escolaridad
de los individuos - el proxy más común para los niveles de capital humano. Sin
embargo, la mayor parte de las iniciativas de política no se centran en la
cantidad de educación, sino de la calidad de la educación. Es aquí que la
controversia acerca de la investigación sobre los factores determinantes de la
calidad ha dado lugar a ambigüedades sobre política. Esta discusión
comentarios pruebas fundamentales sobre el rendimiento de los estudiantes y
la coloca en el contexto de los debates de política contemporánea. La principal
conclusión es que la com-múnicamente entrada usada políticas -como la
reducción de los tamaños de clase o apretando la re-requisitos para enseñar
credenciales - son casi ciertamente inferior a la alteración de los incentivos
dentro de las escuelas.

Los argumentos generales sobre la enseñanza en los Estados Unidos y en otras


partes del mundo tienen una estructura simple. En primer lugar, los altos
retornos de escolaridad adicional se nota. En los Estados Unidos estos retornos
han crecido dramáticamente en los últimos 20 años, especialmente para la
educación universitaria. Durante los años noventa, por ejemplo, un promedio
de graduado universitario devengados en exceso de una prima del 70% por
encima del promedio de los graduados de la escuela secundaria, por ejemplo,
Pierce y Welch (1996). Devuelve la escolarización en otros países, aunque
diferentes, han sido también alta (Psacharopoulos, 1989, 1994; OCDE, 2001). En
segundo lugar, habiendo observado la persona regresa a la escolarización, la
discusión política cambia rápidamente a la necesidad de invertir más en capital
humano, lo que se traduce directamente en un argumento para proporcionar
más financiación pública para las escuelas. Mientras que, nuevamente, hay
algunas variaciones dependiendo de cada país las tasas de logro escolar, los
argumentos a favor de aumentar los fondos generalmente no giran en torno a
apoyar con más años de escolaridad para los individuos, sino concentrarse en el
mejoramiento de la calidad de los años de escolaridad. Incrustados en este
cambio son una serie de presunciones que son ampliamente celebradas. Uno es
que la calidad tiene los mismos beneficios como la cantidad de escolaridad.
Otra es que una mayor financiación conducirá a la mejora de la calidad. Este
documento considera que la segunda presunción - que el gasto y la calidad
están estrechamente relacionados, en detalle.

* Esta investigación ha sido apoyado por una subvención del Instituto de


Humanidades Packard. [ F64 ]

[ F E B R U R S 2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I
C I E S F65
antes de entrar en el debate central, sin embargo, es útil establecer algunos
hechos acerca del valor de la "calidad". Hay una creciente evidencia de que la
calidad - generalmente se mide en las pruebas de rendimiento - está
relacionada con el ingreso de las personas,1 la productividad y el crecimiento
económico. Mientras se centra en las declaraciones estimadas para los años de
escolaridad, los primeros estudios de determinación de los salarios tienden a
indicar efectos relativamente modesto de las variaciones en la capacidad
cognitiva después manteniendo constante la cantidad de escolaridad. Más
recientes investigaciones directas de nivel cognoscitivo, sin embargo, han
sugerido generalmente mayor mercado de trabajo vuelve a medir las
diferencias individuales en el rendimiento cognitivo. Por ejemplo, el Obispo
(1989, 1992), O'Neill (1990), y Grogger Eide (1993), Blackburn y Neumark (1993,
1995), Murn-ane et al. (1995), Neal y Johnson (1996), Murnane et al. (2000), y
Murnane et al. (2001) cada uno encuentra que las ganancias ventajas mayores
logros en las pruebas estandarizadas son considerables.2 La evidencia
internacional es menos abundante pero demuestra también un mercado laboral
volver a habilidades cognitivas (Currie y Thomas, 2000; Boissiere et al., 1985). La
dificultad de separar las habilidades cognitivas de puro escolaridad no obstante
ha realizado esta estimación muy difícil (Cawley et al., 2000; Heckman y Vytlacil,
2001) y, por tanto, deja la ambigüedad sobre la magnitud exacta de los efectos.

Asimismo, parece que la sociedad en términos de ganancia de productividad.


Hanushek y Kimko (2000) demuestran que las diferencias de calidad en las
escuelas tienen un impacto dramático en la productividad y tasas de
crecimiento nacionales. Este estudio de las tasas de crecimiento incorpora
información internacional sobre exámenes de matemáticas y ciencias en
estándar cross-country a las regresiones de crecimiento. Se encuentra una
relación muy fuerte entre las pruebas de rendimiento y el crecimiento nacional
y una menor relación entre la cantidad de escolaridad y el crecimiento. Una
serie de investigaciones sobre la estructura sugiere una relación causal.

Una parte adicional del regreso a la escuela calidad viene a través de la


permanencia en la escuela. Existe considerable evidencia de que los estudiantes
que tienen un mejor rendimiento en la escuela, ya sea a través de categorías o
puntajes en pruebas de aprovechamiento estandarizadas, tienden a ir a
1, mientras que el capital humano ha sido el centro de gran parte de la
economía laboral de unas cuatro décadas, su medición ha sido más
problemático. La medida más comúnmente empleada es simplemente los años
de escolaridad completados, pero esta medida descuida ninguna calidad
diferencias derivadas tanto de la escuela y las diferencias entre individuos
nonschool. La medida más comúnmente utilizada de la calidad implica las
puntuaciones de las pruebas cognitivas, aunque la adecuación de esta medida
no ha sido plenamente investigado; véase, por ejemplo, Murnane et al. (2001).
Primeros análisis de ganancias empleando puntajes generalmente tratados
como medidas de capacidad fija la diferencia, por ejemplo, Griliches (1974).
Pruebas considerables, sin embargo, algunos de ellos presentados a
continuación indica que las pruebas cognitivas típicas son muy dependientes de
las familias y las escuelas.

2 Estos resultados se derivan de enfoques muy distintos. Bishop (1989)


considera que los errores de medición inherente en la mayor parte de las
pruebas de la situación y demuestra que el tratamiento cuidadoso de ese
problema tiene un efecto dramático en la estimación de la importancia de la
prueba de diferencias. O'Neill (1990), y Grogger Eide (1993), Obispo (1991), y
Neal y Johnson (1996), por otra parte, simplemente se basan en los datos más
recientes del mercado laboral junto con una muestra más representativa y
sugieren que las ganancias de ventaja para medir las diferencias de habilidad es
mayor que la encontrada en períodos de tiempo anteriores y en estudios
anteriores (incluso sin corregir para probar la fiabilidad). Murnane et al. (1995),
considerando una comparación en el tiempo, demuestran que los resultados de
mayores retornos para medir habilidades manejar independientemente a través
de análisis simples y corregido error de estimación. Murnane et al. (2000) y
Murnane et al. (2001) emplean muestras representativas pero introducen otras
medidas de las habilidades individuales. Blackburn y Neumark (1993, 1995), al
igual que gran parte de la literatura temprana, se concentran principalmente en
cualquier sesgo en las estimaciones de las tasas de retorno a la escuela cuando
las medidas de capacidad son omitidos.

Royal Economic Society 2003

F66 T H E E C O N Ó M I C O J U R N A L [ F E B R U A R Y
más lejos en la escuela; véase, por ejemplo, Dugan (1976); Manski y Wise
(1983). Rivkin (1995) concluye que las variaciones en las puntuaciones de las
pruebas capturar una proporción considerable de la variación sistemática en la
finalización de la escuela secundaria y en la universidad la continuación, de
modo que prueba las diferencias de puntuación pueden explicar totalmente en
blanco y negro, las diferencias en la escolarización. Bishop (1991) y Hanushek et
al. (1996) encuentran que el logro individual puntuaciones están altamente
correlacionadas con la asistencia a la escuela. Behrman et al. (1998) encuentran
fuerte logro efectos sobre la continuación en el college y la calidad de la
enseñanza universitaria; además, los efectos son mayores cuando se tienen
debidamente en cuenta la endogeneidad de logro. Hanushek y Pace (1995),
usando la alta escuela y más allá de los datos, encontrar que la finalización está
significativamente relacionado con mayores puntuaciones en la final de la
escuela secundaria.

No obstante, la calidad es prácticamente imposible dictar a través de la política.


La búsqueda de la mejora de la calidad sin duda ha contribuido a los recientes
aumentos en los recursos destinados a las escuelas en los EE.UU. y otros países.
Deseoso de mejorar la calidad y no puede hacerlo directamente, la política del
gobierno se mueve normalmente a lo que se cree que es la mejor cosa siguiente
- proporcionar recursos adicionales a las escuelas. Amplia evidencia a partir de
la experiencia en los Estados Unidos y el resto del mundo sugiere que esta es
una manera ineficaz para mejorar la calidad.

Esta característica ambos puntos de interés en el tema y se destacan algunos de


los problemas de interpretación que puedan surgir. El debate de la política
escolar frecuentemente involucra una intensidad no comunes a muchos otros
debates académicos, porque los resultados de los análisis de las escuelas a
veces tener influencia directa en la política. Así, por ejemplo, los argumentos
para reducir el tamaño de la clase de Krueger (2002), en gran medida, que se
reproducen en esta característica como Krueger (2003), ya han proporcionado
combustible para los defensores de la bajada de los tamaños de clase.3 y el
Dustmann et al. (2003) El artículo será igualmente encontrar una política de
espera público como maestro de las políticas de empleo son debatidas en todo
el mundo. ¿Qué hace que los asuntos más complicados es la dificultad de
interpretar los resultados, que se basan en datos imperfecta e incompleta
descripción de la estructura subyacente (Todd y Wolpin, 2003).
Porque el tamaño de las clases políticas están actualmente siendo ampliamente
discutido, atención a otras dimensiones importantes de las decisiones de
política de entrada tiende a ser descuidado. El siguiente artículo presenta la
evidencia disponible sobre un amplio conjunto de políticas de recursos en las
escuelas. Mientras que algunas de las pruebas son menos fiables que otros, el
panorama general es extraordinariamente coherente. Aún descontando
porciones significativas de las pruebas disponibles, uno se queda con la idea
clara de que las políticas de entrada del tipo que suelen perseguir tienen pocas
probabilidades de ser eficaces.

1. Las contribuciones y los resultados escolares

gran parte de la discusión política en todo el mundo se concentra en la


escolaridad entradas, un enfoque aparentemente natural. Y, con la antigua
importancia que se ha concedido a la escolaridad, se ha producido un cambio
considerable en los niveles de

3 Hanushek (2002) proporciona una crítica de Krueger (2002), que difiere de la


característica de la versión inconsequentially. Concretamente, en la búsqueda
de otras ponderaciones de los resultados, la versión en largometraje reweights
estimaciones por el "índice de impacto" de las revistas en lugar de citas. Como
señala Krueger, esto tiene un efecto mínimo sobre las estimaciones.

Royal Economic Society 2003

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F67

entradas comunes. Los tamaños de clase han caído, las calificaciones de los
maestros han aumentado, y los gastos han aumentado. Lamentablemente,
existe poca evidencia para sugerir que cualquier cambio significativo en los
resultados de los estudiantes han acompañado este crecimiento en los recursos
destinados a las escuelas. Debido a que muchos encuentran la escasa relación
entre los insumos del colegio y los resultados de los estudiantes sorprendente y
difícil de creer, esta sección profundiza en la evidencia disponible sobre este
puntaje en algunos detalles.

Estos datos agregados sobre el coste y el rendimiento proporcionan un fuerte


prima facie evi-dencias que simples políticas de recursos generalmente no son
eficaces. Mucho del cur-rent discusión política argumenta que con recursos
adicionales sería posible ejecutar programas o métodos que levante el logro
estudiantil. Por supuesto, estos son precisamente los mismos argumentos
formulados en los últimos decenios. La validez de las propuestas actuales
descansa en estas propuestas actuales siendo notablemente superior a las
políticas del pasado (que fueron diseñados en el momento también para
formular mejores políticas).

1.1. Los datos de EE.UU. Agregado

el más simple y quizás más clara manifestación de la historia de recursos se


encuentra en el conjunto de datos de EE.UU. durante los últimos decenios. Los
Estados Unidos, que operan bajo un sistema que está muy descentralizada hacia
los 50 Estados separados, ha proseguido la conven-cionalmente defendió
enérgicamente las políticas en materia de recursos. Tabla 1 pistas los patrones
de alumno-maestro, maestro, maestro de educación y experiencia. Entre 1960 y
2000, la proporción alumno-profesor cayó casi un 40%. La proporción de
profesores con grado de maestría o más sobre doblado de manera que la
mayoría de todos nosotros los maestros de hoy tienen al menos una maestría.
Por último, mediana experiencia docente -que es más impulsadas por ciclos
demográficos de política activa - aumentó significativamente, duplicando
prácticamente desde su mínimo en 1970.

Los maestros estadounidenses están sindicados, y la estructura más común de


contratos docentes maestro identifica los niveles de educación y la experiencia
del maestro, como la fuerza impulsora detrás de los sueldos. Por lo tanto,
aumento de insumos como profesor y como el número de alumnos por
docente, disminución del gasto por alumno se eleva. Como se ve en la fila
inferior de la Tabla 1, el gasto real por alumno más que triplicado durante este
periodo.4 De hecho, en ese período no es especial en escuelas
estadounidenses. A lo largo de la totalidad de los 100 años de 1890-1990, el
gasto real por alumno aumentó notablemente a un ritmo sostenido del 3,5%
anual (Hanushek y Rivkin, 1997). Durante este largo período, real por alumno
expen-diture en dólares de 1990 va desde los 164 dólares en 1890 a 772 dólares
en 1940 a 4.622 dólares en 1990, aproximadamente el quíntuple en cada
período de 50 años.5

4 El cálculo de los gastos reales se desinfla por el Índice de Precios al


Consumidor. Si la alternativa de un deflactor de salario fueron empleadas, la
tasa calculada de aumento real durante este período no cambiaría mucho.
Baumol's disease (Baumol, 1967) es frecuentemente citada en este punto para
explicar los aumentos en los costos de los insumos sin aumentar los insumos
reales. Concretamente, si los sectores de servicios son aquellas en las que el
crecimiento de la productividad es necesariamente baja - digamos, por razones
tecnológicas, habrán de hacer frente a las presiones de los costos en la
contratación de insumos, poniendo el sector de los servicios (tecnológicamente
atrasadas) en una situación de desventaja. Durante este período, sin embargo,
dichas presiones no pueden explicar los patrones de entradas y salidas a la
escolarización (Hanushek, 1997b).

5 Estos cálculos difieren de las que aparecen en la Tabla 1, tanto en la utilización


de un deflactor diferentes (deflactor del PIB en dólares de 1990) y en el cálculo
de gasto por alumno en una membresía en lugar de una base de asistencia.
Royal Economic Society 2003

F68 T H E E C O N Ó M I C O J U R N A L [ F E B R U R S

TABLA 1

Recursos de escuelas públicas en los Estados Unidos, 1960-2000


1960 1970 1980 1990 2000

relación profesor-alumno 25,8 22,3 18,7 17,2 16,0

% maestros con maestría o más 23,5 27,5 49,6 53,1 56,2*

años mediana experiencia docente 11 8 12 15 15*

el gasto corriente/ADA (2000/2001 $s) $2.235 $3,782 $5.124 $6,867 $7,591

Nota: *Los datos corresponden a 1995. Los datos estadísticos de la Asociación


Nacional de la educación sobre las características de los maestros fue
interrumpido.

Fuente: Departamento de Educación de Estados Unidos (2002).

La cuestión es qué se obtuvo para estos incrementos de gastos? Desde


principios del decenio de 1970, en una muestra aleatoria de estudiantes en los
Estados Unidos ha dado pruebas en diferentes edades en diversos temas bajo
los auspicios de la Evaluación Nacional de Progreso Educativo, o de la NAEP.
Estas pruebas han sido diseñadas para proporcionar una medida coherente de
rendimiento a lo largo del tiempo. La figura 1 muestra los datos de rendimiento
para el mismo período que la descrita previamente los datos de entrada. En
esta figura, el patrón de rendimiento promedio por 17 años es explorada para
lectura, matemáticas y ciencias. El desempeño de los alumnos en matemáticas y
lectura es tan

310
300

290

280

1969 1974 1979 1984 1989 1994 1999

año

leyendo matemáticas ciencia


Fig. 1.

Partituras de 17 años de edad en la Evaluación Nacional de Progreso Educativo,


1969-99

Royal Economic Society 2003

2003 ] FAILUREOFINPUT-BASEDSCHOOLINGPOLICIES F69

slightly higher in 1999 than 30 years before when spending was dramatically low-er.6
The performance of students in science is significantly lower in 1999 than it was in 1970.
Writing performance (not shown) was first tested in 1984 and declined steadily until
1996 when testing was discontinued.

The only other test that provides a national picture of performance over a long period
of time is the Scholastic Aptitude Test, or SAT. This college admissions test has the
advantage of providing data going back to the 1960s but the disadvantage of being a
voluntary test taken by a selective subset of the population. 7 Scores on this test actually
plunged from the mid-1960s until the end of the 1970s, suggesting that the NAEP scores
that begin in the 1970s may understate the magnitude of the performance problem.8

In simplest terms, input policies have been vigorously pursued over a long period of
time, but there is no evidence that the added resources have improved student
performance, at least for the most recent three decades when it has been possible to
compare quantitative outcomes directly. This evidence suggests that the efficacy of
further input-based policies depends crucially on improved use of re-sources compared
to past history.

Two arguments are made, however, for why the simple comparison of expen-ditures
and student performance might be misleading:

1. The characteristics of students may have changed such that they are more
difficult (and expensive) to educate now than in the past:

2. Other expansions of the requirements on schools have driven up costs but would
not be expected to influence observed student performance.
1.1.1. Changes in students

One simple explanation for why added resources yield no apparent performance
improvement is that students are more poorly prepared or motivated for school over
time, requiring added resources just to stay even. For example, there have been clear
increases in the proportion of children living in single-parent families and, relatedly, in
child poverty rates – both of which are hypothesised to lead to lower student
achievement. Between 1970 and 1990, children living in poverty families rose from 15 to
20%, while children living with both parents declined from 85 to 73%. The percentage of
children not speaking English at home also rose from 9% in 1980 to 17% in 2000. But,
there have also been other trends that appear to be positive forces on student
achievement. Family sizes have fallen and

6 The cumulative nature of the educational process implies that scores will reflect both current and past
spending. A 17-year-old in 1970, for example, would have entered school in the late 1950s, implying that the
resource growth in Table 1 that goes back to 1960 is relevant for comparison with the NAEP performance data.

7 NAEP samples are not tainted by selection. The school completion rate and the rate of attendance of
private schools have been essentially constant over the period of the NAEP tests and testing involves a random
sample of public school children.

8 Analyses of the changes in SAT scores suggest that a portion of the decline in scores comes from increases
in the rate of test taking but that the decline also has a real component of lesser average performance over time
(Wirtz, 1977; Congressional Budget Office, 1986).

Royal Economic Society 2003


F70 T H E E C O N Ó M I C O J U R N A L [ F E B R U A R y la

patria de los niveles de educación han mejorado. Entre todas las familias con niños, el
porcentaje de personas con tres o más niños disminuyó de un 36 a un 20%. Además, durante
el mismo período, los adultos entre las edades de 25 a 29 con una alta escuela o mayor nivel
de escolarización pasó del 74 al 86% (frente al 61% en 1960). Por último, la inscripción en el
kindergarten y pre-escolar aumentó espectacularmente durante el período.

Es difícil saber cómo net estas tendencias opuestas con toda precisión. La investigación
extensa, comenzando con el informe Coleman (Coleman et al., 1966) y continuando hasta hoy
(Hanushek, 1997a), ha demostrado que las diferencias en las familias son muy importantes
para el logro de los estudiantes. La mayoría de estos estudios no se han centrado su atención
primaria sobre las familias, sin embargo, y por lo tanto no han profundizado mucho en la
medición y la estructura de las influencias de la familia. Grissmer et al. (1994), intento de
clasificar los diversos factores de manera cruda. Este análisis utiliza técnicas econométricas
para estimar cómo diversos factores familiares influyen en el desempeño de los niños en un
punto en el tiempo. A continuación, aplica estos cross-sectionally coeficientes de regresión
estimada como contrapesos a los antecedentes familiares con tendencias factores iden-tified
anteriormente. Sus conclusiones generales son que los estudiantes negros a lo largo del
tiempo funcionó mejor de lo esperado a partir de las tendencias de los factores familiares en
negro. En homenaje a este mejor desempeño a las mejoras en las escuelas. Por otro lado, los
estudiantes blancos, que constituyen la inmensa mayoría, fueron peores a lo largo del tiempo
de lo que podría esperarse, provocando presumiblemente a la conclusión opuesta que las
escuelas para la mayoría de los estudiantes realmente empeoró a lo largo del tiempo.

Aunque hay razones para ser escépticos sobre estos resultados precisos, que sugieren que la
relación gasto-rendimiento no es impulsada en ninguna manera simple por cambios en la
preparación del estudiante.9 Los cambios en las entradas de la familia se han producido a lo
largo del tiempo, por lo que es posible que una parte del aumento de los recursos escolares ha
ido para contrarrestar los factores adversos. La evidencia es, sin embargo, bastante
concluyente sobre el di-rection incluso de cualquier tendencia, ya no digamos los efectos de
magnitud. Las únicas estimaciones cuantitativas disponibles indican que la modificación de los
efectos de la familia son incapaces de compensar los grandes cambios observados en la
proporción alumno-profesor y recursos escolares e incluso ha trabajado en la dirección
opuesta, haciendo que el rendimiento de las escuelas parecen mejor de lo que era.
1.1.2. Los aumentos de costos exógenos

más discutido problema implica costos 'Special', programas de educación para tratar con los
alumnos que tienen diversas discapacidades. La cuestión es que estos programas son

9 escepticismo acerca de los resultados de Grissmer et al. (1994) viene de


problemas metodológicos. Primero, ellos no observar o medir las diferencias en las
escuelas, sino que simplemente el atributo residual inexplicables diferencias en las
previsiones y las tendencias observadas en los factores escolares. En realidad,
cualquier factor que afecta al logro, que se mide, y que ha cambiado a lo largo de su
período de análisis podría ser mezclado con cualquier escuela efectos. Segundo, en la
estimación de los modelos transversales que proporcionan los pesos de las tendencias
factores familiares, no hay medidas directas de insumos escolares están incluidos. En
el análisis estándar de misspecified modelos econométricos, esta omisión dará lugar a
estimaciones sesgadas de la influencia de factores familiares si los factores escolares
están correlacionadas con la familia incluye factores en los datos transversales que
sustentan su estimación. Por ejemplo, padres mejor educados podrían
sistemáticamente tienden a colocar a sus hijos en las mejores escuelas. En este sencillo
ejemplo, una parte de los efectos de las escuelas será atribuido erróneamente a la
educación de los padres, y esto dará lugar a la inadecuación de los pesos para la
familia con tendencias insumos. Tercero, uno debe creer que los factores identificados
son los verdaderos o influencias causales que son estables los proxies de los
verdaderos factores, pero no hay duda acerca de esto (Mayer, 1997). Royal Economic
Society 2003

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F71

caro pero los destinatarios tienden a no tomar exámenes normalizados. Por lo tanto,
incluso si los programas de educación especial son eficaces (Hanushek et al., 2002), el
aumento de la expen-ditures sobre educación especial no se mostrará en medir el
rendimiento de los estudiantes.

Preocupaciones acerca de la educación de los niños con tanto física como mental dis-
capacidades eran traducidas en la ley federal con la promulgación de la educación para
todos los niños discapacitados la ley en 1975. Esta ley prevé una serie de diagnósticos,
actividades de orientación y servicios educativos para estudiantes minusválidos. Para
implementar esta y posteriores leyes y reglamentos sistemas escolares personal
ampliado y programas, el desarrollo de estructuras administrativas totalmente nuevo
en muchos casos para manejar 'educación'. La orientación general de los servicios
educativos ha sido proporcionar instrucción en el aula regular en la medida de lo
posible ("mainstreaming") junto con la instrucción especializada para hacer frente a
necesidades específicas. El resultado ha sido el crecimiento de los estudiantes
clasificados como la población de educación especial-specto incluso como la población
estudiantil total disminuyó. Entre 1977 y 1999, el porcentaje de alumnos clasificados
como discapacitados aumenta de 9,3 a 13,0%. Además, el número de profesores de
educación especial aumenta mucho más rápidamente que el número de niños
clasificados como discapacitados.

La magnitud del gasto en educación especial y su crecimiento, sin embargo, son


suficientes para reconciliar el dilema de coste y rendimiento. Usando la mejor
estimación del costo diferencial para la educación especial - 2,3 veces el costo de la
educación regular (Chaikind et al., 1993), el crecimiento de los estudiantes de
educación especial ser-tween 1980 y 1990 pueden explicar menos del 20% del
crecimiento de los gastos (Hanushek y Rivkin, 1997). En otras palabras, mientras que
los programas de educación especial sin duda han influido en los gastos generales,
siguen siendo una relat-ively pequeña porción del gasto total en las escuelas.

Estimaciones directas de otros programas exógenos y los cambios resultantes de otros


aspectos académicos de las escuelas, como la enseñanza de idiomas para inmigrantes
o nonacademic programas tales como deportes, arte, música o no están fácilmente
disponibles. Sin embargo, no hay indicios de que estos pueden explicar la magnitud de
crecimiento del gasto.

1.2. Agregado de Datos Internacional la

mayoría de los demás países del mundo no han rastreado el desempeño del
estudiante durante cualquier período de tiempo, realizar análisis comparable a la de
los Estados Unidos debate imposible. Sin embargo, pruebas internacionales durante
las últimas cuatro décadas, permite una visión general de gastos entre países. Siete
diferentes pruebas de matemáticas y ciencias se han dado entre principios de los años
1960 y 1995 a los estudiantes en las diferentes categorías en un diverso conjunto de
naciones que participan voluntariamente. (Sólo EE.UU. y el Reino Unido participaron
en todas las pruebas.) La prueba de rendimiento a través del tiempo, actualizados de
Hanushek y Kimko (2000), se resume en la figura 2. En esta figura las puntuaciones de
cada prueba se han agregado en los niveles de grado y subpruebas y el promedio
mundial de cada año se establece en 50,10, mientras que las pruebas no fueron
diseñados para la pista

10 una descripción de las pruebas individuales y la agregación de las puntuaciones se


da en Hanushek y Kim (1995). La cifra cae del primer año de pruebas (1965) cuando
hay preguntas acerca de repre-tativeness del muestreo. Tampoco se incluyen los
ensayos más recientes (TIMSS-R en 1999).

Royal Economic Society 2003.

Copiar F 72
Fig. 2. Rendimiento en exámenes Internacional de Matemáticas y ciencias del

comportamiento en el tiempo y, aunque han sido adoptadas por diversos


países, pueden equipararse con los patrones de nosotros los resultados de las
pruebas se indica en la figura 1. Esta alternativa de normalización no afecta al
patrón porque el patrón de rendimiento de estudiantes de Estados Unidos es
esencialmente el mismo en ambos nacionales e inter-nacional de exámenes.

El rendimiento tiene escasa relación con los patrones de gasto en los distintos
países. La tabla 2 presenta la distribución de la escuela primaria y secundaria
1998 el gasto por alumno en un conjunto de países que participan en el
reciente Tercer Estudio Internacional de Matemáticas y Ciencias (TIMSS). Estos
países están ordenados por orden de rendimiento acumulado en TIMSS, y basta
con echar un vistazo a la tabla resalta la incongruencia de gasto y
rendimiento.11 La simple

11 Datos de la OCDE (2001) proporcionan un conjunto coherente de gastar


cifras convertidas a dólares americanos en base a la paridad del poder
adquisitivo. Un total de 23 países han notificado TIMSS cifras de gasto.
Royal Economic Society 2003

F 73

correlation between secondary school spending and TIMSS score is an insigni-ficant 0.06.

International comparisons, of course, amplify the problems of possible con-tamination of the influence
of factors other than schools that was considered previously in the case of the US. As a preliminary
attempt to deal with some of these issues, Hanushek and Kimko (2000) estimate models that relate
spending, family backgrounds, and other characteristics of countries to student performance for the tests
prior to 1995.12 This estimation consistently indicates a statistically significant negative effect of added
resources on performance after controlling for other influences.

Gundlach et al. (2001) consider changes in scores of a set of developed nations between 1970 and
1995 and their relationship to spending changes. They con-clude that productivity of schools has fallen
dramatically across these countries. Woessman (2000, 2001) also performs a related analysis that relies
on just the 1995 performance information from TIMSS. His analysis suggests that traditional

12 The estimation includes average schooling of parents, population growth rates, school participa-tion rates, and separate
intercepts for each of the different tests. Several measures of school resources including spending as a proportion of GNP, current
expenditures per student, and class size in ele-mentary and secondary schools were also included.

Royal Economic Society 2003

F74 T H E E C O N Ó M I C O J U R N A L [ F E B R U R S

medidas de recursos guardan poca relación coherente con diferencias en las puntuaciones
entre las 39 naciones participantes en TIMSS durante 13 años.

1.3. Conclusiones del

análisis de datos agregados de rendimiento acumulado datos están sujetos a una variedad de
problemas. Cualquier relación entre los recursos y los logros de los estudiantes -ya sea dentro
de un mismo país o entre distintos países, podría estar distorsionado por otros factores que
influyen en el rendimiento. Sin embargo, las variaciones en los recursos son enormes,
sugiriendo que cualquier efecto debería ser evidente incluso en las comparaciones de crudo.
Ningún efecto significativo del gasto viene a través del conjunto, aun cuando el examen de los
antecedentes familiares se presenta diferencias.

Cualquier alegación de que un determinado conjunto de efectos de recursos estimado


proporciona soporte para grandes aumentos de insumos específicos -como argumentaron por
Krueger (2002, 2003) - debe conciliarse con los datos agregados que no muestran efectos
anteriores de amplia aplicación de dichas políticas.

2. Pruebas econométricas

el agregado historia es apoyado por un amplio cuerpo de evidencia directa procedente del
análisis econométrico detallado de los logros de los estudiantes. Esta evidencia ha sido
motivada por un monumental estudio gubernamental de nosotros logro que se realizó a
mediados de la década de 1960. El 'Informe' Coleman (Coleman et al., 1966) presentan
evidencia que fue ampliamente interpretado como diciendo que las escuelas no importa. El
factor más importante en el logro fue la familia, seguido por sus compañeros en la escuela.
Este estudio condujo a una gran cantidad de investigación - que ha apoyado la investigación
parte del estudio de Coleman, sino, lo que es más importante, ha aclarado la interpretación.

2.1. Las estimaciones estadounidenses

los análisis estadísticos pertinentes a esta obra un marco común que ha sido bien entendido
por algún tiempo (Hanushek, 1979). Los logros de los estudiantes en un momento en que está
relacionado con los insumos primarios: influencias familiares, compañeros de trabajo y
escuelas. El proceso educativo también es acumulativa, de modo que tanto la histórica y
contem-poraneous insumos influyen en el rendimiento actual.

Con la excepción del informe Coleman, el análisis subsiguiente raramente se ha basado en los
datos recopilados específicamente para el estudio de los procesos educativos. En su lugar, ha
tendido a ser oportunistas, empleando los datos disponibles para obtener una visión detallada
de las actividades escolares. El objetivo de gran parte de esta labor ha sido el efecto de la
modificación de los recursos en el logro de los estudiantes. Este enfoque fluye desde la
perspectiva subyacente de las funciones de producción; desde su evidente importancia para la
política; y de la prevalencia del recurso pertinente datos en los registros administrativos que se
utilizan con frecuencia.

El resumen de la producción en escuelas norteamericanas comienza con todas las


estimaciones separadas de los efectos de los recursos sobre el rendimiento de los estudiantes
y, a continuación,

Real Sociedad Económica 2003

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F75

se concentra en un conjunto de estimaciones más refinado.13 El trabajo subyacente incluye


todos los análisis publicados antes de 1995 que incluyen una de las medidas de recursos
descritos a continuación, que tenga alguna medida de insumos de la familia además de las
escuelas, y que proporciona el signo y la significación estadística de la relación recursos-barco
con una estudiante resultados mensurables. Las 89 publicaciones individuales que aparecieron
antes de 1995 y que forman la base de este análisis contienen 376 estimaciones de la función
de producción independiente. Mientras que un gran número de análisis se produjo como una
reacción más o menos inmediata del informe Coleman, la mitad de las estimaciones
disponibles han sido publicados desde 1985. Por supuesto, una serie de análisis posteriores
también han aparecido desde 1995. Aunque no es formalmente evaluadas, es evidente que su
inclusión no cambia significativamente cualquiera de los resultados reportados aquí, dado sus
resultados mixtos y el gran número de antes esti-compañeros.

Comprender el carácter del análisis subyacente es importante para la interpretación


subsiguiente. Las tres cuartas partes de las estimaciones se basan en el rendimiento de los
estudiantes medido por las pruebas estandarizadas, mientras que el resto se utiliza una
variedad de diferentes medidas que incluyen cosas tales como la permanencia en la escuela,
deserción escolar y, posteriormente, el comportamiento de los ingresos en el mercado de
trabajo. No sorprendentemente, calificación de prueba medidas de rendimiento son más
frecuentemente empleada para el estudio de edu-cación en escuelas primarias, mientras que
una gran mayoría de los análisis de otros resultados relacionados a las escuelas secundarias. El
nivel de agregación de la escuela medidas de entrada también es una cuestión que se examinó
en detalle a continuación. Una cuarta parte de las estimaciones debe tener en cuenta el
rendimiento en los salones de clases, mientras que el 10% de los insumos se centrara en las
escuelas sólo en el nivel del estado. Por otra parte, plenamente, una cuarta parte de las
estimaciones empleando medidas nontest confiar únicamente en la Interstate variaciones en
los insumos del colegio.

La tabla 3 presenta el resumen general de los resultados básicos sobre los recursos clave que
forman la base para la mayoría de los debates sobre políticas generales.14 La hipótesis de
conducción estándar las iniciativas políticas es que cada uno de estos recursos deberían tener
un positivo

13 publicaciones individuales suelen contener más de una serie de estimaciones, que se


distinguen por diferentes medidas de rendimiento estudiantil, por diferentes niveles de grado,
y a menudo con diseños de muestreo completamente diferente. Sin embargo, si una
publicación se incluyen estimaciones de especificaciones alternativas empleando la misma
muestra y medidas de desempeño, sólo uno de los cálculos alternativos está incluido. Como
regla general, los resultados tabulados reflejan las estimaciones que son enfatizados por los
autores de los documentos de base. En algunos casos, esta regla no lleva a una clara elección,
momento en el cual la tabulación destacó resultados estadísticamente significativos entre las
alternativas preferidas por el autor original. Un enfoque alternativo, seguido por Betts (1996),
agrupa todas las estimaciones separadas de un parámetro común que se presentan en cada
papel. Otro enfoque, seguido por Krueger (2002, 2003), todas las estimaciones de agregados
en una determinada publicación en un solo cálculo subyacente, independientemente del
parámetro que se estima (véase infra).

14 Una descripción más completa de los estudios puede encontrarse en Hanushek (1997a),
que actualiza el análisis en Hanushek (1986). Las tabulaciones aquí corregir algunos de los
efectos de la codificación incorrecta original en estas publicaciones. También omite las
estimaciones de Card y Krueger (1992b). En la revisión de todos los estudios y estimaciones, se
descubrió que los resultados de este trabajo se basan en los modelos que no incluyen
antecedentes familiares de cualquier medida de diferencias y por lo tanto no podía
interpretarse como la identificación de cualquier parámetro de recursos. Como un criterio
mínimo de calidad, tabulada las estimaciones deben provenir de modelos estadísticos que
incluyan alguna medida de antecedentes familiares, puesto que la omisión seguramente llevar
a estimaciones sesgadas de los recursos. Antecedentes familiares han demostrado ser
bastante generalmente correlacionada con los recursos escolares y han demostrado tener
fuertes efectos sobre los resultados de los alumnos.
Royal Economic Society 2003

F 76

Efecto sobre el rendimiento de los alumnos.15 En términos reales de los recursos en el aula,
sólo el 9% de las estimaciones considerando el nivel de la educación de los maestros y el 14%
de las estimaciones de investigar el coeficiente alumnos-profesor encontrar positiva y
estadísticamente signifi-peralte efectos sobre el rendimiento de los alumnos.16 Estos números
relativamente pequeños de statis-caciones importantes resultados positivos están equilibradas
por otro conjunto encontrar resultados negativos estadísticamente significativas, alcanzando
el 14% en el caso de que el coeficiente alumnos-profesor.17 Una mayor proporción de efectos
estimados de la experiencia del maestro, son positivas y estadísticamente significativas: el
29%. Sin embargo, es importante señalar que, el 71% aún indicar empeoramiento del
rendimiento con experiencia o menos confianza en cualquier efecto positivo. Porque los más
experimentados profesores frecuentemente puede elegir su escuela y/o estudiantes, una
parte de los efectos positivos que podría reflejar la causalidad inversa (Greenberg y McCall,
1974; Murnane, 1981; Hanushek et al., 2001b). En suma, el gran número de estimaciones de
los efectos reales de recursos da poca confianza que acaba de agregar más de cualquiera de
los recursos específicos para las escuelas conducirá a un aumento en el logro estudiantil.
Además, esta declaración no incluso entrar en si tienen o no efectos son 'grande'. Dada la
escasa confianza en apenas

15 Es posible que el nivel y la forma de los salarios con respecto a la experiencia están
configurados para atraer y retener un suministro óptimo de profesores, y que año a año
cambios en los salarios no reflejan diferencias de productividad a corto plazo. Esta posibilidad
podría introducir cierta ambigüedad acerca de ex-pectations de estimaciones de experiencia y
efectos de sueldos.

16 Los estudios tienden a medir cada uno de estos insumos de diferentes maneras. Con la
relación entre maestros y alumnos, por ejemplo, cierta clase de tamaño real, mientras que la
mayoría de medir la relación entre maestros y alumnos. En todos los casos, las estimaciones de
los signos están invertidos si la medida implica la proporción alumno-profesor o el tamaño de
la clase en lugar de la relación entre maestros y alumnos.
17, mientras que una gran parte de los estudios simplemente señalar que el coeficiente
estimado es estadísticamente insignificante sin dar la dirección del efecto estimado
estadísticamente insignificantes, aquellos estudios que informaron el signo de los coeficientes
estimados se dividen de forma bastante uniforme entre positivo y negativo.

Royal Economic Society 2003.

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F77

mejoras evidentes, parece algo sin importancia para investigar la magnitud de los efectos
estimados.

Los agregados financieros y otros insumos proporcionan un panorama similar. Hay muy escaso
apoyo para la idea de que simplemente ofreciendo salarios más altos para los maestros o
mayor gasto general conducirá a la mejora del rendimiento de los alumnos. El gasto por
alumno ha recibido más atención, pero sólo el 27% de la estimada de co-coeficientes son
positivas y estadísticamente significativas. De hecho, el 7% incluso sugerir alguna confianza en
el hecho de que el gasto más perjudicaría a los logros de los estudiantes. En realidad, como se
verá más adelante, el análisis de los gastos por alumno tienden a ser de menor calidad, y hay
buenas razones para creer que incluso estos resultados exagerar el verdadero efecto del gasto
agregado.

2.1.1.

El análisis de la calidad del estudio tabulados del rendimiento educativo difieren claramente en
la calidad y su potencial para la obtención de resultados sesgados. Dos elementos de calidad,
tanto en relación con la especificación y estimación del modelo, son particularmente
importantes. En primer lugar, la política de educación en los Estados Unidos se realiza
principalmente por los 50 estados independientes, y las consiguientes variaciones en el gasto,
reglamentos, requisitos de graduación, las pruebas, las leyes laborales y la certificación
docente y en las políticas de contratación son grandes. Estas importantes diferencias -que son
también el locus de la mayoría de los actuales debates de política - implica que las
estimaciones del rendimiento del estudiante en los estados deben incluir una descripción de la
política de medio ambiente de escuelas o estarán sujetos a la norma de variables omitidas
sesgo. El sesgo misspecification de modelos que ignoran las variaciones en la política educativa
del Estado (y otros posibles diferencias de estado) se verá agravada por la agregación de la
estimación muestra. En segundo lugar, como se ha señalado, la educación es un proceso
acumulativo, pero la mayoría de los análisis son puramente transversales con sólo contem-
poraneous medidas de insumos. En otras palabras, cuando se mira el rendimiento al final de la
escuela secundaria, muchos análisis incluyen sólo las medidas de los docentes y recursos
actuales e ignorar la docena o más de años anteriores de los insumos. Obviamente, insumos
escolares actuales tienden a ser una medida muy imperfecta de los recursos que entraron en
producción logro final. Este mismeasurement es más fuerte para cualquier niño que cambió las
escuelas a lo largo de su carrera (un ma-jority considerable en los EE.UU.) pero también es
válida para los estudiantes que no se mueven a causa de la heterogeneidad de los profesores
en las escuelas; ver Hanushek et al. (2001a); Rivkin et al. (2001). Incluso si las medidas
contemporáneas eran razonables para representar la secuencia de entradas acumuladas, la
incertidumbre acerca de la interpretación y las implicaciones políticas seguiría siendo el
mismo. Pero hay pocas razones para creer que son buenos sustitutos.

Mientras que los juicios acerca de la calidad del estudio tienen a menudo un elemento
subjetivo, es posible hacer distinciones basadas en directa violación de estos dos problemas.
Empezamos con la cuestión de la medición de la política del medio ambiente. Los Estados
difieren radicalmente en sus políticas, y haciendo caso omiso de las políticas que tienen un
impacto directo va a sesgar los resultados estadísticos si importantes políticas tienden a estar
correlacionadas con el uso de los recursos entre los Estados. Mientras que la dirección de
cualquier sesgo depende de la magnitud y el signo de la correlación, bajo circunstancias
bastante general, la gravedad aumenta con el nivel de agregación de los insumos escolares.

Royal Economic Society 2003

F78 T H E E C O N Ó M I C O J U R N A L [ F E B R U R S

, es decir, cualquier sesgo que tienden a ser más graves si la estimación se realizó a

nivel estatal que si se realizaran en el aula (Hanushek et al., 1996).18 La

COPIAR TABLA 4 F 78
Tabla 4 proporciona una idea de la trama y la importancia del sesgo de variables omitidas
específicos resultantes de la falta de información acerca de las principales diferencias de
política educativa. En esta tabla se considera dos medidas: la relación entre maestros y
alumnos y ex-penditure por alumno. Estas entradas, además de ser importantes para la
formulación de políticas, son en-cluida en un número suficiente de análisis en diversos niveles
de agregación que pueden señalar los posibles sesgos misspecification. Como hemos
comentado anteriormente, el porcentaje global de todas las estimaciones de profesor-alumno
ratios que son estadísticamente sig-nificant y positivo es equilibrado por aquellos que son
estadísticamente significativos y negativos. Pero esto no es cierto para las estimaciones
dependen las muestras tomadas enteramente dentro de un solo estado, donde el entorno
general de política es constante y, por lo tanto, donde cualquier sesgo de omitir las políticas
del estado general es minimizado o eliminado. Para un solo Estado estima, los efectos
estadísticamente significativos son desproporcionadamente negativo. Sin embargo, como las
muestras se extraen a través de los estados, la proporción relativa de pos-itive y
estadísticamente significativas subidas. Para aquellos agregados a nivel estatal, donde los
esperaba el sesgo es mayor, casi dos tercios de las estimaciones son positivas y

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F79

estadísticamente significativa. El patrón de resultados es válido también para las estimaciones


de los efectos de las diferencias de gastos (que tienen más probabilidad de venir de análisis
altamente agregada que involucra múltiples estados).19

Este patrón de resultados es congruente con las expectativas de considerar especifi cación de
sesgos al estado favorable políticas tienden a ser correlacionada positivamente con el uso de
los recursos. La evaluación inicial de los efectos indicados pocas razones para ser optimistas en
cuanto a las políticas de recursos globales. Este refinamiento en la calidad indica que un
número de efectos significativos también puede ser artefactos del muestreo y metodología.

El segundo problema, inadecuada la consideración del carácter acumulativo del proceso


educativo, es otra variante de las especificaciones del modelo. Sobre el nivel de rendimiento
en cualquier punto en el tiempo justo para los recursos actuales es probable que sea muy
engañoso. El enfoque estándar para tratar con esto es la estimación de los modelos de valor
añadido en el que la atención se limita al crecimiento de logros a lo largo de un período de
tiempo limitado (donde el flujo de recursos es también observado). Por concen-trating en el
alcance de logros a lo largo de, digamos, un solo grado, es posible controlar por diferencias de
logro inicial, lo cual será determinado por los anteriores recursos y otros insumos educativos.
En otras palabras, fijo pero no se evaluaban factores son elim-inated.
La tabla 5 muestra los resultados de las estimaciones que consideran que los modelos de valor
añadido para los estudiantes. El panel superior muestra todos esos resultados, mientras que el
panel inferior sigue el enfoque anterior de concentrarse sólo en estimaciones dentro de un
estado en particular. Con el más refinado la investigación de calidad, el número de análisis que
se obtiene es bastante pequeña y selectiva. En estos casos, sin embargo, no hay soporte para
mejoras sistemáticas aumentando el coeficiente alumnos-profesor y la contratación de los
maestros con más formación de postgrado. Los efectos de la experiencia del maestro, son en
gran medida inalteradas desde aquellos para el universo de las estimaciones.

La máxima calidad de las estimaciones indican que los resultados generales previas acerca de
los efectos de los insumos del colegio no fueron simplemente un artefacto de la calidad del
estudio. En todo caso, el conjunto total de las estimaciones se desdibuja la ineficacia de los
recursos puro en las diferencias que afectan a los resultados de los alumnos.

La metodología de Krueger (2002, 2003) adopta un enfoque diferente es el tabu-relativos los


resultados - Grabación de un solo compuesto para la estimación de cada publicación.20 Él
implica que él está haciendo la calidad general sentencias en sus cuadros cuando él contrasta
selectivamente algunas publicaciones con un gran número de estimaciones y dañando
potencialmente problemas estadísticos con un análisis que tiene un pequeño

gasto 19 estudios casi nunca el análisis directo en el rendimiento en diferentes aulas o


escuelas, ya que los datos relativos a los gastos normalmente están disponibles sólo en el nivel
de distrito. Por lo tanto, comienzan a un nivel más agregado de muchos estudios de recursos
reales. Una explicación alternativa de las estimaciones más fuertes con la globalización es que
los estudios desagregados están sujetas a importantes errores en la medición de las variables
de recurso. El análisis en Hanushek et al. (1996) sugiere, sin embargo, que el error de medición
no es la fuerza motriz detrás de la pauta de los resultados.

20 Un enfoque diferenciado para la agregación de los resultados econométricos, denominado


'meta-análisis', ha sido propuesto por Greenwald et al. (1996). En lugar de sólo la tabulación de
los resultados, se proponen análisis estadístico formal. Este enfoque, sin embargo, que
normalmente se considera la hipótesis equivocada política de discus siones (es decir, que
todos los coeficientes estimados para un parámetro determinado son simultáneamente cero).
Además, estos enfoques carecen invariablemente de la información estadística necesaria
cuando se apoyan en acaba de publicar resultados: ver Hanushek (1996).

Royal Economic Society 2003


TABLA 5.

Número de estimaciones y mejores modelos estadísticos (veranos y Wolfe, 1977). Esta


impresión, sin embargo, es muy decepcionante, y los enfoques de tabulación mecánica
simplemente no proporcionan ninguna evaluación de calidad global eficaz.21

Una revisión de las estimaciones disponibles aclara cómo Krueger la tabulación de los
resultados de la relación maestro-alumno difiere: 17 de las 59 publicaciones (29%) contenían
una única estimación del efecto de la relación maestros-alumnos, pero estas estimaciones son
sólo el 6% de las 277 el total de las estimaciones disponibles.22 Krueger quiere aumentar el
peso en estas estimaciones (17 publicaciones) y consecuentemente disminuir el peso sobre el
re-maining 260 estimaciones. Sin embargo, tenga en cuenta que más del 40% de la estimación
único pub-ramal estado utilizar datos agregados, en comparación con sólo el 4% de todos los
presupuestos. En conjunción con ello, la única estimación de publicaciones son más propensos
a emplear estimaciones (estado múltiplo que consistentemente ignorar las diferencias
sistemáticas en las políticas de estado) que las publicaciones con dos o más estimaciones.
Ponderación por publicaciones, más que estimaciones separadas, según Krueger, promueve
fuertemente los pesos estimados de baja calidad que sufren los dos principales problemas de
calidad mencionados anteriormente.

Las consecuencias de los diferentes sistemas de ponderación son quizás más fácil visto
observando el efecto sobre la ponderación de sus propias estimaciones (Card y Krueger,
1992a, b). Cada uno de estos análisis a nivel estatal contribuye una positiva y sta-tistically
estimación significativa de profesor-alumno ratios (aunque, como se ha señalado, la tarjeta y
Krueger (1992b) no debería incluirse porque carece de cualquier medida de la familia

21 una de las principales motivaciones de Krueger (2002) es la afirmación de que las


publicaciones que contengan más esti-compañeros tendrán tamaños de muestra pequeños y,
por lo tanto, suelen tener mayores errores estándar. Los tamaños de la muestra, sin embargo,
no caen en promedio, con el número de estimaciones. El tamaño de la muestra promedio para
las estimaciones en publicaciones con sólo uno es indistinguible del de publicaciones con 8 o
más estimaciones (Hanushek, 2002). La única estimación en Card y Krueger (1992a), por
ejemplo, se basa en el estado a sólo 147 puntos de datos agregados, colocando su tamaño de
muestra utilizado en menos de la mitad de la media de todas las estimaciones de los efectos
de las ratios de alumnos por profesor. Además, si uno toma en serio que los resultados
deberían ser ponderado por el tamaño de la muestra, estos cálculos pueden hacerse
fácilmente en lugar de confiar en la impre-cise ponderación del número de estimaciones en
cada publicación.
Nota 22, para facilitar las comparaciones con Krueger (2003), este debate incluye la estimación
de los efectos de la proporción alumno-profesor en Card y Krueger (1992b) que fue excluido
de las tabulaciones mostradas anteriormente; véase la nota a pie de página 14. Esta
estimación de hecho tiene un enorme impacto en la Krueger cálculos porque se trata de una
publicación citó frecuentemente con una única estimación.

Royal Economic Society 2003

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F81

Antecedentes). Sobre la base de estimaciones disponibles, estas representarían el 0,7% de los


resultados. Esta cifra se eleva al 3,4% sobre la base de la ponderación por publicaciones. Pero,
sobre la base de citas, estas estimaciones van a un asombroso 17% de la ponderación de los
hallazgos; ver Hanushek (2002).

Las consideraciones que se hacen explícitos de calidad en el panel inferior del cuadro 5 en
realidad eliminar todas las publicaciones y las estimaciones Krueger identifica como prob-
lematic (es decir, los nueve publicaciones con ocho o más estimaciones) -aunque son
eliminadas por motivos de calidad estadística y no porque simplemente pro-rectamente
demasiadas estimaciones separadas de tamaño de clase efectos. Ese grupo incluye los veranos
y Wolfe (1977) estiman que, junto con una serie de otras igualmente análisis de alta calidad de
los logros de los estudiantes. Pero, lo más importante, también elimina las 11 estimaciones
muy problemático que provienen de las estimaciones del efecto de profesor-alumno ratios
usando el análisis a nivel estatal que ignoran las diferencias en el entorno de la política estatal.
Estas últimas estimaciones tienen un impacto desproporcionado en cada uno de sus cuadros, a
pesar de que son probablemente los más pobres las estimaciones del efecto del tamaño de la
clase sobre el rendimiento de los estudiantes.

En suma, Krueger es re-análisis de las pruebas econométricas logran resultados diferentes


haciendo hincapié en las estimaciones de baja calidad. Las estimaciones son de baja calidad
dem-onstrably sesgada hacia el logro de efectos positivos significativos de reducción de
tamaño y clase de gasto añadido. Su análisis intenta sugerir que uno está atrapado en los
cuernos de un dilema: o bien el peso fuertemente las estimaciones a partir de las nueve
publicaciones con la mayoría de las estimaciones (como en las estimaciones generales del
cuadro 3) o peso fuertemente el estado de baja calidad estimaciones agregadas (como él
favores). En realidad, hay otra opción disponible: peso ni fuertemente porque ambos sufren
graves problemas estadísticos, tal como se muestra en la parte inferior de la Tabla 5. En su
lugar, concentrarse en los estudios de mayor calidad.
Sorprendentemente, simplemente vuelva a la ponderación por la técnica de Krueger ofrece
todavía débil apoyo a las políticas de reducción de tamaño de clase global que Krueger
defensores. La mayoría de las estimaciones, no importa cuán tabuladas, no es
estadísticamente diferente de cero para los niveles convencionales. Incluso la ponderación por
publicaciones en lugar de las estimaciones, las tres cuartas partes de las estimaciones son
insignificantes o tienen el signo equivocado, y apenas más de la mitad de los resultados indican
un efecto positivo de las clases más pequeñas. Así pues, aun cuando la ponderación a las
estimaciones de baja calidad, que sólo puede lograr su propósito retórico de subrayar que "el
tamaño de la clase es sistemáticamente relacionada con el rendimiento estudiantil" dando
igual peso a estadísticamente insignificante y resultados estadísticamente significativos y
desechando las estimaciones donde el signo de insignificante esti-compañeros no está
disponible.

2.1.2. Especificación econométrica general

una cuestión clave en la consideración de los resultados de los análisis de la función de


producción educativa es si proporcionan la orientación necesaria para fines políticos.
Concretamente, mientras que muestran un patrón de asociación, es razonable inferir que
identificar relaciones causales?

La cuestión es particularmente importante cuando se ponen en el contexto de la política


educativa. Las asignaciones de recursos son determinados por una compleja serie de políticas
y opciones de comportamiento en las escuelas y los padres. El carácter de estas opciones

Royal Economic Society 2003

F82 T H E E C O N Ó M I C O J U R N A L [ F E B R U A R y

podría influir en las estimaciones de la eficacia de los recursos. Consideremos, por ejemplo, el
resultado de la asignación sistemática de recursos escolares en un compen-satory forma. Si
baja el logro de los niños les dan recursos extra- dicen que las clases pequeñas, instrucciones
especiales de recuperación, tecnología mejorada y similares - hay un evidente problema de
identificación. Los problemas de este tipo sugieren tanto la atención en la interpretación de los
resultados y la necesidad de enfoques alternativos.

Antes de continuar, sin embargo, es importante ser más precisos acerca de la naturaleza y de
la potencial importancia de estas consideraciones. La responsabilidad de la financiación de las
escuelas en los Estados Unidos tiende a ser en promedio aproximadamente divididos por igual
entre los Estados y las localidades con el gobierno federal sólo aporta el 7% del gasto total.
Gran variación en los niveles de financiación y fórmulas sin embargo existe entre estados. En la
mayor parte de la financiación estatal de escuelas en los Estados Unidos, la distribución del
gasto no dependen del desempeño real de cada uno de los estudiantes, pero en su lugar
(inversamente) sobre la riqueza y los ingresos de la comunidad. En los modelos de logro que
incluyen los antecedentes familiares términos pertinentes (tales como educación, ingresos o
riqueza), esta distribución de los recursos del estado simplemente sería aumentar las
correlaciones entre las variables exógenas, pero no sugieren ningún obvios problemas de
simultaneidad para el logro de los modelos. De hecho, mientras que la naturaleza de la
financiación compensatoria a menudo motiva algunas preocupaciones, incluso esta correlación
de antecedentes y recursos no es clara. Gran parte de los fondos para el debate en los Estados
Unidos ha girado en torno a la preocupación de que las comunidades más ricas y los padres
pueden permitirse el lujo de gastar más dinero para las escuelas, y de hecho casi toda la
fórmula de financiación estatal están diseñados para contrarrestar esta tendencia, al menos
parcialmente. Así, las correlaciones reales de recursos y antecedentes familiares a menudo no
son muy altas.23

En el nivel individual de cada estudiante, las correlaciones con agregado recursos del distrito a
través de cualquiera de las fórmulas de asignaciones o las decisiones de la comunidad no son
una causa importante de preocupación. Las asignaciones de aulas individuales, sin embargo,
pueden ser un motivo de preocupación. Por ejemplo, dentro de una escuela, de bajo
rendimiento puede ser colocado en clases más pequeñas, sugiriendo la posibilidad de la
simultaneidad. Cualquiera de estos problemas debe ser mejorado en gran medida por los
modelos de valor añadido, que consideran los logros previos del estudiante directamente. La
única preocupación se convierte entonces en las asignaciones hechas sobre la base de logros
no se evaluaban las influencias que no tienen nada que ver con logros previos.

Especialmente en el área de análisis de tamaño de clase, una variedad de enfoques no ir más


allá para intentar identificar los efectos causales, y los resultados son bastante variadas. Hoxby
(2000) utilizó con tendencias de las variaciones en el tamaño de las cohortes de nacimiento
para identificar cambios exógenos en el tamaño de la clase en pequeños pueblos de
Connecticut. Los cambios en los tamaños de cohorte, junto
23 La distribución de fondos del Estado varía según los estados, pero un patrón bastante
común es que la mayor parte de los fondos del estado se distribuyen inversamente con la
riqueza de la propiedad de la comunidad. Debido a la riqueza de la comunidad incluye el valor
de la propiedad comercial e industrial dentro de una comunidad, la correlación de la riqueza
de la comunidad con los ingresos de los residentes locales tiende a ser baja y a veces incluso
negativo.

Royal Economic Society 2003.

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F83

con el lumpiness de clases en pequeños distritos escolares, puede proporcionar las variaciones
en el tamaño de la clase que no estén vinculados a otros factores.24 Otras estimaciones
también han considerado explícitamente los factores exógenos que afectan el tamaño de clase
en el contexto de los instrumentos mentales de estimadores de variables para los efectos del
tamaño de la clase (Akerhielm, 1995; Boozer y Rouse, 1995). Lamentablemente, la
identificación de los factores determinantes de la exógena realmente el tamaño de la clase, o
la asignación de recursos de manera más general, es suficientemente raro que otros
compromisos en el modelado de datos y con frecuencia son necesarios. Estos coinci-dental
compromisos pone en peligro la capacidad de obtener estimaciones de los recursos limpia los
efectos y puede limitar la generalizabilidad de los resultados. Rivkin et al. (2001), empleando
un enfoque de espíritu similar al utilizado por Hoxby, hacer uso de exo-genous variaciones en
el tamaño de las clases en las escuelas de Texas a través de varias cohortes de diferentes
tamaños.25 que encuentre alguna clase de pequeño tamaño, pero los efectos adversos varían
significativamente entre los distintos grados y especificaciones.

Estos enfoques alternativos producen resultados inconsistentes, tanto en términos de tamaño


de la clase de efectos y en términos de los efectos de las metodologías alternativas. Los
resultados en cada uno de estos análisis tienden a ser muy sensibles a los procedimientos de
estimación y a las especificaciones del modelo. Además, son incompatibles en términos de
significación estadística, patrón, el grado y la magnitud de los efectos. Como grupo, los
resultados son más propensos a ser estadísticamente significativa con el signo esperado de los
presentados anteriormente para todas las estimaciones, pero la estimación típica (para
estimaciones estadísticamente significativo) tiende a ser muy pequeños en magnitud (véase
infra).
2.2. Pruebas econométricas internacional

la evidencia de otros países distintos de los Estados Unidos es potencialmente importante para
una variedad de razones. Otros países tienen diferentes estructuras institucionales, tan
diferentes hallazgos podrían ayudar a identificar la importancia de la organización y, en
general, en los incentivos. Además, otros países tienen a menudo mucho diferentes niveles de
re-sources y exhiben mayor variación en el uso de los recursos, ofreciendo la posibilidad de
comprender mejor la importancia de las diferencias en los recursos puro. Por ejemplo, una
explicación de la falta de relación entre los recursos y el rendimiento en los EEUU es sus
escuelas hay generalmente operan en una zona de grave disminución de la productividad
marginal, colocando la mayoría en el "plano de la curva". Así, mediante la observación de las
escuelas con muy diferentes niveles de recursos, sería posible distinguir entre los aspectos
tecnológicos de la relación de producción y otras posibles interpretaciones de la evidencia
como imprecisas, incentivos para los estudiantes y profesores.

24 Mientras que pertenecen directamente a la evidencia internacional a continuación en un


enfoque relacionado Angrist y Lavy (1999) nota que Maimónides' la regla exige que Israel no
puede exceder de cuarenta estudiantes de clases, de manera que, nuevamente, el lumpiness
de aulas pueden llevar a grandes cambios en el tamaño de la clase, cuando el número de
alumnos en una escuela enfoques múltiplos de 44 (y el tamaño de la clase preferida es
superior a 44). Formular un criterio de discontinuidad de regresión para identificar los efectos
del tamaño de la clase, pero muchos de sus estimaciones también utilizan la variación en el
tamaño de clase distinta de la generada por las discontinuidades. Del mismo modo, Caso y
Deaton (1999) se concentran en el impacto de blanco la toma de decisiones en las escuelas
negras en Sudáfrica (donde la endogeneidad de las políticas compensatorias es probablemente
menos importante). Concluyen que las clases más pequeñas tienen un impacto sobre los
resultados de los estudiantes en ese escenario.

25 La naturaleza de este análisis es que se examinan más adelante en la sección sobre la


calidad de los maestros. Royal Economic Society 2003.

F84 T H E E C O N Ó M I C O J U R N A L [ F E B R U R S
mientras que la evidencia internacional ha sido más limitado, es probable que esta situación se
invierta de manera rentable en el futuro. Un problema fundamental ha sido menos disponible
el rendimiento de datos para distintos países, pero esta falta de información está siendo
enmendada. Como los datos de los resultados estudiantiles sean más abundantes,
permitiendo la investigación de valor añadido por los maestros en las escuelas en diferentes
entornos, la evidencia internacional debieran crecer en importancia.

2.2.1. Los países en desarrollo

análisis existentes en los países menos desarrollados han mostrado una incongruencia similar
de efectos como recurso estimada que se encuentra en los Estados Unidos. Si bien estas
estimaciones proceden normalmente de propósito especial analiza y con frecuencia no están
publicados en revistas técnicas, proporcionan información sobre el uso de los recursos en
niveles muy diferentes de apoyo. La Tabla 6 proporciona evidencia sobre los efectos de las
estimaciones de recursos completada por 1990.26 dos facetas de estos datos en comparación
con los anteriores datos de EE.UU. destacan: (i) en general, una minoría de las estimaciones
disponibles sugieren mucha confianza que los recursos identificados influyen positivamente en
el rendimiento de los estudiantes; (ii) hay gener-aliado ligeramente más fuerte apoyo a estas
políticas de recursos que la existente en EE.UU. Analiza. Así pues, los datos sugieren que la
importancia de los recursos puede variar con el nivel de recursos, una presunción natural. No
obstante, la evidencia no es con-exclusiva que la pura las políticas de recursos se puede
esperar que tenga un efecto significativo en los resultados de los alumnos.

2.2.2. Los países desarrollados

las pruebas en los países desarrollados de fuera de los Estados Unidos es más difícil com-pila.
La revisión por Vignoles et al. (2000) apunta a un pequeño número de análisis fuera de los
Estados Unidos y muestra alguna variación similar al que ya se les informó que entre las
estimaciones de otros lugares. Dustman et al. (2003) proporcionan un conjunto adicional de
estimaciones.

TABLA 6

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F85
un conjunto de estimaciones coherentes para la TIMSS datos se presentan en Hanushek y
Luque (2003). Se emplean los datos sobre las variaciones en las puntuaciones en las escuelas
dentro de los distintos países. Los 17 países con datos completos para los niños de 9 años y los
33 países con datos completos de 13 años de edad son ponderados hacia los países más
desarrollados, pero no son países pobres. Como se muestra en la Tabla 7, se encuentran pocas
pruebas de que ninguna de las medidas de recursos estándar para las escuelas están
relacionadas con las diferencias en las puntuaciones de matemáticas dentro de los países,
aunque la mayoría del tamaño de la clase los resultados para el grupo de edad más joven
tienen el signo negativo esperado. Una extensión de la estimación considera la posibilidad de
compensar la asignación de estudiantes a distintos tamaños de clase. Específicamente, la
estimación para las escuelas rurales con una sola aula, donde no es factible la colocación
compensatoria - da poco cambio en los resultados globales.27 La falta de recursos
significativos efectos cuando se corrigió para la selección no difieren de los hallazgos de Angrist
y Lavy (1999) y del caso y Deaton (1999), en la que se encuentre más recursos significativos
efectos en Israel y Sudáfrica (véase la nota 24 para más detalles).

Además, no hay ninguna evidencia en este trabajo constante que hay diferentes efectos de
recursos al nivel de ingresos del país o a nivel de los recursos. Así pues, contrariamente a las
conclusiones de Heyneman y Loxley (1983), las escuelas no parecen relativamente más
importantes para los países más pobres.

Woessman (2000, 2001) se centra en las diferencias nacionales en la cruz TIMSS mathe-matics
y ciencia puntuaciones y llega a la conclusión de que la estructura institucional importante
para cuestiones de logro. Mediante la agrupación de las puntuaciones de la prueba individual
de cada estudiante a través de países y estimar modelos que incluyen tanto la escuela y caract.
nacional-teristics, él encuentra pruebas que sugieran que la cuantía de la competencia de
escuelas privadas y el importe de la descentralización de la toma de decisiones de los
individuos de las escuelas tienen importantes efectos beneficiosos, mientras que la fuerza
sindical es perjudicial y estándar de la diferencia de recursos entre los países no están
claramente relacionados con el rendimiento de los estudiantes. El número limitado de
observaciones para las instituciones nacionales, sin embargo, deja cierta incertidumbre acerca
de las estimaciones y las llamadas para la replicación en otras muestras que permitan, por
ejemplo, las variaciones dentro de los distintos países en las principales características
institucionales.

3. Proyecto Estrella y datos experimentales28


una forma diferente de pruebas- que desde la asignación aleatoria experimento -
recientemente ha sido ampliamente distribuido en los debates acerca de la reducción del
tamaño de la clase. En la evaluación de los efectos de los recursos, la preocupación por la
selección sigue siendo con frecuencia, incluso en los enfoques instrumentales. Siguiendo el
ejemplo de la medicina, una gran escala de investigación experimental en el estado de
Tennessee a mediados de la década de 1980 (proyecto de estrella) persigue la eficacia de la
reducción de tamaño de clase. Los experimentos de asignación aleatoria, en principio, tienen
un considerable atractivo. La idea subyacente es que podemos obtener evidencia válida acerca
de los efectos de un determinado tratamiento bien definidos por

27 una comprobación adicional analiza si las clases más pequeñas en un determinado grado
parecen ser asignados sobre indemnización compensatoria o motivos elitista y encuentra
países divididos sobre este punto. El impacto de tales consideraciones sobre los efectos
estimados sin embargo es mínima.

28 Para un examen más amplio del proyecto estrella, ver Hanushek (1999a, b). Royal Economic
Society 2003

TABLA 7.

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F87

asignar aleatoriamente los sujetos a los grupos de tratamiento y de control, eliminando los
posibles efectos contaminantes de otros factores y permitir conceptualmente clea-ner el
análisis de los resultados de interés a lo largo de estos grupos. Con observaciones derivadas de
las variaciones naturales en la selección individual, uno debe ser capaz de dis-tinguish entre el
tratamiento y otras diferencias que podrían afectar directamente a los resultados observados y
que podrían estar relacionados con si o no recibir el tratamiento. Aleatorización pretende
eliminar cualquier relación entre la selección dentro de un programa de tratamiento y otros
factores que podrían afectar los resultados. (Sin embargo, véase la atención proporcionada en
Todd y Wolpin (2003)).

Proyecto estrella fue diseñado para comenzar con los estudiantes de kindergarten y a seguirlos
durante cuatro años. Los tres tratamientos fueron inicialmente incluidos: Clases pequeñas (13
a 17 estudiantes); las clases regulares (22 a 25 estudiantes); y clases regulares (22 a 25
estudiantes) con un asistente de maestra. Las escuelas fueron solicitados para la participación,
con la estipulación de que cualquier escuela que participen deben ser lo suficientemente
grandes como para tener al menos una clase en cada grupo de tratamiento. La muestra inicial
incluía 6.324 alumnos de kindergarten, dividido entre 1.900 en clases pequeñas y 4.424 en las
clases regulares. (Después del primer año, los dos tratamientos fueron las clases regulares
combinado eficazmente, porque no hubo diferencias percibidas en el rendimiento estudiantil.
El resultado sobre la eficacia de ayudantes ha recibido prácticamente ninguna atención.) La
muestra inicial incluyó 79 escuelas, aunque esta tasa disminuyó a 75. Los primeros 326
profesores creció ligeramente para reflejar el aumento del tamaño de la muestra en grados
posteriores, aunque, por supuesto, la mayoría de los profesores son nuevos para el
experimento en cada nuevo grado.

Los resultados del proyecto STAR experimento han sido ampliamente publicitada. El resumen
más simple es que:

1. Los alumnos en clases pequeñas funcionan mejor que aquellos en clases regulares o clases
regulares con ayudantes comenzando en kindergarten;

2. La ventaja de rendimiento de kindergarten clases pequeñas amplía una pequeña cantidad


en el primer grado, pero luego bien sigue cuantitativamente la misma (lectura) o estrecha
(matemáticas) por tercer grado; y,

3. Teniendo en cada categoría por separado, la diferencia en el rendimiento entre los


pequeños y clases regulares es estadísticamente significativa.

Este resumen refleja el típico reporting, centrándose en las diferencias en el rendimiento en


cada grado y llegar a la conclusión de que las clases pequeñas son mejores que las grandes, por
ejemplo, Aquiles y Finn (1990); Mosteller (1995). Pero, ignora el hecho de que bajo el régimen
común de discusiones conceptuales que uno esperaría las diferencias en el rendimiento de
ensancharse a través de los grados porque siguen para obtener más recursos (clases más
pequeñas) y que deberían seguir añadiendo una ventaja. Esta cuestión fue planteada por
primera vez por la actualidad PRAIS (1996), que enmarca el debate en términos de valor
añadido. Según Krueger (1999) demuestra la clase pequeña ventaja es casi ex-clusively
obtenidos en el primer año de estar en una clase pequeña, lo que sugiere que las ventajas de
las clases pequeñas no son generalizables a cualquier otros grados.

Importante, este patrón de efectos está en contradicción con la retórica habitual sobre las
clases pequeñas permite más instrucción individualizada, permitiendo la mejora de las
interacciones del salón de clase, reduciendo las interrupciones y similares. Si estos son los
cambios importantes, clases pequeñas debería conferir continuos beneficios en ninguno de los
grados
Royal Economic Society 2003

F88 T H E E C O N Ó M I C O J U R N A L [ F E B R U R S

donde están empleados. En cambio, los resultados parecen más acordes con la soci-alisation o
introducción en el comportamiento de la clase - uno de los efectos del tiempo que implica la
reducción del tamaño de la clase más general de las políticas a través de diferentes grados no
será efectiva - o con problemas sencillos en la asignación al azar y la apli-cación del
experimento.

Las mejoras en el desempeño real de la reducción en el tamaño de las clases experimentales


fueron relativamente pequeños (menos de 0,2 desviaciones estándar de la prueba de
rendimiento), es especialmente cuando las ganancias se comparan con la magnitud de la
reducción del tamaño de clase (alrededor de 8 estudiantes por clase). Por lo tanto, incluso si el
proyecto estrella es tomar a su valor nominal, tiene implicaciones políticas relativamente
limitado.

Si bien el enfoque experimental tiene un gran atractivo, la aplicación real en el caso del
proyecto STAR introduce una incertidumbre considerable en estos esti-compañeros
(Hanushek, 1999b). La incertidumbre surge lo más importante de las preguntas sobre la
calidad de la asignación al azar a lo largo del tiempo. En cada año del experimento, no fue un
considerable desgaste de los grupos de tratamiento del año anterior, y estos estudiantes
fueron reemplazados con los nuevos estudiantes. El primer grupo experimental, empezando
en el kindergarten, el 48% permaneció en el experimento para la totalidad de cuatro años.
Ninguna información, como pretest puntuaciones antes de la entrada en el experimento, está
disponible para evaluar la calidad de la asignación al azar del estudiante para la muestra
experimental inicial o para las siguientes adiciones. A lo largo de los cuatro años del
experimento no era sustancial y no aleatoria de traspaso del grupo de tratamiento (alrededor
del 10% de la pequeña clase de tratamiento en grupo en los grados 1 a 3). También hay
considerables, no prueba al azar teniendo a lo largo de los años del experimento, superiores al
10% en algunas pruebas. Lo que es más importante, los resultados dependen
fundamentalmente de la elección de los maestros. Mientras que los maestros fueron
asignados aleatoriamente a los grupos de tratamiento, hay poca descripción de cómo se hizo.
Tampoco es fácil para proporcionar cualquier análisis fiable de la asignación docente, porque
sólo unos pocos descriptores de los profesores se encuentran en los datos y porque hay pocas
razones para creer que se miden adecuadamente las diferencias en la calidad de los
maestros.29 las escuelas mismas fueron auto-seleccionados y claramente no son aleatorios.
Las escuelas pequeñas se les impide el estudio, como lo fueron las escuelas que no estaban
dispuestos a proporcionar su propia financiación parcial para cubrir el costo total. (Este tema
también es importante, porque el experimento estrella excesivamente muestreados y escuelas
de las minorías urbanas donde la respuesta al programa está pensado para ser mayor.)30 El
resultado neto de cada uno de estos efectos es difícil de determinar, pero hay indicios de que
el impacto total es exagerar el impacto de la reducción de tamaño de la clase (Hanushek,
1999b). Hoxby (2000) señala, además, que los maestros y administradores, porque sabían que
estaban participando en un experimento que podría tener importantes implicaciones para los
recursos futuros, su comportamiento en el experimento podría verse afectado.

29 Los datos del profesor son la raza, el género, la experiencia docente, el grado más alto, y su
posición en el escalafón de Tennessee. Aunque no hay información sobre el efecto de la
Escalera de carrera posición sobre el rendimiento de los estudiantes, como se ha resumido, en
ninguna de las otras medidas han demostrado ser indicadores fiables de la calidad. Para las
estimaciones de la magnitud de la variación en la calidad de los maestros, véase más abajo.

30 de Krueger (1999) identifica significativamente mayores efectos para los estudiantes


desfavorecidos, que luego serán sobrepeso en programa de cálculo promedio de los efectos
del tratamiento.

Royal Economic Society 2003

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F89.

La importancia de la metodología no merecen atención. Debido a cues-tiones sobre la eficacia


y la causalidad en el análisis de los colegios, el uso de la asignación aleatoria experimentación
tendría gran valor. Como Todd y Wolpin (2003) señalan, la asignación al azar los experimentos
no responda a todas las cuestiones de política. No obstante, parecería natural para desarrollar
una amplia gama de experimentos que podrían comenzar a proporcionar información acerca
de qué tipo de generalizaciones pueden ser hechas.
El experimento uno limitado y deficiente en Tennessee no pueden ser tomadas como
proporcionar la evidencia definitiva necesaria para cambios de política que cuestan miles de
millones de dólares anualmente. En el mejor de los casos, se proporciona evidencia sobre el
impacto potencial de grandes cambios en el tamaño de la clase aplicado a los estudiantes de
kindergarten, y hay evidencia directa de que estos hallazgos no generalizar a otros grados y
otras situa-ciones.

4. Interpretar el recurso evidencia

una amplia gama de análisis indican que, en general, las políticas de recursos no han
conducido a mejoras tangibles en el rendimiento de los estudiantes. Es importante entender
qué es y no es implícito en esta conclusión. Primero, no significa que el dinero y los recursos no
importa. Es evidente que existen situaciones en las que las clases pequeñas o recursos
añadidos tienen un impacto. Es sólo que no hay una buena descripción de dónde y cuándo se
producen estas situaciones está disponible, de modo que recursos amplias políticas tales como
legislado desde los gobiernos centrales pueden golpear algunos buenos usos pero también
golpeó las malas utilizaciones que llevan generalmente a compensar los resultados. En
segundo lugar, esta declaración no significa que el dinero y los recursos no importa. En su
lugar, como se describe a continuación, alterado conjuntos de incentivos podrían mejorar
drásticamente el uso de los recursos.

Las pruebas sobre los recursos es notablemente coherentes entre los países, tanto de-veloped
y en desarrollo. Ha habido resultados marcadamente diferentes para ciertos subconjuntos de
países, temas de qué tipo de generalizaciones surgirán naturalmente eran posibles. Tales
conflictos no parecen especialmente importantes.

Existe una tendencia por parte de los investigadores y los encargados de formular políticas a
tomar un solo estudio y generalizar ampliamente de él. Por encontrar un análisis que sugiere
una relación entre ficant importantes de un recurso específico y el rendimiento de los
estudiantes, concluyen que el uso de los recursos, mientras que otros podrían no ser
productivo, el uso que se habría identificado, e.g, Grissmer et al. (2000). Si es así, esto conduce
a un número de preguntas importantes. ¿Por qué es que las escuelas no han podido emplear a
esa política? Es sólo que no tienen la información que el investigador tiene? Por supuesto que
parece improbable ya que las escuelas de hecho experimento constantemente con una
variedad de enfoques y modelos de recurso. Alternativamente, en consonancia con la
discusión siguiente, parece más probable que las escuelas tienen pocos incentivos para buscar
y emplear programas que constantemente se refieren a los logros de los estudiantes.
Es precisamente esta tendencia a generalizar demasiado a partir de pruebas limitadas de que
subyace en la búsqueda de múltiples fuentes de evidencia sobre la eficacia de diferentes re-
uso de fuentes. Cuerpo de evidencia más amplia que ofrece poco apoyo para las políticas de
entrada que siguen siendo el método más común para la toma de decisiones.

Royal Economic Society 2003.

F90 T H E E C O N Ó M I C O J U R N A L [ F E B R U A R y

5. La calidad de los maestros

comenzando con la Coleman Informe sobre la Igualdad de Oportunidades Educativas (Coleman


et al., 1966), muchos han argumentado que las escuelas no importan y que sólo las familias y
los compañeros pueden afectar al rendimiento. Lamentablemente, ese informe y la
subsiguiente inter-pretations tienen generalmente confundido 'measurability' con efectos
reales. Específica-ically, tal como se ha descrito anteriormente para el trabajo más reciente,
características de las escuelas y en las aulas no estaban estrechamente relacionados con el
rendimiento de los estudiantes - que conducen a la afirmaciï que las escuelas no importan.
Esta conclusión no sólo condujo a investigaciones extensivas posteriores pero también
probablemente más que cualquier otra cosa a prevalecer la opinión de que las diferencias
entre las escuelas no son muy importantes.

La investigación extensa en los últimos 35 años ha dejado claro que hay diferencias muy
importantes entre profesores y, por ende, las escuelas. Este hallazgo, por supuesto, no es
sorprendente que muchos padres que son conscientes de las diferencias en la calidad de los
docentes pero eludido muchos investigadores.

La simple definición de la calidad de los maestros utilizada aquí es una medida basada en la
salida que se centra en el rendimiento de los estudiantes, en lugar de las más típicas medidas
de entrada en función de las características del profesor y la escuela. Los maestros de alta
calidad son aquellos que consistentemente obtienen ganancias superiores a lo esperado en el
rendimiento de los estudiantes, mientras que la baja calidad de los maestros son aquellos que
consistentemente obtener ganancias inferiores a los esperados. Con esa definición, las
variaciones en la calidad de los maestros pueden obtenerse mediante la estimación de los
modelos de efectos fijos del rendimiento del estudiante tras acondicionamiento al entrar en el
STU-dent rendimiento y otros factores que afectan el alcance de logros. Cuando se ha utilizado
este enfoque en el estudio de escuelas norteamericanas, grandes variaciones en el
rendimiento se han descubierto, por ejemplo, Hanushek (1971, 1992); (1975); Murnane
Murnane y Phillips (1981); Armadura et al. (1976); Rivkin et al. (2001)31 El único estudio
relacionado internacionalmente pertenece a las zonas rurales de Brasil, donde igualmente
grandes diferencias entre los docentes se encuentran (Harbison y Hanushek, 1992).

La magnitud de las diferencias en la calidad de los maestros es impresionante. Mirar el rango


de calidad para docentes en una sola gran distrito urbano, profesores cerca de la parte
superior de la distribución de calidad puede conseguir todo un año de aprendizaje adicionales
fuera de sus alumnos en comparación con aquellas que están cerca de la parte inferior
(Hanushek, 1992).32 que es un buen maestro obtendrá una ganancia de 1½ equivalentes de
nivel de grado, mientras que un mal profesor conseguirá ½ año para un solo año académico.

Un segundo conjunto de estimaciones proviene de los trabajos recientes sobre los estudiantes
en Texas (Rivkin et al., 2001). El análisis siguiente varias cohortes enteras de estudiantes y
permisos

31 En general la formulación de efectos fijos, identificación e interpretación de los efectos de


los docentes y de la escuela es, sin embargo, complicado. Por ejemplo, maestro de escuela,
efectos adversos y efectos de pares en el aula no se identifican por separado si las
estimaciones proceden de una única sección transversal de los maestros. Hanushek (1992), sin
embargo, demuestra la coherencia del profesor individual de los efectos entre los grados y los
años de escuela, lo que indica que las estimaciones de las diferencias se relacionan
directamente con la calidad de los maestros y no la mezcla específica de los estudiantes y la
interacción entre profesor y alumnos. Rivkin et al. (2001) y grado escolar separar los efectos
fijos y observar la consistencia de efectos maestros en diferentes cohortes, así aislar el impacto
de los maestros.

32 Estas estimaciones se consideran modelos de valor añadido con los modelos familiares y
parentales. En la muestra comprende únicamente los estudiantes minoritarios de bajos
ingresos, cuyo promedio de logro en la escuela primaria es inferior al promedio nacional. Las
comparaciones dado comparar los maestros en el percentil 5 con aquellos en el percentil 95.
Royal Economic Society 2003.

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F91

varias observaciones de distintas clases con un profesor. Miramos sólo las variaciones en el
rendimiento de las diferencias en la calidad de los maestros en una escuela típica y no
considerar cualquier variación entre escuelas, haciéndolos mucho un límite inferior a efectos
docentes. La variación en la calidad de los maestros es grande: moviéndose de un profesor
promedio a uno en el percentil 85 de la calidad de los maestros (es decir, pasando de una
desviación estándar en la calidad de los maestros) implica que los alumnos del profesor haría
subir más de 4 categorías de percentiles en el año determinado. (Para una variedad de
razones, estos límites inferiores son estimaciones de las variaciones en la calidad de los
maestros. Cualquier variación en la calidad entre las escuelas podría añadir a esto. Además, las
estimaciones se basan en una serie de supuestos conservadores que todos tienden a conducir
a subestimar-ción sistemática de la maestra diferencias.)

Una tercera indicación de gran magnitud se encontraron en el proyecto STAR resultados. El


promedio de la diferencia en el rendimiento de los estudiantes en pequeños jardines infantiles
ha sido el foco de atención, pero en realidad los resultados difirieron ampliamente por aula.
Sólo en 40 de los 79 colegios hizo el rendimiento de kindergarten en la pequeña aula supere el
que en las aulas regulares (con y sin ayudantes). La interpretación más sencilla de esta
heterogeneidad es que las variaciones en la calidad de los maestros son extraordinariamente
importantes.

El profesor las diferencias estimadas en Texas son enormes en comparación con ninguna de las
estimaciones para medir los atributos de los docentes y de la escuela. Por ejemplo, una
desviación estándar de reducción en el tamaño de la clase implica una desviación estándar de
0,01-0,03 mejora-miento en el logro estudiantil (Rivkin et al., 2001). El límite inferior de la
estimación de la calidad de los maestros resumidos implica un cambio de una desviación
estándar en la calidad conduce a una desviación estándar de 0.11 aumento de logro. El hecho
de que incluso el límite inferior de la estimación de la calidad de los maestros efectos enanos
bien el tamaño de las clases o los efectos experimentados encargados de formular políticas
deberían dar pausa.

Estas estimaciones de la calidad del maestro también puede estar relacionada con el
argumento popular que los antecedentes familiares son sumamente importantes y que las
escuelas no pueden esperarse para compensar la mala preparación del hogar. Las últimas
estimaciones de los maestros sugieren que tener cinco años de buenos maestros en una fila
(una desviación estándar por encima de la media, o en el 85 percentil) de calidad por-venir el
progreso medio déficit entre niños de bajos ingresos (los de almuerzo gratis o a precio
reducido) y otras de las familias de mayores ingresos. En otras palabras, maestros de alta
calidad puede compensar el déficit típico que vemos en el pre-Reparación de niños
procedentes de entornos desfavorecidos.

No tendemos a observar estos déficits desapareciendo, sin embargo, porque el actual sistema
educativo no garantiza ningún rayas de tan alta calidad de docentes - especialmente para
estudiantes desfavorecidos. De hecho, actualmente, es probable que el típico estudiante tiene
una racha de mala maestros -con el logro simétrica pérdidas - como una racha de buenos
maestros.

6. Las alternativas de política

mucho del análisis económico se basa en la presunción de que el mayor gasto produce
mejores resultados. Así, muchas personas se sorprenden al encontrar evidencia de que los
recursos escolares no están estrechamente relacionados con el rendimiento de los
estudiantes. De hecho, una variedad de

Royal Economic Society 2003

F92 T H E E C O N Ó M I C O J U R N A L [ F E B R U A R Y

mecanismos podrían empujar conceptualmente las escuelas hacia una mejor utilización de los
recursos. Sin duda, los padres se preocupan por el rendimiento de sus hijos. Las presiones
políticas democráticas podrían obligar a responder las acciones del gobierno. Ubicación del
hogar deci siones permiten que las familias cierta latitud para seleccionar las escuelas que
están funcionando bien.

Pero este no es un mercado libre de fricciones con consumidores bien informados que de-
cisions con información perfecta. Estamos considerando el gobierno la prestación de un
servicio cuya calidad es difícil de juzgar. Mover la residencia o forzar un mejor desempeño
gubernamental en una determinada área de servicio es difícil y costoso. Además, con
frecuencia es difícil separar la calidad de la escuela, desde la calidad de los estudiantes.
Sabemos que los padres, así como a estudiantes de ejercer una poderosa influencia en el logro
de los alumnos. A fin de hacer juicios de calidad, es ne-cessary para separar la escuela del
nonschool influencias. Los padres pueden gener-aliado decir las diferencias entre los maestros
diferentes dentro de una misma escuela, pero comparando la calidad media de los maestros
en una escuela a los de otro es una tarea más difícil. Es especialmente difícil porque la decisión
de elegir la escuela residencial y a menudo implican un elemento de clasificación a lo largo de
líneas socioeconómicas y, en promedio, a lo largo de líneas de preparación del estudiante.
Convencionalmente definido "buenas escuelas" son a menudo las escuelas con los estudiantes
mejor preparados entrar en ellos, pero no necesariamente aquellos donde el valor añadido de
la escuela es particularmente elevada y viceversa para 'las malas escuelas'.

El contraste más claro en las perspectivas de política es política entre la entrada y la salida, o
incentivo, políticas. En los Estados Unidos y en otros lugares, por ejemplo, un muy popular
reciente política está financiando o exigir clases más pequeñas. Pero como la evidencia indica,
este es un proceso costoso y generalmente política improductiva.

En reconocimiento de la importancia de la calidad del personal docente, una variedad de


recomenda-ciones y las iniciativas de política que se han introducido. Lamentablemente, las
propuestas más populares del momento en los Estados Unidos tendían a disminuir la calidad
de los maestros, en lugar de mejorarla. La idea que ha sido recogida por nosotros los
encargados de formular políticas en todos los niveles es aumentar los requisitos para ser un
maestro. La idea es simple: si podemos insistir en mejor preparados y más capaces profesores,
aumentarán necesariamente la calidad y el rendimiento de los estudiantes responderán. Este
argumento -al menos como apli-carse - demuestra como incorrecto ya que es sencillo. La gama
de opciones de ser empujada hacia adelante incluyen elevar el trabajo del curso requisito de
certificación para maestros, profesores de pruebas sobre conocimientos generales o
específicos, que requieren un tipo específico de licenciaturas, maestrías y requiriendo. Cada
uno de estos tiene plausibilidad superficial, pero existe muy poca evidencia para sugerir que
estos están estrechamente relacionados con la calidad de los maestros y a los logros de los
estudiantes.

Más pernicioso, estos requisitos de entrada casi ciertamente actuar para reducir la oferta de
maestros. En otras palabras, mientras que los requisitos propuestos hacen poco o nada para
garantizar la alta calidad de los maestros, hacen disminuir el grupo de personas que pueden
entrar en la enseñanza. Requisitos de certificación docente son generalmente ad-vertised
como asegurarse de que hay unos mínimos de calidad, pero, si los requisitos terminan
manteniendo una buena calidad de los profesores que no quieren tomar los cursos específicos
que requiere, en lugar de actuar más como un techo de calidad.

Una propuesta de política relacionados es elevar los sueldos de los maestros a fin de
compensar cualquier costo adicional de preparación o simplemente para atraer a un grupo
más amplio de mayor calidad
Royal Economic Society 2003

2003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F93

personas en la enseñanza. Por sí mismo, sin embargo, esa política salarial indiferenciado poco
haría para garantizar que la calidad de la enseñanza mejoraría, al menos por un largo tiempo.
Los actuales maestros, buenas y malas, se verían alentados a no dejar la enseñanza y cualquier
déficit específicos como de alta calidad de maestros o de profesores en áreas más técnicas no
sería relevado a menos que estos salarios podrían ser atacados.

El conjunto de posibles alternativas destaca las políticas de incentivos al rendimiento. Algunos


empleados de escuelas públicas estadounidenses encuentran que sus empleos están en todas
dependen del desempeño de los estudiantes. La remuneración, la promoción, la permanencia
en un trabajo, y al igual que parecen ser poco diferente por maestros de alta calidad y baja
calidad de los maestros. Asimismo trabajos para directores de escuela u otro personal
administrativo y de apoyo no parecen estar estrechamente relacionados con cualquiera de los
resultados de los alumnos. Una idea sencilla que impregna la economía es que los incentivos
tienen efectos poderosos. En el caso de escuelas pocos incentivos relacionados con el objeto
de interés - El rendimiento de los estudiantes. Por lo tanto, no debería ser sorprendente si se
agregan recursos no se traduce en un mejor rendimiento, porque hay poca retroalimentación
de rendimiento.

Gran parte del debate más amplio sobre la escuela realmente la política gira alrededor de los
cambios propuestos en la estructura de incentivos de la escuela. La gama de políticas de
incentivos actualmente en debate se dividen en tres tipos genéricos.33 En primer lugar,
merecen pagar por enseñar-ers -como los que recientemente introducidos en las escuelas
británicas -o recompensas a escuelas completas implica mover a un teléfono de pago por
rendimiento de relación. Segundo, pri-vatisation o contratantes acuerdos implican la
contratación de empresas privadas para proporcionar gi-ven académicas o nonacademic
funciones con sus recompensas basadas en resultados. Por último, ampliado las opciones de
escuelas por los estudiantes se basa en la idea de que las escuelas que hacen bien atraerá a
más estudiantes y aquellos que lo hagan mal perderán los estudiantes y que este mecanismo
proporcionará incentivos para mejorar el rendimiento estudiantil (Friedman, 1962). (Opción
realmente viene en diferentes formas identificado principalmente por si o no las escuelas
privadas pueden competir con las escuelas públicas.)
Cada uno de estos enfoques tiene genérica apelación considerable en comparación con el
sistema actual. Cada centra la atención en lo que se desea, en lugar de intentar adivinar en un
conjunto de aportaciones que conduzca al resultado deseado. Contrariamente a la estructura
actual, el esquema general de cada una de las estructuras de incentivos que tienen sentido
económico.

Diseñar buenos incentivos, sin embargo, no es fácil. Por ejemplo, vale-nentes oppo apuntan a
una variedad de temas, incluyendo la perspectiva de una mayor segregación racial y
económica en las escuelas; la posibilidad de que las escuelas ofrecen cursos de estudio
indeseables; y la posibilidad de que la competencia no tiene mucho impacto en las escuelas
públicas. Asimismo, merecen pagar los opositores argumentan que hay pocas investigaciones
que apoyen los resultados positivos (Cohen y Murnane, 1986); que su concesión, es probable
que sea demasiado subjetivo y político; y recompensas individuales que conducen a una
competencia indeseable entre los docentes.

En la mayoría de los casos, sería posible diseñar planes de incentivos que sortean los mayores
problemas, al menos si los problemas están previstos. Lamentablemente, en centive contratos
pueden ser muy complicados, y algunas de las reacciones a los SPE-cified incentivos pueden
ser sorprendentes. Por ejemplo, uno de los primeros experimentos con

33 una extensa discusión de tales incentivos pueden encontrarse en Hanushek et al. (1994).
Royal Economic Society 2003.

F94 T H E E C O N Ó M I C O J U R N A L [ F E B R U A R y el

rendimiento de la contratación (que implicaba la contratación de empresas privadas para


enseñar las materias básicas para estudiantes desfavorecidos y pagar las empresas basadas en
los resultados) no pudo rendir mucha información debido a fallas fundamentales en el
contrato de incentivos (Gramlich y Koshel, 1975).34 En otros casos, tales como la exploración
limitada del uso de vales en Milwaukee, Wisconsin, un único sistema altamente restringidas
fue empleado e incluso entonces una considerable controversia sobre los resultados de con-
sigue existiendo (Peterson et al., 1996; Greene et al., 1998; Rouse, 1998; Witte, 1999).35

En suma, hay abundantes pruebas de que los empleados actualmente Políticas de entrada son
un fracaso. Nadie, por supuesto, alega que desean proseguir las políticas fallidas del pasado.
Normalmente, los partidarios de las políticas de entrada bien argumentan que tienen nuevas
ideas que no están repitiendo los errores de las políticas pasadas. Sin embargo, estas nuevas
políticas, al igual que en el pasado, rara vez se basa en la evidencia de la superioridad. Una
forma alternativa utilizada es decir que "el dinero gastado sabiamente producirá resultados
favorables", pero esto es una tautología.

Al mismo tiempo el incentivo enfoques genéricos, con la excepción de ciertos tipos de sistemas
de remuneración por méritos, no han sido juzgadas muy a menudo, así que hay poca
experiencia en el desarrollo de buenos contratos. Además, ningún planteamiento sistemático
para desarrollar información sobre incentivos ha sido empleado. Por lo tanto, el su-periority de
utilizar incentivos de desempeño en lugar de confiar sólo en las políticas de entrada
permanece en gran medida sin explotar.

Una cuestión importante en el debate de los incentivos es la lentitud con que la evidencia se
acumula. No existe una fuerte tradición de evaluación científica en el ámbito de la educación.
Además, porque la educación es un potente tema político, hay constantes presiones para ir
inmediatamente a nuevas políticas universales sin preocuparse demasiado acerca de la
evidencia a favor de ellos. Esto tiene dos funciones. En primer lugar, muchos se cometen
errores (que conducen a los resultados descritos anteriormente). En segundo lugar, ninguna
nueva evidencia se acumula para ayudar en la toma de decisiones futuras.

El estado de California ofrece un instructivo si desalentar estudio de caso. En 1997, el Estado


proporcionó incentivos financieros a los distritos escolares para reducir el tamaño de la clase.
Este popular programa políticamente, se ofreció a todos los distritos simultáneamente, desafía
toda evaluación porque no se dispone de datos de rendimiento de referencia y porque todos
los distritos recibieron el mismo tratamiento. Continúa con los créditos de 1.500 millones de
dólares anuales con ninguna información sobre su eficacia.

Si las políticas educativas van a mejorarse, mucho más grave, debe prestarse atención al
desarrollo de pruebas sólidas sobre qué cosas funcionan y qué cosas no lo hacen. El desarrollo
de tales pruebas significa que periódicamente información de alta calidad sobre los resultados
de los alumnos debe ser generado. En particular, debe ser posible deducir el valor añadido de
las escuelas. Mejora también sería avanzado significativamente por la introducción y el uso
general de la asignación aleatoria, experimentos y otros

34 El contrato experimentales no ofrecen a las empresas una oportunidad justa para obtener
un beneficio proporcionado ningún pago a las empresas si logro ganancias fueron inferiores a
la media nacional, y se limitó la mayor recompensa. Estas disposiciones ofrecen pocos
incentivos y llevaron a las empresas a hacer una variedad de cosas inapropiadas desde el
punto de vista educativo.

35 Evaluación controversias han surgido a lo largo de la longitud de tiempo antes de que el


alcance de logros que cabe esperar, a través de los grupos de comparación apropiados, y sobre
los costos de la educación privada.

Royal Economic Society 2003.

003 ] F A I L U R E o F I N P U T - B A S D E C H O S O L I N G P O L I C I E S F95

bien definidos los métodos de evaluación. Sin incentivos y sin-eval uation adecuados, no cabe
esperar que las escuelas mejorar, independientemente de los recursos agregados a la
estructura actual.

La Universidad de Stanford y el NBER

Referencias

Akerhielm, K. (1995). "¿Importa el tamaño de la clase?", Economía de la educación Review, vol.


14 (3) (septiembre de 2002), págs. 229-41.

Angrist, J.D., y Lavy, V. (1999). "Uso de Maimónides' la regla para calcular el efecto del tamaño
de las clases en el rendimiento escolar", Quarterly Journal of Economics, vol. 114 (2) (mayo),
págs. 533-75.

Armadura, D.J., Conry-Oseguera, P., Cox, M., el Rey, N. McDonnell, L., Pascal, A. Pauly, E. y
Zellman, G. (1976). Análisis de la escuela programa de lectura preferido seleccionado en Los
Angeles escuelas de las minorías. Santa Monica, CA: RAND Corp.
Baumol, W.J. (1967). 'Macroeconomics de crecimiento desequilibrado: la anatomía de la crisis
urbana", American Economic Review, vol. 57 (3) (junio), págs. 415-26.

Behrman, J.R., Kletzer, L.G., McPherson, M.S. y Schapiro, M.O. (1998). "La Microeconomía de la
universidad elección, carreras y salarios: medición del impacto de la educación superior",
Anales de la Academia Americana de Ciencias Políticas y Sociales, vol. 559 (Septiembre de
2002), págs. 12-23.

Betts, J.R. (1996). "Hay un vínculo entre los insumos del colegio y ganancias? Escrutinio fresco
de una vieja litera-tura", (G. Burtless, ed.) ¿cuestión de dinero? El efecto de los recursos
escolares en los logros de los estudiantes y adultos Éxito, pp. 141-191. Washington, DC:
Brookings.

Obispo, J. (1989). 'Es la calificación de prueba disminución responsable de la disminución del


crecimiento de la productividad?", American Economic Review, vol. 79 (1), págs. 178-97.

Obispo, J. (1991). "Los logros, resultados de pruebas y los salarios relativos", (M.H. Kosters,
ed.), los trabajadores y sus salarios, págs. 146-86. Washington, DC: La Prensa de la AEI.

Obispo, J. (1992). "El impacto de las competencias académicas de los salarios, el desempleo, y
realizar trabajo-ance', Carnegie-Rochester serie de conferencias sobre política pública, vol. 37
(diciembre), págs. 127-94.

Blackburn, M.L. y Neumark, D. (1993). "Omite el sesgo de habilidad y el aumento en el regreso


a la escuela", revista de economía laboral, vol. 11 (3) (julio de 1997), págs. 521-44.

Blackburn, M.L., y Neumark, D. (1995). "Son estimaciones OLS del regreso a la escuela sesgado
a la baja? Otro aspecto", el examen de Economía y Estadística, vol. 77 (2) (mayo), págs. 217-30.

Boissiere, M.X., Caballero, J.B., y Sabot, R.H. (1985). "Ingreso, escolaridad, capacidad y
habilidades cognitivas", American Economic Review, vol. 75 (5), págs. 1016-30.
Boozer, M.A., y Rouse, C. (1995). "Intraschool variación en el tamaño de la clase: patrones e
implicaciones", NBER Documento de Trabajo, junio de 5144.

Burtless, G. (1996). ¿Cuestión de dinero? El efecto de los recursos escolares en los logros de los
estudiantes y adultos de éxito. Washington, DC: Brookings.

Tarjeta, D. y Krueger, A.B. (1992a). No importa la calidad de la escuela? Devuelve a la


educación y la char-acteristics de escuelas públicas en los Estados Unidos", Revista de
Economía Política, vol. 100 (1) (febrero), págs. 1-40.

Tarjeta, D. y Krueger, A.B. (1992b). "La escuela de calidad y negro-blanco de las ganancias
relativas: evaluar directa-ment", Quarterly Journal of Economics, vol. 107 (1) (febrero), págs.
151-200.

Así, A. y Deaton, A. (1999). "La escuela los insumos y los resultados de la educación en
Sudáfrica", Quarterly Journal of Economics, vol. 114 (3) (agosto), pp. 1047-84.

Cawley, J. Heckman, J.J., Lochner, L. y Vytlacil, E. (2000). "La comprensión del papel de la
capacidad cognoscitiva en la contabilidad de la reciente alza en la rentabilidad económica de la
educación", en la letra K. Flecha, S. Bowles y S. Durlauf, eds.) la meritocracia y la desigualdad
económica, págs. 230-65. Princeton, NJ: Princeton University Press.

Chaikind, S., Danielson, L.C. y Brauen, M.L. (1993). "Qué sabemos acerca de los costos de la
educación especial? Un examen seleccionado', Oficial de Educación Especial, vol. 26 (4), págs.
344-70.

Cohen, D.K. y Murnane, R.J. (1986). 'Merit pagar y el problema de la evaluación: comprender
por qué la mayoría de los planes de remuneración por mérito fallar y pocos sobreviven',
Harvard Educational Review, vol. 56 (1) (febrero), págs. 1-17. Coleman, J.S., Campbell, E.Q.,
Hobson, C.J., McPartland, J., humor, A.M., Weinfeld, F.D. Y York, R.L.

(1966). La igualdad de oportunidades educativas. Washington, D.C.: Oficina de Impresión del


Gobierno de EE.UU.

La Oficina Presupuestaria del Congreso. (1986). Las tendencias en el logro educativo. Washin