Está en la página 1de 10

La belleza en el aula: pulcritud de los instructores y productividad pedagógica

putativa.
Una inmensa literatura en psicología social (resumida por Hatfield y Sprecher, 1986) ha examinado el
impacto de la belleza humana en una variedad de resultados no económicos. Recientemente, los
economistas han considerado cómo la belleza afecta los resultados del mercado laboral, en particular las
ganancias, y han intentado inferir las fuentes de sus efectos del comportamiento de diferentes agentes
económicos (Hamermesh & Biddle 1998). Los impactos en estos resultados monetarios son
implícitamente los resultados finales de los efectos de la belleza en la productividad; pero no parece haber
evidencia directa de los impactos de la belleza en la productividad en un contexto en el que podemos
estar bastante seguros de que la productividad genera recompensas económicas.

Una cantidad sustancial de investigación ha indicado que los administradores académicos prestan
atención a la calidad de la enseñanza al establecer los salarios (Becker & Watts, 1999). Varios estudios (
Katz, 1973; Siegfried y White, 1973; Kaun, 1984; Moore, Newman y Turnbull, 1998) han demostrado que
la calidad de la enseñanza genera aumentos en el salario de ceteris paribus (DeLorme, Hill y Wood). ,
1979). La pregunta es qué genera la productividad medida por la cual las recompensas económicas se
están ofreciendo. Una posibilidad es simplemente que las características descriptivas, como la belleza,
desencadenan respuestas positivas de los estudiantes y los llevan a evaluar a algunos maestros de manera
más favorable, de modo que su belleza les permita obtener mayores rendimientos económicos.

En este estudio, examinamos los efectos de la belleza en la productividad en el contexto de la educación


de pregrado.1 (Los instructores vinculados a su productividad pedagógica no parecen haberse realizado
anteriormente, pero Goebel & Cashen (1979) y Buck & Tiene (1989) pidieron a los estudiantes de varios grados que
comentaran la capacidad de enseñanza que esperarían de los individuos de Varios niveles de belleza basados en un
conjunto de fotografías. Ambady y Rosenthal (1993), el único estudio que examinó las evaluaciones de la enseñanza
real (de 13 TA en un solo curso), se centró en su comportamiento no verbal, pero hizo referencia a los efectos de su
atractivo)

En particular, consideramos el impacto de la apariencia de los instructores en sus calificaciones de


instrucción en los cursos que imparten. En la Sección 2 describimos un conjunto de datos que hemos
creado para analizar el impacto de la belleza en este indicador de la productividad de los instructores. En
la Sección 3 discutimos e interpretamos los resultados del estudio de estos impactos. La Sección 4
presenta las implicaciones del análisis para interpretar el impacto de una característica adscriptiva en los
resultados económicos como resultado de los efectos de la productividad o la discriminación.

2. La medición de la productividad docente y sus determinantes.

La Universidad de Texas en Austin, al igual que la mayoría de las otras instituciones de educación superior
en los Estados Unidos y cada vez más en otros lugares, requiere que sus profesores sean evaluados por
sus estudiantes en todas las clases. Las evaluaciones se llevan a cabo en algún momento de las últimas 3
semanas del semestre de 15 semanas. Un estudiante administra el instrumento de evaluación mientras
el instructor está ausente del aula. Los formularios de calificación incluyen: "En general, este instructor
fue muy insatisfactorio (1), insatisfactorio (2), satisfactorio (3), muy bueno (4), excelente (5), '' y '' En
general, este curso fue muy insatisfactorio, insatisfactorio ''. En el análisis nos concentramos en las
respuestas a la segunda pregunta, tanto porque parece más pertinente inferir la productividad educativa
del instructor como porque en cualquier caso, los resultados de las dos preguntas están altamente
correlacionados positivamente (r = 0.95).

Elegimos instructores en todos los niveles de la jerarquía académica, obteniendo personal docente de
varios departamentos que habían publicado las fotos de todos los miembros de la facultad en los sitios
web de sus departamentos. Se obtuvieron fotos de diez profesores adicionales de varios departamentos
de la universidad. El puntaje promedio de evaluación para cada clase de pregrado que el miembro de la
facultad enseñó durante el curso académico se incluyen los años 2000–2002. Este criterio de selección de
la muestra resultó en 463 clases, con un número de clases enseñadas por los miembros de la muestra
desde 1 a 13. Las clases variaron en tamaño desde 8 a 581 estudiantes (inscritos al 12 día del semestre,
después de lo cual se convierte en costoso dejar una clase o incluso cambiar de sección en un curso de
varias secciones), mientras que el número de estudiantes que completaron las calificaciones de
instrucción varió de 5 a 380. Detrás de las 463 observaciones de la muestra hay 16.957 evaluaciones
completadas de 25.547 estudiantes registrados. Se incluyen ambos cursos de baja y alta división. Hacemos
esta distinción porque no hay manera de saber la fracción de estudiantes en un curso en particular para
quien se requiere, lo que de otra manera podría ser más interesante. También obtuvimos información
sobre el sexo de cada miembro de la facultad, ya sea en el período de permanencia o no, el estado de
minoría y si recibió una educación de pregrado en un país de habla inglesa.2 (Esta última variable está
diseñada para dar cuenta de la posibilidad de una menor productividad de los maestros extranjeros (véase Borjas,
2000, pero también de Fleisher, Hashimoto y Weinberg, 2002) que también podrían estar relacionados con las
percepciones de su apariencia. De hecho, en nuestra muestra esta correlación es solo de "0.02.)

La Tabla 1 presenta las estadísticas que describen estas variables y la información sobre las clases Los
promedios son promedios ponderados (por el número de formularios de evaluación devueltos) de los
promedios de cada clase. Estas estadísticas descriptivas generalmente no son sorprendentes: (1) la
calificación promedio de la clase es inferior a la del propio instructor; (2) la calificación promedio es de
alrededor de 4.0 (en la escala 5 a 1), con una desviación estándar de alrededor de 0.5; y (3) la facultad de
la trayectoria no laboral se asigna de manera desproporcionada a los cursos de división inferior. Cada una
de las fotos de los instructores fue calificada por cada uno de los seis estudiantes de pregrado: tres
mujeres y tres hombres, con uno de cada género en una división más baja, dos estudiantes de la división
superior (de acuerdo con la distribución de clases en los dos niveles). Se les dijo a los evaluadores que
usaran una escala de calificación de 10 (más alta) a 1, que se concentraran en la fisonomía del instructor
en la imagen, que hicieran que sus calificaciones fueran independientes de la edad y que tuvieran en
cuenta a 5 como promedio. En los análisis la unidad normalizamos cada calificación. Para reducir el error
de medición, las seis clasificaciones normalizadas se sumaron para crear una calificación de belleza
estandarizada compuesta para cada instructor. La Tabla 2 presenta estadísticas que describen las
calificaciones de la belleza de los instructores por cada uno de los seis estudiantes que realizaron las
calificaciones. Claramente, los estudiantes tuvieron algunas dificultades para aceptar que se esforzaran
por obtener una calificación promedio de 5, ya que los promedios de tres de las seis calificaciones brutas
fueron significativamente más bajos que eso, y ninguno fue significativamente superior (tal vez reflejando
la incapacidad de los estudiantes para juzgar estos puntos). personas mayores, tal vez reflejando las
elecciones implícitas en el epígrafe). Además, las calificaciones estandarizadas muestran que cinco de los
seis conjuntos de
Table 1 Descriptive statistics, courses, instructors and evaluations

Variable All Lower division Upper division

Course evaluation 4.022 (0.525) 4.060 (0.563) 3.993 (0.493)


Instructor evaluation 4.217 (0.540) 4.243 (0.609) 4.196 (0.481)
Number of students 55.18 (75.07) 76.50 (109.29) 44.24 (45.54)
Percent evaluating 74.43 73.52 74.89
Female 0.359 0.300 0.405
Minority 0.099 0.110 0.090
Non-native English 0.037 0.007 0.060
Tenure track 0.851 0.828 0.869
Lower division 0.339 — —
One credit 0.029 — —
Number of courses 463 157 306
Number of faculty 94 42 79

Evolución de curso, evaluación del instructor, numero de estudiantes, porcentaje evaluando, mujeres,
minoridad, Inglés no nativo, pista de tenencia, división inferior, un crédito, numero de cursos y numero
de facultad.

Variable, todos, división inferior, división superior.

Nota: Significa con desviaciones estándar entre paréntesis. Todas las estadísticas, excepto las que describen el
número de estudiantes, el porcentaje que evalúa al instructor y la distinción de la división inferior-alta se ponderan
según el número de estudiantes que completan los formularios de evaluación del curso.

Tabla 2 Evaluaciones de belleza, individuales y compuestas.

Average Standard deviation Standardized

Minimum Maximum

Individual ratings:

Male, upper division—1 4.43 2.18 -1.57 2.10


Male, upper division—2 4.87 1.65 - 2.34 2.50
Female, upper division—1 5.18 2.05 -2.03 1.84
Female, upper division—2 5.39 2.10 -2.10 2.20
Male, lower division 3.53 1.70 -1.49 2.04
Female, lower division 4.14 1.88 -1.67 2.05

Composite standardized rating 0 0.83 - 1.54 1.88

Promedio, división estandar, estandarizado, mínimo y máximo. Hombre, mujer, división superior y división inferior.
Las calificaciones estaban sesgadas a la derecha. Hubo cierta preocupación, según las observaciones de
investigaciones anteriores, de que la distribución de las calificaciones de los profesores de la mujer podría
tener una varianza más alta que la de los hombres. Si bien la varianza fue ligeramente mayor, la igualdad
de las pruebas estadísticas de Kolmogorov-Smirnov de las dos distribuciones tuvo un valor de p de 0.077.
A pesar de estas pequeñas dificultades, una preocupación central, que las evaluaciones de la belleza sean
consistentes entre los evaluadores, se logró notablemente bien. Los 15 coeficientes de correlación de
pares de las clasificaciones de belleza estandarizadas varían de 0,54 a 0,72, con un coeficiente de
correlación promedio de 0,62. El alfa de Cronbach, la medida psicométrica estándar de concordancia, es
de 0,91. Estos indican un acuerdo sustancial entre los evaluadores sobre el aspecto de los 94 miembros
de la facultad. Sin embargo, cualquier desacuerdo o una mayor subjetividad acerca de las calificaciones
simplemente impartiría una tendencia a la baja.

sesgo a las estimaciones del impacto de la belleza en las evaluaciones de enseñanza.

3. Impacto de la belleza en los índices de enseñanza.

3.1. Resultados basicos

El modelo básico especifica las calificaciones de enseñanza de un miembro de la facultad según lo


determinado por un vector de sus características, X, y por un vector de las características del curso, Z. Se
incluye en X si el instructor es femenino, si es una minoría, ya sea que no sea un hablante nativo de inglés,
y si está en la pista de tenencia La variable central en X es nuestra medida compuesta de belleza
estandarizada. Z incluye si la observación está en un curso de división superior o inferior, y si es para un
crédito. (27 de las clases fueron laboratorios de un crédito,

Tabla 3 Estimaciones de mínimos cuadrados ponderados de los determinantes de las calificaciones de


clase

Todos Hombres Mujeres Division inferiror Division Superior


Variable All Males Females Lower division Upper division

Composite standardized beauty 0.275 (0.059) 0.384 (0.076) 0.128 (0.064) 0.359 (0.092) 0.166 (0.061)
Female - 0.239 (0.085) — — -0.345 (0.133 -0.093 (0.104)
Minority - 0.249 (0.112) 0.060 (0.101) -0.260 (0.139) -0.288 (0.156) -0.231 (0.107)
Non-native English -0.253 (0.134) -0.427 (0.143) -0.262 (0.151) -0.374 (0.141) -0.286 (0.131)
Tenure track -0.136(0.094) -0.056(0.089) -0.041 (0.133) -0.187(0.141) 0.005(0.119)
Lower division -0.046(0.111) 0.005(0.129) -0.228(0.164) — —
One-credit course 0.687 (0.166) 0.768 (0.119) 0.517 (0.232) 0.792 (0.101) —
R2 .279 .359 .162 .510 .126
N courses 463 268 195 15 7 306
N faculty 94 54 40 42 79

Compuesto de belleza estandarizada Curso de un credito

Mujeres R2

Minoridad N Cursos
Inglés no nativo N Facultad

Pista de tenencia

Division Inferiror

Nota: Errores estándar robustos entre paréntesis aquí y en la Tabla 4.

Evaluaciones esperadas del curso Percentil de belleza Fig. 1. Evaluaciones de belleza y curso

educación física u otras actividades de baja intensidad que los estudiantes tienden a ver de manera
diferente a otras clases).3 La edad y una edad cuadrática se incluyeron en otras versiones de la ecuación básica.
Estos términos nunca fueron significativamente distintos de cero como un par o individualmente y esencialmente
no tuvieron impacto en los coeficientes de los otros términos en X y Z. También no fue importante un indicador de
si el miembro de la facultad estaba en posesión. Si se excluyen las clases de un crédito, el coeficiente de belleza
cambia ligeramente, aumentando a 0. 283.

Donde el tamaño de las muestras lo permita, examinamos los determinantes de las evaluaciones de los
cursos en los cursos de división inferior y superior por separado, ya que los estudiantes en el primero
pueden ser más centrado en el propio instructor y menos en el grado en que el instructor puede exponer
el material del curso.

La Tabla 3 presenta estimaciones ponderadas de mínimos cuadrados de las ecuaciones que describen las
evaluaciones promedio del curso. Como ponderadores utilizamos la cantidad de estudiantes que
completan los formularios de evaluación en cada clase, porque las variaciones de error en las
calificaciones promedio de enseñanza son mayores cuantos menos estudiantes completen las
evaluaciones instructivas. Presentamos errores estándar robustos que explican el agrupamiento de las
observaciones (porque observamos múltiples clases para la mayoría abrumadora de instructores) para
cada uno de los parámetros estimados.4 Las estimaciones del parámetro de mínimos cuadrados no ponderados
difieren poco de las que se presentan aquí. Sin embargo, si no hubiéramos podido utilizar los errores estándar
robustos correctos, las estimaciones de los parámetros aquí parecerían estadísticamente más significativas.

El hecho sorprendente de las estimaciones en la primera columna es el significado estadístico de la


Medida de belleza estandarizada compuesta. Los efectos de las diferencias en la belleza en la calificación
promedio del curso no son pequeños: pasar de una desviación estándar por debajo de la media a una
desviación estándar anterior conduce a un aumento en la calificación promedio de clase de 0.46, cerca de
un aumento de una desviación estándar en el Calificación promedio de la clase.5 Este impacto se encuentra
en el margen intensivo, entre los estudiantes que se presentaron en clase el día en que se realizaron las evaluaciones
del curso y fueron completadas. Si examinamos el amplio margen, el impacto en la fracción de estudiantes que
asisten a clase ese día, también encontramos un efecto positivo y estadísticamente significativo de la belleza
estandarizada compuesta.
Una imagen completa de la importancia de la belleza para afectar las evaluaciones de clase de los
instructores se presenta en la Fig. 1. Para los instructores en cada percentil de la distribución de belleza,
la figura muestra la evaluación de clase que obtendría con otras características en X y Z en la muestra
significa. La calificación de instrucción varía en casi dos desviaciones estándar entre los instructores de
peor aspecto y de mejor apariencia en la muestra.6 Es posible que le preocupen los límites superior e inferior
de los puntajes de evaluación. Mientras que el promedio de clase más bajo fue 2.1, ocho de las 463 clases recibieron
una evaluación promedio de 5.0. Para examinar si este efecto de techo es importante, reestimamos la ecuación
básica en la columna 1 de la Tabla 3 utilizando un estimador de tobit de límite superior. No es sorprendente, dada
la pequeña fracción de observaciones en el techo, las estimaciones de los parámetros se mantuvieron esencialmente
sin cambios. Los cuadrados mínimos también pueden ser problemáticos dada la distribución de esta medida. Por lo
tanto, también reestimamos la ecuación básica utilizando las desviaciones menos absolutas. Nuevamente, los
coeficientes se mantuvieron esencialmente sin cambios (con la estimación del parámetro en la medida de belleza
aumentando ligeramente, hasta 0.299).

El hecho de inferir el impacto de las miradas de los instructores sobre las medidas de su productividad
instructiva requiere que varios evaluadores evalúen su apariencia se demuestra mediante reestimaciones
secuenciales de la ecuación básica que incluye cada una de las evaluaciones de los evaluadores
individualmente. Si bien las calificaciones de las clases están significativamente relacionadas con las
opiniones de los instructores de cada evaluador, los impactos estimados varían solo de 0.12 a 0.23, es
decir, por debajo de las estimaciones basadas en la medida estandarizada compuesta. Existe un error de
medición sustancial en las clasificaciones de belleza individuales. Los errores se vuelven menos
importantes una vez que se promedia cualquier par de clasificaciones: los coeficientes estimados que usan
los 15 pares posibles varían de 0.19 a 0.26, y van desde 0.23 cuando se promedian tres clasificaciones.

Los miembros de la facultad de minorías reciben evaluaciones de enseñanza más bajas que los
instructores de la mayoría, y los hablantes de inglés no nativos reciben calificaciones sustancialmente más
bajas que los nativos. Los cursos de división inferior tienen una calificación ligeramente inferior a los
cursos de división superior. Los instructores que no pertenecen a la tenencia reciben calificaciones de los
cursos que son sorprendentemente casi significativamente más altas que las de los profesores de la
tenencia de la pista. Esto puede surgir porque son personas especiales que se especializan en la enseñanza
en lugar de combinar la enseñanza y la investigación, o quizás de los incentivos (en términos de
nombramiento y salario) que enfrentan para complacer a sus estudiantes. Los cursos de un crédito, todos
los cuales son de división más baja, reciben evaluaciones mucho más altas que otros, tal vez debido a la
naturaleza de los cursos como laboratorios o cursos electivos.

Quizás el resultado más interesante entre las otras variables en los vectores X y Z es la calificación
significativamente más baja recibida por instructores femeninas, un efecto que implica reducciones en las
calificaciones de clase promedio de casi la mitad de la desviación estándar. Esta disparidad se aparta del
consenso en la literatura de que no existe una relación entre el género del instructor y las calificaciones
de instrucción (Feldman, 1993).

Para explorar más a fondo esta diferencia sexual, estimamos el modelo básico por separado para las clases
impartidas por instructores masculinos y femeninos. Los resultados se muestran en las columnas 2 y 3 de
la Tabla 3. En las medias de las variables, la calificación de instrucción pronosticada es más baja para las
instructoras; el coeficiente negativo en el indicador de la columna 1 no es un artefacto de una correlación
de belleza percibida y género. Las reestimaciones muestran, sin embargo, que el impacto de la belleza en
las calificaciones de los cursos de los instructores es mucho menor para las mujeres que para los
profesores masculinos. La buena apariencia genera más de una prima, la mala apariencia es más una
multa para los instructores masculinos, tal como se demostró (Hamermesh y Biddle, 1994) por los efectos
de la belleza en la determinación del salario.

Las columnas 4 y 5 muestran los resultados de estimar la ecuación por separado para las clases de división
inferior y superior. El impacto de la belleza en las calificaciones de instrucción, si bien es estadísticamente
significativo en ambas ecuaciones, es más del doble de grande en clases de división baja. De hecho, se
encuentran los mismos efectos mucho mayores para dos de las otras variables que afectaron las
calificaciones de instrucción en la muestra en su conjunto, ya sea que el instructor esté en la pista de
tenencia o sea femenino. Podríamos sentirnos tentados a concluir que las calificaciones de clase de los
estudiantes más maduros, y los estudiantes que están aprendiendo más allá del nivel introductorio en
una materia, se ven menos afectados por factores como la belleza que probablemente no están
relacionados con el conocimiento del instructor sobre la materia. Sin embargo, los impactos de ser un
miembro de la facultad minoritario o un hablante no nativo de inglés son tan grandes en las estimaciones
para los cursos de la división superior que en los cursos de división inferior. No está claro por qué los
impactos de estas variables entre los de X no se atenúan en los cursos más avanzados. Estas estimaciones
pueden implicar la existencia de discriminación por parte de los estudiantes en sus evaluaciones, o pueden
resultar de deficiencias en la capacidad de los instructores para transmitir conocimientos o inspirar a los
estudiantes.

3.2. Pruebas de robustez

Uno podría estar preocupado de que una gran cantidad de problemas estadísticos plaguen las
estimaciones que se muestran en la Tabla 3 e implica que nuestros resultados son falsos. Una dificultad
es un posible error de medición: los evaluadores pueden ser incapaces de distinguir el atractivo físico del
buen aseo y la vestimenta. Si se tratara de un error de medición simplemente clásico, no tendríamos
dificultades. Sin embargo, surge un problema sutil si aquellos que se visten mejor y cuyas fotografías
pueden ser mejor calificadas, son las mismas personas que se preocupan de organizarse en clase, de llegar
a clase a tiempo, de celebrar sus horas de oficina anunciadas, etc. ¿Qué pasa si nuestra medida de belleza
es simplemente un proxy de la calidad general del miembro de la facultad independiente de su apariencia?

Para tener en cuenta esta posibilidad, creamos un indicador que equivale a uno para los miembros de la
facultad masculina que llevan corbatas en sus fotografías y para la facultad femenina que lleva una
chaqueta y blusa. Las imágenes formales se encuentran en los sitios web de una sexta parte de la facultad
(ponderada por el número de estudiantes), y este indicador se agrega a una versión reflejada de la
ecuación básica para la cual se muestran los resultados en la Columna 1 de la Tabla 3. Los impactos
estimados de este indicador y de la belleza estandarizada compuesta se presentan en la primera fila de la
Tabla 4. Mientras que los instructores que presentan una imagen formal reciben calificaciones más altas,
la inclusión de esta medida adicional reduce el impacto estimado de la belleza solo ligeramente. El efecto
de la belleza estandarizada compuesta es bastante grande y estadísticamente muy significativo. Podemos
concluir que la posible correlación positiva de error de medición en las calificaciones de belleza con
determinantes no observables del éxito de la enseñanza no genera sesgos serios en nuestras
estimaciones. Un problema relacionado, que también implica un posible error de medición no clásico,
puede surgir si….

Tabla 4 Estimaciones alternativas de la relación entre la belleza y las clasificaciones de clase (clases de
división inferior y superior)

Variable

Composite standardized beauty = compuesto de belleza estandarizada

Formal dress = Vesido formal

Black and white = blanco y negro

Composite standardized beauty

Above mean = encima de la media

Below mean = debajo de la media

Photo bias (dress) (N = 463) 0.229 (0.047) 0.243 (0.088)

2. Photo bias (picture quality) (N ¼463) 0.267 (0.063) 0.088 (0.106)

3. Photo bias (department) (N ¼414) 0.236 (0.049)

4. Asymmetric beauty effect (N ¼ 463) 0.237 (0.096) "0.318 (0.133)

5. Course fixed effects (N ¼157) 0.177 (0.107)

Nota: Las ecuaciones reportadas en las filas 1 a 4 también incluyen todas las variables incluidas en la
ecuación básica en la columna 1 de la Tabla 3. La ecuación reportada en la fila 5 excluye las variables en
el vector Z.

los instructores interesados estaban lo suficientemente preocupados por sus imágenes para incluir color
en lugar de fotos en blanco y negro en los sitios web. Clasificamos las fotografías según este criterio y
nuevamente reestimamos la ecuación básica. Como muestra la segunda fila de la Tabla 4, casi no hubo
cambios en el parámetro que describe la relación entre la belleza estandarizada compuesta y la
evaluación. Si bien el coeficiente de la variable indicadora "blanco y negro" fue pequeño y
estadísticamente insignificante, fue algo sorprendentemente positivo.7 Otra dificultad potencial es que las
fotografías pueden no ser todas igualmente actuales. Dado que todos tenían que estar en archivos electrónicos, y
dada la fuerte evidencia de que la belleza percibida de un individuo cambia muy lentamente con la edad, incluso
una correlación entre la edad de la fotografía y una evaluación del instructor causaría, como máximo, un sesgo
mínimo en cualquier estimación.

Quizás el problema potencial más grave puede deberse a un tipo de selectividad de la muestra. Considera
la siguiente posibilidad. Entre un grupo de personas (un departamento), aquellos que coloquen sus
fotografías en sus sitios web, hasta que se alcance el equilibrio en el juego, serán más atractivos que
aquellos que no presentan sus fotografías. También pueden ser personas que son "ve a buscar" en otros
aspectos de sus vidas, incluida la enseñanza en el aula. Si eso es cierto, los instructores que se encuentran
entre los pocos en un departamento cuyas imágenes están disponibles tendrán una mejor apariencia y
serán mejores instructores, mientras que los de los departamentos con todas las imágenes disponibles
tendrán, en promedio, una apariencia promedio y un promedio.

Para examinar este problema potencial, volvemos a estimar la ecuación básica en la submuestra de 84
miembros de la facultad, que imparten 414 clases, en las que se encuentran disponibles las imágenes de
la facultad de todo un departamento. Los resultados de la estimación de la ecuación básica sobre esta
muestra ligeramente reducida se muestran en la segunda fila de la Tabla 4. En comparación con
estimación básica (0.275), la explicación de este problema potencial reduce levemente el impacto
estimado de la belleza estandarizada compuesta e implica que un cambio de la diferencia en la belleza de
dos niveles eleva la calificación del curso en 0,39 (tres cuartos de una desviación estándar en las
calificaciones del curso). Aparentemente este tipo de selectividad importa un poco, pero no vicia el
resultado básico.

La siguiente posibilidad no representa un sesgo potencial en los resultados básicos, sino que pregunta si
están ocultando alguna información de muestra adicional. Hay algunos indicios (Hamermesh y Biddle,
1994 Hamermesh, Meng, y Zhang, 2002) de que el efecto de la belleza en las ganancias es asimétrico, con
mayores efectos del mal que del buen aspecto. ¿Esta asimetría se traslada a sus efectos sobre la
productividad en la enseñanza universitaria? Para examinar esta posibilidad, descomponemos la medida
de belleza estandarizada compuesta en valores positivos y negativos y reestimamos la ecuación básica
que permite la asimetría. Los resultados se muestran en la tercera fila de la Tabla 4. El efecto en las
calificaciones del curso de verse mejor que el promedio es ligeramente inferior y opuesto al signo de que
el efecto se ve peor que el promedio.8El estadístico t de la hipótesis de que son iguales y opuestos en el signo
es de 0,41. Esto puede no contradecir los resultados que indican los efectos asimétricos de la belleza en las
ganancias. Muchos más individuos se califican por encima del promedio en apariencia que se consideran por debajo
del promedio, por lo que la asimetría podría no existir si la medida de belleza en sí fuera simétrica, como lo es aquí
por construcción.

Solo hay una ligera evidencia de asimetría en el impacto de La belleza de los instructores en sus
calificaciones de cursos.

Otro problema potencial es que los cursos pueden atraer a estudiantes con diferentes actitudes hacia la
belleza. Estos pueden estar correlacionados con las calificaciones de instrucción que los estudiantes dan
y también pueden inducir a los administradores departamentales a asignar cursos a los instructores en
función de su apariencia. Algunos cursos también pueden generar diferentes calificaciones dependiendo
de su dificultad, su nivel y otras diferencias, y éstas pueden estar correlacionadas con la apariencia del
instructor. La mezcla de género de los estudiantes puede diferir entre los cursos, y esto también puede
afectar los impactos estimados de la belleza. Para examinar estas posibilidades, aprovechamos el hecho
de que 157 de las 463 clases en nuestra muestra son instruidas por más de un miembro de la facultad
durante los 2 años de observación. Estos cursos involucran a 54 instructores diferentes (de los 94 en la
muestra). Reestimamos la ecuación básica en esta submuestra agregando efectos fijos del curso. Por lo
tanto, cualquier efecto estimado de la belleza reflejará las diferencias dentro del curso en el impacto de
la apariencia en las calificaciones de instrucción.
Los resultados se presentan en la fila final de la Tabla 4. El impacto estimado de la belleza estandarizada
compuesta en las evaluaciones de clase es algo más pequeño que en las otras estimaciones, pero aún es
sustancial. Esto se debe principalmente a la variabilidad de muestreo. La reestimación de la ecuación
básica de la Tabla 3 sobre esta muestra reducida de 157 clases produce un impacto de belleza
estandarizada compuesta en calificaciones de instrucción de 0.190 (es decir, = 0.079) .9 Si incluimos un
vector de indicadores para departamentos en la ecuación básica en la Tabla 3, encontramos un efecto
algo mayor que aquí, aunque uno que aún es menor que el de la ecuación básica.

4. Conclusiones e interpretaciones.

Las estimaciones dejan pocas dudas de que las medidas de belleza percibida tienen un impacto positivo
independiente sustancial en las calificaciones de instrucción de los estudiantes de pregrado. Hemos
explicado una variedad de correlatos posiblemente relacionados, y hemos demostrado que los impactos
estimados son robustos a los problemas potenciales de selectividad, error de medición correlacionado y
otras dificultades. La pregunta es si estos hallazgos realmente significan que la belleza misma hace que
los instructores sean más productivos en el aula, o si los estudiantes simplemente están reaccionando a
una característica irrelevante que difiere entre los instructores. El primer problema es que nuestra medida
de la belleza puede ser simplemente un proxy de una variedad de características no medidas relacionadas
que pueden afectar positivamente las calificaciones de instrucción. En la medida en que estos se
correlacionan positivamente con la belleza pero no son causados por ella, nuestros resultados exageran
el impacto de la belleza. El hecho de que nos hayamos mantenido constantes para todas las características
del curso y del instructor que tengamos debería mitigar algunas preocupaciones sobre este problema
potencial. Si hay una característica que es causada por la apariencia física de una persona y que también
genera calificaciones de instrucción más altas, no es correcto medirla (y excluirla de las regresiones). Por
ejemplo, si los instructores apuestos son más seguros de sí mismos porque su belleza generada
previamente

un mejor trato por parte de otras personas, y si su confianza en sí mismos los hace instructores más
atractivos, es su belleza lo que determina en última instancia (parte de) su éxito en la enseñanza. Un
segundo y más importante problema es si las calificaciones de instrucción más altas significan que el
miembro de la facultad es un mejor maestro, es más productivo para estimular el aprendizaje de los
estudiantes. Las calificaciones de instrucción pueden reflejar la productividad, pero ¿realmente lo hacen?
Discutan

También podría gustarte