ES Joel Wapnick1 and Alice-Ann Darrow

Machine Translated by Google
465318JRM60410.1177/0022429412465318Diario
de Investigación en Educación MusicalWapnick y Darrow
Revista de Investigación en Educación
Seccional versus intacto Musical 60(4)
462–474 © 2013 Nacional
Evaluaciones de cuatro Asociación para la Educación Musical
Reimpresiones y permiso:
sagepub.com/journalsPermissions.nav DOI:
Versiones de un estudio de Chopin 10.1177/0022429412465318 http://
jrme.sagepub.com
Joel Wapnick1 y AliceAnn Darrow2
Abstracto
El propósito de este estudio fue determinar cómo las evaluaciones de cuatro representaciones intactas de
un estudio de Chopin (Op. 25, No. 9, Mariposa), que difieren en calidad, se relacionan con las evaluaciones
de las secciones de cada actuación. Presentamos cada actuación como cinco extractos: (a) frase de
apertura, (b) primera mitad, (c) segunda mitad, (d) coda y (e) intacto. Luego presentamos 10 de los 20
extractos por segunda vez para evaluar la confiabilidad del oyente. Los resultados revelaron una interacción
entre el ejecutante y las calificaciones: las calificaciones de las actuaciones intactas fueron significativamente
más altas que las calificaciones de las secciones de los componentes para las dos mejores actuaciones.
Sin embargo, para las otras dos actuaciones, las calificaciones de los extractos intactos fueron
significativamente más bajas que las calificaciones de las secciones componentes. Los factores no
significativos fueron las secciones y el fondo del oyente. Los datos indican que las calificaciones de las
secciones más largas (primera y segunda mitad) estaban más estrechamente vinculadas a las calificaciones
de desempeño intacto que las secciones más cortas (frase inicial y coda). Los datos correlacionales
revelaron que las especializaciones en piano eran marginalmente más confiables que las especializaciones en otras discipl
Palabras clave
adjudicación, interpretación musical, piano
La duración de los extractos ha surgido recientemente como una variable de interés en la investigación
sobre adjudicación de música (Geringer & Johnson, 2007; Geringer, Allen, MacLeod y Scott, 2009; W.
Thompson, Diamond y Balkwill, 2007; Wapnick et al., 2005). . Sin embargo, aún quedan por abordar a fondo
muchas cuestiones relativas a esta variable. Uno de ellos podría plantearse en forma de pregunta: ¿Cuánto
tiempo es "suficientemente largo"? En este contexto,
Universidad McGill, Montreal, QC, Canadá
2
Universidad Estatal de Florida, Tallahassee, Florida, EE. UU.
Autor para correspondencia: Joel
Wapnick, Universidad McGill, 555 Sherbrooke St. W., Montreal, QC H3W 2J1, Canadá Correo electrónico:
jwapnick@music.mcgill.ca
Wapnick y Darrow 463
“el tiempo suficiente” no se refiere ni a la cortesía mostrada a un intérprete o grupo de
interpretación ni al disfrute estético de la música, por importantes que sean estas consideraciones.
El concepto de “tiempo suficiente” se basa en la suposición de que hay un punto en el tiempo
más allá del cual las evaluaciones ya no cambian sustancialmente y la confiabilidad ya no mejora.
En concursos y audiciones, los jueces a veces terminan las representaciones de manera
arbitraria; han oído lo suficiente y, por lo tanto, han aceptado la suposición de “el tiempo
suficiente”, al menos tácitamente. Sin embargo, en otras situaciones, como las actuaciones de
recitales, los jueces escuchan el final de una actuación. Aquí no hay suposición de “lo
suficientemente largo”; los eventos que ocurren después de cualquier momento, incluso cerca
del final de un recital de una hora, pueden afectar las evaluaciones.
Geringer et al. (2009) sostuvieron que la eficiencia en la adjudicación es una preocupación
importante porque escuchar una gran cantidad de actuaciones suele ser costoso, lleva mucho
tiempo y está sujeto a errores debido a los efectos potenciales de la fatiga y el sesgo. Su estudio
se refería a la selección de candidatos a violinistas para la admisión en tres orquestas de todo el
estado de Florida. El proceso de adjudicación tradicional requería calificar actuaciones de un
estudio de 1 minuto, un extracto orquestal, escalas mayores y menores, y lectura a primera vista.
Los investigadores encontraron, sin embargo, que las decisiones basadas en el uso de una
rúbrica de preselección, aplicada únicamente a la evaluación del estudio, se correlacionaron bien
con las decisiones basadas en el enfoque tradicional más extenso. Pudieron reducir el "tiempo
suficiente" a 1 minuto por alumno.
Con la excepción de una disertación de Vasil (1973) y una serie de estudios realizados por
Bergee (1993, 1995, 1997, 2003), los estudios de investigación sobre adjudicación de música
expusieron universalmente a los oyentes a extractos de menos de 3 minutos. El empleo de
extractos de 1 a 3 minutos se ha utilizado comúnmente (Ekholm, 1994; Gillespie, 1997; W.
Thompson et al., 1998; Wagner, 1991; Wapnick, Darrow, Kovacs y Dalrymple, 1997; Wapnick y
Ekholm , 1997; Wapnick, KovacsMazza y Darrow, 2000; Wapnick, Ryan, Lacaille y Darrow,
2004), y muchos estudios utilizaron extractos incluso más breves (Brittin, 2002; Byo y Crone,
1989; Fiske, 1975, 1977b; Geringer y Madsen, 1998; LeBlanc y Sherrill, 1986; McCrary, 1993;
Zdzinski y Barnes, 2002). El uso de extractos breves es problemático solo en la medida en que
las evaluaciones de ellos pueden ser menos confiables que las evaluaciones de extractos más
largos, o que las evaluaciones de extractos breves pueden no ser representativas de las
evaluaciones tomadas de extractos más largos. En al menos dos estudios, sin embargo, se ha
demostrado que para piezas relativamente cortas, las duraciones de escucha para interpretaciones
seccionales versus intactas pueden diferir considerablemente sin que surjan diferencias
sustanciales en las calificaciones o la confiabilidad. Vasil (1973) no encontró tales diferencias
para extractos de 5 min, 2,5 min y 1,25 min de duración. Geringer y Johnson (2007) obtuvieron
resultados similares utilizando duraciones más cortas. Compararon extractos de actuaciones de
bandas de música de 12 s, 25 s y 50 s de duración y no encontraron ningún efecto principal en la
duración. Sin embargo, encontraron que los desempeños a nivel profesional y universitario se
calificaron más alto cuando la duración de los extractos era más larga, y que las calificaciones
más bajas de los desempeños de la escuela secundaria de menor calidad se asociaron con
extractos de menor duración. Estos resultados corroboran los de Wapnick et al. (2005), quienes
encontraron que para oyentes experimentados, extractos de interpretaciones de pianistas de alto nivel que du
464 Revista de investigación en educación musical 60 (4)
Los extractos de 20 s recibieron una calificación más alta y más confiable que los extractos de 20 s. Los
participantes en un estudio de S. Thompson, Williamon y Valentine (2007) calificaron las obras para piano
de Bach y Chopin continuamente moviendo el mouse a lo largo de una escala de 7 puntos. Aunque las
respuestas se estabilizaron hasta cierto punto después de 15 a 20 s, tendieron a aumentar después,
particularmente dentro del primer minuto.
En el presente estudio, examinamos los efectos de la duración de los extractos comparando las
calificaciones de las interpretaciones intactas de un estudio de Chopin con las calificaciones de las
secciones extraídas de la interpretación. También estábamos interesados en cómo las calificaciones de
secciones particulares del estudio podrían relacionarse con las calificaciones de sus correspondientes
actuaciones intactas. Es posible que las calificaciones de una obra intacta se predigan mejor a partir de
las calificaciones de su frase de apertura que de las calificaciones de otras secciones. Por otro lado, las
calificaciones de la coda del estudio podrían estar más estrechamente relacionadas con las calificaciones
de las interpretaciones intactas. Además, comparamos las calificaciones de las interpretaciones intactas
con las calificaciones de la primera y la segunda mitad del estudio, e investigamos si la calidad de una
interpretación intacta en relación con otras interpretaciones intactas podría ser importante para determinar
cómo las calificaciones de las secciones versus las calificaciones de la obra completa. relacionados entre
sí. ¿La calificación numérica de una interpretación intacta estaría cerca de la calificación media de las
secciones que comprende, o sería más alta para las interpretaciones de mayor calificación y menor para
las de menor calificación? En resumen, estábamos interesados en cómo la percepción del todo se
relacionaba con la percepción de sus partes, y en si las diferencias en la calidad de los cuatro "todos"
empleados en este estudio, las cuatro actuaciones intactas, interactuarían con las calificaciones de sus
partes. secciones correspondientes.
Método
Este estudio constó de dos fases. En la Fase 1, los evaluadores escucharon y calificaron 22 versiones de
Butterfly Étude de Chopin, op. 25, No. 9. Usamos estas clasificaciones para seleccionar 4 versiones de
las 22 para usar en la Fase 2, como se describe en la siguiente sección.
Evaluadores
Empleamos dos grupos de evaluadores, todos voluntarios. Los evaluadores de la Fase 1 fueron 9
personas: 3 estudiantes graduados de piano y 6 profesores de tiempo completo en interpretación, teoría,
musicología y educación musical. Todos eran de la misma escuela universitaria de música. Los
evaluadores de la Fase 2 fueron 111 estudiantes de pregrado y posgrado en música de dos universidades.
Ochenta y cinco eran mayores de piano y 26 eran mayores de piano.
Fase 1: Materiales y Procedimientos
Grabamos 22 representaciones completas de Butterfly Étude de Chopin desde YouTube (www.youtube.com)
en un iMac de Apple usando Wiretap Studio (Ambrosia Software, Inc.). Se utilizaron actuaciones de
YouTube porque incluían una amplia variedad de niveles de habilidad. Los editamos usando Peak (Bias,
Inc.) para igualar los niveles de volumen y estandarizar la duración del silencio antes y después de cada
actuación.
A seis de los 9 evaluadores se les entregó un CD para que lo escucharan en su tiempo libre.
Otros tres escucharon el CD al mismo tiempo en un salón de clases. A los evaluadores se les dieron
las siguientes instrucciones:
Está a punto de escuchar 22 versiones diferentes del Estudio de la mariposa de Chopin (Op.
25, No. 9). Después de escuchar cada uno, asígnele una calificación de 0 a 100, donde 100
representa lo que, en su opinión, es una interpretación tan buena como es probable que
escuche de la pieza y 0 representa un esfuerzo muy pobre. Me doy cuenta de que la calidad
del sonido en estas actuaciones varía; intente ignorar la calidad del sonido y concéntrese solo
en la calidad de las actuaciones.
Empleamos una escala de 100 puntos para esta tarea porque tal escala comúnmente es
utilizado en muchas universidades en la evaluación de actuaciones musicales.
Fase 2: Materiales y Procedimientos
Seleccionamos 4 actuaciones de las 22 escuchadas por los evaluadores de la Fase 1 (consulte la
Tabla A1, en el material complementario en línea disponible en http://jrme.sagepub.com/supplemen
tal) para usar en la Fase 2. Elegimos actuaciones que diferían notablemente de entre sí en la
calificación de la calidad. Esto nos permitió determinar si las diferencias en la calidad relativa
afectarían la fuerza y dirección de las discrepancias entre las calificaciones generales y seccionales
para cada una de las 4 representaciones.
Las cuatro grabaciones de la Fase 2 fueron interpretadas por un concertista de piano de renombre
internacional, ganador de concursos internacionales de piano, un profesor universitario de piano
experimentado y un pianista aficionado (Interpretaciones 15, 11, 21 y 10, respectivamente, en la Tabla
A del Apéndice). , disponible en el material complementario en línea en http://jrme.sagepub.com/
supplemental). La duración de las actuaciones intactas varió de 59 s a 65 s. Cabe señalar que la
calificación más baja de las cuatro representaciones fue fluida y competente y se interpretó a un
tempo apropiado para el estudio. De ahora en adelante, se hará referencia a estas interpretaciones
por número, siendo la Interpretación 1 la calificación más alta y la Interpretación 4 la calificación más
baja.
Para verificar que las cuatro actuaciones diferían en la calidad nominal, realizamos seis pruebas t
(consulte la Tabla B, http://jrme.sagepub.com/supplemental). Con la excepción de la prueba t que
compara los dos desempeños con calificaciones más bajas (p = 0,061), la calificación media de cada
desempeño fue significativamente diferente de las calificaciones promedio de los otros tres (p < 0,025).
El primer extracto del CD experimental consistía en una versión intacta "modelo" del estudio de
Chopin (no es una de las cuatro representaciones de la Fase 2 y no debe ser calificada por los
participantes). De las 22 versiones calificadas en la Fase 1, esta había alcanzado el segundo promedio
más alto y es el octavo desempeño como se muestra en la Tabla A (ver http://jrme.sagepub.com/
supplemental).
Siguieron veinte ensayos, y consistieron en una presentación ordenada al azar de los cinco
extractos tomados de las cuatro actuaciones. Los extractos consistían en
siguiente: (a) frase inicial (mm. 1–8, duración media = 8 s); (b) primera mitad (mm. 124, duración media
= 29 s); (c) segunda mitad (mm. 2551, duración media = 33 s); (d) coda (mm. 3751, duración media =
18 s); y (e) intacto (mm. 151, duración media = 62 s). Luego presentamos la mitad de las 20 versiones
(ensayos 1 a 10) nuevamente en el mismo orden (ensayos 21 a 30) para evaluar la confiabilidad del
evaluador.
Se realizaron sesiones de escucha en grupos y se leyeron a los evaluadores las siguientes
instrucciones:
El propósito de este estudio es determinar la cantidad mínima de tiempo que se necesita para
juzgar la música de manera confiable. En consecuencia, escuchará 30 ejemplos musicales, todos
de la misma pieza y cada uno con una duración de 8 segundos a 1 minuto. Cada prueba será de
la interpretación completa del Estudio de la mariposa de Chopin o de un extracto de esa obra.
Califique estas pruebas en una escala de 7 puntos encerrando en un círculo un número, donde 1
significa un rendimiento deficiente y 7 significa un rendimiento excelente. Además, y de acuerdo
con el propósito de este experimento, no haga su elección de calificación hasta después de que
se reproduzca todo el ejemplo de prueba. Hay algunas diferencias en la calidad de la grabación;
intente ignorarlas y califique solo a los pianistas. Tendrás 5 segundos entre intentos para calificar
cada desempeño. El experimento completo tomará 18 minutos.
Comenzaremos con una interpretación completa del Butterfly Étude, para que os hagáis una idea
de cómo suena la pieza. No califiques este desempeño. Anunciaré los números de las pruebas
siguientes a medida que avancemos.
¿Tiene usted alguna pregunta?
Resultados
Fase 1: Calificaciones
Las calificaciones de la Fase 1 revelaron diferencias en la calificación entre los 9 evaluadores (Tabla C
en el material complementario en línea; consulte http://jrme.sagepub.com/supplemental), lo cual fue
confirmado por un análisis de varianza de medidas repetidas unidireccionales, F(8, 168) = 17,46, p <
0,001, η2 = 0,454 y pruebas LSD post hoc: el evaluador 1 dio puntuaciones significativamente más altas
que todos los demás evaluadores (p < 0,01), los evaluadores 2 y 3 dieron puntuaciones significativamente
más altas calificaciones que todos los demás evaluadores excepto el Evaluador 1 (p < .03), y los
Evaluadores 4 y 5 dieron calificaciones significativamente más altas que los Evaluadores 6, 7, 8 y 9 (p < .05).
Fase 1: Datos correlacionales
Parecía haber una consistencia considerable con respecto a las calificaciones de los 22 desempeños,
como se puede ver en la Tabla 1. De las 36 correlaciones productomomento de Pearson entre los 9
evaluadores, 32 fueron significativas al nivel de .01 y las 4 restantes fueron significativas al nivel de .01.
el nivel .05. El promedio de Pearson r fue .67.
Tabla 1. Fase 1: Correlaciones entre Evaluadores
evaluador 1 2 3 4 5 6 7 8 9
1
—
2 .43* —
3 .64** .71** —
4 .73** .62** .83** —
5 .58** .44* .72** .53** —
6 .80** .sesenta y cinco** .83** .81** .79** —
7 .sesenta y cinco** .63** .71** .75** .45* .73** —
8 .74** .54** .71** .75** .47* .75** .67** —
9 .61** .77** .71** .61** .66** .74** .63** .57** —
*p < .05. ** p < 0,01.
Fase 2: Efectos de Mayor, Sección e Intérprete
Realizamos un análisis de varianza de diseño mixto de tres vías para determinar los efectos de la mayor
(piano frente a no piano), la sección (frase de apertura, primera mitad, segunda mitad, coda e interpretación
intacta) y los cuatro intérpretes en las calificaciones. Se encontraron dos efectos significativos: un efecto
principal por ejecutante, F(3, 327) = 366,66, p < ,001, η2 = 0,770), y una interacción significativa entre
ejecutante y sección (F [12, 1308] = 18,42, p < 0,001, η2 = 0,143. El análisis post hoc del efecto del
intérprete reveló que las calificaciones de todos los intérpretes eran significativamente diferentes entre sí
(p < 0,01 en todos los casos). La interacción Ejecutor × Sección se puede interpretar examinando las
calificaciones intactas en función de la calificación de desempeño (ver Tabla 2): Para los Ejecutantes 1 y
2, las calificaciones intactas fueron más altas que las calificaciones de cualquiera de las secciones, pero
para los Ejecutores 3 y 4, las actuaciones intactas fueron calificadas más bajas que cualquiera de las
calificaciones seccionales. (aunque para el Intérprete 3, la calificación intacta promedio fue prácticamente
idéntica a la calificación promedio de la coda).
No surgieron otros factores significativos de este análisis de varianza. Los estudiantes de piano no
otorgaron calificaciones más altas o más bajas que los estudiantes que no son de piano, ni hubo
diferencias significativas en las calificaciones de las diversas secciones del estudio.
Tabla 2. Fase 2: Medias y Desviaciones Estándar para Desempeño Seccional y Completo
Rendimiento 1 Rendimiento 2 Rendimiento 3 Rendimiento 4
METRO Dakota del Sur METRO Dakota del Sur METRO Dakota del Sur METRO Dakota del Sur
Apertura 5.59 1.01 4.31 1.00 4.53 0.94 3.27 1.28

Primera mitad 6.01 0.94 4.89 1.08 4.11 1.24 2.74 1.22
segunda mitad 5.90 1.11 5.13 1.29 4.06 1.18 3.08 1.21
coda 5.54 1.16 5.21 1.14 3.69 1.28 3.47 1.28
Intacto 6.48 0.97 5.46 1.02 3.68 1.15 2.47 1.06
Fase 2: Datos correlacionales
Predicción de calificaciones desde secciones hasta el desempeño intacto. Para determinar si las
actuaciones intactas se predijeron con mayor precisión a partir de la frase inicial, de la coda o de la
primera o segunda mitad del estudio, calculamos correlaciones r de Pearson separadas para cada una
de las cuatro actuaciones. Los resultados se muestran en la Tabla 3.
Es difícil generalizar a partir de estos datos aparte de notar que (a) las correlaciones entre las cuatro
secciones y el desempeño intacto son más altas para el desempeño mejor calificado que para los otros
desempeños y (b) las calificaciones de los desempeños intactos parecen predecirse algo mejor a partir
de las secciones más grandes (primera y segunda mitad del estudio) que de las secciones más pequeñas
(frase de apertura y coda): La correlación promedio de productomomento de Pearson entre las
actuaciones fue de 0,38 para la primera mitad intacta y la segunda mitad. –coeficientes de correlación
intactos promediados juntos, pero fue de solo 0,25 para los coeficientes de apertura intacta y coda intacta
promediados juntos.
Finalmente, esperábamos encontrar correlaciones superiores al promedio entre apertura y
Tabla 3. Correlaciones r de Pearson por sección para cada desempeño
Apertura Primera mitad Segunda mitad coda Intacto
Rendimiento 1
—
Apertura
Primera mitad .42** —
segunda mitad .25** .30** —
coda .46** .30** .37** —
Intacto .40** .40** .51** .42** —

Rendimiento 2
—
Apertura
Primera mitad .01 —
segunda mitad .13 .17 —
coda .00 .18 .17 —
Intacto .24* .46** .39** .23* —
Rendimiento 3
—
Apertura
Primera mitad .19* —
segunda mitad .18 .04 —
coda .17 .32* .21* —
Intacto .13 .40** .10 .23* —
Rendimiento 4
—
Apertura
Primera mitad .34** —
segunda mitad .18 .31** —
coda .dieciséis .06 .28** —
Intacto .34** .48** .32** .04 —
*p < .05. ** p < 0,01.
primera mitad y entre segunda mitad y coda, porque en ambos casos, una de las secciones estaba
subsumida dentro de la otra. Este no resultó ser el caso.
Fiabilidad. Evaluamos la confiabilidad calculando las correlaciones productomomento de Pearson
para los primeros 10 extractos (ensayos 1 a 10) y sus presentaciones repetidas (ensayos 21 a 30). Para
las especialidades de piano, media r(25) = 0,66 (p < 0,01), y para las especialidades no pianísticas, media
r(85) = 0,60 (p < 0,01). El cincuenta y tres por ciento de las correlaciones de las carreras de piano no
fueron significativas, mientras que el 64% de las correlaciones de las carreras de piano fueron significativas (p < .05).
Confiabilidad por sección. Calculamos las correlaciones productomomento de Pearson individualmente
para cada uno de los 10 extractos que se presentaron dos veces (ensayos 1 y 21, 2 y 22, etc.). Las dos
correlaciones para cada uno de los cinco tipos de sección (frase de apertura, primera mitad, segunda
mitad, coda e intacta) luego se promediaron por separado para piano mayor y no piano mayor. Los
resultados revelaron que las correlaciones medias variaron de 0,27 a 0,38, excepto por correlaciones de
0,20 y 0,22 para las no principales al calificar la frase de apertura y la coda, respectivamente. Por lo tanto,
parece que las mayores no pianísticas se vieron afectadas de alguna manera por la longitud de la sección,
ya que las confiabilidades más bajas se asociaron solo con secciones más cortas. Sin embargo, para los
estudiantes de piano, el tipo de sección no pareció afectar la confiabilidad.
Discusión
En este estudio, intentamos determinar cómo se relacionarían las evaluaciones de una pieza musical
intacta con las evaluaciones de sus secciones componentes y ver si tales asociaciones variarían como
consecuencia de la calidad de la interpretación. Los participantes escucharon cuatro representaciones del
Estudio de la mariposa de Chopin , que difieren en calidad general, cada una presentada en su totalidad
(intacta) y en secciones. Los resultados indicaron que para las dos interpretaciones mejor calificadas, el
todo fue mayor que sus partes: las calificaciones intactas fueron más altas que las calificaciones parciales.
Sin embargo, para las dos actuaciones con calificaciones más bajas, sucedió lo contrario: las calificaciones
intactas fueron calificadas más bajas que las calificaciones seccionales. Por lo tanto, para cada una de las
cuatro representaciones, las calificaciones intactas divergieron de lo que se habría obtenido promediando
las calificaciones de las secciones que las componen.
Nuestros resultados son consistentes con investigaciones previas que muestran que las actuaciones
de los expertos se califican mejor para los extractos más largos que para los más cortos (Bergee, 1993,
1997; Fiske, 1975, 1979; Hewitt, 2007; Hewitt & Smith, 2004; S. Thompson et al. , 2007; Wapnick et al.,
2005). Son, de hecho, sorprendentemente similares a los de Geringer y Johnson (2007), quienes
encontraron que aunque los conjuntos universitarios y profesionales de bandas de viento obtuvieron una
calificación más alta durante más tiempo que los extractos más cortos, las actuaciones de conjuntos de
secundaria de menor calidad fueron calificadas más bajas durante más de para extractos más cortos. En
la actualidad, no se sabe si esta interacción se debió a estándares absolutos con respecto a la calidad del
desempeño o si fue el resultado de comparaciones implícitas realizadas entre los desempeños. Es posible,
por ejemplo, que los evaluadores tuvieran más confianza en sus evaluaciones cuanto más tiempo
escuchaban una actuación. Este aumento en la confianza puede haber impulsado sus calificaciones por
encima o por debajo de la calificación media de las secciones que componen el desempeño, dependiendo
de si la evaluación fue positiva o negativa.
negativo. O es posible que lo que se juzga bueno dependa de qué más se juzga.
Aunque no encontramos correlaciones particularmente fuertes entre la frase de apertura y la
interpretación intacta, o para la coda y la interpretación intacta, sí encontramos que las correlaciones con
las interpretaciones intactas correspondientes eran algo más fuertes para las calificaciones basadas en
la primera mitad o la segunda mitad del estudio (media r = 0,38) que para las secciones más cortas de
apertura y cierre (media r = 0,25). Esta mayor previsibilidad se puede ver en la Tabla 2: Las diferencias
de calificación entre las cuatro actuaciones están marcadas para las secciones de la primera mitad y la
segunda mitad y para las actuaciones intactas. Sin embargo, para la frase de apertura, la Interpretación
3 en realidad fue calificada ligeramente más alta que la Interpretación 2; y para la coda, las diferencias
en las calificaciones entre las dos interpretaciones principales y entre las dos interpretaciones inferiores
son mucho más estrechas que las diferencias en las calificaciones de las interpretaciones intactas
correspondientes.
Nuestro examen de la relación entre las secciones de apertura y cierre de una obra y su calificación
intacta tenía como objetivo determinar si las calificaciones intactas habrían sido susceptibles a un efecto
de primacía o un efecto de actualidad. Sin embargo, la importancia de una sección de apertura o de
cierre escuchada de forma aislada puede diferir de su importancia cuando se integra dentro de una
interpretación intacta. Una forma de que los investigadores examinen los verdaderos efectos de primacía
y actualidad sería empalmar varias aperturas diferentes seguidas de una interpretación posterior invariable
(efecto de primacía) y presentar una interpretación seguida de varios finales diferentes (efecto de
actualidad).
Dado que este estudio involucró escuchar solo una composición, debe verse como un impulso para
futuras investigaciones en lugar de un punto de partida para hacer generalizaciones. El estudio de
mariposas de Chopin es una pieza musical breve, monotemática, rápida y técnicamente exigente. Estas
características musicales particulares podrían haber afectado las calificaciones. Es concebible que
hubiésemos obtenido resultados completamente diferentes si hubiésemos utilizado piezas musicales más
extensas y estructuralmente complejas. No obstante, los resultados de nuestro estudio sugieren que las
evaluaciones de las secciones pueden diferir sistemáticamente de las evaluaciones de la obra intacta;
pueden ser más bajas o más altas que las calificaciones de las obras intactas, dependiendo de la calidad
general de la interpretación.
En nuestro estudio, los evaluadores calificaron extractos a nivel mundial. Podríamos haber obtenido
datos adicionales valiosos si hubiéramos utilizado una rúbrica de calificaciones (Ciorba & Smith, 2009;
Geringer et al., 2009; Latimer, Bergee & Cohen, 2010) o si hubiéramos pedido calificaciones de aspectos
musicales específicos. Sin embargo, sentimos que hacerlo aumentaría el tiempo necesario para que los
evaluadores califiquen 30 desempeños más allá de lo que hubiera sido aceptable.
Debe tenerse en cuenta que los resultados de este estudio no significan que ninguno de los pianistas
cuyas interpretaciones fueron escuchadas por los evaluadores sea en ningún sentido “superior”.
Aunque la interpretación con la calificación más alta fue calificada más alta que la segunda interpretación
con la calificación más alta, la Interpretación 2 provino de un concierto en vivo, mientras que la
Interpretación 1 se extrajo de un disco compacto comercial. Además, es posible que estas dos actuaciones
se hayan beneficiado de una grabación de sonido superior en comparación con las otras dos actuaciones.
Aunque ninguna de las grabaciones que elegimos sufría de problemas graves de sonido, e instruimos a los
evaluadores para que ignoraran la calidad de la grabación al asignar calificaciones a los extractos, la
calidad de la grabación, sin embargo, podría haber afectado las calificaciones.
En la Fase 1 de este estudio, encontramos que aunque nuestros 9 evaluadores diferían en
sus estándares de calificación, coincidían sustancialmente en qué actuaciones eran mejores
que otras (Tabla 1). Sin embargo, las correlaciones obtenidas probablemente dependían de las
características específicas de la situación experimental. Doce de las 22 actuaciones fueron de
concertistas reconocidos internacionalmente. Si hubiéramos reducido la dispersión de la calidad
de la interpretación utilizando únicamente las interpretaciones de dichos pianistas, es muy
probable que hubiéramos obtenido correlaciones más bajas. Además, es posible que el acuerdo
entre los evaluadores se hubiera reducido si hubiéramos pedido a evaluadores con menos
experiencia musical que calificaran las actuaciones. Investigaciones previas han arrojado
resultados mixtos sobre este punto, con algunos estudios que muestran que la experiencia
musical y la familiaridad mejoran la confiabilidad tanto dentro como entre evaluadores (Fiske,
1977a; Hewitt, 2002, 2005; Kinney, 2009; Morrison, Montemayer y Wiltshire, 2004) ; Sparks,
1990; W. Thompson et al., 1998; Towers, 1980) y otros estudios que no confirman tales
resultados (Fiske, 1975, 1977; Heath, 1976; Roberts, 1975; Wapnick, Flowers, Alegant, &
Jasinskas, 1993 ). También parece posible que los efectos de variables como la familiaridad
del extracto (Bergee, 2007; Kinney, 2009; Wapnick et al., 2004) y aspectos de los estímulos
musicales, particularmente el tempo (Geringer & Johnson, 2007; LeBlanc, Colman, McCrary,
Sherrill y Malin, 1988; Wapnick et al., 2005), podría interactuar con el tiempo de escucha.
Finalmente, la cuestión de la evaluación de la parte frente al todo podría considerarse en
relación con la interpretación musical. Es posible que la concepción general de una pieza
musical de un artista sea de mayor importancia que la precisión y la expresividad con que se
tocan las notas, dentro de una sección en particular o quizás a lo largo de toda la obra. Puede
resultar difícil para uno definir la concepción musical operativamente, pero tal vez sus efectos
puedan mostrarse en aquellos casos en que las medidas de las partes difieren de las medidas
del todo.
Declaración de Conflicto de Intereses
Los autores no declararon posibles conflictos de interés con respecto a la investigación, autoría y/o publicación
de este artículo.
Fondos
Los autores no recibieron apoyo financiero para la investigación, autoría y/o publicación de este artículo.
Referencias
Bergee, MJ (1993). Una comparación de la facultad, los compañeros y la autoevaluación de las actuaciones
aplicadas del jurado de metales. Revista de Investigación en Educación Musical, 41, 19–27.
doi:10.2307/3345476 Bergee, MJ (1995). Factores primarios y de orden superior en una escala que evalúa la
interpretación de una banda de concierto. Boletín del Consejo de Investigación en Educación Musical, 126, 1–14.
Bergee, MJ (1997). Relaciones entre docentes, pares y autoevaluaciones de desempeños aplicados. Revista de
Investigación en Educación Musical, 45, 601–612. doi:10.2307/3345425
Bergee, MJ (2003). La facultad interjuece la confiabilidad de la evaluación de la interpretación musical. Diario de
Bergee, MJ (2007). Intérprete, evaluador, ocasión y secuencia como fuentes de variabilidad en la evaluación de
la interpretación musical. Revista de Investigación en Educación Musical, 55, 344–358.
doi:10.1177/0022429408317515
Brittin, RL (2002). Valoración de los instrumentistas de la interpretación solista con disco compacto, piano o sin
acompañamiento. Revista de Investigación en Educación Musical, 50, 63–74. doi:10.2307/3345693
Byo, JL y Crone, LJ (1989). Adjudicación por no músicos: una comparación de actuaciones profesionales y
amateurs. Missouri Journal of Research in Music Education, 26, 60–73.
Ciorba, CR y Smith, Nueva York (2009). Medición de jurados de desempeño instrumental y vocal de pregrado
utilizando una rúbrica de evaluación multidimensional. Revista de Investigación en Educación Musical, 57, 5–
15. doi:10.1177/0022429409333405
Ekholm, E. (1994). El efecto de la escucha guiada en la evaluación de la interpretación vocal solista
(Tesis de maestría). Universidad McGill, Montreal, Canadá.
Fiske, HE (1975). Diferencias entre grupos de jueces en la calificación de las interpretaciones de la trompeta en
la escuela secundaria. Revista de Investigación en Educación Musical, 23, 186–196. doi:10.2307/3344643
Fiske, HE (1977a). Relación de factores seleccionados en la confiabilidad de la adjudicación del desempeño de
la trompeta. Revista de Investigación en Educación Musical, 25, 256–263. doi:10.2307/3345266 Fiske, HE
(1977b). ¿Quién va a juzgar? Nuevos conocimientos sobre la evaluación del desempeño. Música Educa
tors Journal, 64(4), 23–25. doi:10.2307/3395371
Fiske, HE (1979). Capacidad de evaluación de la interpretación musical: hacia un modelo de especificidad.
Boletín del Consejo de Investigación en Educación Musical, 59, 2731.
Geringer, JM, Allen, ML, MacLeod, RB y Scott, L. (2009). Uso de una rúbrica de preselección para la selección
de violines en todos los estados: influencias de la interpretación y la experiencia docente. Actualización:
Aplicaciones de la Investigación en Educación Musical, 28, 41–46. doi:10.1177/8755123309344109 Geringer,
JM y Johnson, CM (2007). Efectos de la duración del extracto, el tempo y el nivel de rendimiento en las
calificaciones de los músicos de las actuaciones de la banda de viento. Journal of Research in Music
Education, 55, 289–301. doi:10.1177/0022429408317366
Geringer, JM y Madsen, CK (1998). Calificaciones de los músicos de buenas versus malas interpretaciones
vocales y de cuerdas. Revista de Investigación en Educación Musical, 46, 522–534. doi:10.2307/3345348
Gillespie, R. (1997). Calificaciones de interpretación de vibrato de violín y viola en presentaciones audiovisuales
y de solo audio. Revista de Investigación en Educación Musical, 45, 212–220. doi:10.2307/3345581 Heath,
CE (1976). El efecto de la instrucción en la consistencia de las calificaciones otorgadas en la adjudicación de
extractos de solos de trompeta (tesis doctoral), Universidad de Indiana, Bloomington.
Hewitt, parlamentario (2002). Tendencias de autoevaluación de instrumentistas de secundaria. Diario de
Investigación en Educación Musical, 50, 215–226. doi:10.2307/3345799 Hewitt,
MP (2005). Precisión de la autoevaluación entre instrumentistas de secundaria y preparatoria. Revista de
Investigación en Educación Musical, 53, 148–161. doi:10.1177/ 002242940505300205
Hewitt, parlamentario (2007). Influencia del instrumento de interpretación principal y el nivel educativo en la
evaluación de la interpretación musical. Revista de Investigación en Educación Musical, 55, 18–30.
doi:10.1177/002242940705500103
Hewitt, MP y Smith, BP (2004). La influencia del nivel de la carrera docente y el instrumento principal de
interpretación en la evaluación de la interpretación musical. Revista de Investigación en Educación Musical,
52, 314–327. doi:10.1177/002242940405200404
Kinney, D. (2009). Consistencia interna de las evaluaciones de desempeño en función de la experiencia musical
y la familiaridad con el extracto. Revista de Investigación en Educación Musical, 56, 322–337.
doi:10.1177/0022429408328934
Latimer, ME, Bergee, MJ y Cohen, ML (2010). Fiabilidad y utilidad percibida de una rúbrica ponderada de
evaluación del desempeño musical. Revista de Investigación en Educación Musical, 58, 168–183.
doi:10.1177/0022429410369836
LeBlanc, A., Colman, J., McCrary, J., Sherrill, C. y Malin, S. (1988). Preferencias de tempo de oyentes de
música de diferentes edades. Revista de Investigación en Educación Musical, 36, 156–168.
doi:10.2307/3344637
LeBlanc, A. y Sherrill, C. (1986). Efecto del vibrato vocal y el sexo del intérprete en la preferencia musical de los
niños. Revista de Investigación en Educación Musical, 34, 222–237. doi:10.2307/3345258 McCrary, J.
(1993). Efectos de la raza de los oyentes e intérpretes en las preferencias musicales. Diario de
Morrison, SJ, Montemayer, M. y Wiltshire, ES (2004). El efecto de un modelo grabado en las autoevaluaciones,
el rendimiento y la actitud de los estudiantes de banda. Revista de Investigación en Educación Musical, 52,
116–129. doi:10.2307/3345434 Roberts, BA (1975). Diferencias entre jueces y grupos en la calificación de
interpretaciones pianísticas (tesis de MusM). Universidad de Western Ontario, Londres, Canadá.
Chispas, GE (1990). El efecto de la autoevaluación en el rendimiento musical, la atención y las actitudes de los
estudiantes instrumentales de la escuela primaria (tesis doctoral). Universidad Estatal de Luisiana, Baton
Rouge.
Thompson, S., Williamon, A. y Valentine, E. (2007). Características dependientes del tiempo de per
evaluación de rendimiento. Percepción musical, 25, 13–29.
Thompson, WF, Diamond, CP y Balkwill, LL (1998). La adjudicación de seis actuaciones de un estudio de
Chopin: un estudio del conocimiento experto. Psicología de la Música, 26, 154–174.
doi:10.1177/0305735698262004
Torres, R. (1980). Diferencias por grupos de edad en la confiabilidad de los jueces de las interpretaciones de
voz solista (Tesis de maestría no publicada). Universidad de Western Ontario, Londres, Canadá.
Vasil, T. (1973). Los efectos de la variación sistemática de factores seleccionados en la adjudicación de la
interpretación musical (tesis doctoral inédita). Universidad de Connecticut, Storrs.
Wagner, MJ (1991). El efecto de adjudicar tres actuaciones de música popular grabadas en video en una
calificación de “crítica compuesta” y una calificación “general”. Missouri Journal of Research in Music
Education, 28, 53–70.
Wapnick, J., Darrow, A.A., Kovacs, J. y Dalrymple, L. (1997). Efectos del atractivo físico en la evaluación del
desempeño vocal. Revista de Investigación en Educación Musical, 45, 470–479. doi:10.2307/3345540
Wapnick, J. y Ekholm, E. (1997). Evaluación de la producción vocal en la interpretación de voz solista.
Revista de Voz, 11, 429–436. doi:10.1016/S08921997(97)800392
Wapnick, J., Flowers, P., Alegant, M. y Jasinskas, L. (1993). Coherencia en la evaluación de la interpretación
pianística. Revista de Investigación en Educación Musical, 4, 282–292. doi:10.2307/3345504
Wapnick, J., KovacsMazza, J. y Darrow, A.A. (2000). Efectos del artista intérprete o ejecutante atractivo
ness, el comportamiento escénico y la vestimenta en la evaluación de las interpretaciones de piano de los niños. Revista
de Investigación en Educación Musical, 48, 323–336. doi:10.2307/3345367
Wapnick, J., Ryan, C., Campbell, L., Deek, P., Lemire, R. y Darrow, A.A. (2005). Efectos del tempo y la duración del extracto
en las calificaciones de los músicos de las interpretaciones de piano de alto nivel. Revista de Investigación en Educación
Musical, 53, 162–176. doi:10.1177/002242940505300206 Wapnick, J., Ryan, C., Lacaille, N. y Darrow, A.A. (2004).
Efectos de variables seleccionadas en las calificaciones de los músicos de las interpretaciones de piano de alto nivel. Revista
Internacional de Educación Musical, 22, 7–20. doi:10.1177/0255761404042371
Zdzinski, SF y Barnes, GV (2002). Desarrollo y validación de una escala de calificación de desempeño de cuerdas. Revista de
biografías
Joel Wapnick es profesor de educación musical en la Universidad McGill. Sus intereses de investigación se ocupan de las
variables musicales y no musicales que afectan la evaluación de la interpretación musical.
AliceAnn Darrow es Profesora Irwin Cooper de Musicoterapia y Educación Musical en la Universidad Estatal de Florida. Sus
intereses de investigación incluyen la enseñanza de la música a poblaciones especiales y el papel de la música en la cultura
sorda.
Presentado el 25 de agosto de 2011; aceptado el 10 de mayo de 2012.

ES Joel Wapnick1 and Alice-Ann Darrow

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

ES Joel Wapnick1 and Alice-Ann Darrow

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

Rendimiento 1 Rendimiento 2 Rendimiento 3 Rendimiento 4

METRO Dakota del Sur METRO Dakota del Sur METRO Dakota del Sur METRO Dakota del Sur

Apertura 5.59 1.01 4.31 1.00 4.53 0.94 3.27 1.28

Apertura Primera mitad Segunda mitad coda Intacto

segunda mitad .25 .30 —

coda .46 .30 .37** —

Intacto .40 .40 .51 .42 —

segunda mitad .13 .17 —

coda .00 .18 .17 —

Intacto .24* .46 .39 .23* —

segunda mitad .18 .04 —

coda .17 .32* .21* —

Intacto .13 .40** .10 .23* —

segunda mitad .18 .31** —

coda .dieciséis .06 .28** —

Intacto .34 .48 .32** .04 —

También podría gustarte