Está en la página 1de 13

Machine Translated by Google

465318JRM60410.1177/0022429412465318Diario
de  Investigación  en  Educación  MusicalWapnick  y  Darrow

Revista  de  Investigación  en  Educación  
Seccional  versus  intacto Musical  60(4)  
462–474  ©  2013  Nacional

Evaluaciones  de  cuatro Asociación  para  la  Educación  Musical
Reimpresiones  y  permiso:  
sagepub.com/journalsPermissions.nav  DOI:  
Versiones  de  un  estudio  de  Chopin 10.1177/0022429412465318  http://
jrme.sagepub.com

Joel  Wapnick1  y  Alice­Ann  Darrow2

Abstracto

El  propósito  de  este  estudio  fue  determinar  cómo  las  evaluaciones  de  cuatro  representaciones  intactas  de  
un  estudio  de  Chopin  (Op.  25,  No.  9,  Mariposa),  que  difieren  en  calidad,  se  relacionan  con  las  evaluaciones  
de  las  secciones  de  cada  actuación.  Presentamos  cada  actuación  como  cinco  extractos:  (a)  frase  de  
apertura,  (b)  primera  mitad,  (c)  segunda  mitad,  (d)  coda  y  (e)  intacto.  Luego  presentamos  10  de  los  20  
extractos  por  segunda  vez  para  evaluar  la  confiabilidad  del  oyente.  Los  resultados  revelaron  una  interacción  
entre  el  ejecutante  y  las  calificaciones:  las  calificaciones  de  las  actuaciones  intactas  fueron  significativamente  
más  altas  que  las  calificaciones  de  las  secciones  de  los  componentes  para  las  dos  mejores  actuaciones.  
Sin  embargo,  para  las  otras  dos  actuaciones,  las  calificaciones  de  los  extractos  intactos  fueron  
significativamente  más  bajas  que  las  calificaciones  de  las  secciones  componentes.  Los  factores  no  
significativos  fueron  las  secciones  y  el  fondo  del  oyente.  Los  datos  indican  que  las  calificaciones  de  las  
secciones  más  largas  (primera  y  segunda  mitad)  estaban  más  estrechamente  vinculadas  a  las  calificaciones  
de  desempeño  intacto  que  las  secciones  más  cortas  (frase  inicial  y  coda).  Los  datos  correlacionales  
revelaron  que  las  especializaciones  en  piano  eran  marginalmente  más  confiables  que  las  especializaciones  en  otras  discipl

Palabras  clave  

adjudicación,  interpretación  musical,  piano

La  duración  de  los  extractos  ha  surgido  recientemente  como  una  variable  de  interés  en  la  investigación  
sobre  adjudicación  de  música  (Geringer  &  Johnson,  2007;  Geringer,  Allen,  MacLeod  y  Scott,  2009;  W.  
Thompson,  Diamond  y  Balkwill,  2007;  Wapnick  et  al.,  2005). .  Sin  embargo,  aún  quedan  por  abordar  a  fondo  
muchas  cuestiones  relativas  a  esta  variable.  Uno  de  ellos  podría  plantearse  en  forma  de  pregunta:  ¿Cuánto  
tiempo  es  "suficientemente  largo"?  En  este  contexto,

Universidad  McGill,  Montreal,  QC,  Canadá
2
Universidad  Estatal  de  Florida,  Tallahassee,  Florida,  EE.  UU.

Autor  para  correspondencia:  Joel  
Wapnick,  Universidad  McGill,  555  Sherbrooke  St.  W.,  Montreal,  QC  H3W  2J1,  Canadá  Correo  electrónico:  
jwapnick@music.mcgill.ca
Machine Translated by Google

Wapnick  y  Darrow 463

“el  tiempo  suficiente”  no  se  refiere  ni  a  la  cortesía  mostrada  a  un  intérprete  o  grupo  de  
interpretación  ni  al  disfrute  estético  de  la  música,  por  importantes  que  sean  estas  consideraciones.  
El  concepto  de  “tiempo  suficiente”  se  basa  en  la  suposición  de  que  hay  un  punto  en  el  tiempo  
más  allá  del  cual  las  evaluaciones  ya  no  cambian  sustancialmente  y  la  confiabilidad  ya  no  mejora.  
En  concursos  y  audiciones,  los  jueces  a  veces  terminan  las  representaciones  de  manera  
arbitraria;  han  oído  lo  suficiente  y,  por  lo  tanto,  han  aceptado  la  suposición  de  “el  tiempo  
suficiente”,  al  menos  tácitamente.  Sin  embargo,  en  otras  situaciones,  como  las  actuaciones  de  
recitales,  los  jueces  escuchan  el  final  de  una  actuación.  Aquí  no  hay  suposición  de  “lo  
suficientemente  largo”;  los  eventos  que  ocurren  después  de  cualquier  momento,  incluso  cerca  
del  final  de  un  recital  de  una  hora,  pueden  afectar  las  evaluaciones.
Geringer  et  al.  (2009)  sostuvieron  que  la  eficiencia  en  la  adjudicación  es  una  preocupación  
importante  porque  escuchar  una  gran  cantidad  de  actuaciones  suele  ser  costoso,  lleva  mucho  
tiempo  y  está  sujeto  a  errores  debido  a  los  efectos  potenciales  de  la  fatiga  y  el  sesgo.  Su  estudio  
se  refería  a  la  selección  de  candidatos  a  violinistas  para  la  admisión  en  tres  orquestas  de  todo  el  
estado  de  Florida.  El  proceso  de  adjudicación  tradicional  requería  calificar  actuaciones  de  un  
estudio  de  1  minuto,  un  extracto  orquestal,  escalas  mayores  y  menores,  y  lectura  a  primera  vista.  
Los  investigadores  encontraron,  sin  embargo,  que  las  decisiones  basadas  en  el  uso  de  una  
rúbrica  de  preselección,  aplicada  únicamente  a  la  evaluación  del  estudio,  se  correlacionaron  bien  
con  las  decisiones  basadas  en  el  enfoque  tradicional  más  extenso.  Pudieron  reducir  el  "tiempo  
suficiente"  a  1  minuto  por  alumno.
Con  la  excepción  de  una  disertación  de  Vasil  (1973)  y  una  serie  de  estudios  realizados  por  
Bergee  (1993,  1995,  1997,  2003),  los  estudios  de  investigación  sobre  adjudicación  de  música  
expusieron  universalmente  a  los  oyentes  a  extractos  de  menos  de  3  minutos.  El  empleo  de  
extractos  de  1  a  3  minutos  se  ha  utilizado  comúnmente  (Ekholm,  1994;  Gillespie,  1997;  W.  
Thompson  et  al.,  1998;  Wagner,  1991;  Wapnick,  Darrow,  Kovacs  y  Dalrymple,  1997;  Wapnick  y  
Ekholm ,  1997;  Wapnick,  Kovacs­Mazza  y  Darrow,  2000;  Wapnick,  Ryan,  Lacaille  y  Darrow,  
2004),  y  muchos  estudios  utilizaron  extractos  incluso  más  breves  (Brittin,  2002;  Byo  y  Crone,  
1989;  Fiske,  1975,  1977b;  Geringer  y  Madsen,  1998;  LeBlanc  y  Sherrill,  1986;  McCrary,  1993;  
Zdzinski  y  Barnes,  2002).  El  uso  de  extractos  breves  es  problemático  solo  en  la  medida  en  que  
las  evaluaciones  de  ellos  pueden  ser  menos  confiables  que  las  evaluaciones  de  extractos  más  
largos,  o  que  las  evaluaciones  de  extractos  breves  pueden  no  ser  representativas  de  las  
evaluaciones  tomadas  de  extractos  más  largos.  En  al  menos  dos  estudios,  sin  embargo,  se  ha  
demostrado  que  para  piezas  relativamente  cortas,  las  duraciones  de  escucha  para  interpretaciones  
seccionales  versus  intactas  pueden  diferir  considerablemente  sin  que  surjan  diferencias  
sustanciales  en  las  calificaciones  o  la  confiabilidad.  Vasil  (1973)  no  encontró  tales  diferencias  
para  extractos  de  5  min,  2,5  min  y  1,25  min  de  duración.  Geringer  y  Johnson  (2007)  obtuvieron  
resultados  similares  utilizando  duraciones  más  cortas.  Compararon  extractos  de  actuaciones  de  
bandas  de  música  de  12  s,  25  s  y  50  s  de  duración  y  no  encontraron  ningún  efecto  principal  en  la  
duración.  Sin  embargo,  encontraron  que  los  desempeños  a  nivel  profesional  y  universitario  se  
calificaron  más  alto  cuando  la  duración  de  los  extractos  era  más  larga,  y  que  las  calificaciones  
más  bajas  de  los  desempeños  de  la  escuela  secundaria  de  menor  calidad  se  asociaron  con  
extractos  de  menor  duración.  Estos  resultados  corroboran  los  de  Wapnick  et  al.  (2005),  quienes  
encontraron  que  para  oyentes  experimentados,  extractos  de  interpretaciones  de  pianistas  de  alto  nivel  que  du
Machine Translated by Google

464 Revista  de  investigación  en  educación  musical  60  (4)

Los  extractos  de  20  s  recibieron  una  calificación  más  alta  y  más  confiable  que  los  extractos  de  20  s.  Los  
participantes  en  un  estudio  de  S.  Thompson,  Williamon  y  Valentine  (2007)  calificaron  las  obras  para  piano  
de  Bach  y  Chopin  continuamente  moviendo  el  mouse  a  lo  largo  de  una  escala  de  7  puntos.  Aunque  las  
respuestas  se  estabilizaron  hasta  cierto  punto  después  de  15  a  20  s,  tendieron  a  aumentar  después,  
particularmente  dentro  del  primer  minuto.
En  el  presente  estudio,  examinamos  los  efectos  de  la  duración  de  los  extractos  comparando  las  
calificaciones  de  las  interpretaciones  intactas  de  un  estudio  de  Chopin  con  las  calificaciones  de  las  
secciones  extraídas  de  la  interpretación.  También  estábamos  interesados  en  cómo  las  calificaciones  de  
secciones  particulares  del  estudio  podrían  relacionarse  con  las  calificaciones  de  sus  correspondientes  
actuaciones  intactas.  Es  posible  que  las  calificaciones  de  una  obra  intacta  se  predigan  mejor  a  partir  de  
las  calificaciones  de  su  frase  de  apertura  que  de  las  calificaciones  de  otras  secciones.  Por  otro  lado,  las  
calificaciones  de  la  coda  del  estudio  podrían  estar  más  estrechamente  relacionadas  con  las  calificaciones  
de  las  interpretaciones  intactas.  Además,  comparamos  las  calificaciones  de  las  interpretaciones  intactas  
con  las  calificaciones  de  la  primera  y  la  segunda  mitad  del  estudio,  e  investigamos  si  la  calidad  de  una  
interpretación  intacta  en  relación  con  otras  interpretaciones  intactas  podría  ser  importante  para  determinar  
cómo  las  calificaciones  de  las  secciones  versus  las  calificaciones  de  la  obra  completa.  relacionados  entre  
sí.  ¿La  calificación  numérica  de  una  interpretación  intacta  estaría  cerca  de  la  calificación  media  de  las  
secciones  que  comprende,  o  sería  más  alta  para  las  interpretaciones  de  mayor  calificación  y  menor  para  
las  de  menor  calificación?  En  resumen,  estábamos  interesados  en  cómo  la  percepción  del  todo  se  
relacionaba  con  la  percepción  de  sus  partes,  y  en  si  las  diferencias  en  la  calidad  de  los  cuatro  "todos"  
empleados  en  este  estudio,  las  cuatro  actuaciones  intactas,  interactuarían  con  las  calificaciones  de  sus  
partes.  secciones  correspondientes.

Método

Este  estudio  constó  de  dos  fases.  En  la  Fase  1,  los  evaluadores  escucharon  y  calificaron  22  versiones  de  
Butterfly  Étude  de  Chopin,  op.  25,  No.  9.  Usamos  estas  clasificaciones  para  seleccionar  4  versiones  de  
las  22  para  usar  en  la  Fase  2,  como  se  describe  en  la  siguiente  sección.

Evaluadores

Empleamos  dos  grupos  de  evaluadores,  todos  voluntarios.  Los  evaluadores  de  la  Fase  1  fueron  9  
personas:  3  estudiantes  graduados  de  piano  y  6  profesores  de  tiempo  completo  en  interpretación,  teoría,  
musicología  y  educación  musical.  Todos  eran  de  la  misma  escuela  universitaria  de  música.  Los  
evaluadores  de  la  Fase  2  fueron  111  estudiantes  de  pregrado  y  posgrado  en  música  de  dos  universidades.  
Ochenta  y  cinco  eran  mayores  de  piano  y  26  eran  mayores  de  piano.

Fase  1:  Materiales  y  Procedimientos

Grabamos  22  representaciones  completas  de  Butterfly  Étude  de  Chopin  desde  YouTube  (www.youtube.com)  
en  un  iMac  de  Apple  usando  Wiretap  Studio  (Ambrosia  Software,  Inc.).  Se  utilizaron  actuaciones  de  
YouTube  porque  incluían  una  amplia  variedad  de  niveles  de  habilidad.  Los  editamos  usando  Peak  (Bias,  
Inc.)  para  igualar  los  niveles  de  volumen  y  estandarizar  la  duración  del  silencio  antes  y  después  de  cada  
actuación.
Machine Translated by Google

Wapnick  y  Darrow 465

A  seis  de  los  9  evaluadores  se  les  entregó  un  CD  para  que  lo  escucharan  en  su  tiempo  libre.  
Otros  tres  escucharon  el  CD  al  mismo  tiempo  en  un  salón  de  clases.  A  los  evaluadores  se  les  dieron  
las  siguientes  instrucciones:

Está  a  punto  de  escuchar  22  versiones  diferentes  del  Estudio  de  la  mariposa  de  Chopin  (Op.  
25,  No.  9).  Después  de  escuchar  cada  uno,  asígnele  una  calificación  de  0  a  100,  donde  100  
representa  lo  que,  en  su  opinión,  es  una  interpretación  tan  buena  como  es  probable  que  
escuche  de  la  pieza  y  0  representa  un  esfuerzo  muy  pobre.  Me  doy  cuenta  de  que  la  calidad  
del  sonido  en  estas  actuaciones  varía;  intente  ignorar  la  calidad  del  sonido  y  concéntrese  solo  
en  la  calidad  de  las  actuaciones.

Empleamos  una  escala  de  100  puntos  para  esta  tarea  porque  tal  escala  comúnmente  es
utilizado  en  muchas  universidades  en  la  evaluación  de  actuaciones  musicales.

Fase  2:  Materiales  y  Procedimientos

Seleccionamos  4  actuaciones  de  las  22  escuchadas  por  los  evaluadores  de  la  Fase  1  (consulte  la  
Tabla  A1,  en  el  material  complementario  en  línea  disponible  en  http://jrme.sagepub.com/supplemen  
tal)  para  usar  en  la  Fase  2.  Elegimos  actuaciones  que  diferían  notablemente  de  entre  sí  en  la  
calificación  de  la  calidad.  Esto  nos  permitió  determinar  si  las  diferencias  en  la  calidad  relativa  
afectarían  la  fuerza  y  dirección  de  las  discrepancias  entre  las  calificaciones  generales  y  seccionales  
para  cada  una  de  las  4  representaciones.
Las  cuatro  grabaciones  de  la  Fase  2  fueron  interpretadas  por  un  concertista  de  piano  de  renombre  
internacional,  ganador  de  concursos  internacionales  de  piano,  un  profesor  universitario  de  piano  
experimentado  y  un  pianista  aficionado  (Interpretaciones  15,  11,  21  y  10,  respectivamente,  en  la  Tabla  
A  del  Apéndice). ,  disponible  en  el  material  complementario  en  línea  en  http://jrme.sagepub.com/
supplemental).  La  duración  de  las  actuaciones  intactas  varió  de  59  s  a  65  s.  Cabe  señalar  que  la  
calificación  más  baja  de  las  cuatro  representaciones  fue  fluida  y  competente  y  se  interpretó  a  un  
tempo  apropiado  para  el  estudio.  De  ahora  en  adelante,  se  hará  referencia  a  estas  interpretaciones  
por  número,  siendo  la  Interpretación  1  la  calificación  más  alta  y  la  Interpretación  4  la  calificación  más  
baja.
Para  verificar  que  las  cuatro  actuaciones  diferían  en  la  calidad  nominal,  realizamos  seis  pruebas  t  
(consulte  la  Tabla  B,  http://jrme.sagepub.com/supplemental).  Con  la  excepción  de  la  prueba  t  que  
compara  los  dos  desempeños  con  calificaciones  más  bajas  (p  =  0,061),  la  calificación  media  de  cada  
desempeño  fue  significativamente  diferente  de  las  calificaciones  promedio  de  los  otros  tres  (p  <  0,025).

El  primer  extracto  del  CD  experimental  consistía  en  una  versión  intacta  "modelo"  del  estudio  de  
Chopin  (no  es  una  de  las  cuatro  representaciones  de  la  Fase  2  y  no  debe  ser  calificada  por  los  
participantes).  De  las  22  versiones  calificadas  en  la  Fase  1,  esta  había  alcanzado  el  segundo  promedio  
más  alto  y  es  el  octavo  desempeño  como  se  muestra  en  la  Tabla  A  (ver  http://jrme.sagepub.com/
supplemental).
Siguieron  veinte  ensayos,  y  consistieron  en  una  presentación  ordenada  al  azar  de  los  cinco  
extractos  tomados  de  las  cuatro  actuaciones.  Los  extractos  consistían  en
Machine Translated by Google

466 Revista  de  investigación  en  educación  musical  60  (4)

siguiente:  (a)  frase  inicial  (mm.  1–8,  duración  media  =  8  s);  (b)  primera  mitad  (mm.  1­24,  duración  media  
=  29  s);  (c)  segunda  mitad  (mm.  25­51,  duración  media  =  33  s);  (d)  coda  (mm.  37­51,  duración  media  =  
18  s);  y  (e)  intacto  (mm.  1­51,  duración  media  =  62  s).  Luego  presentamos  la  mitad  de  las  20  versiones  
(ensayos  1  a  10)  nuevamente  en  el  mismo  orden  (ensayos  21  a  30)  para  evaluar  la  confiabilidad  del  
evaluador.
Se  realizaron  sesiones  de  escucha  en  grupos  y  se  leyeron  a  los  evaluadores  las  siguientes  
instrucciones:

El  propósito  de  este  estudio  es  determinar  la  cantidad  mínima  de  tiempo  que  se  necesita  para  
juzgar  la  música  de  manera  confiable.  En  consecuencia,  escuchará  30  ejemplos  musicales,  todos  
de  la  misma  pieza  y  cada  uno  con  una  duración  de  8  segundos  a  1  minuto.  Cada  prueba  será  de  
la  interpretación  completa  del  Estudio  de  la  mariposa  de  Chopin  o  de  un  extracto  de  esa  obra.  
Califique  estas  pruebas  en  una  escala  de  7  puntos  encerrando  en  un  círculo  un  número,  donde  1  
significa  un  rendimiento  deficiente  y  7  significa  un  rendimiento  excelente.  Además,  y  de  acuerdo  
con  el  propósito  de  este  experimento,  no  haga  su  elección  de  calificación  hasta  después  de  que  
se  reproduzca  todo  el  ejemplo  de  prueba.  Hay  algunas  diferencias  en  la  calidad  de  la  grabación;  
intente  ignorarlas  y  califique  solo  a  los  pianistas.  Tendrás  5  segundos  entre  intentos  para  calificar  
cada  desempeño.  El  experimento  completo  tomará  18  minutos.

Comenzaremos  con  una  interpretación  completa  del  Butterfly  Étude,  para  que  os  hagáis  una  idea  
de  cómo  suena  la  pieza.  No  califiques  este  desempeño.  Anunciaré  los  números  de  las  pruebas  
siguientes  a  medida  que  avancemos.

¿Tiene  usted  alguna  pregunta?

Resultados

Fase  1:  Calificaciones

Las  calificaciones  de  la  Fase  1  revelaron  diferencias  en  la  calificación  entre  los  9  evaluadores  (Tabla  C  
en  el  material  complementario  en  línea;  consulte  http://jrme.sagepub.com/supplemental),  lo  cual  fue  
confirmado  por  un  análisis  de  varianza  de  medidas  repetidas  unidireccionales,  F(8,  168)  =  17,46,  p  <  
0,001,  η2  =  0,454  y  pruebas  LSD  post  hoc:  el  evaluador  1  dio  puntuaciones  significativamente  más  altas  
que  todos  los  demás  evaluadores  (p  <  0,01),  los  evaluadores  2  y  3  dieron  puntuaciones  significativamente  
más  altas  calificaciones  que  todos  los  demás  evaluadores  excepto  el  Evaluador  1  (p  <  .03),  y  los  
Evaluadores  4  y  5  dieron  calificaciones  significativamente  más  altas  que  los  Evaluadores  6,  7,  8  y  9  (p  <  .05).

Fase  1:  Datos  correlacionales

Parecía  haber  una  consistencia  considerable  con  respecto  a  las  calificaciones  de  los  22  desempeños,  
como  se  puede  ver  en  la  Tabla  1.  De  las  36  correlaciones  producto­momento  de  Pearson  entre  los  9  
evaluadores,  32  fueron  significativas  al  nivel  de  .01  y  las  4  restantes  fueron  significativas  al  nivel  de  .01.  
el  nivel  .05.  El  promedio  de  Pearson  r  fue  .67.
Machine Translated by Google

Wapnick  y  Darrow 467

Tabla  1.  Fase  1:  Correlaciones  entre  Evaluadores

evaluador 1 2 3 4 5 6 7 8 9

1

2 .43*  —
3 .64** .71**  —
4 .73** .62** .83**  —
5 .58** .44* .72** .53**  —
6 .80** .sesenta  y  cinco** .83** .81** .79**  —
7 .sesenta  y  cinco** .63** .71** .75** .45* .73**  —
8 .74** .54** .71** .75** .47* .75** .67**  —
9 .61** .77** .71** .61** .66** .74** .63** .57**  —

*p  <  .05.  **  p  <  0,01.

Fase  2:  Efectos  de  Mayor,  Sección  e  Intérprete
Realizamos  un  análisis  de  varianza  de  diseño  mixto  de  tres  vías  para  determinar  los  efectos  de  la  mayor  
(piano  frente  a  no  piano),  la  sección  (frase  de  apertura,  primera  mitad,  segunda  mitad,  coda  e  interpretación  
intacta)  y  los  cuatro  intérpretes  en  las  calificaciones.  Se  encontraron  dos  efectos  significativos:  un  efecto  
principal  por  ejecutante,  F(3,  327)  =  366,66,  p  <  ,001,  η2  =  0,770),  y  una  interacción  significativa  entre  
ejecutante  y  sección  (F  [12,  1308]  =  18,42,  p  <  0,001,  η2  =  0,143.  El  análisis  post  hoc  del  efecto  del  
intérprete  reveló  que  las  calificaciones  de  todos  los  intérpretes  eran  significativamente  diferentes  entre  sí  
(p  <  0,01  en  todos  los  casos).  La  interacción  Ejecutor  ×  Sección  se  puede  interpretar  examinando  las  
calificaciones  intactas  en  función  de  la  calificación  de  desempeño  (ver  Tabla  2):  Para  los  Ejecutantes  1  y  
2,  las  calificaciones  intactas  fueron  más  altas  que  las  calificaciones  de  cualquiera  de  las  secciones,  pero  
para  los  Ejecutores  3  y  4,  las  actuaciones  intactas  fueron  calificadas  más  bajas  que  cualquiera  de  las  
calificaciones  seccionales.  (aunque  para  el  Intérprete  3,  la  calificación  intacta  promedio  fue  prácticamente  
idéntica  a  la  calificación  promedio  de  la  coda).

No  surgieron  otros  factores  significativos  de  este  análisis  de  varianza.  Los  estudiantes  de  piano  no  
otorgaron  calificaciones  más  altas  o  más  bajas  que  los  estudiantes  que  no  son  de  piano,  ni  hubo  
diferencias  significativas  en  las  calificaciones  de  las  diversas  secciones  del  estudio.

Tabla  2.  Fase  2:  Medias  y  Desviaciones  Estándar  para  Desempeño  Seccional  y  Completo

Rendimiento  1 Rendimiento  2 Rendimiento  3 Rendimiento  4

METRO Dakota  del  Sur METRO Dakota  del  Sur METRO Dakota  del  Sur METRO Dakota  del  Sur

Apertura 5.59 1.01 4.31 1.00 4.53 0.94 3.27 1.28


Primera  mitad 6.01 0.94 4.89 1.08 4.11 1.24 2.74 1.22
segunda  mitad 5.90 1.11 5.13 1.29 4.06 1.18 3.08 1.21
coda 5.54 1.16 5.21 1.14 3.69 1.28 3.47 1.28
Intacto 6.48 0.97 5.46 1.02 3.68 1.15 2.47 1.06
Machine Translated by Google

468 Revista  de  investigación  en  educación  musical  60  (4)

Fase  2:  Datos  correlacionales

Predicción  de  calificaciones  desde  secciones  hasta  el  desempeño  intacto.  Para  determinar  si  las  
actuaciones  intactas  se  predijeron  con  mayor  precisión  a  partir  de  la  frase  inicial,  de  la  coda  o  de  la  
primera  o  segunda  mitad  del  estudio,  calculamos  correlaciones  r  de  Pearson  separadas  para  cada  una  
de  las  cuatro  actuaciones.  Los  resultados  se  muestran  en  la  Tabla  3.
Es  difícil  generalizar  a  partir  de  estos  datos  aparte  de  notar  que  (a)  las  correlaciones  entre  las  cuatro  
secciones  y  el  desempeño  intacto  son  más  altas  para  el  desempeño  mejor  calificado  que  para  los  otros  
desempeños  y  (b)  las  calificaciones  de  los  desempeños  intactos  parecen  predecirse  algo  mejor  a  partir  
de  las  secciones  más  grandes  (primera  y  segunda  mitad  del  estudio)  que  de  las  secciones  más  pequeñas  
(frase  de  apertura  y  coda):  La  correlación  promedio  de  producto­momento  de  Pearson  entre  las  
actuaciones  fue  de  0,38  para  la  primera  mitad  intacta  y  la  segunda  mitad.  –coeficientes  de  correlación  
intactos  promediados  juntos,  pero  fue  de  solo  0,25  para  los  coeficientes  de  apertura  intacta  y  coda  intacta  
promediados  juntos.
Finalmente,  esperábamos  encontrar  correlaciones  superiores  al  promedio  entre  apertura  y

Tabla  3.  Correlaciones  r  de  Pearson  por  sección  para  cada  desempeño

Apertura Primera  mitad Segunda  mitad coda Intacto

Rendimiento  1

Apertura
Primera  mitad .42**   —

segunda  mitad .25**   .30**   —

coda .46**   .30**   .37**   —

Intacto .40** .40** .51** .42**  —


Rendimiento  2

Apertura
Primera  mitad .01 —

segunda  mitad .13 .17 —

coda .00   .18   .17   —

Intacto .24* .46** .39** .23* —

Rendimiento  3

Apertura
Primera  mitad .19* —

segunda  mitad .18 .04 —

coda .17 .32*   .21* —

Intacto .13 .40** .10 .23* —

Rendimiento  4

Apertura
Primera  mitad .34** —

segunda  mitad .18 .31** —

coda .dieciséis .06 .28** —

Intacto .34** .48** .32** .04 —

*p  <  .05.  **  p  <  0,01.
Machine Translated by Google

Wapnick  y  Darrow 469

primera  mitad  y  entre  segunda  mitad  y  coda,  porque  en  ambos  casos,  una  de  las  secciones  estaba  
subsumida  dentro  de  la  otra.  Este  no  resultó  ser  el  caso.
Fiabilidad.  Evaluamos  la  confiabilidad  calculando  las  correlaciones  producto­momento  de  Pearson  
para  los  primeros  10  extractos  (ensayos  1  a  10)  y  sus  presentaciones  repetidas  (ensayos  21  a  30).  Para  
las  especialidades  de  piano,  media  r(25)  =  0,66  (p  <  0,01),  y  para  las  especialidades  no  pianísticas,  media  
r(85)  =  0,60  (p  <  0,01).  El  cincuenta  y  tres  por  ciento  de  las  correlaciones  de  las  carreras  de  piano  no  
fueron  significativas,  mientras  que  el  64%  de  las  correlaciones  de  las  carreras  de  piano  fueron  significativas  (p  <  .05).
Confiabilidad  por  sección.  Calculamos  las  correlaciones  producto­momento  de  Pearson  individualmente  
para  cada  uno  de  los  10  extractos  que  se  presentaron  dos  veces  (ensayos  1  y  21,  2  y  22,  etc.).  Las  dos  
correlaciones  para  cada  uno  de  los  cinco  tipos  de  sección  (frase  de  apertura,  primera  mitad,  segunda  
mitad,  coda  e  intacta)  luego  se  promediaron  por  separado  para  piano  mayor  y  no  piano  mayor.  Los  
resultados  revelaron  que  las  correlaciones  medias  variaron  de  0,27  a  0,38,  excepto  por  correlaciones  de  
0,20  y  0,22  para  las  no  principales  al  calificar  la  frase  de  apertura  y  la  coda,  respectivamente.  Por  lo  tanto,  
parece  que  las  mayores  no  pianísticas  se  vieron  afectadas  de  alguna  manera  por  la  longitud  de  la  sección,  
ya  que  las  confiabilidades  más  bajas  se  asociaron  solo  con  secciones  más  cortas.  Sin  embargo,  para  los  
estudiantes  de  piano,  el  tipo  de  sección  no  pareció  afectar  la  confiabilidad.

Discusión
En  este  estudio,  intentamos  determinar  cómo  se  relacionarían  las  evaluaciones  de  una  pieza  musical  
intacta  con  las  evaluaciones  de  sus  secciones  componentes  y  ver  si  tales  asociaciones  variarían  como  
consecuencia  de  la  calidad  de  la  interpretación.  Los  participantes  escucharon  cuatro  representaciones  del  
Estudio  de  la  mariposa  de  Chopin ,  que  difieren  en  calidad  general,  cada  una  presentada  en  su  totalidad  
(intacta)  y  en  secciones.  Los  resultados  indicaron  que  para  las  dos  interpretaciones  mejor  calificadas,  el  
todo  fue  mayor  que  sus  partes:  las  calificaciones  intactas  fueron  más  altas  que  las  calificaciones  parciales.  
Sin  embargo,  para  las  dos  actuaciones  con  calificaciones  más  bajas,  sucedió  lo  contrario:  las  calificaciones  
intactas  fueron  calificadas  más  bajas  que  las  calificaciones  seccionales.  Por  lo  tanto,  para  cada  una  de  las  
cuatro  representaciones,  las  calificaciones  intactas  divergieron  de  lo  que  se  habría  obtenido  promediando  
las  calificaciones  de  las  secciones  que  las  componen.
Nuestros  resultados  son  consistentes  con  investigaciones  previas  que  muestran  que  las  actuaciones  
de  los  expertos  se  califican  mejor  para  los  extractos  más  largos  que  para  los  más  cortos  (Bergee,  1993,  
1997;  Fiske,  1975,  1979;  Hewitt,  2007;  Hewitt  &  Smith,  2004;  S.  Thompson  et  al. ,  2007;  Wapnick  et  al.,  
2005).  Son,  de  hecho,  sorprendentemente  similares  a  los  de  Geringer  y  Johnson  (2007),  quienes  
encontraron  que  aunque  los  conjuntos  universitarios  y  profesionales  de  bandas  de  viento  obtuvieron  una  
calificación  más  alta  durante  más  tiempo  que  los  extractos  más  cortos,  las  actuaciones  de  conjuntos  de  
secundaria  de  menor  calidad  fueron  calificadas  más  bajas  durante  más  de  para  extractos  más  cortos.  En  
la  actualidad,  no  se  sabe  si  esta  interacción  se  debió  a  estándares  absolutos  con  respecto  a  la  calidad  del  
desempeño  o  si  fue  el  resultado  de  comparaciones  implícitas  realizadas  entre  los  desempeños.  Es  posible,  
por  ejemplo,  que  los  evaluadores  tuvieran  más  confianza  en  sus  evaluaciones  cuanto  más  tiempo  
escuchaban  una  actuación.  Este  aumento  en  la  confianza  puede  haber  impulsado  sus  calificaciones  por  
encima  o  por  debajo  de  la  calificación  media  de  las  secciones  que  componen  el  desempeño,  dependiendo  
de  si  la  evaluación  fue  positiva  o  negativa.
Machine Translated by Google

470 Revista  de  investigación  en  educación  musical  60  (4)

negativo.  O  es  posible  que  lo  que  se  juzga  bueno  dependa  de  qué  más  se  juzga.

Aunque  no  encontramos  correlaciones  particularmente  fuertes  entre  la  frase  de  apertura  y  la  
interpretación  intacta,  o  para  la  coda  y  la  interpretación  intacta,  sí  encontramos  que  las  correlaciones  con  
las  interpretaciones  intactas  correspondientes  eran  algo  más  fuertes  para  las  calificaciones  basadas  en  
la  primera  mitad  o  la  segunda  mitad  del  estudio  (media  r  =  0,38)  que  para  las  secciones  más  cortas  de  
apertura  y  cierre  (media  r  =  0,25).  Esta  mayor  previsibilidad  se  puede  ver  en  la  Tabla  2:  Las  diferencias  
de  calificación  entre  las  cuatro  actuaciones  están  marcadas  para  las  secciones  de  la  primera  mitad  y  la  
segunda  mitad  y  para  las  actuaciones  intactas.  Sin  embargo,  para  la  frase  de  apertura,  la  Interpretación  
3  en  realidad  fue  calificada  ligeramente  más  alta  que  la  Interpretación  2;  y  para  la  coda,  las  diferencias  
en  las  calificaciones  entre  las  dos  interpretaciones  principales  y  entre  las  dos  interpretaciones  inferiores  
son  mucho  más  estrechas  que  las  diferencias  en  las  calificaciones  de  las  interpretaciones  intactas  
correspondientes.
Nuestro  examen  de  la  relación  entre  las  secciones  de  apertura  y  cierre  de  una  obra  y  su  calificación  
intacta  tenía  como  objetivo  determinar  si  las  calificaciones  intactas  habrían  sido  susceptibles  a  un  efecto  
de  primacía  o  un  efecto  de  actualidad.  Sin  embargo,  la  importancia  de  una  sección  de  apertura  o  de  
cierre  escuchada  de  forma  aislada  puede  diferir  de  su  importancia  cuando  se  integra  dentro  de  una  
interpretación  intacta.  Una  forma  de  que  los  investigadores  examinen  los  verdaderos  efectos  de  primacía  
y  actualidad  sería  empalmar  varias  aperturas  diferentes  seguidas  de  una  interpretación  posterior  invariable  
(efecto  de  primacía)  y  presentar  una  interpretación  seguida  de  varios  finales  diferentes  (efecto  de  
actualidad).

Dado  que  este  estudio  involucró  escuchar  solo  una  composición,  debe  verse  como  un  impulso  para  
futuras  investigaciones  en  lugar  de  un  punto  de  partida  para  hacer  generalizaciones.  El  estudio  de  
mariposas  de  Chopin  es  una  pieza  musical  breve,  monotemática,  rápida  y  técnicamente  exigente.  Estas  
características  musicales  particulares  podrían  haber  afectado  las  calificaciones.  Es  concebible  que  
hubiésemos  obtenido  resultados  completamente  diferentes  si  hubiésemos  utilizado  piezas  musicales  más  
extensas  y  estructuralmente  complejas.  No  obstante,  los  resultados  de  nuestro  estudio  sugieren  que  las  
evaluaciones  de  las  secciones  pueden  diferir  sistemáticamente  de  las  evaluaciones  de  la  obra  intacta;  
pueden  ser  más  bajas  o  más  altas  que  las  calificaciones  de  las  obras  intactas,  dependiendo  de  la  calidad  
general  de  la  interpretación.
En  nuestro  estudio,  los  evaluadores  calificaron  extractos  a  nivel  mundial.  Podríamos  haber  obtenido  
datos  adicionales  valiosos  si  hubiéramos  utilizado  una  rúbrica  de  calificaciones  (Ciorba  &  Smith,  2009;  
Geringer  et  al.,  2009;  Latimer,  Bergee  &  Cohen,  2010)  o  si  hubiéramos  pedido  calificaciones  de  aspectos  
musicales  específicos.  Sin  embargo,  sentimos  que  hacerlo  aumentaría  el  tiempo  necesario  para  que  los  
evaluadores  califiquen  30  desempeños  más  allá  de  lo  que  hubiera  sido  aceptable.
Debe  tenerse  en  cuenta  que  los  resultados  de  este  estudio  no  significan  que  ninguno  de  los  pianistas  
cuyas  interpretaciones  fueron  escuchadas  por  los  evaluadores  sea  en  ningún  sentido  “superior”.
Aunque  la  interpretación  con  la  calificación  más  alta  fue  calificada  más  alta  que  la  segunda  interpretación  
con  la  calificación  más  alta,  la  Interpretación  2  provino  de  un  concierto  en  vivo,  mientras  que  la  
Interpretación  1  se  extrajo  de  un  disco  compacto  comercial.  Además,  es  posible  que  estas  dos  actuaciones  
se  hayan  beneficiado  de  una  grabación  de  sonido  superior  en  comparación  con  las  otras  dos  actuaciones.
Machine Translated by Google

Wapnick  y  Darrow 471

Aunque  ninguna  de  las  grabaciones  que  elegimos  sufría  de  problemas  graves  de  sonido,  e  instruimos  a  los  
evaluadores  para  que  ignoraran  la  calidad  de  la  grabación  al  asignar  calificaciones  a  los  extractos,  la  
calidad  de  la  grabación,  sin  embargo,  podría  haber  afectado  las  calificaciones.
En  la  Fase  1  de  este  estudio,  encontramos  que  aunque  nuestros  9  evaluadores  diferían  en  
sus  estándares  de  calificación,  coincidían  sustancialmente  en  qué  actuaciones  eran  mejores  
que  otras  (Tabla  1).  Sin  embargo,  las  correlaciones  obtenidas  probablemente  dependían  de  las  
características  específicas  de  la  situación  experimental.  Doce  de  las  22  actuaciones  fueron  de  
concertistas  reconocidos  internacionalmente.  Si  hubiéramos  reducido  la  dispersión  de  la  calidad  
de  la  interpretación  utilizando  únicamente  las  interpretaciones  de  dichos  pianistas,  es  muy  
probable  que  hubiéramos  obtenido  correlaciones  más  bajas.  Además,  es  posible  que  el  acuerdo  
entre  los  evaluadores  se  hubiera  reducido  si  hubiéramos  pedido  a  evaluadores  con  menos  
experiencia  musical  que  calificaran  las  actuaciones.  Investigaciones  previas  han  arrojado  
resultados  mixtos  sobre  este  punto,  con  algunos  estudios  que  muestran  que  la  experiencia  
musical  y  la  familiaridad  mejoran  la  confiabilidad  tanto  dentro  como  entre  evaluadores  (Fiske,  
1977a;  Hewitt,  2002,  2005;  Kinney,  2009;  Morrison,  Montemayer  y  Wiltshire,  2004) ;  Sparks,  
1990;  W.  Thompson  et  al.,  1998;  Towers,  1980)  y  otros  estudios  que  no  confirman  tales  
resultados  (Fiske,  1975,  1977;  Heath,  1976;  Roberts,  1975;  Wapnick,  Flowers,  Alegant,  &  
Jasinskas,  1993 ).  También  parece  posible  que  los  efectos  de  variables  como  la  familiaridad  
del  extracto  (Bergee,  2007;  Kinney,  2009;  Wapnick  et  al.,  2004)  y  aspectos  de  los  estímulos  
musicales,  particularmente  el  tempo  (Geringer  &  Johnson,  2007;  LeBlanc,  Colman,  McCrary,  
Sherrill  y  Malin,  1988;  Wapnick  et  al.,  2005),  podría  interactuar  con  el  tiempo  de  escucha.
Finalmente,  la  cuestión  de  la  evaluación  de  la  parte  frente  al  todo  podría  considerarse  en  
relación  con  la  interpretación  musical.  Es  posible  que  la  concepción  general  de  una  pieza  
musical  de  un  artista  sea  de  mayor  importancia  que  la  precisión  y  la  expresividad  con  que  se  
tocan  las  notas,  dentro  de  una  sección  en  particular  o  quizás  a  lo  largo  de  toda  la  obra.  Puede  
resultar  difícil  para  uno  definir  la  concepción  musical  operativamente,  pero  tal  vez  sus  efectos  
puedan  mostrarse  en  aquellos  casos  en  que  las  medidas  de  las  partes  difieren  de  las  medidas  
del  todo.

Declaración  de  Conflicto  de  Intereses
Los  autores  no  declararon  posibles  conflictos  de  interés  con  respecto  a  la  investigación,  autoría  y/o  publicación  
de  este  artículo.

Fondos
Los  autores  no  recibieron  apoyo  financiero  para  la  investigación,  autoría  y/o  publicación  de  este  artículo.

Referencias
Bergee,  MJ  (1993).  Una  comparación  de  la  facultad,  los  compañeros  y  la  autoevaluación  de  las  actuaciones  
aplicadas  del  jurado  de  metales.  Revista  de  Investigación  en  Educación  Musical,  41,  19–27.  
doi:10.2307/3345476  Bergee,  MJ  (1995).  Factores  primarios  y  de  orden  superior  en  una  escala  que  evalúa  la  
interpretación  de  una  banda  de  concierto.  Boletín  del  Consejo  de  Investigación  en  Educación  Musical,  126,  1–14.
Bergee,  MJ  (1997).  Relaciones  entre  docentes,  pares  y  autoevaluaciones  de  desempeños  aplicados.  Revista  de  
Investigación  en  Educación  Musical,  45,  601–612.  doi:10.2307/3345425
Machine Translated by Google

472 Revista  de  investigación  en  educación  musical  60  (4)

Bergee,  MJ  (2003).  La  facultad  interjuece  la  confiabilidad  de  la  evaluación  de  la  interpretación  musical.  Diario  de
Investigación  en  Educación  Musical,  51,  137–150.  doi:10.2307/3345847  
Bergee,  MJ  (2007).  Intérprete,  evaluador,  ocasión  y  secuencia  como  fuentes  de  variabilidad  en  la  evaluación  de  
la  interpretación  musical.  Revista  de  Investigación  en  Educación  Musical,  55,  344–358.  
doi:10.1177/0022429408317515

Brittin,  RL  (2002).  Valoración  de  los  instrumentistas  de  la  interpretación  solista  con  disco  compacto,  piano  o  sin  
acompañamiento.  Revista  de  Investigación  en  Educación  Musical,  50,  63–74.  doi:10.2307/3345693

Byo,  JL  y  Crone,  LJ  (1989).  Adjudicación  por  no  músicos:  una  comparación  de  actuaciones  profesionales  y  
amateurs.  Missouri  Journal  of  Research  in  Music  Education,  26,  60–73.
Ciorba,  CR  y  Smith,  Nueva  York  (2009).  Medición  de  jurados  de  desempeño  instrumental  y  vocal  de  pregrado  
utilizando  una  rúbrica  de  evaluación  multidimensional.  Revista  de  Investigación  en  Educación  Musical,  57,  5–
15.  doi:10.1177/0022429409333405
Ekholm,  E.  (1994).  El  efecto  de  la  escucha  guiada  en  la  evaluación  de  la  interpretación  vocal  solista
(Tesis  de  maestría).  Universidad  McGill,  Montreal,  Canadá.
Fiske,  HE  (1975).  Diferencias  entre  grupos  de  jueces  en  la  calificación  de  las  interpretaciones  de  la  trompeta  en  
la  escuela  secundaria.  Revista  de  Investigación  en  Educación  Musical,  23,  186–196.  doi:10.2307/3344643  
Fiske,  HE  (1977a).  Relación  de  factores  seleccionados  en  la  confiabilidad  de  la  adjudicación  del  desempeño  de  
la  trompeta.  Revista  de  Investigación  en  Educación  Musical,  25,  256–263.  doi:10.2307/3345266  Fiske,  HE  
(1977b).  ¿Quién  va  a  juzgar?  Nuevos  conocimientos  sobre  la  evaluación  del  desempeño.  Música  Educa
tors  Journal,  64(4),  23–25.  doi:10.2307/3395371
Fiske,  HE  (1979).  Capacidad  de  evaluación  de  la  interpretación  musical:  hacia  un  modelo  de  especificidad.
Boletín  del  Consejo  de  Investigación  en  Educación  Musical,  59,  27­31.
Geringer,  JM,  Allen,  ML,  MacLeod,  RB  y  Scott,  L.  (2009).  Uso  de  una  rúbrica  de  preselección  para  la  selección  
de  violines  en  todos  los  estados:  influencias  de  la  interpretación  y  la  experiencia  docente.  Actualización:  
Aplicaciones  de  la  Investigación  en  Educación  Musical,  28,  41–46.  doi:10.1177/8755123309344109  Geringer,  
JM  y  Johnson,  CM  (2007).  Efectos  de  la  duración  del  extracto,  el  tempo  y  el  nivel  de  rendimiento  en  las  
calificaciones  de  los  músicos  de  las  actuaciones  de  la  banda  de  viento.  Journal  of  Research  in  Music  
Education,  55,  289–301.  doi:10.1177/0022429408317366
Geringer,  JM  y  Madsen,  CK  (1998).  Calificaciones  de  los  músicos  de  buenas  versus  malas  interpretaciones  
vocales  y  de  cuerdas.  Revista  de  Investigación  en  Educación  Musical,  46,  522–534.  doi:10.2307/3345348  
Gillespie,  R.  (1997).  Calificaciones  de  interpretación  de  vibrato  de  violín  y  viola  en  presentaciones  audiovisuales  
y  de  solo  audio.  Revista  de  Investigación  en  Educación  Musical,  45,  212–220.  doi:10.2307/3345581  Heath,  
CE  (1976).  El  efecto  de  la  instrucción  en  la  consistencia  de  las  calificaciones  otorgadas  en  la  adjudicación  de  
extractos  de  solos  de  trompeta  (tesis  doctoral),  Universidad  de  Indiana,  Bloomington.
Hewitt,  parlamentario  (2002).  Tendencias  de  autoevaluación  de  instrumentistas  de  secundaria.  Diario  de
Investigación  en  Educación  Musical,  50,  215–226.  doi:10.2307/3345799  Hewitt,  
MP  (2005).  Precisión  de  la  autoevaluación  entre  instrumentistas  de  secundaria  y  preparatoria.  Revista  de  
Investigación  en  Educación  Musical,  53,  148–161.  doi:10.1177/  002242940505300205

Hewitt,  parlamentario  (2007).  Influencia  del  instrumento  de  interpretación  principal  y  el  nivel  educativo  en  la  
evaluación  de  la  interpretación  musical.  Revista  de  Investigación  en  Educación  Musical,  55,  18–30.  
doi:10.1177/002242940705500103
Machine Translated by Google

Wapnick  y  Darrow 473

Hewitt,  MP  y  Smith,  BP  (2004).  La  influencia  del  nivel  de  la  carrera  docente  y  el  instrumento  principal  de  
interpretación  en  la  evaluación  de  la  interpretación  musical.  Revista  de  Investigación  en  Educación  Musical,  
52,  314–327.  doi:10.1177/002242940405200404
Kinney,  D.  (2009).  Consistencia  interna  de  las  evaluaciones  de  desempeño  en  función  de  la  experiencia  musical  
y  la  familiaridad  con  el  extracto.  Revista  de  Investigación  en  Educación  Musical,  56,  322–337.  
doi:10.1177/0022429408328934

Latimer,  ME,  Bergee,  MJ  y  Cohen,  ML  (2010).  Fiabilidad  y  utilidad  percibida  de  una  rúbrica  ponderada  de  
evaluación  del  desempeño  musical.  Revista  de  Investigación  en  Educación  Musical,  58,  168–183.  
doi:10.1177/0022429410369836
LeBlanc,  A.,  Colman,  J.,  McCrary,  J.,  Sherrill,  C.  y  Malin,  S.  (1988).  Preferencias  de  tempo  de  oyentes  de  
música  de  diferentes  edades.  Revista  de  Investigación  en  Educación  Musical,  36,  156–168.  
doi:10.2307/3344637
LeBlanc,  A.  y  Sherrill,  C.  (1986).  Efecto  del  vibrato  vocal  y  el  sexo  del  intérprete  en  la  preferencia  musical  de  los  
niños.  Revista  de  Investigación  en  Educación  Musical,  34,  222–237.  doi:10.2307/3345258  McCrary,  J.  
(1993).  Efectos  de  la  raza  de  los  oyentes  e  intérpretes  en  las  preferencias  musicales.  Diario  de
Investigación  en  Educación  Musical,  41,  200–211.  doi:10.2307/3345325
Morrison,  SJ,  Montemayer,  M.  y  Wiltshire,  ES  (2004).  El  efecto  de  un  modelo  grabado  en  las  autoevaluaciones,  
el  rendimiento  y  la  actitud  de  los  estudiantes  de  banda.  Revista  de  Investigación  en  Educación  Musical,  52,  
116–129.  doi:10.2307/3345434  Roberts,  BA  (1975).  Diferencias  entre  jueces  y  grupos  en  la  calificación  de  
interpretaciones  pianísticas  (tesis  de  MusM).  Universidad  de  Western  Ontario,  Londres,  Canadá.

Chispas,  GE  (1990).  El  efecto  de  la  autoevaluación  en  el  rendimiento  musical,  la  atención  y  las  actitudes  de  los  
estudiantes  instrumentales  de  la  escuela  primaria  (tesis  doctoral).  Universidad  Estatal  de  Luisiana,  Baton  
Rouge.
Thompson,  S.,  Williamon,  A.  y  Valentine,  E.  (2007).  Características  dependientes  del  tiempo  de  per
evaluación  de  rendimiento.  Percepción  musical,  25,  13–29.
Thompson,  WF,  Diamond,  CP  y  Balkwill,  LL  (1998).  La  adjudicación  de  seis  actuaciones  de  un  estudio  de  
Chopin:  un  estudio  del  conocimiento  experto.  Psicología  de  la  Música,  26,  154–174.  
doi:10.1177/0305735698262004

Torres,  R.  (1980).  Diferencias  por  grupos  de  edad  en  la  confiabilidad  de  los  jueces  de  las  interpretaciones  de  
voz  solista  (Tesis  de  maestría  no  publicada).  Universidad  de  Western  Ontario,  Londres,  Canadá.
Vasil,  T.  (1973).  Los  efectos  de  la  variación  sistemática  de  factores  seleccionados  en  la  adjudicación  de  la  
interpretación  musical  (tesis  doctoral  inédita).  Universidad  de  Connecticut,  Storrs.
Wagner,  MJ  (1991).  El  efecto  de  adjudicar  tres  actuaciones  de  música  popular  grabadas  en  video  en  una  
calificación  de  “crítica  compuesta”  y  una  calificación  “general”.  Missouri  Journal  of  Research  in  Music  
Education,  28,  53–70.
Wapnick,  J.,  Darrow,  A.­A.,  Kovacs,  J.  y  Dalrymple,  L.  (1997).  Efectos  del  atractivo  físico  en  la  evaluación  del  
desempeño  vocal.  Revista  de  Investigación  en  Educación  Musical,  45,  470–479.  doi:10.2307/3345540

Wapnick,  J.  y  Ekholm,  E.  (1997).  Evaluación  de  la  producción  vocal  en  la  interpretación  de  voz  solista.
Revista  de  Voz,  11,  429–436.  doi:10.1016/S0892­1997(97)80039­2
Wapnick,  J.,  Flowers,  P.,  Alegant,  M.  y  Jasinskas,  L.  (1993).  Coherencia  en  la  evaluación  de  la  interpretación  
pianística.  Revista  de  Investigación  en  Educación  Musical,  4,  282–292.  doi:10.2307/3345504
Machine Translated by Google

474 Revista  de  investigación  en  educación  musical  60  (4)

Wapnick,  J.,  Kovacs­Mazza,  J.  y  Darrow,  A.­A.  (2000).  Efectos  del  artista  intérprete  o  ejecutante  atractivo
ness,  el  comportamiento  escénico  y  la  vestimenta  en  la  evaluación  de  las  interpretaciones  de  piano  de  los  niños.  Revista  
de  Investigación  en  Educación  Musical,  48,  323–336.  doi:10.2307/3345367

Wapnick,  J.,  Ryan,  C.,  Campbell,  L.,  Deek,  P.,  Lemire,  R.  y  Darrow,  A.­A.  (2005).  Efectos  del  tempo  y  la  duración  del  extracto  
en  las  calificaciones  de  los  músicos  de  las  interpretaciones  de  piano  de  alto  nivel.  Revista  de  Investigación  en  Educación  
Musical,  53,  162–176.  doi:10.1177/002242940505300206  Wapnick,  J.,  Ryan,  C.,  Lacaille,  N.  y  Darrow,  A.­A.  (2004).  
Efectos  de  variables  seleccionadas  en  las  calificaciones  de  los  músicos  de  las  interpretaciones  de  piano  de  alto  nivel.  Revista  
Internacional  de  Educación  Musical,  22,  7–20.  doi:10.1177/0255761404042371

Zdzinski,  SF  y  Barnes,  GV  (2002).  Desarrollo  y  validación  de  una  escala  de  calificación  de  desempeño  de  cuerdas.  Revista  de  
Investigación  en  Educación  Musical,  50,  245–255.  doi:10.2307/3345801

biografías

Joel  Wapnick  es  profesor  de  educación  musical  en  la  Universidad  McGill.  Sus  intereses  de  investigación  se  ocupan  de  las  
variables  musicales  y  no  musicales  que  afectan  la  evaluación  de  la  interpretación  musical.

Alice­Ann  Darrow  es  Profesora  Irwin  Cooper  de  Musicoterapia  y  Educación  Musical  en  la  Universidad  Estatal  de  Florida.  Sus  
intereses  de  investigación  incluyen  la  enseñanza  de  la  música  a  poblaciones  especiales  y  el  papel  de  la  música  en  la  cultura  
sorda.

Presentado  el  25  de  agosto  de  2011;  aceptado  el  10  de  mayo  de  2012.

También podría gustarte