Está en la página 1de 15

Psicothema

ISSN: 0214-9915
psicothema@cop.es
Universidad de Oviedo
España

Diez Itza, Eliseo; Snow, Catherine E.; MacWhinney, Brian


La metodología retamhe y el proyecto childes: breviario para la codificación y análisis del lenguaje
infantil
Psicothema, vol. 11, núm. 3, 1999, pp. 517-530
Universidad de Oviedo
Oviedo, España

Disponible en: http://www.redalyc.org/articulo.oa?id=72711305

Cómo citar el artículo


Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
Psicothema, 1999. Vol. 11, nº 3, pp. 517-530
ISSN 0214 - 9915 CODEN PSOTEG
Copyright © 1998 Psicothema

LA METODOLOGÍA RETAMHE Y EL
PROYECTO CHILDES: BREVIARIO PARA LA
CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE
INFANTIL
Eliseo Diez-Itza, Catherine E. Snow* y Brian MacWhinney**
Universidad de Oviedo, * Universidad de Harvard y ** Universidad Carnegie

En este artículo se investigan algunas cuestiones metodológicas relativas al estu-


dio del lenguaje infantil y se presenta la instrumentación y el software desarrollados en
el proyecto CHILDES (Sistema de Intercambio de Datos del Lenguaje Infantil). El sis-
tema proporciona potentes herramientas para investigar en el marco de la metodología
de Registro, Transcripción y Análisis de Muestras de Habla Espontánea (RETAMHE).
Se proporciona información del sistema de codificación (CHAT) que permite introducir
finas distinciones en el proceso de transcripción, al tiempo que se exponen los requeri-
mientos básicos (minCHAT) para crear archivos CHAT. El paquete de programas
(CLAN) específicamente diseñados para analizar esos archivos que contienen transcrip-
ciones de muestras de habla, incluye recuentos de frecuencias, búsqueda de palabras,
análisis de la interacción, etc. El núcleo de comandos y opciones de CLAN constituye el
sistema minCLAN, del que se ofrecen algunas pautas. Se trata con todo ello de facilitar
los primeros pasos para aprender a usar los instrumentos metodológicos de CHILDES.

RETAMHE methodology and the CHILDES project with a focus on minimal stan-
dards to codify and analyze child language. This paper investigates some methodologi-
cal issues concerning research in the field of child language and introduces a set of ins-
truments and software developed in the context of the CHILDES (Child Language Data
Exchange System) Project. The RETAHME system provides powerful tools for recor-
ding, transcribing, and analyzing spontaneous speech samples. Information about the use
of the coding system (CHAT) for making distinctions in the transcription process is pro-
vided together with the minimum set of standards (minCHAT) to create CHAT files. The
CLAN computer programs are used to analyze files containing transcriptions of speech
samples for frequency counts, word searches, interactional analyses, etc. The core set of
CLAN commands and options constitute the minCLAN system. The first steps in lear-
ning to use the CHILDES tools are also explained.

El devenir histórico de la investigación marcado, como no podía ser de otra manera,


científica del lenguaje infantil ha venido por inflexiones en la metodología. Así, des-
de sus orígenes más recientes, ligados a los
Correspondencia: Eliseo Diez-Itza de la psicología del desarrollo, se podrían
Facultad de Psicología distinguir tres etapas, presididas por otras
Universidad de Oviedo
33003 Oviedo (Spain) tantas orientaciones metodológicas. En la
E-mail: ditza@correo.uniovi.es primera de ellas, los naturales afanes des-

Psicothema, 1999 517


LA METODOLOGÍA RETAMHE Y EL PROYECTO CHILDES: BREVIARIO PARA LA CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE INFANTIL

criptivos cobraron forma en la metodología resto resultaba bastante simple: «Cada


observacional de los diarios. La segunda tra- quincena, nosotros, uno o dos observadores
dujo el interés diferencial en el método co- y yo, o los otros dos juntos, visitábamos sus
rrelacional. Y la tercera, en la que ya estaba hogares durante cerca de una hora y grabá-
en juego la explicación del lenguaje infantil, bamos media hora de cintas de video y de
vio proliferar el método experimental. audio de la madre y el niño jugando a lo
El estudio moderno del lenguaje infantil, que en ese momento resultaba ser su activi-
que cumple ahora un cuarto de siglo si to- dad recreativa. […..] Las cintas de video y
mamos la referencia obligada de quien fue de audio eran transcritas tan pronto como
su destacado precursor (Brown, 1973), tam- era posible después de grabarlas, habitual-
poco puede entenderse al margen de cam- mente en una semana, ayudados por notas y
bios metodológicos de naturaleza funda- por la memoria. Las transcripciones tenían
mentalmente tecnológica. En torno a esa fe- la forma habitual de tres columnas de ano-
cha se produce una eclosión de investiga- taciones ordenadas temporalmente, en las
ciones del lenguaje infantil marcadas por un que se daban los enunciados maternos, los
nuevo enfoque: la idea de que el lenguaje y enunciados del niño y las descripciones del
su desarrollo no pueden ser aislados de su contexto» (Bruner, 1986, p. 48).
contexto conversacional, es lo que en otro Esta es en términos sencillos la metodo-
lugar hemos llamado el «giro comunicati- logía de «Registro, Transcripción y Análisis
vo» (Diez-Itza, 1992). de Muestras de Habla Espontánea», que
El giro comunicativo, que llegó de la ma- abreviadamente denominamos metodología
no de los enfoques funcionales, sociocultu- RETAMHE (Diez-Itza, 1992) y que expli-
rales y pragmáticos, vino a decir que estába- camos con mayor pormenor del habitual en
mos haciendo las fotos con las figuras corta- el libro que se cita, ya que suele darse por
das por la mitad, que no podíamos hablar del sentado el procedimiento en estos casos. De
lenguaje del niño, de un niño, que el lengua- todos modos, el ámbito español constituye
je es cosa de dos, que el discurso es compar- en tal sentido una excepción merced sobre
tido y que, de algún modo, había que volver todo a la obra de Miguel Siguán y sus cola-
atrás, volver a observar y a describir la ad- boradores (Arnau y Boada, 1985; Serra,
quisición y desarrollo del lenguaje en sus es- 1976; Siguán, 1983; Siguán, Colomina y
cenarios comunicativos naturales. Muy grá- Vila, 1990; Solé, 1988; Triadó y Forns,
ficamente lo expresó Bruner, uno de sus 1989). Dicha metodología se convirtió en el
principales protagonistas, desdeñando por paradigma moderno de la investigación del
artificial el elegante laboratorio de Oxford lenguaje infantil, desde que Brown (1973) y
«a favor del desorden de la vida del hogar, sus colaboradores de Harvard empezaran el
fuimos hacia los niños en lugar de hacerlos registro longitudinal de un niño de poco
venir hacia nosotros» (Bruner, 1986, p. 13). más de dos años (Adán), el ocho de octubre
Viejos métodos (la observación en el hogar), de 1962, al que siguieron casi paralelamen-
para nuevos enfoques (las variables pragmá- te los de otras dos niñas (Eva y Sara) y las
ticas: las condiciones de uso). consiguientes transcripciones. El deseo que
Se volvió pues al inevitable e insustitui- Brown expresa al final del prefacio de su
ble método observacional, pero en unas obra se ha visto sobradamente cumplido y
condiciones tecnológicas impensables para en gran parte se debe a su iniciativa: «ha-
nuestros tatarabuelos en estas lides, que se- biendo sido psicólogo durante veinte años
guían a sus hijos lápiz en ristre. El grafito se he vivido entre unas cuantas prometedoras
convirtió en mágica banda magnética y el y activas tradiciones investigadoras. Por

518 Psicothema, 1999


ELISEO DIEZ-ITZA, CATHERINE E. SNOW Y BRIAN MACWHINNEY

desgracia muchas de ellas no han dejado estos nuevos recursos tecnológicos creando
huellas importantes en forma de nuevo co- un sistema de intercambio de transcripciones
nocimiento. El desarrollo del lenguaje es de muestras de habla entre los investigado-
hoy un campo de investigación prometedor res de todo el mundo, se gestó desde 1981
y activo. Mi más profundo deseo es que nos hasta 1984, en que se puso en marcha, el
deje un claro incremento del conocimiento Proyecto CHILDES (CHIld Language Data
psicológico» (Brown, 1973, p. 20). Exchange System), coordinado por Brian
Si la metodología RETAMHE ha contri- MacWhinney y Catherine Snow (MacWhin-
buido decisivamente al estudio y conoci- ney y Snow, 1985, 1990), cuyos objetivos
miento de la adquisición y desarrollo del enuncia MacWhinney (1995, p. X) así:
lenguaje, no se debe sólo al trabajo pionero
de Brown, sino también a su generosidad. 1. Proporcionar más datos de más niños
Antes que sus resultados, compartió sus da- hablantes de más lenguas.
tos con todo aquel que se lo pidió y de ellos 2. Obtener mejores datos mediante un
surgieron infinidad de estudios y todavía sistema de transcripción consistente y docu-
hoy día el «corpus» de Brown sigue siendo mentado.
objeto de investigación, como más adelante 3. Automatizar el proceso de análisis de
se pondrá de manifiesto. La ingente tarea los datos.
que supone la recogida de datos de acuerdo
con esta metodología alcanza una rentabili- Herramientas del sistema CHILDES
dad científica inusitada cuando los datos ob-
tenidos se comparten. Si el «giro comunica- El proyecto encaró dichos objetivos de-
tivo» se caracterizó por entender el lengua- sarrollando tres herramientas distintas e in-
je como una actividad compartida, su acti- tegradas en su función, «como las patas de
tud metodológica no le fue a la zaga convir- un taburete», tal y como lo expresa MacW-
tiendo la investigación en una tarea compar- hinney (1995) en el libro que constituye el
tida por la comunidad científica interna- Manual del sistema CHILDES:
cional en sentido estricto. Al complejo tra-
bajo de transcripción, Brown añadió el tras- 1. DATABASE. El objetivo fundamental
lado de las extensísimas transcripciones de del proyecto era crear una base de datos in-
Adán, Eva y Sara a un cliché que permitió formatizada con el conjunto de todas las
tirar un número limitado de copias que se transcripciones que los investigadores
distribuyeron por todo el mundo, hasta el miembros del sistema fueran aportando, es-
punto de que Brown al final sólo conserva- ta es pues la primera herramienta, la de los
ba la copia original archivada ya como un datos. Una vez informatizadas las muestras
documento histórico. fundacionales de Brown (Adán, Eva y Sa-
El progreso tecnológico había permitido ra), constantemente se ha ido actualizando
desde los años 60 grabar conversaciones in- DATABASE con nuevas transcripciones en
fantiles y reproducir, aunque fuera de un cada uno de sus apartados: inglesas, no-in-
modo restringido, sus transcripciones, pero glesas, bilingües, narrativas y con altera-
la idea de compartir tales datos del lenguaje ciones del lenguaje, hasta alcanzar unas di-
infantil, no encontró su vía ilimitada en po- mensiones considerables tanto cuantitati-
sibilidades hasta el desarrollo de la informá- vas, como cualitativas, es decir, en número
tica y sus ventajas de copia instantánea e in- de lenguas representadas. Sin embargo, to-
cluso, como luego ha ocurrido, de envío a davía son mayoritarias las transcripciones
distancia. Con el propósito de aprovechar en inglés y llama la atención la escasez de

Psicothema, 1999 519


LA METODOLOGÍA RETAMHE Y EL PROYECTO CHILDES: BREVIARIO PARA LA CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE INFANTIL

datos en español, que se reducen a seis cor- el CD-ROM «The CHILDES Database»
pora, en relación con la importancia y difu- (MacWhinney, 1997) que incluye las tres
sión de esta lengua, por lo que uno de los herramientas citadas, además del manual y
objetivos del presente artículo es promover de una cuarta herramienta la BIB/DATABA-
el enriquecimiento de DATABASE con SE, compendio bibliográfico actualizado so-
nuevos datos en español. bre el lenguaje infantil con cerca de 13.000
2. CHAT (Codes for the Human Analysis entradas (Higginson y MacWhinney, 1990).
of Transcripts). El primer problema al que
se enfrentaba el proyecto de intercambio era Codificación básica de transcripciones
la ausencia de sistematización en la forma (MinCHAT)
tradicional de las transcripciones (Ochs,
1979). Un requisito básico era pues estable- Las transcripciones en CHAT no presen-
cer una herramienta de transcripción, un sis- tan inicialmente el formato tradicional en
tema estandarizado, un formato, el formato columnas, sino en líneas y se escriben con el
CHAT, que han de tener las transcripciones procesador de textos de CHILDES (CED)
para entrar a formar parte de DATABASE. (véase un ejemplo en la Tabla 1). Existen
Existen unos mínimos requerimientos for- tres tipos de líneas, indicado cada uno de
males que se incluyen dentro de lo que se ellos por un símbolo de codificación que
considera la codificación más elemental, aparece como primer carácter de la línea:
MinCHAT, que luego expondremos, y la po-
sibilidad de codificaciones más complejas 1. Líneas de encabezamiento @ Ej. @Begin
con finalidades investigadoras específicas. 2. Líneas principales * Ej. *CHI:
3.CLAN (Computerized Language Analy- 3. Líneas dependientes % Ej. %err:
sis). La informatización de las transcripcio-
nes facilitó enormemente lo que al fin y al Líneas de encabezamiento (@)
cabo constituye el objetivo último de la me-
todología RETAMHE, el análisis de los re- Como su nombre indica, son en su ma-
sultados obtenidos en el proceso de registro yoría las líneas que encabezan la transcrip-
y codificación, tarea de recuento que antaño ción, marcan el inicio y el final de la misma
se hacía «a mano» en sesiones agotadoras y o pasajes determinados y contienen datos
con fiabilidad excesivamente dependiente fundamentales tales como quiénes son los
de los errores del investigador. La automati- participantes en la conversación, la edad del
zación de dicha tarea se concretó en la terce- niño objeto de estudio, la fecha de la graba-
ra herramienta, CLAN, un paquete de pro- ción o la situación en que se realizó la mis-
gramas informáticos específicos para el aná- ma. Se clasifican en tres categorías: obliga-
lisis de transcripciones en CHAT. Al igual torias, constantes y variables.
que el sistema de codificación, los progra-
mas tienen un uso básico, minCLAN, que in- 1. Obligatorias
troduciremos en este artículo, y unos usos
avanzados que se explican pormenoriza- @Begin: Primera línea de una transcrip-
damente en el Manual (MacWhinney, 1995). ción
El sistema incluye versiones tanto para @End: Última línea de una transcripción
Macintosh, como para MS-DOS y reciente- @Participants: Segunda línea de una
mente se ha incorporado una nueva para transcripción donde se listan todos los parti-
Windows 95. Las actualizaciones de todos cipantes con las tres letras que identificarán
los componentes se publican anualmente en sus intervenciones (CHI, INV, MOT, etc.),

520 Psicothema, 1999


ELISEO DIEZ-ITZA, CATHERINE E. SNOW Y BRIAN MACWHINNEY

con su nombre (opcional) y su papel en la Ej. @Time Duration: 18:45-19:25


situación (Target_Child, Investigator, Mot- @Situation: Situación en la que tiene lu-
her, etc.) gar la grabación
Ej. @Begin Ej. @Situation: en el salón del domi-
@Participants: CHI Sara cilio del niño, sentados sobre la al-
Target_Child, INV Gerardo Inves- fombra
tigator @Activities: Actividades de los partici-
*INV: hola # Sara! pantes durante la grabación
*CHI: hola! Ej. @Activities: jugando con puzzles y
@End mirando cuentos
@Comment: Comentario sobre algún as-
2. Constantes pecto global de la grabación
Ej. @Comment: el niño estuvo inquie-
@Age of XXX: Edad del participante to porque era su hora de la siesta
XXX (años;meses.días) @New Episode: Marca de un nuevo epi-
Ej. @Age of CHI: 4;1.3 sodio cuando la grabación no se hace en una
@Birth of XXX: Fecha de nacimiento del única sesión o hay interrupciones o modifi-
participante XXX (día-MES-año) caciones en la situación.
Ej. @Birth of CHI: 23-DEC-1993 @Bg: comienzo de un fragmento (gem)
@Coder: Identificación del transcrip- que podrá ser analizado aisladamente por
tor/es los programas de CLAN.
Ej. @Coder: Verónica Martínez López Ej. @Bg: cuento de Caperucita
@Education of XXX: Años de escolari- @Eg: final de un fragmento «gem»
dad del participante XXX (0-20) Ej. @Eg: cuento de Caperucita
@Filename: Nombre del archivo infor-
mático que contiene la transcripción Líneas principales (*)
Ej. @Filename: angelpep.cha
@Language: Lengua principal de los Son las líneas de la transcripción propia-
participantes en la transcripción mente dichas donde se recoge todo lo que
Ej. @Language: Spanish dicen los participantes. Comienzan con el
@ SES of XXX: Status socioeconómico símbolo * y las tres mayúsculas identificati-
del participante XXX vas del participante seguidas de dos puntos.
Ej. @SES of CHI: middle El texto o transcripción de lo hablado em-
@Sex of XXX: Sexo del participante pieza en la novena columna con lo que se
XXX (female/male) debe introducir el espacio correspondiente
mediante un tabulador prefijado en CED, el
3. Variables procesador de textos de CHILDES. No se
utilizan mayúsculas excepto para los nom-
@Date: Fecha de la grabación (día- bres propios. El final de cada línea principal
MES-año) debe delimitarse siempre, bien con un pun-
Ej. @Date: 26-JAN-1998 to, una interrogación o una exclamación,
@Location: Lugar de la grabación (ciu- con lo que dichos símbolos no pueden apa-
dad, provincia, país) recer en otra posición que no sea el final de
Ej. @Location: Oviedo,Asturias,Spain una línea principal. Cada línea no necesaria-
@Time Duration: Horas de inicio y final mente recoge un turno completo del partici-
del registro (00:00-24:00) pante, sino un único enunciado completo,

Psicothema, 1999 521


LA METODOLOGÍA RETAMHE Y EL PROYECTO CHILDES: BREVIARIO PARA LA CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE INFANTIL

siendo necesario utilizar una nueva línea & palabra incompleta o no palabra
por cada nuevo enunciado, aunque el parti- *CHI: &ee no # dame # el &co coche #
cipante sea el mismo y no cambie el turno. &secí [?].
Por ejemplo, cuando el niño narra un cuen-
to, probablemente será necesario incluir lo Acciones paralingüísticas
que dice en varias líneas principales:
[=!] acciones que acompañan o sustitu-
*CHI: la mamá le dijo que llevase la ces- yen al habla y tienen un valor comunicati-
tita. vo
*CHI: y entonces Caperucita se metió en
el bosque. *CHI: <me quitó el camión> [=! grita].
*CHI: 0 [=! ríe].
1. Códigos en líneas principales *INV: 0 [=! asiente].

Pausas El 0 indica que en su turno el niño no di-


ce nada, pero ejecuta alguna acción que
Sólo excepcionalmente se emplean co- puede ser paralingüística o no:
mas, hasta el punto de que puede ser prefe-
rible no utilizarlas nunca. Al tratarse del ha- *INV: cómo te llamas?
bla, lo que se marca son las pausas reales de *CHI: 0 [% la niña mira a la cámara].
los hablantes y se indican mediante el sím-
bolo: # Interjecciones

*CHI: no # dame el coche # es mío. Van seguidas de una pausa que sustituye
*CHI: no # dame # el coche es mío. al signo exclamativo, salvo cuando van al
*CHI: no # dame # el coche # es mío. final de la línea principal.

Material ininteligible *INV: ah # sí!

xxx fragmento que no se entiende Onomatopeyas y palabras compuestas


*CHI: xxx.
%exp: pasa un coche y no se oye lo que di- Cuando deseamos que una palabra o con-
ce. junto de palabras se compute como una so-
la, como puede ser el caso de las onomato-
xx palabra/s que no se entiende/n peyas o los nombres compuestos, se unen
*CHI: no # dame # el coche # xx xx. mediante el símbolo: +

[?] palabra o fragmento dudoso brrn+brrn+brrn/ja+ja+ja


*CHI: no # dame # el coche # <es mío> [?]. taca+taca/guau+guau
Jose+Luis/Caperucita+Roja/Power+Ra
www material no transcrito nger
*CHI: www.
%exp: el niño canta una canción (el símbolo + puede sustituir también a
*INV: www. los guiones, ya que estos son interpreta-
%exp: habla con el operador de la cá- dos como códigos morfológicos por
mara CLAN).

522 Psicothema, 1999


ELISEO DIEZ-ITZA, CATHERINE E. SNOW Y BRIAN MACWHINNEY

Tabla 1
Fragmento de transcripción en formato CHAT de una muestra de habla espontánea recogida en la
conversación entre un niño de tres años y su madre

@Begin
@Participants: CHI Target_Child, MOT Mother
@Age of CHI: 3;6.0
@Coder: Eliseo Diez-Itza
@SES of CHI: middle
@Sex of CHI: male
@Filename: angelpep.cha
@Situation: la madre y el niño juegan sobre la alfombra del salón sentados frente a frente. Tienen un papel y una caja con pinturas
y sellos de caucho.
@Comment: fragmento de una transcripción con finalidad didáctica
@Language: Spanish
@Location: Gijón, Asturias, Spain

*CHI: Ángel # Pepe # y Luis.


%act: va señalando alternativamente los dibujos en el papel
*MOT: ah # Ángel Pepe y Luis?
*MOT: andá # el tractor de quién es # este?
*CHI: de Luis.
*MOT: y este # qué?
*MOT: u:y # venga!
*CHI: este de Ángel.
*MOT: ahora pintamos # por ejemplo +…
*MOT: a quién ponemos aquí?
*CHI: eh [?]?
%com: el niño emite un sonido poco audible como si no hubiese entendido bien
*MOT: <a Ana> [//] pintamos a Ana # eh?
*MOT: venga # vamos a pintar a Ana.
*CHI: no # esta es Josefa.
*MOT: esta es Josefa?
%act: señala un dibujo en el papel
*MOT: venga # yo te la pongo ahí # y tú le das colores # vale?
*MOT: de qué color vas a pintar a Josefa?
*CHI: <tu me lo> [//] tu moja [= sello de caucho] # y lo pones aquí.
%act: señala un lugar en el papel
*MOT: yo mojo y lo pongo aquí.
%act: la madre coge un sello de caucho y lo imprime donde ha señalado el niño
*MOT: y tú qué haces?
*CHI: <yo # nada> [?] +…
%com: parece rehuir la pregunta y a continuación cambia de tema
*CHI: todo esto lo pinté yo y esto lo pintó xx xx xx.
%act: se pone a señalar dibujos en el papel, sin levantar la vista
*CHI: mira # como come hierba el burrito # se ponió [*] verde!
%err: ponió=puso $MOR;
*MOT: no me digas # se puso verde porque comió hierba?
*MOT: a ver # entonces # Josefa [//] vamos a pintar a Josefa.
*MOT: mira # porque lleva ahí la cesta de qué?
*CHI: de Caperucita.
*MOT: de Caperucita?
*MOT: ah # yo pensé que era de ir a por los huevos a las gallinas.
*MOT: venga!
@End

Psicothema, 1999 523


LA METODOLOGÍA RETAMHE Y EL PROYECTO CHILDES: BREVIARIO PARA LA CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE INFANTIL

Interrupciones (@c colocado al final de la palabra «lololo»


indica que se trata de un término inventado
+/. final de una producción incompleta por el niño, que forma parte de su jerga in-
por haber sido interrumpida dividual)
*INV: vamos a ir +/.
*CHI: al cine! [=? texto] transcripción alternativa
+… final de una producción incompleta *CHI: dame # el &co coche # &secí [=?
sin interrupción sadí].
*CHI: pues el otro día +…
*CHI: a mí me gusta mucho la playa. [% texto] comentario
+//. final de una producción autointe- *INV: y tú # qué haces?
rrumpida *CHI: <yo # nada> [% en tono evasivo]
*INV: no quiero que os +//.
*INV: mira # aquí viene mamá! Líneas dependientes (%)
+/? Final de una pregunta interrumpida
*INV: queréis ir al +/? Contienen códigos, comentarios o des-
cripciones que complementan la transcrip-
Repeticiones, reformulaciones y superposiciones ción propiamente dicha que aparece en las
líneas principales de las que dependen. Co-
[/] repetición exacta mienzan con el símbolo % seguido de tres
*CHI: <tú moja> [/] tú moja y lo pones letras minúsculas identificativas de su nom-
aquí. bre/contenido y dos puntos, no llevando
[//] reformulación: sobre la misma idea puntuación al final excepto en el caso de las
cambia alguna palabra o la forma de la fra- líneas de error en las que se emplea el pun-
se to y coma. Se colocan siempre a continua-
*CHI: <tú me lo> [//] tú moja! ción de la línea principal de la que depen-
[/-] falso comienzo sin reformulación den, es decir, a la que se refieren, y se re-
posterior, es decir, empezando una frase fieren sólo a ella. Pueden seguir a una línea
nueva principal tantas líneas dependientes como se
*CHI: <tú me lo> [/-] # dame esa pintu- considere necesario introducir, pero no se
ra! pueden repetir sus nombres, de modo que,
[>] superposición con la línea siguiente por ejemplo, no podemos codificar varios
[<] superposición con la línea anterior errores que aparezcan en la misma línea
*INV: yo lo pongo ahí # <y tú le das co- principal mediante líneas %err:, hemos de
lores> [>]. incluirlos todos en una misma línea con ese
*CHI: <tú moja y lo> [<] pones ahí! nombre y separados por punto y coma. Los
programas de CLAN reconocen 23 nombres
2. Explicaciones en líneas principales de líneas dependientes llamadas «standard»,
que cumplen distintas finalidades, pero se
[= texto] explicación que identi- pueden inventar nuevas líneas en el caso
fica personas o cosas (raro) de que aquellas no cubran nuestras
*INV: dáselo [= lápiz] a ella [= Sara]. necesidades. Veamos algunas de ellas:

[:=x texto] traducción 1. Líneas de información y observaciones


*CHI: vamos con lololo@c [:=x abue-
lo]! %act: acciones de los participantes

524 Psicothema, 1999


ELISEO DIEZ-ITZA, CATHERINE E. SNOW Y BRIAN MACWHINNEY

%com: comentarios %err: pínsite = príncipe $PHO;


%exp: explicaciones *CHI: lo ponió [*] aquí.
%par: material paralingüístico %err: ponió = puso $MOR;
%sit: información situacional *CHI: <me se> [*] cayó!
%flo: versión fluida o «limpia» de la %err: me se = se me $SYN;
transcripción *CHI: un caballo [*].
*INV: yo [/] yo lo pongo [= un sello de %exp: señala un dibujo de una vaca
caucho] ahí [= en el papel] # <y [//] # pe- %err: caballo = vaca $LEX;
ro tú le das colores> [>]. *CHI: dame el coche # &secí [*] [?].
%flo: yo yo lo pongo ahí y pero tú le das %err: secí = ?; $PITO.
colores. *CHI: pínsite [*] ponió [*] gorro> [*].
*CHI: <tú moja [= el sello de caucho] y %err: pínsite = el príncipe $PHO $SYN;
lo> [<] pone [*] ahí! ponió = se puso $MOR $SYN; gorro = la
%flo: tú moja y lo pone ahí. orona $LEX; $SYN.

2. Líneas de codificación Análisis computerizado de transcripciones


(MinCLAN)
%cod: línea de codificación general
*CHI: se lo di a él. Una vez transcritos los datos, CHILDES
%cod: $MLU=5 $PRON=3 $PREP=1 proporciona la posibilidad de automatizar el
$VERB=1 tercer y último proceso de la metodología
RETAMHE, el análisis. Ello merced al pa-
%pho: descripción codificada de la fono- quete de programas informáticos CLAN
logía (cfr. cap. 11 (PHONASCII) y 10 (UNI- que Leonid Spektor diseñó en la Universi-
BET) del Manual) dad Carnegie Mellon. Estos programas per-
miten realizar recuentos de frecuencias, cál-
%spa: actos de habla (cfr. cap. 13 del culos del MLU, búsqueda de palabras, aná-
Manual) lisis de coocurrencias, de interacciones, de
*INV: hola # Sara! cambios textuales, etc. Su formato se adap-
%spa: $nma:cl ta al de las transcripciones en CHAT, aun-
*CHI: hola! que muchos de ellos funcionan en archivos
%spa: $sat:ac ASCII.
El núcleo de los comandos y opciones de
(códigos INCA-A: Ninio, Snow, Pan y Ro- CLAN, constituye el sistema MinCLAN,
llins, 1994). cuya utilización requiere únicamente cono-
cimientos básicos de los sistemas operativos
%mor: descripción codificada de la mor- de Macintosh o PC y aprendizaje previo del
fosintaxis (cfr. cap. 14 del Manual) sistema MinCHAT que hemos resumido en
*CHI: se cayó el coche. el apartado anterior de transcripción usando
%mor: pro:refl|se v|caer-PAST det|el el procesador de textos de CHILDES
n|coche (CED). En el Manual se ofrece una descrip-
ción detallada de los programas y sus múlti-
%err: exige que en la línea principal los ples opciones, empezando según un orden
errores estén marcados con [*], finaliza con alfabético precisamente con CED (MacW-
punto y coma (cfr. cap. 12 del Manual) hinney, 1995, cap. 21). Las opciones de ca-
*CHI: mira # es un pínsite [*]! da programa pueden consultarse también di-

Psicothema, 1999 525


LA METODOLOGÍA RETAMHE Y EL PROYECTO CHILDES: BREVIARIO PARA LA CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE INFANTIL

rectamente en la pantalla del ordenador sim- iniciarse en MinCLAN a través de sus dis-
plemente escribiendo el nombre del progra- tintos usos. FREQ efectúa sobre las trans-
ma y pulsando «enter», veamos algunos de cripciones recuentos de las frecuencias de
ellos. todas las palabras ofreciendo un listado de
las mismas, al tiempo que calcula otro de
MLU y MLT los índices tradicionalmente más utilizados
para estudiar el vocabulario la type/token
La longitud media de los enunciados ha ratio (TTR), índice de diversidad léxica que
sido la medida más universalmente emplea- viene dado por el cociente entre los voca-
da para cuantificar el desarrollo gramatical blos diferentes que aparecen en la muestra
de los niños. Naturalmente CLAN propor- y el total de palabras de la misma. La eje-
ciona un programa llamado MLU para efec- cución de FREQ se realiza del mismo mo-
tuar dicho cálculo sobre una transcripción o do señalado para MLT y MLU, sin embar-
un conjunto de ellas. Sin embargo, y parti- go el output que se obtiene no separa las
cularmente para el español, resulta difícil frecuencias de cada uno de los participan-
establecer dicha medición en términos de tes, es decir, nos da el recuento de todas las
morfemas, por lo que concedemos mayor palabras que aparecen en la transcripción.
fiabilidad al cálculo del MLU en función Puesto que normalmente nos interesará rea-
del número de palabras por enunciado lizar el recuento de un participante, es ne-
(Diez-Itza, 1992). Dicha medición es uno de cesario introducir una opción en el coman-
los resultados de otro programa que mide la do de modo que el análisis se reduzca a un
longitud media de los turnos: MLT. Dicho tipo de línea, dicha opción es +t seguido
programa, como se puede ver en el ejemplo del nombre de la línea que deseamos anali-
de la Tabla 2, donde se aplica al fragmento
de transcripción reproducido arriba, mide
Tabla 2
para cada uno de los participantes el núme- Análisis con MLT de la longitud media de los
ro de enunciados, el número de turnos y el turnos y enunciados del niño y de la madre en
número de palabras y sobre ellos calcula la la transcripción de la Tabla 1
media de palabras por turno, la media de
producciones por turno y la media de pala- MLT.EXE angelpep.cha +f
Sat Apr 11 21:03:01 1998
bras por enunciado, es decir, el MLU, la
MLT.EXE (18-JUL-95) is conducting analyses on:
longitud media de los enunciados. Para eje- ALL speaker tiers
cutar los programas de CLAN basta con te- ****************************************
clear su nombre seguido del nombre del ar- From file <angelpep.cha> to file <angelpep.mt>
MLT for Speaker: *MOT:
chivo que contiene la transcripción que de- MLT (xxx and yyy are INCLUDED in the utterance and morphe-
seamos analizar. Por ejemplo, para obtener me counts):
en pantalla el análisis que aparece en la Ta- Number of: utterances = 19, turns = 8, words = 110
bla 2 el comando es: Ratio of words over turns = 13.750
Ratio of utterances over turns = 2.375
Ratio of words over utterances = 5.789
>mlt angelpep.cha
MLT for Speaker: *CHI:
FREQ MLT (xxx and yyy are INCLUDED in the utterance and morp-
heme counts):
Number of: utterances = 10, turns = 8, words = 45
Este es uno de los más poderosos pro- Ratio of words over turns = 5.625
gramas de CLAN y a la vez uno de los más Ratio of utterances over turns = 1.250
fáciles de usar, por lo que se recomienda Ratio of words over utterances = 4.500

526 Psicothema, 1999


ELISEO DIEZ-ITZA, CATHERINE E. SNOW Y BRIAN MACWHINNEY

zar: Por ejemplo, para obtener en pantalla KWAL


un análisis de frecuencia léxica del niño
(*CHI) como el del ejemplo de la Tabla 3, Este programa busca las producciones o
realizado sobre el fragmento de la trans- líneas de la transcripción en las que aparece
cripción reproducida más arriba la orden determinada palabra que se especifique. Per-
sería: mite por tanto analizar el contexto en el que
aparecen elementos predeterminados. Di-
>freq +t*chi angelpep.cha
chos elementos se señalan mediante la op-
ción +s seguida de la palabra o grupo de pa-
Nótese que el recuento total de pala-
labras en cuestión entrecomillados. También
bras de FREQ no coincide con el de MLT.
podemos escribir en un archivo una lista de
Ello se debe a que FREQ cuenta por de-
las palabras que deseamos buscar, como artí-
fecto todas las palabras, mientras que
culos, preposiciones, etc. (@art, @prep, etc.)
MLT excluye por defecto las repeticiones
y KWAL las buscará en la transcripción:
y reformulaciones que estén codificadas
como tales. Si deseamos que FREQ ex-
>kwal +t*chi +s«en» angelpep.cha
cluya dichas palabras hemos de añadir la
>kwal +t*chi +s@prep angelpep.cha
opción +r6.
COMBO
Tabla 3
Análisis con FREQ de la diversidad léxica del Es también un programa de búsqueda
niño en la transcripción de la Tabla 1 con +s, pero en este caso de cadenas de ca-
racteres, palabras o grupos de palabras que
FREQ.EXE +t*chi angelpep.cha +f
Sat Apr 11 21:03:45 1998 pueden aparecer o no juntas en la trans-
FREQ.EXE (18-JUL-95) is conducting analyses cripción. Los elementos de la cadena que
on: ONLY speaker main tiers matching: *CHI; se desea buscar deben unirse en el coman-
****************************************
do mediante el símbolo ^. Este programa
From file <angelpep.cha>
to file <angelpep.frq> resulta particularmente importante para la
investigación de aspectos sintácticos. Po-
1 aquí 1 mira demos buscar, por ejemplo, la secuencia
1 burrito 1 moja
1 caperucita 1 nada
«come burrito» en una producción, con la
1 come 1 no
1 como 1 pepe Tabla 4
3 de 1 pinté
Análisis con COMBO de la aparición de la
1 eh 1 pintó
1 el 1 pones
secuencia «come^*burrito» en la transcripción
1 es 1 ponió de la Tabla 1
1 esta 1 se
1 este 1 todo COMBO.EXE +scome^*^burrito angelpep.cha
2 esto 2 tu Sun Apr 12 12:26:19 1998
1 hierba 1 verde COMBO.EXE (18-JUL-95) is conducting analyses on:
1 josefa 3 xx ALL speaker tiers
4 lo 3 y ****************************************
2 luis 2 yo From file <angelpep.cha>
1 me 2 Ángel
**** line 45; file angelpep.cha ****
34 Total number of different word types used *CHI: mira # como come hierba el burrito # se ponió [*] verde!
48 Total number of words (tokens) 1 1
0.708 Type/Token ratio Strings matched 1 times

Psicothema, 1999 527


LA METODOLOGÍA RETAMHE Y EL PROYECTO CHILDES: BREVIARIO PARA LA CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE INFANTIL

opción de que dichas palabras puedan no GEM


ser consecutivas en la misma, en cuyo caso
insertaremos en el comando el símbolo * Cualquiera de los programas de CLAN
(el resultado de este análisis sobre la trans- puede aplicarse a un fragmento de la trans-
cripción del ejemplo es la que aparece en la cripción predeterminado, sin necesidad de
Tabla 4): copiarlo en un archivo separado. GEM es el
programa que separa dicho fragmento y se
>combo +s«come^*^burrito» angelpep.cha utiliza en combinación con los otros progra-
mas. El fragmento o «gem» en cuestión de-
CHIP be estar delimitado por las líneas de encabe-
zamiento antes citadas @Bg y @Eg. Puede
Se trata de un programa escrito por Jef- interesarnos, por ejemplo, analizar con
frey Sokolov para estudiar la interacción FREQ la diversidad léxica en una tarea na-
verbal, es decir, para analizar cuantitativa- rrativa, como contar el cuento de Caperuci-
mente las similitudes y diferencias entre el ta Roja, que está incluida en una transcrip-
input lingüístico parental y las respuestas ción con las marcas de «gem» correspon-
infantiles. CHIP compara dos grupos de dientes, para lo que utilizaríamos GEM con
enunciados predeterminados, los primeros a el siguiente comando:
los que llamamos «fuentes» y marcamos
con +b y los segundos a los que llamamos >gem +scaperucita +d angelpep.cha |
«respuestas» y marcamos con +c. El pro- freq +t*chi
grama introduce líneas de codificación con
las distintas comparaciones y un cuadro fi- GEM corta o separa ese fragmento para
nal donde se recogen las estadísticas de los que FREQ o cualquier otro programa reali-
análisis. Por ejemplo, con la siguiente orden ce el análisis solamente sobre el mismo,
obtenemos un output con fragmentos del ti- permitiendo así obtener medidas de diferen-
po de los que aparecen en la Tabla 5: tes tareas o situaciones que se pueden com-
parar entre sí, con otras similares o con el
>chip +bMOT +cCHI angelpep.cha cómputo total de la transcripción en la me-
dida correspondiente.
Tabla 5
Análisis comparativo con CHIP de enunciados Normas elementales para la utilización de
«fuente» (madre) y enunciados «respuesta» de CHILDES
la transcripción de la Tabla 1

CHIP.EXE +bMOT +cCHI angelpep.cha +f


Existe ya una amplia literatura de inves-
Sat Apr 11 21:27:12 1998 tigaciones que han utilizado o se han basa-
CHIP.EXE (18-JUL-95) is conducting analyses on: do en el sistema CHILDES y un número
ALL speaker tiers menor, aunque creciente, de trabajos, como
****************************************
From file <angelpep.cha> to file <angelpep.chp> el presente, que tratan de difundir, enseñar o
*CHI: Ángel # Pepe # y Luis . promover su empleo. De entre estos destaca
*MOT:ah # Ángel Pepe y Luis ? un Manual específicamente dedicado a
%adu: $EXA:Ángel-pepe-y-luis $ADD:ah $EXPAN $DIST = 1
prácticas de investigación del desarrollo del
$REP = 0.80
*MOT:andá # el tractor de quién es # este ? lenguaje utilizando CHILDES (Sokolov y
%asr: $NO_REP $REP = 0.00 Snow, 1994). En él se recogen ejemplos de
%adu: $NO_REP $REP = 0.00 investigaciones de temática diversa, desde
[…]
el «babytalk» a las diferencias individuales

528 Psicothema, 1999


ELISEO DIEZ-ITZA, CATHERINE E. SNOW Y BRIAN MACWHINNEY

o desde los artículos en español al perfil de a la editorial Erlbaum. El manejo correcto


los niños con retraso específico del lengua- de los datos requiere una comprensión bá-
je. Aparece, cómo no, un capítulo donde se sica de los contenidos del mismo, inclu-
analizan las transcripciones de Brown, la de yendo el sistema CHAT, los programas
Adán en concreto, y un simpático y breve CLAN y la documentación descriptiva de
prólogo de Brown que nos devuelve al ini- DATABASE.
cio de este artículo con una anécdota meto- 3. Citar a MacWhinney (1995) en cual-
dológica: dos investigadores japoneses pre- quier publicación que se base en el uso de
guntaron a Bellugi y Brown, por el labora- los datos y los programas, así como los artí-
torio y el equipo con el que habían estudia- culos vinculados a los corpora particulares
do a Adán, Eva y Sara, «ambos empuñamos que se manejen.
en alto nuestros lápices amarillos Mogol 4. Asumir la responsabilidad de contri-
No. 2» (Sokolov y Snow, 1994, p. iX). buir al crecimiento de la base de datos apor-
Seguimos empuñando metafóricamente tando nuevos corpora y urgiendo a otros co-
esos lápices de nuestros antepasados cuando legas a que hagan lo mismo.
empleamos la metodología RETAMHE y ¡Buena suerte!
las herramientas que proporciona el proyec-
to CHILDES. Animamos pues a los investi- Agradecimientos
gadores del comportamiento lingüístico y su
desarrollo en el ámbito del español a seguir Este trabajo está dedicado a la memoria de
esta senda o método. Tal y como MacWhin- Roger Brown, uno de los pioneros en hacer re-
ney indica en el Manual y también en el alidad el sueño de compartir datos del lengua-
00Readme que acompaña al CHILDES CD- je infantil. Está relacionado con diversos cur-
ROM, las personas que utilicen los datos y sos y seminarios metodológicos impartidos
los programas de CHILDES deben seguir por los autores en España, de modo que dese-
las siguientes normas: an dar testimonio de gratitud a los participan-
tes y organizadores de dichos eventos por su
1. Hacerse miembro del sistema CHILDES contribución a la difusión del proyecto. Muy
poniéndose en contacto a través de la dirección especialmente deben agradecer la inestimable
electrónica: childes@andrew.cmu.edu, facili- colaboración en los mismos de Verónica Mar-
tando nombre, dirección, e-mail, teléfono y ex- tínez, de la Universidad de Oviedo, y María
plicando el posible uso que desea hacer de los Carrasco y Cruz Celis, de la Universidad Com-
datos y los programas. plutense de Madrid, autoras de distintos docu-
2. Adquirir una copia del Manual mentos y manuales de gran utilidad acerca de
(MacWhinney, 1995) y de los programas CHILDES.

Referencias

Arnau, J. y Boada, H. (1985). Aspectos de la Bruner, J. (1986). El habla del niño. Barcelo-
evolución del instrumento lingüístico en bilin- na: Paidós. (Orig. 1983).
gües y monolingües. III Congreso Nacional de Diez-Itza, E. (1992). Adquisición del lengua-
AESLA. Valencia. je. Oviedo: Pentalfa.
Brown, R. (1973). A first language. The early Higginson, R. y MacWhinney, B. (1990). CHIL-
stages. Cambridge, Mass.: Harvard University DES/BIB: An anotated bibliography of child langua-
Press. ge and language disorders. Hillsdale, NJ: Erlbaum.

Psicothema, 1999 529


LA METODOLOGÍA RETAMHE Y EL PROYECTO CHILDES: BREVIARIO PARA LA CODIFICACIÓN Y ANÁLISIS DEL LENGUAJE INFANTIL

MacWhinney, B. (1995) The CHILDES Pro- Siguán, M. (1983). Metodología para el estu-
yect. Tools for analyzing talk. Hillsdale, N.J.: dio del lenguaje en la infancia. Barcelona: Pu-
Erlbaum. blicacions i Edicions de la Universitat.
MacWhinney, B. y Snow, C. (1985). The Siguán, M., Colomina, R. y Vila, I. (1990).
Child Language Data Exchange System. Journal Metodología para el estudio del lenguaje Infan-
of Child Language, 12, 271-296. til. Vic: Abril.
MacWhinney, B. y Snow, C. (1990). The Sokolov, J.L. y Snow, C. (1994). Handbook of
Child Language Data Exchange System: an up- research in language development using CHIL-
date. Journal of Child Language, 17, 457-472. DES. Hillsdale, N.J.: Erlbaum.
Ninio, A., Snow, C., Pan, B. y Rollins, P. Solé, M.R. (1988). La comunicació verbal en
(1994). Classifying communicative acts in chil- el marc escolar. Vic: Eumo.
dren’s interactions. Journal of Communicative Triadó, C. y Forns, M. (1989) La evaluación
Disorders, 27, 157-188. del lenguaje: Una aproximación evolutiva. Bar-
Ochs, E. (1979). Transcription as theory. En E. celona: Anthropos.
Ochs y B. Schieffelin (eds.) Developmental Prag-
matics (pp. 43-72). Nueva York: Academic Press.
Serra, M. (1976). Métodos e índices para el
estudio psicológico y patológico del lenguaje.
Anuario de Psicología, 15: 171-196. Aceptado el 23 de diciembre de 1998

530 Psicothema, 1999

También podría gustarte