Está en la página 1de 42

Fontica y Fonologa

Los sonidos del lenguaje

Introduccin a las Tecnologas del Habla


2o cuatrimestre 2014
Recordatorios y Anuncios
Pgina web: http://habla.dc.uba.ar/gravano/ith/
Primer parcial: 17/9, 13-14h.
Temas: acstica, fontica y prosodia.
Mails: ith-alu@dc y gravano@dc

Clase pasada: Acstica


Sonidos peridicos y aperidicos.
Ondas peridicas simples y complejas.
Ruido blanco; ondas transitorias.
Procesamiento digital de seales.
Tasa de muestreo; precisin.
Anlisis de Fourier; FFT; espectrograma.
Herramientas: sox y python.
Hoy: Fontica y fonologa. Praat.
De estas figuras, cul se llama Buba y cul Kiki?
NYTimes, 17/1/2010
Los sonidos del lenguaje

Quin estudia los sonidos del habla?


Lingistas (fonlogos), fonoaudilogos, lexicgrafos,
cantantes, maestros de idiomas.

Qu preguntas se hacen?
Cul es el inventario de un idioma X?
Cmo se producen los sonidos?
Qu sonidos comparten dos idiomas X e Y?
Cmo vara la produccin de un sonido segn el
contexto en que se produce?
Representacin de sonidos

Para qu es necesaria?
Aprender/estudiar la pronunciacin de las palabras.
Traducir sonidos palabras (ASR, TTS).

Cmo se representan los sonidos?


Ortografa.
Smbolos especiales: IPA, ARPAbet, SAMPA.
Representacin ortogrfica
Para algunos idiomas, funciona relativamente
bien: espaol, alemn, italiano, checo, ruso, ...
Para otros claramente no: ingls.
Una letra puede sonar de varias maneras:
o comb, tomb, bomb oo blood, food, book
c court, center, cheese s reason, surreal, shy
Un sonido se puede escribir de varias maneras:
[i] sea, see, scene, receive, thief [s] cereal, same, miss
[u] true, chew, choose, do [ay] prime, buy, rhyme, lie
Para el espaol tampoco es perfecta.
Ejemplos?
Smbolos fonticos

International Phonetic Alphabet (IPA)


Sonidos de todos los lenguajes del mundo.
Emplea exactamente un caracter para cada sonido.
Requiere tipografas especiales.
Smbolos fonticos

International Phonetic Alphabet (IPA)


Sonidos de todos los lenguajes del mundo.
Emplea exactamente un caracter para cada sonido.
Requiere tipografas especiales.
Smbolos fonticos

International Phonetic Alphabet (IPA)


Sonidos de todos los lenguajes del mundo.
Emplea exactamente un caracter para cada sonido.
Requiere tipografas especiales.

ARPAbet, TIMIT, SAMPA,


Emplean 1-2 caracteres ASCII para cada sonido.
Para idiomas especficos.
SAMPA del espaol argentino. [Gurlekian et al. 2001]
Smbolos fonticos

International Phonetic Alphabet (IPA)


Sonidos de todos los lenguajes del mundo.
SAMPA para el
Emplea exactamente un caracter para espaol
cada sonido.
argentino
Requiere tipografas especiales.
Gurlekian et al. 2001,
El alfabeto fontico Sampa y
el diseo de corpora
ARPAbet, TIMIT, SAMPA, fonticamente balanceados

Emplean 1-2 caracteres ASCII para cada sonido.


Para idiomas especficos.
SAMPA del espaol argentino. [Gurlekian et al. 2001]

...
Fontica articulatoria
Cmo se producen los sonidos del habla?
Fontica articulatoria
Cmo se capturan los datos articulatorios de la
produccin de cada sonido?

Rayos X
Grabaciones de los 60s y 70s:
http://www.queensu.ca/psychology/SpeechPerception/xraydatabase.html
It's ten below outside

Why did Ken set the soggy net on top of his deck
Peligroso!
Fontica articulatoria
Resonancia magntica.
Inocuo, pero lento; anlisis esttico.

Gurlekian et al. 2004, "Caracterizacin articulatoria de los sonidos voclicos del espaol
de Buenos Aires mediante tcnicas de resonancia magntica".
Fontica articulatoria
Articulografa electromagntica (EMA)
Inocuo y dinmico, aunque algo molesto.

http://www.phon.ox.ac.uk/files/people/west/emahome.html
Clases de sonidos
Vocales:

Generalmente sonoras, poca restriccin o bloqueo del


flujo del aire (ej: [a] [e] [i] [o] [u]).
Consonantes:

Restriccin o bloqueo del flujo del aire (ej: [s]).


Sonoras vs. sordas (ej: [m] vs. [s])
Semiconsonantes: [j] labio, [w] agua.
Semivocales: reino, causa.
Consonantes: Punto de articulacin
Dnde se restringe el flujo del aire?

alveolar
pos-alveolar/palatal
dental
velar

uvular
labial
farngea

larngea/glotal
Consonantes: Punto de articulacin
Ejemplos en espaol:
Labial: bilabial [p] [m]; labiodental [f].
Dental: [] zorro en espaol peninsular.
Alveolar: [s], [n], [t], [r].
Palatal: [] oqui.
Velar: [] hongo, [k] casa, [x] juez.
Larngea: [h] mosca en espaol porteo.
Consonantes: Modo de articulacin
Cmo se restringe el flujo del aire?
Oclusiva: Se bloquea el paso del aire y luego se lo
libera: [p]Ejemplos?
[t] [k] [g].
Nasal: El aire sale por la nariz: [m]Ejemplos?
[n].
Fricativa: Se fuerza el aire por un canal angosto,
generando una friccin turbulenta: [f]Ejemplos?
[s].
Africada: Comienza como una oclusiva, pero termina
como una fricativa: [t]Ejemplos?
techo.
Aproximante: Se restringe poco el flujo del aire, sin
bloquear ni producir friccin turbulenta: [l].Ejemplos?
Vibrante: Se hace vibrar la lengua: [r]. Ejemplos?
Consonantes: Modo de articulacin
Cmo se restringe el flujo del aire?
Oclusiva: Se bloquea el paso del aire y luego se lo
libera: [p] [t] [k] [g].
Nasal: El aire sale por la nariz: [m] [n].
Fricativa: Se fuerza el aire por un canal angosto,
generando una friccin turbulenta: [f] [s].
Africada: Comienza como una oclusiva, pero termina
como una fricativa: [t] techo.
Aproximante: Se restringe poco el flujo del aire, sin
bloquear ni producir friccin turbulenta: [l].
Vibrante: Se hace vibrar la lengua: [r].
Espaol
Espaol

Ejemplos de posibles transcripciones fonticas:


beb be 'e chancho 'tan to
dedo 'de o oqui 'o ki
gag ga 'a zorro 'so ro / 'o ro
enfermo e 'fe mo jaque 'xa ke
hongo 'o o mosca 'moh ka / 'mos ka
lluvia 'u ia / 'u ia / 'u ia / 'u ia patio 'pa tjo

(Link til: Teclado IPA http://ipa.typeit.org/full/)


Vocales
Todas son sonoras.
Apertura o altura: cun alta est la lengua?
Abierta [a]; medio [e][o]; cerrada [i][u].
Localizacin: dnde est su parte ms alta?
Anterior [a][e][i]; centro; posterior [o][u].
Cun redondeados estn los labios?
Redondeados [o][u]; no redondeados [a][e][i].
Secuencias de sonidos voclicos.
Simple [e] vs. diptongo [ej] vs. Triptongo [uej].
Hiato: caer, zoolgico, perodo, chita.
Vocales: Disposicin de la lengua
Vocales

Demo: [formant.exe] http://www.speech.kth.se/wavesurfer/formant/


IPA para el espaol: Vocales
Clases abstractas de sonidos
sopa vs. desde vs. mosca
"es uno" (porteo vs. santafecino)
nada vs. enfermo
azul vs. agua
mil vs. radio
beso vs. labio
gol vs. agua
carro (porteo vs. riojano)
Clases abstractas de sonidos
Fonos: Sonidos de un idioma. Not.: []
Fonemas: Clases abstractas de sonidos que
permiten distinguir palabras de un idioma. Not.: //
Alfonos: Conjunto de fonos que en un idioma se
reconocen como el mismo fonema.

Ejemplos en espaol:
[h] y [s] son alfonos del fonema /s/ (desde, sopa).
[d] y [] son alfonos del fonema /d/ (dado).
En ingls, /d/ y // son dos fonemas (dose vs. those).
/p/ y /b/ son fonemas (peso vs. beso).
En mandarn, [p] y [b] son alfonos del mismo fonema.
Fonos en accin

s a p o m a n t a
Fenmenos fonticos importantes
Reduccin (o hipoarticulacin): acortamiento de
los sonidos, por ejemplo por hablar rpido.
Eliminacin de fonemas: fsforo.
Hiperarticulacin: pronunciacin muy marcada
(exagerada) de cada sonido.
Co-articulacin: Coordinacin de movimientos
articulatorios para la realizacin de un sonido.
Ejemplo: en pa, la lengua adopta la posicin
articulatoria de [a] mientras se est articulando [p].
Asimilacin:
La pronunciacin de una slaba se
acomoda a la de una vecina: hongo, desde.
Resumen
Fontica: Estudia los sonidos del habla.
Representaciones: Ortografa, IPA, ARPABET.
Fontica articulatoria:
Cmo se producen los sonidos.
Clases de sonidos: segn punto y modo de articulacin.

Fonologa: Funcin de los sonidos en el lenguaje.


Fonemas (ej: /s/) vs. fonos (ej: [s] en sopa, [h] en desde).

Pgina web: Ejercicios de fontica y fonologa.

Despus del intervalo, empezamos con Praat.


Herramientas de Anlisis: Praat
http://www.praat.org

Creado por Paul Boersma y David Weenink, del


Instituto de Ciencias Fonticas de la Universidad de
Amsterdam.

Herramienta de procesamiento del habla con fines


generales.
Edicin, segmentacin, rotulado, manipulacin de
prosodia, batch scripting, y ms.
Praat
Pros: Diseado para anlisis del habla; GUI completa;
scripting; batch processing; desarrollo activo;
manipulacin prosdica; comunidad online (scripts, foros);
todas las plataformas; instalacin trivial.
Contras
GUI no standard y poco intuitiva; lenguaje de scripting
primitivo; formato nativo de archivos.
Algunos problemas tcnicos, sobre todo en Linux...
Si no funciona el audio:
Probar padsp praat o pasuspender -- praat
Usar la ltima versin disponible.

!
En el labo, usar /home/ith50/praat
Administracin de archivos
New: crear y grabar nuevos sonidos.
Open/Save: lectura y escritura de disco.
Archivos de audio Sound (en memoria) y Long Sound (en
disco).
Archivos de otros tipos: e.g. TextGrid.

Ejercicio 1: Crear un sonido nuevo a partir de una frmula (New


Sound Create Sound from formula); escribirlo en el disco;
borrarlo de la lista de objetos; y volver a leerlo.
0.5 * sin(2*pi*100*x)

0.5 * (sin(2*pi*100*x) + sin(2*pi*200*x))

randomGauss(0, 0.1)

0.5 * sin(2*pi*100*x) + randomGauss(0, 0.1)


Opciones de edicin en la ventana
de objetos (objects window)
Ejercicio 2:

Abrir el archivo /home/ith50/clase03/tarzan.wav


Escucharlo.
Analizar el espectrograma.
Crear una copia del objeto Sound tarzan con Copy....
Invertir la copia con Modify Reverse.
Escuchar el resultado.
Frecuencia de muestreo

Ejercicio 3:

Abrir el archivo /home/ith50/clase03/sf16k.wav


Secuencia de fonos [s] y [f], grabado a 16 kHz, 16 bits.
Query Query time sampling Get sampling frequency
Bajarle la frecuencia
Convert Resample... 8000 Hz y 16 bits.
Escuchar y comparar los espectrogramas.
Opciones de edicin en la ventana
de objetos (objects window)
Elegir un objeto de tipo Sound, click Edit.
Spectrum
Show spectrogram; View spectral slice.
Pitch
Show pitch; Pitch settings; Pitch listing; Get pitch.
Intensity
Show intensity; Settings; Listing; Get intensity.
Formant
Show formants.
Ejercicio 4: Abrir el archivo /home/ith50/clase03/aeiou.wav
Ver cmo difieren los espectrogramas de las vocales.
Pitch, intensity: clase que viene.
Prestar especial atencin a los formantes.
Formantes
Picos de intensidad en el espectro de un sonido.
Aparecen en un espectrograma como bandas
negras aproximadamente horizontales.
Fonos en accin
Ejercicio 5:
Abrir lamparita.wav y ver el espectrograma.
Sub un peldao ms y alcanz la lamparita.
Identificar sonidos peridicos y aperidicos.
Ondas peridicas complejas, ruido blanco y transitorios.
Construir un nuevo wav que diga:
Alcanz uno ms y sub la lmpara.
Herramientas:
Seleccionar segmentos con mouse y/o con SHIFT.
Cortar y pegar segmentos con Edit > Cut y Edit > Paste.
Usar File > Extract selected sound (time from 0) para crear
un objeto en Praat Objects (ventana principal).
En Praat Objects, seleccionar 2+ segmentos y concatenar
con Combine > Concatenate.
No olvidar guardar el wav nuevo!
Tarea para casa
Grabar las 5 vocales y comparar los formantes con los de
aeiou.wav.
Grabar como aeiou-apellido.wav y traer la prxima clase.
Repetir con los diptongos /ai/, /au/, /ia/, /ua/, /ui/, /iu/ y con los
triptongos /uai/, /uei/.
Grabar diferentes clases de consonantes (modo de
articulacin; sonora vs. muda) con el mismo contexto voclico:
/aba/, /aka/, /ata/, /ama/, /asa/, /afa/, etc.
Comparar los espectrogramas.
Hacer los Ejercicios de fontica y fonologa (ver pgina web).