Está en la página 1de 17

Codificacin de la voz Codificar la voz consiste en transformar las ondas sonoras que la representan a otro tipo de representacin que,

aunque menos natural, s resulta ms adecuada para determinadas tareas. Veamos un posible ejemplo de codificacin de voz : supongamos que disponemos de un ordenador que tiene conectado un micrfono, las ondas sonoras se pueden traducir a valores numricos (que el ordenador puede almacenar) sin ms que ir midiendo peridicamente el resultado de la excitacin del micrfono. Posteriormente, los valores almacenados podran utilizarse para excitar un altavoz, y as reproducir la voz. La codificacin tambin estudia, una vez que se ha transformado la seal de voz a otra representacin, cul es la mejor forma de tratar esa nueva representacin para que el tratamiento de la informacin obtenida sea el ptimo.

Historia de los codificadores de voz Hace unos cincuenta aos que empez la investigacin en el campo de la codificacin de la voz. El pionero fue Homer Dudley, que trabajaba en los laboratorios de la Bell Telephone. La motivacin a esta investigacin surgi por la necesidad de transmitir voz por los cables de telegrafa de pequeo ancho de banda. La idea del vocoder (VOIce CODER, codificador de voz) de Dudley era analizar la voz para extraer una serie de caractersticas y que el emisor enviase esas caractersticas, cuando stas le llegasen al receptor reconstruir a la voz original. Este codificador recibi gran atencin durante la Segunda Guerra Mundial, debido a su potencial en cuanto a eficiencia y posibilidad de encriptacin se refiere.

Las primeras implementaciones del vocoder eran analgicas, sin embargo, con el nacimiento de los sistemas digitales y de las posibilidades que stos ofrecen, pronto se pas a las implementaciones digitales. Durante la dcada de los 40 hubo una gran actividad en la Codificacin por Modulacin de Impulsos (PCM). Gracias a la flexibilidad de los sistemas digitales, se pudo experimentar con formas ms sofisticadas de representacin de la voz. Fant, a finales de los 50, trabaj en el modelo de produccin de voz lineal.

Clasificacin de los codificadores de voz Los codificadores de voz se clasifican en tres grandes grupos, a saber: codificadores de la forma de onda vocoders codificadores hbridos

Coficadores de la forma de onda


Los codificadores de la forma de onda intentan reproducir la forma de la onda de la seal de entrada. Generalmente se disean para ser independientes a la seal, de tal forma que pueden ser usados para codificar una gran variedad de seales. Presentan una degradacin aceptable en presencia de ruido y errores de transmisin. Sin embargo, para que sean efectivos, slo se deben usar a bit-rates medios. La codificacin se puede llevar a cabo tanto en el dominio del tiempo como de la frecuencia.

Vocoders Los codificadores de la forma de la onda no tienen en cuenta la naturaleza de la seal a codificar. Sin embargo, si codificamos una seal de voz, podemos aprovechar sus caractersticas intrnsecas para que la codificacin se realice de forma ms eficiente. As, los vocoders (VOice CODERS) suponen el siguiente modelo de produccin de voz:

Los vocoders intentan producir una seal que suene como la voz original, independientemente de si la forma de onda se parece o no. En el transmisor se analiza la voz y se extraen los parmetros del modelo y la excitacin. Esta informacin se enva al receptor donde se sintetiza la voz. El resultado es que se produce voz inteligible a muy bajo bit-rate, pero tiene el problema de que no suena natural.

Codificadores Hbridos En la codificacin hbrida se combinan las tcnicas de los codificadores de la forma de la onda con las de los vocoders con el propsito de obtener una alta calidad de voz a bajos bit-rates (inferiores a 8 Kb/s).En estos codificadores, las muestras de la seal de entrada se dividen en bloques de muestras (vectores) que son procesados como si fueran uno solo. Llevan a cabo una representacin paramtrica de la seal de voz para tratar que la seal sinttica se parezca lo ms posible a la original. Tambin se les conoce como codificadores de anlisis-por-sntesis. En el emisor se lleva a cabo un anlisis que obtiene los parmetros de la seal para luego sintetizarla y conseguir el mayor parecido a la original.

Sntesis de voz Sobre la dcada de 1980, se introduce la idea de generar voz sinttica, simulando la manera en que se produce la voz humana en el conducto vocal.

Modelo del Conducto Vocal

Espectro tpico de la voz

Digitalizacin de la voz -Proceso de digitalizacin Muestreo Se toman muestras de la seal a intervalos regulares. Estos intervalos deben ser tales que cumplan con el teorema de muestreo: La mnima frecuencia a la que puede ser muestrada una seal y luego reconstruida es el doble de la frecuencia mxima de dicha seal.

Proceso de digitalizacin 2. Cuantificacin Los valores de las muestras se cuantifican en cantidades discretas. La cantidad total de valores discretos debe introducir la menor cantidad posible de ruido de cuantificacin

Digitalizacin de la voz Proceso de digitalizacin 3. Codificacin Los valores cuantificados se codifican en nmeros que pueden ser luego transmitidos y procesados digitalmente.

En algn punto del sistema de telecomunicaciones la seal de audio analgica debe ser digitalizada, es decir, convertida en una secuencia de nmero discretos. Este proceso puede realizarse en los propios telfonos (cmo es el caso en los telfonos digitales o en los telfonos IP), en Gateways (o conversores de medios y sealizacin) o las placas de abonados entre otros Seal de vos analgica

Esta seal se convierte en una seal digital Pulse Code Modulation PCM

Organismos internacionales de estandarizacin

ITU (International Telecommunication Union) Antigua CCITT Formada por organismos pblicos y privados mbito internacional ITU-T, ITU-R http://www.itu.org

Organismos internacionales de estandarizacin

ETSI (European Telecommunications Standards Institute) mbito europeo Compuesta por organismos pblicos y privados Estndar GSM http://www.etsi.org

Estndares de codificacin de voz Referencia: Calidad y tasa binaria de la red telefnica bsica 8bits/muestra, muestreo a 8Khz: 64Kbps Opciones Disminuir la velocidad binaria manteniendo la calidad Medidas de calidad Aumentar la calidad manteniendo la tasa binaria

ITU-T G.711 Modulacin por impulsos codificados (MIC) de frecuencias vocales Muestreo a 8Khz Codificacin PCM lineal: 104 Kbps Codificacin PCM logartmica: 64 Kbps Ley A y Ley

ITU-T G.711 PCM logartmico Menor error relativo Refleja el comportamiento logartmico del odo Aproximacin por tramos lineales Implementacin prctica Cuantificacin a 12 bits lineales por muestra Compresin a 8 bits despreciando bits menos significativos (ms cuanto ms altos son los valores) Descompresin a 13 bits lineales Valor de reconstruccin en mitad del intervalo

ITU-T G.729 Codificacin de la voz a 8kbit/s mediante prediccin lineal con excitacin por cdigo algebraico de estructura conjugada (CS-ACELP) Ventanas de 30 ms con desplazamientos de 10 ms Clculo de LSF (Line Spectrum Frecuencies)sobre ventana con un adelanto de 5 ms Retardo algortmico de 15 ms (10 de trama actual + 5 de trama futura)

También podría gustarte