Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tarea 3 - Estándares de Codificación de Voz
Tarea 3 - Estándares de Codificación de Voz
IDEA
CEI: Liceo Guatemala
Nombre de la Carrera: LITAT
Curso: Normas Y Estándares Para Telecomunicaciones
Horario: Miércoles, 18:00 Hrs.
Tutor: Eddy Galván
NOMBRE DE LA TAREA
La codificación tiene su origen desde la invención del telégrafo, inventado por Samuel
Morse en 1837, esta consiste en la generación de un código binario de tamaño variable
que representa las letras del alfabeto, representando las letras más frecuentes con
códigos de menor longitud. En la década de 1870 se desarrolló un código de longitud fija
generando la misma codificación. Luego de muchos estudios y desarrollos, se
establecieron los fundamentos matemáticos de este mecanismo y se definieron límites
de carácter fundamental para los sistemas de comunicación digital. Gracias a estos
limites establecidos se han desarrollado códecs diseñados específicamente para la
reproducción de voz en diferentes bandas. Estos códecs se categorizan en distintas
bandas siendo estas: banda angosta, ancha, superancha y banda completa.
ESTANDARES DE CODIFICACION DE VOZ
Las centrales telefónicas digitales realizan la conmutación de audio en forma digital. Las
centrales IP utilizan las redes de datos para realizar el envío de audio entre dispositivos,
a través del envío de paquetes de datos. Esto requiere que en algún punto del sistema
la señal de voz analógica sea digitalizada, es decir, convertida en una secuencia de
número discretos. Este proceso puede realizarse en los propios teléfonos, Gateways o
las placas de abonados. Las primeras ideas acerca de la digitalización del audio son
atribuidas al Ingeniero Alec Reeves, quien desarrolló el primer sistema de audio digital,
con fines militares en 1937. Si bien la idea fue patentada por Reeves, su popularización
debió esperar por varias décadas a la invención del transistor. La tecnología de PCM se
popularizó sobre fines de la década de 1960, momento para el cual ya no eran
reclamables derechos por la patente. En el caso de ser una señal sonora el modelo es
un generador de impulsos periódicos, simulando la apertura y cierre periódicos de las
cuerdas vocales, a una frecuencia dada por el tono de la voz.
La voz humana puede tener tonos que lleguen hasta los 20 kHz, lo que se corresponde
con el límite de frecuencias que puede escuchar el oído. Sin embargo, la mayor parte de
la energía de la voz se centra en las frecuencias bajas, típicamente por debajo de los 4
kHz.
Los códecs son los dispositivos que realizan la codificación y decodificación de la voz.
Pueden ser caracterizados por diferentes aspectos, entre las que se encuentran su tasa
de bits, la calidad resultante del audio codificado, su complejidad, el tipo de tecnología
utilizada y el retardo que introducen, entre otros. Originalmente, los primeros códecs
fueron diseñados para reproducir la voz en la banda de mayor energía, entre 300 Hz a
3.4 kHz. Actualmente este tipo de códecs son caracterizados como de “banda angosta”
(narrowband). En contraste, los códecs que reproducen señales entre 50 Hz y 7 kHz se
han llamado de “banda ancha” (wideband). Más recientemente, ITU-T ha estandarizado
códecs llamados de banda superancha (superwideband), para el rango de 50 Hz a 14
kHz y de banda completa (fullband), para el rango de 50 Hz a 20 kHz
El códec básico y más antiguo en telefonía es el estandarizado en la recomendación
G.711 de la ITU-T, implementando la “ley A” o “ley µ”. Mediante esta codificación se
obtiene una señal digital de 64 kb/s, como se verá a continuación. El códec G.711 es del
tipo de forma de onda.
MPEG-1 Audio
- Extensión de MPEG-1 para tasas de muestreo bajas. Incluye tasas a 16, 22.05 y
24 ksps, que originan tasas binarias por debajo de 64 kbps para cada canal. Es
una extensión muy fácilmente incorporable a los reproductores MPEG-1.
- Extensión a sonido multicanal compatible con MPEG-1. Permite la utilización de
hasta cinco canales con tasa binaria máxima más un sexto canal de mejora de las
bajas frecuencias. Esta extensión es compatible con MPEG-1 siendo posible la
reproducción de los bitstreams MPEG-2 BC mediante reproductores MPEG-1.
- Nuevo esquema de codificación. Este nuevo esquema se denomina Advanced
Audio Coding (AAC) y genera bitstreams que no pueden ser utilizados por los
reproductores MPEG-1. Mejora mucho la razón de compresión de los datos.
MPEG-4 Audio
Es por lo tanto un estándar que combina diferentes fuentes audio en un mismo bitstream
con especial énfasis en aplicaciones multicanal, soporte multilenguaje, tasa binaria
variable y recuperación de errores.
Codificación de voz en MPEG-4
La mayor novedad a los formatos de audio que incorpora MPEG-4 está asociada a
codificaciones de voz con tasas binarias extra bajas.
Los codificadores de voz tienen distintos usos y aplicaciones, los más sencillos tienen
por objetivo reproducir una onda que en todo momento siga la onda originalmente
emitida, esto se logra cuando se refiere a codificación de pulsos. Cuando se refiere a
PCM básicamente se está hablando de tres etapas: muestreo, cuantización y asignación
de un código.
RECOMENDACIONES
Aprender a utilizar las distintas formas de codificación es muy importante para el uso y
la aplicación de tecnologías de voz, ya que gracias a las distintas codificaciones de voz
podemos desarrollar distintas aplicaciones de utilidad en las nuevas tecnologías.
EGRAFIA