Está en la página 1de 10

UNIVERSIDAD GALILEO

IDEA
CEI: Liceo Guatemala
Nombre de la Carrera: LITAT
Curso: Normas Y Estándares Para Telecomunicaciones
Horario: Miércoles, 18:00 Hrs.
Tutor: Eddy Galván

NOMBRE DE LA TAREA

Estándares de codificación de Voz

Apellidos, Nombres del Alumno:


Saavedra Herrarte, Pavel Ivan
Carné: 14003747 Fecha de entrega: 24 de febrero 2021
Semana a la que corresponde: 6
INTRODUCCION

La codificación tiene su origen desde la invención del telégrafo, inventado por Samuel
Morse en 1837, esta consiste en la generación de un código binario de tamaño variable
que representa las letras del alfabeto, representando las letras más frecuentes con
códigos de menor longitud. En la década de 1870 se desarrolló un código de longitud fija
generando la misma codificación. Luego de muchos estudios y desarrollos, se
establecieron los fundamentos matemáticos de este mecanismo y se definieron límites
de carácter fundamental para los sistemas de comunicación digital. Gracias a estos
limites establecidos se han desarrollado códecs diseñados específicamente para la
reproducción de voz en diferentes bandas. Estos códecs se categorizan en distintas
bandas siendo estas: banda angosta, ancha, superancha y banda completa.
ESTANDARES DE CODIFICACION DE VOZ

Las centrales telefónicas digitales realizan la conmutación de audio en forma digital. Las
centrales IP utilizan las redes de datos para realizar el envío de audio entre dispositivos,
a través del envío de paquetes de datos. Esto requiere que en algún punto del sistema
la señal de voz analógica sea digitalizada, es decir, convertida en una secuencia de
número discretos. Este proceso puede realizarse en los propios teléfonos, Gateways o
las placas de abonados. Las primeras ideas acerca de la digitalización del audio son
atribuidas al Ingeniero Alec Reeves, quien desarrolló el primer sistema de audio digital,
con fines militares en 1937. Si bien la idea fue patentada por Reeves, su popularización
debió esperar por varias décadas a la invención del transistor. La tecnología de PCM se
popularizó sobre fines de la década de 1960, momento para el cual ya no eran
reclamables derechos por la patente. En el caso de ser una señal sonora el modelo es
un generador de impulsos periódicos, simulando la apertura y cierre periódicos de las
cuerdas vocales, a una frecuencia dada por el tono de la voz.

La voz humana puede tener tonos que lleguen hasta los 20 kHz, lo que se corresponde
con el límite de frecuencias que puede escuchar el oído. Sin embargo, la mayor parte de
la energía de la voz se centra en las frecuencias bajas, típicamente por debajo de los 4
kHz.

Los códecs son los dispositivos que realizan la codificación y decodificación de la voz.
Pueden ser caracterizados por diferentes aspectos, entre las que se encuentran su tasa
de bits, la calidad resultante del audio codificado, su complejidad, el tipo de tecnología
utilizada y el retardo que introducen, entre otros. Originalmente, los primeros códecs
fueron diseñados para reproducir la voz en la banda de mayor energía, entre 300 Hz a
3.4 kHz. Actualmente este tipo de códecs son caracterizados como de “banda angosta”
(narrowband). En contraste, los códecs que reproducen señales entre 50 Hz y 7 kHz se
han llamado de “banda ancha” (wideband). Más recientemente, ITU-T ha estandarizado
códecs llamados de banda superancha (superwideband), para el rango de 50 Hz a 14
kHz y de banda completa (fullband), para el rango de 50 Hz a 20 kHz
El códec básico y más antiguo en telefonía es el estandarizado en la recomendación
G.711 de la ITU-T, implementando la “ley A” o “ley µ”. Mediante esta codificación se
obtiene una señal digital de 64 kb/s, como se verá a continuación. El códec G.711 es del
tipo de forma de onda.

Los algoritmos de codificación de voz más utilizados se basan en la codificación


predictiva lineal. En particular, el esquema de codificación de voz más común es la
codificación de predicción lineal excitada por código, que se utiliza, por ejemplo, en el
estándar GSM. En CELP, el modelado se divide en dos etapas, una etapa predictiva
lineal que modela la envoltura espectral y el modelo basado en el libro de códigos del
residuo del modelo predictivo lineal. En CELP, los coeficientes de predicción lineal (LPC)
se calculan y cuantifican, generalmente como pares espectrales de línea (LSP). Además
de la codificación de voz real de la señal, a menudo es necesario utilizar la codificación
de canal para la transmisión, para evitar pérdidas debido a errores de transmisión. Por
lo general, la codificación de voz y los métodos de codificación de canal deben elegirse
en pares, con los bits más importantes en el flujo de datos de voz protegidos por una
codificación de canal más robusta, para obtener los mejores resultados de codificación
general.

(Desconocido, Wikipedia, s.f.) (Desconocido, 2.Elo.utfsm.cl, s.f.) (Joskowicz, s.f.)

MPEG-1 Audio

El estándar MPEG-1 se terminó en 1992 y constituyó el estándar internacional ISO/IEC


11172-3, publicado en 1993. Estandariza tres esquemas distintos para la codificación de
ondas de sonido denominados Layers I, II y III. No estandariza el codificador sino el tipo
de información que éste debe producir y cómo un decodificador debe dividir,
descomprimir y sintetizar esta información para obtener el sonido codificado. Puede
combinarse la secuencia de bits (bitstream) audio con vídeo en lo que se conoce como
un bitstrem de sistemas MPEG-1
MPEG-2 Audio

El estándar MPEG-2 fue terminado en 1994 y constituye el estándar internacional


ISO/IEC 13818-3, publicado en 1995. MPEG-2 AAC fue terminado y publicado como el
estándar internacional ISO/IEC 13818-7 en 1997. Este estándar es la segunda fase del
proceso de estandarización MPEG y consta de tres elementos bien diferenciados:

- Extensión de MPEG-1 para tasas de muestreo bajas. Incluye tasas a 16, 22.05 y
24 ksps, que originan tasas binarias por debajo de 64 kbps para cada canal. Es
una extensión muy fácilmente incorporable a los reproductores MPEG-1.
- Extensión a sonido multicanal compatible con MPEG-1. Permite la utilización de
hasta cinco canales con tasa binaria máxima más un sexto canal de mejora de las
bajas frecuencias. Esta extensión es compatible con MPEG-1 siendo posible la
reproducción de los bitstreams MPEG-2 BC mediante reproductores MPEG-1.
- Nuevo esquema de codificación. Este nuevo esquema se denomina Advanced
Audio Coding (AAC) y genera bitstreams que no pueden ser utilizados por los
reproductores MPEG-1. Mejora mucho la razón de compresión de los datos.

MPEG-4 Audio

Este estándar consta de dos versiones. El estándar MPEG-4 Versión 1 se terminó en


Octubre de 1998 y se publicó en 1999. La segunda versión se terminó en diciembre de
1999 y se publicó en 2000. MPEG-4 es una fase que engloba todos los esquemas vistos
para MPEG-1 y MPEG-2 define estructuras de más alto nivel por las cuales se permite
el control y la combinación de elementos audio procedentes tanto de fuentes sonoras
digitalizadas (p.ej. por medio de los formatos MPEG-1/2, codificación CELP, etc.) como
sintetizadas (voz o sonidos musicales, tanto simples como complejos).

Es por lo tanto un estándar que combina diferentes fuentes audio en un mismo bitstream
con especial énfasis en aplicaciones multicanal, soporte multilenguaje, tasa binaria
variable y recuperación de errores.
Codificación de voz en MPEG-4

La mayor novedad a los formatos de audio que incorpora MPEG-4 está asociada a
codificaciones de voz con tasas binarias extra bajas.

(Desconocido, lpi.tel.uva.es, s.f.) (Desconocido, GoogleDocs, s.f.)


CONCLUSION

Los codificadores de voz tienen distintos usos y aplicaciones, los más sencillos tienen
por objetivo reproducir una onda que en todo momento siga la onda originalmente
emitida, esto se logra cuando se refiere a codificación de pulsos. Cuando se refiere a
PCM básicamente se está hablando de tres etapas: muestreo, cuantización y asignación
de un código.
RECOMENDACIONES

Aprender a utilizar las distintas formas de codificación es muy importante para el uso y
la aplicación de tecnologías de voz, ya que gracias a las distintas codificaciones de voz
podemos desarrollar distintas aplicaciones de utilidad en las nuevas tecnologías.
EGRAFIA

Desconocido. (s.f.). 2.Elo.utfsm.cl. Obtenido de http://www2.elo.utfsm.cl:


http://www2.elo.utfsm.cl/~elo341/ComDig07_HC.pdf

Desconocido. (s.f.). GoogleDocs. Obtenido de https://docs.google.com:


https://docs.google.com/document/d/1rbxDFM0zsbFDNRZeM2FoXfRDbYSiSt6tCdbYPA0qdzs/ed
it?hl=en_US#!

Desconocido. (s.f.). lpi.tel.uva.es. Obtenido de https://www.lpi.tel.uva.es:


https://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/trabajos_01_02/formatos_audio_digita
l/html/mpegformat.htm

Desconocido. (s.f.). Wikipedia. Obtenido de https://es.wikipedia.org:


https://es.wikipedia.org/wiki/Codificaci%C3%B3n_de_voz

Joskowicz, J. (s.f.). iie.fing.edu.uy. Obtenido de iie.fing.edu.uy:


https://iie.fing.edu.uy/ense/asign/ccu/material/docs/Codificacion%20de%20voz%20y%20video.
pdf

También podría gustarte