4

Tecsup
Virtu@l
Digitalización
y Tráfico de
V oz
Copyright © 2008 por TECSUP

Digitalización y tráfico de la voz Tecsup
Marzo 2008
ÍNDICE
1. Introducción ....................................................................................... 3
2. Objetivos ............................................................................................. 3
3. Digitalización y Codificación (Comprensión) de voz .................. 3
3.1. Muestreo Digital ................................................................... 4
3.2. Cuantificación ....................................................................... 5
4. Algoritmos de Codificación (Compresión) de Voz....................... 6
4.1. Codecs de Forma de Onda .................................................. 7
4.2. Codecs Fuente (Vocoders) ................................................... 7
4.3. Codecs Híbridos.................................................................... 7
5. Algoritmos o estándares de compresión de voz .......................... 8
5.1. Recomendación G.711.......................................................... 8
5.2. Recomendación G.726.......................................................... 9
5.3. Recomendación G.728........................................................ 10
5.4. Recomendación G.723.1..................................................... 10
5.5. Recomendaciones G.729 y G.729A ................................... 11
6. Calidad de compresión ................................................................... 11
7. Medición de la Calidad de Voz...................................................... 12
8. Glosario ............................................................................................. 13
9. Referencias Bibliográficas............................................................... 13
Página 2
Tecsup Digitalización y tráfico de la voz
Marzo 2008
1. Introducción
En estos tiempos donde la información juega un papel

indispensable en la vida de todos nosotros, la necesidad de mover
y procesar grandes cantidades de información es crucial para las
compañías de telecomunicaciones.
Realizar esta tarea es más fácil si tenemos la información en

formato digital. Por eso la importancia digitalizar la información.
Y además sería más fácil mover mayor cantidad de información si
pudiéramos hacer que ésta ocupe menos espacio. Para esta tarea
los compresores juegan un papel crucial tratando de lograr altas
tasas de compresión manteniendo la calidad.
2. Objetivos
• Identificar y analizar las principales técnicas de digitalización

utilizadas en la comunicación de datos.
• Identificar las aplicaciones de la digitalización en la
transmisión de voz.
• Identificar los tipos de señalización digital.
• Analizar los principales codificadores de voz.
• Seleccionar el codificador de voz adecuado de acuerdo a sus
características.
3. Digitalización y Codificación (Comprensión) de voz
Figura 1: Digitalización de la voz.
Las señales analógicas son continuas en dos dimensiones: tiempo

y valor. Para digitalizar una señal analógica, se debe muestrear la
señal con respecto al tiempo (Muestrear es el proceso de hacer
discreta la señal analógica con respecto al tiempo), y cuantificarla
con respecto al valor muestreado.
Para enviar audio por una red convergente de datos, la forma de

onda de audio analógica ha de ser codificada en bits binarios de
Página 3
Marzo 2008
datos que puedan ser procesados por un ordenador. Se muestrea,

se cuantifica (se le asignan valores de bit discretos) y se comprime
para que ocupe la mínima cantidad de ancho de banda. Cuando
el sonido llega a su destino, se invierte el proceso.
Los programas de compresión (la "co" de codecs) se aprovechan

de las pausas entre palabras, períodos de silencio y cambios
predecibles en las amplitudes para reducir el requisito de ancho
de banda para transmitir la voz humana a la mitad. A
continuación encontrará una lista de los estándares de codecs más
populares de la International Telecomunication Union (ITU),
incluyendo los utilizados por la Telefonía IP.
• Para poder brindar conectividad de usuarios a través de una

red telefónica, es necesaria y la interconexión de Centrales
Telefónicas. Todas la conexiones de PBX son de tipo digital
bajo interfaces de tipo E1, E2 ó E3, pudiendo incluso tener
interfaces SDH.
• El manejo de la información de voz, a través de largas

distancias tiene que ser del tipo digital, debido a que su
tratamiento analógico, causaría pérdida en la calidad de la voz
así como se obtendría mucha atenuación.
• Para que la voz pueda utilizar las interfaces digitales de alta

velocidad necesita ser digitalizada, debiéndose considerar las
muchas técnicas de digitalización, las cuales varían entre sí
por el ancho de banda utilizado, la razón de compresión y la
calidad de la señal de voz.
• Este proceso de digitalización también es llamado

compresión, cuando el ancho de banda utilizado es menor a
los 64 Kbps.
3.1. Muestreo Digital
Voice Bandwidth =
300 Hz to 3400 Hz
Analog Audio Source Sampling Stage
Figura 2: Muestro de la voz a 8 Khz.
Página 4
Marzo 2008
- S a m p le : 8 k H z (8 ,0 0 0 S a m p le s /S e c )
- C o d e d o n 8 b its
= > 6 4 K b /s B W fo r o n e c o n v e r s a tio n
Figura 3: Tasa de bits.
En la figura anterior se muestra el proceso de muestreo de

una señal analógica. Una fuente de reloj proporciona la
base de tiempo para tomar una muestra de la señal
analógica a intervalos fijos de tiempo. Según el teorema de
Nyquist, la frecuencia de muestreo debe ser al menos dos
veces más alta que la mayor frecuencia de entrada.
Mientras los humanos podemos oír frecuencias de hasta

20 Khz, la mayoría de la información transmitida en una
conversación no excede de los 4 Khz. Las señales de un
teléfono analógico se filtran antes del muestreo para que la
mayor parte de la señal esté entre 300 y 3,400 Hz. Esta
señal es muestreada a 8,000 Hz para que las frecuencias de
hasta 4,000 Hz puedan ser muestreadas. Cada 125 us
(1/800 seg), el valor de señal es transmitida a función de
cuantificación. Si la señal es muestreada a 8000 muestras
por segundo y codificadas a 8 bits por muestra entonces
tendremos por conversación un ancho de banda (BW) de
uso de 64 Kbps.
3.2. Cuantificación
8159 10000000
4063 10001111
2015 10011111
991 10101111
479 10111111
223 11001111
95 11011111
31 11101111
0 11111111/01111111
-31 01101111
-95 01011111
-223 01001111
-479 00111111
-991 00101111
-2015 00011111
-4063 00001111
-8159 00000000
Figura 4: Cuantificación.
La cuantificación es el proceso de redondear los valores

muestreados a un valor discreto predefinido más próximo.
Esto permite representar el valor del impulso como un
Página 5
Marzo 2008
flujo binario de bits en vez de un puro formato analógico.

En el proceso de cuantificación se debe considerar dos
variables importantes:
• Número de niveles de cuantificación: La señal digital

se parece más a la señal analógica según aumenta el
número de niveles de cuantificación, para esto se
requiere que se codifique más información, por lo que
se requiere aumentar el número de bits por muestreo,
lo cual aumentará la proporción de bits de salida
digitalizada requiriendo mayor BW para el envió de la
señal digitalizada.
• Distribución de Niveles de cuantificación: Indica la
resolución digital en los diferentes rangos del valor de
la señal analógica.
4. Algoritmos de Codificación (Compresión) de Voz
El objetivo de la codificación de las señales de voz es desarrollar

codecs de audio que proporcionen mejor calidad de la señal de
voz con una proporción más baja de bits, permitiendo alojar una
mayor cantidad de conversaciones de voz en un BW dado. Los
codecs de baja proporción de bits tienden a perder señal, lo que
significa que la calidad de la señal se reduce, estos son los codecs
más utilizados ya que requieren un menor ancho de banda para el
envió de señal de voz digitalizada.
Algoritmo
Designación Índice de
Audio BW de Comentarios
ITU Transmisión
Compresión
Compresión simple de
G.711 3.4 KHz 56K, 64Kbps PCM amplitud; Ampliamente
extendido en PSTN
Misma calidad que
G.728 3.4 KHz 16Kbps LD-CELP G.711; Videoconferencia
de bajo índice
Cercano a la calidad
48K, 56K,
G.723.1 3.4 KHz LP-MLQ tarificada; Codec básico
64Kbps
del VoIP Forum
Baja latencia y
ligeramente mejor
G.729 and
3.4 KHz 8Kbps CS-ACELP calidad que G.723.1;
G.729A
Aplicaciones más nuevas
de telefonía IP
Página 6
Marzo 2008
Los algoritmos de codificación de conversación pueden

clasificarse como sigue:
• Codecs de forma de Onda.

• Codecs Fuente (Vocoders).
• Codecs Híbridos.
4.1. Codecs de Forma de Onda
Reconstruyen una señal de entrada sin modelar el proceso

que creó la señal de entrada. La señal de salida recrea la
forma de entrada de la forma de onda, con la
independencia de que la entrada sea una señal de
conversación. Es tipo de codec no utiliza un baja
proporción de bits para la codificación y son los menos
complejos. Estándares de compresión de voz que utilizan
Codecs del algoritmo de forma de onda:
• G.711 PCM (Modulación por Pulsos Codificados).

• G.726 ADPCM (Modulación por Pulsos codificados
Diferencial y Adaptable).
4.2. Codecs Fuente (Vocoders)
Los codecs fuente de conversación intentan replicar el

proceso físico de la creación de sonido. Los codecs fuente
producen señales de muy baja tasa de bits, pero tienen una
baja calidad de voz, y son utilizados en aplicaciones
militares.
4.3. Codecs Híbridos
Estos Codecs proporcionan una mayor calidad de voz que

los codecs fuente y utilizan proporciones de bits más bajos
que los codecs de forma de onda. Para cumplir este
rendimiento, los codecs híbridos usan una combinación de
codecs fuente y de análisis de forma de onda. Estos
algoritmos de los codecs híbridos son bastante complejos.
Los codecs híbridos más comunes operan en el dominio

del tiempo usando técnicas de predicción lineal de análisis
por síntesis (LPAS). Algoritmos estándares que utilizan
codecs híbridos:
• G.723 ITU que utiliza un algoritmo MP-MLQ

(Cuantificación de Probabilidad máxima de
Multiimpulso).
• G.728 que utiliza algoritmo LD-CELP (Predicción
Lineal de código estimulado de bajo retraso).
Página 7
Marzo 2008
• G.729 que usa el algoritmo CS-ACELP.

• G.723.1 1ue usa el algoritmo ACELP.
5. Algoritmos o estándares de compresión de voz
5.1. Recomendación G.711
La ITU ha estandarizado la Modulación de Código de

Pulso (Pulse Code Modulation, PCM) como G.711, que
permite una señal de audio de calidad tarificada con un
ancho de banda de 3.4 KHz que ha de ser codificado para
la transmisión de índices de 56 Kbps o 64 Kbps.
El G.711 utiliza A-law o Mu-law para una compresión

simple de amplitud y es el requisito básico de la mayoría
de los estándares de comunicación multimedia de la ITU.
Figura 5: Codificación G.711.
(PCM es el método de codificación de señal de audio

analógica más popular y es ampliamente utilizado por la
red telefónica pública. Sin embargo, el PCM no soporta
compresión de ancho de banda, por lo que otras técnicas
de codificación como el Adaptive Differential PCM
(ADPCM) utilizan estimaciones basándose en dos
muestras cuantificadas consecutivas para reducir el ancho
de banda).
Página 8
Marzo 2008
Figura 6: PCM.
En codificación en PCM usa un codec de forma de onda y

la señal es previamente filtrada para eliminar los
componentes de frecuencias altas y bajas y muestreada a
8000 veces por segundo. Este valor muestreado es
cuantificado para uno de los 256 valores, que están
representados en 8 bits. La proporción de bits resultantes
del codec G.711 es de 64 Kbps, lo que determina un time Como las señales de
slot DS0. El valor de cada muestra es codificado usando
alta frecuencia tienen
una de las dos leyes de codificación A-Law (Usa y Japon)
menor resolución en
o u-Law (Europa). Estas leyes se refieren a la distribución
G7.11, las señales
de los niveles de cuantificación, a esto también se le llama
DMTF de marcado
companding (compresión y descompresión).
pueden ser
irreconocibles si el
nivel de audio es
demasiado alto.
Es un codec de forma de onda y en lugar de transmitir los
valores reales PCM de la forma de onda, el codec ADPCM
transmite una señal de error que es la diferencia entre la
entrada real y la estimada.
Bits por muestra de Números de Niveles de

Tasa de Bits
señal de error cuantificación
40 Kbps 5 31
32 Kbps 4 15
24 Kbps 3 7
16 Kbps 2 4
Página 9
Marzo 2008
Figura 7: ADPCM.
• ADPCM
–4KHz (3.4 kHz) x 2 =
–8000 samples of 4 bits =
–32 kBit/s
Figura 8: Cálculo de ADPCM de 32 bits.

1100
1101
1100
0100
0110
0100
0100
1101
1100
1110
0101
0111
0000
1100
1100
0011
0011
Figura 9: ADPCM asignación de códigos a las muestras.
G.728 codifica una señal de audio de calidad tarifada con

un ancho de banda de 3.4 KHz para transmitir a 16 Kbps.
Es comúnmente utilizada en sistemas de videoconferencia
que funcionan a 56 Kbps o 64 Kbps. Con un requisito de
ordenador más alto, el G.728 proporciona la cualidad del
G.711 a un cuarto del índice de datos necesario.
5.4. Recomendación G.723.1
G.723.1 define cómo puede codificarse una señal de audio

con un ancho de banda de 3.4 KHz para transmitirse a 5.3
Página 10
Marzo 2008
Kbps y 6.4 Kbps. G.723.1 requiere un índice de

transmisión muy bajo ofreciendo una calidad de audio
cercana a la tarifada. G.723.1 ha sido seleccionada por el
VoIP Forum como el codec básico para aplicaciones de
telefonía IP de bajo índice de bits.
5.5. Recomendaciones G.729 y G.729A
Elegidas como los estándares oficiales de la ITU en 1996,

estas recomendaciones codifican señales de audio cerca de
la calidad tarifada con un ancho de banda de 3.4 KHz para
su transmisión a una velocidad de 8 Kbps. G.729A
requiere una potencia de ordenador más baja que G.729 y
G.723.1. Tanto G.729 como G.729A tienen una latencia (el
tiempo que necesita para convertir de analógico a digital)
más baja que G.723.1. Se espera que G.729A tenga un
impacto mayor en la compresión de voz para su
transmisión sobre redes inalámbricas.
Bajo este tipo de algoritmo de compresión, la filosofía de

la digitalización se basa en que no se necesita muestrear
toda la señal de voz a cada momento y codificarla en un
determinado número de bits, debido a que los cambios en
la señal de voz pueden ser mínimos durante una
conversación, más aún cuando a menudo se producen
espacios de silencio. Es por esto que las muestras de voz
bajo esta técnica, son en menor número de bits.
6. Calidad de compresión
Como se mencionó anteriormente, la calidad de la voz depende

directamente del ancho de banda que se destine para la
transmisión únicamente de voz. Por ejemplo, la técnica PCM
necesita de 64Kbps para establecer una sola comunicación de voz
con una calidad de voz excelente.
Técnicas como ADPCM, basadas en el concepto de que no es

necesario muestrear toda la señal para tener una referencia de la
misma puede tener solo en 32Kbps una calidad de voz
comparable con PCM.
Algoritmos bastante eficientes como el G.729 permiten tener una

calidad muy buena, y comparable a la calidad que ofrece PCM a
64Kbps, con solo 8Kbps. Este último es unos de los estándares
más utilizados en la actualidad por la eficiencia en desarrollo del
algoritmo de muestreo y compresión.
Página 11
Marzo 2008
Figura 10: Comparación de la calidad de los codecs.
7. Medición de la Calidad de Voz
MOS.- (Mean Opinion Score)
Conocido como Tasa de Opinión Media, es una unidad de

medida referente a la calidad del habla humana en sistemas de
telefonía VoIP, representada con un porcentaje. MOS es calculada
tomando el promedio numérico entre puntajes dados por un
jurado utilizándolo como un indicador para medir la calidad de
un sistema.
La elección del
CODEC adecuado Figura 11
para cada aplicación se
hace en función del Los CODECS de voz son evaluados y catalogados de acuerdo a su
ancho de banda que MOS. El CODEC con MOS más alto es el G.711 pero con la tasa de
consume y la calidad compresión más baja. Según la tabla que sigue a continuación el
de voz que entrega. CODEC más adecuado es el G.729 que alcanza una tasa de
compresión muy alta y un MOS aceptable.
Página 12
Marzo 2008
Figura 12: MOS de los principales CODECs.
8. Glosario
ADPCM PCM Diferencial y Adaptivo
CODEC CODificador DECodificador
LD-CELP Predicción Lineal de código estimulado de bajo

retraso
MOS Tasa de Opinión Media
PCM Codificación por modulación de pulsos
9. Referencias Bibliográficas
• http://www.voip-info.org/wiki-Codecs
• http://voip.about.com/od/voipbasics/a/MOS.htm
Página 13

4

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

4

Cargado por

Copyright:

Formatos disponibles

Tecsup

Copyright © 2008 por TECSUP

En estos tiempos donde la información juega un papel

Realizar esta tarea es más fácil si tenemos la información en

• Identificar y analizar las principales técnicas de digitalización

3. Digitalización y Codificación (Comprensión) de voz

Figura 1: Digitalización de la voz.

Las señales analógicas son continuas en dos dimensiones: tiempo

Para enviar audio por una red convergente de datos, la forma de

datos que puedan ser procesados por un ordenador. Se muestrea,

Los programas de compresión (la "co" de codecs) se aprovechan

• Para poder brindar conectividad de usuarios a través de una

• El manejo de la información de voz, a través de largas

• Para que la voz pueda utilizar las interfaces digitales de alta

• Este proceso de digitalización también es llamado

3.1. Muestreo Digital

Analog Audio Source Sampling Stage

Figura 2: Muestro de la voz a 8 Khz.

Figura 3: Tasa de bits.

En la figura anterior se muestra el proceso de muestreo de

Mientras los humanos podemos oír frecuencias de hasta

La cuantificación es el proceso de redondear los valores

flujo binario de bits en vez de un puro formato analógico.

• Número de niveles de cuantificación: La señal digital

4. Algoritmos de Codificación (Compresión) de Voz

El objetivo de la codificación de las señales de voz es desarrollar

Los algoritmos de codificación de conversación pueden

• Codecs de forma de Onda.

4.1. Codecs de Forma de Onda

Reconstruyen una señal de entrada sin modelar el proceso

• G.711 PCM (Modulación por Pulsos Codificados).

4.2. Codecs Fuente (Vocoders)

Los codecs fuente de conversación intentan replicar el

4.3. Codecs Híbridos

Estos Codecs proporcionan una mayor calidad de voz que

Los codecs híbridos más comunes operan en el dominio

• G.723 ITU que utiliza un algoritmo MP-MLQ

• G.729 que usa el algoritmo CS-ACELP.

5. Algoritmos o estándares de compresión de voz

5.1. Recomendación G.711

La ITU ha estandarizado la Modulación de Código de

El G.711 utiliza A-law o Mu-law para una compresión

Figura 5: Codificación G.711.

(PCM es el método de codificación de señal de audio

En codificación en PCM usa un codec de forma de onda y

Bits por muestra de Números de Niveles de

Figura 8: Cálculo de ADPCM de 32 bits.

Figura 9: ADPCM asignación de códigos a las muestras.

5.3. Recomendación G.728

G.728 codifica una señal de audio de calidad tarifada con

5.4. Recomendación G.723.1

G.723.1 define cómo puede codificarse una señal de audio

Kbps y 6.4 Kbps. G.723.1 requiere un índice de

5.5. Recomendaciones G.729 y G.729A

Elegidas como los estándares oficiales de la ITU en 1996,

Bajo este tipo de algoritmo de compresión, la filosofía de

Como se mencionó anteriormente, la calidad de la voz depende

Técnicas como ADPCM, basadas en el concepto de que no es

Algoritmos bastante eficientes como el G.729 permiten tener una

Figura 10: Comparación de la calidad de los codecs.

7. Medición de la Calidad de Voz

MOS.- (Mean Opinion Score)

Conocido como Tasa de Opinión Media, es una unidad de

Figura 12: MOS de los principales CODECs.