Códecs de Voz

ESCUELA SUPERIOR POLITCNICA DEL CHIMBORAZO
FIE
ESCUELA: ELECTRNICA TELECOMUNICACIONES Y REDES

MATERIA: SISTEMAS CELULARES
PREPARADO POR: ERIKA ZURITA
FECHA: 4/11/2015
TTULO: CDEC DE VOZ
DESARROLLO
1. Consultar los Cdecs de voz utilizados en el mercado, y los utilizados en GSM.
Los archivos de audio y video son muy largos para ser transmitidos digitalmente. Normalmente estn
comprimidos en una seal digital y luego transmitidos. Los cdecs son programas capaces de
comprimir y descomprimir una seal digital. La codificacin y decodificacin de los codecs es para la
transmisin, almacenamiento o cifrado. Los cdecs son usados en videos y videoconferencias, entre
otras aplicaciones.
La comunicacin de voz es analgica, mientras que la red de datos es digital. El proceso de convertir
ondas analgicas a informacin digital se hace con un codificador-decodificador (el CODEC). Hay
muchas maneras de transformar una seal de voz analgica, todas ellas gobernadas por varios
estndares. El proceso de la conversin es complejo. Es suficiente decir que la mayora de las
conversiones se basan en la modulacin codificada mediante pulsos (PCM) o variaciones.
Adems de la ejecucin de la conversin de analgico a digital, el CODEC comprime la secuencia de
datos, y proporciona la cancelacin del eco. La compresin de la forma de onda representada puede
permitir el ahorro del ancho de banda. Esto es especialmente interesante en los enlaces de poca
capacidad y permite tener un mayor nmero de conexiones de VoIP simultneamente. Otra manera de
ahorrar ancho de banda es el uso de la supresin del silencio, que es el proceso de no enviar los
paquetes
de
la
voz
entre
silencios
en
conversaciones
humanas.
A continuacin se muestra una tabla resumen con los cdecs ms utilizados actualmente:
El Bit Rate indica la cantidad de informacin que se manda por segundo.

El Sampling Rate indica la frecuencia de muestreo de la seal vocal.(cada cuanto se toma una
muestra de la seal analgica)
El Frame size indica cada cuantos milisegundos se enva un paquete con la informacin sonora.
El MOS indica la calidad general del cdec (valor de 1 a 5)
Octubre - Febrero 2016
Ing. Alex Troya.
1/6

FIE
Nombre
Estandariza
do
Descripcin
G.711
ITU-T
Pulse code
modulation
(PCM)
64
G.711.1
ITU-T
Pulse code
modulation
(PCM)
G.721
ITU-T
G.722
ITU-T
G.722.1
ITU-T
G.722.2
AMR-WB
ITU-T
G.723
ITU-T
G.723.1
ITU-T
Frame
size
(ms)
Observaciones
Muestrea
da
80-96Kbps
Muestrea
da
Adaptive
differential
pulse
code
modulation
(ADPCM)
7 kHz audiocoding within
64 kbit/s
32
Muestrea
da
Tiene dos
versiones u-law
(US, Japan) y alaw (Europa)
para muestrear
la seal
Mejora del
codec G.711
para abarcar la
banda de 50 Hz
a 7 Khz.
Obsoleta. S e ha
transformado en
la G.726.
64
16
Muestrea
da
Codificacin
a 24 y 32
kbit/s
para
sistemas sin
manos con
baja perdida
de paquetes
Adaptive
Multi-Rate
Wideband
Codec (AMRWB)
24/32
16
20
23.85/
23.05/
19.85/
18.25/
15.85/
14.25/
12.65/
8.85/ 6.6
24/40
16
20
Muestrea
da
5.6/6.3
30
Extensin de
la
norma
G.721 a 24 y
40 kbit/s para
aplicaciones
en circuitos
digitales.
Dual
rate
speech coder
for
multimedia
communicati
ons
transmitting
at 5.3 and 6.3
kbit/s
Bit rate
(kb/s)
Sampling
rate (kHz)
Ing. Alex Troya.
MOS
(Mean
Opinion
Score)
4.1
Divide los 16
Khz en dos
bandas cada
una usando
ADPCM
Se usa
principalmente
para compreson
de voz en
tecnologa movil
de tercera
generacin.
Obsoleta por
G.726. Es
totalmente
diferente de
G.723.1.
Parte de H.324
video
conferencing.
Codifica la seal
usando linear
predictive
analysis-bysynthesis
coding. Para el
codificador de
high rate utiliza
Multipulse
Maximum
Likelihood
Quantization
3.8-3.9
2/6

FIE
G.726
ITU-T
G.727
ITU-T
G.728
ITU-T
G.729
ITU-T
G.729.1
ITU-T
GSM
06.10
ETSI
LPC10
Gobierno de
USA
Speex
40, 32, 24, 16

kbit/s
adaptive
differential
pulse
code
modulation
(ADPCM)
5-, 4-, 3- and
2-bit/sample
embedded
adaptive
differential
pulse
code
modulation
(ADPCM)
Coding
of
speech at 16
kbit/s using
low-delay
code excited
linear
prediction
Coding
of
speech at 8
kbit/s using
conjugatestructure
algebraiccode-excited
linearprediction
(CS-ACELP)
Coding
of
speech at 8
kbit/s using
conjugatestructure
algebraiccode-excited
linearprediction
(CS-ACELP)
Regular
Pulse
Excitation
LongTerm
Predictor
(RPE-LTP)
Linearpredictive
codec
16/24/32/4
0
var.
Muestrea
da
Muestrea
da
(MP-MLQ) y
para el de lowrate usa
Algebraic-CodeExcited LinearPrediction
(ACELP).
ADPCM;
reemplaza a
G.721 y G.723.
3.85
ADPCM.
Relacionada con
G.726.
16
2.5
CELP.
3.61
10
Bajo retardo (15

ms)
3.92
8/12/14/16/
18/20/22/2
4/
26/28/30/3
2
10
Ancho de banda
desde 50Hz a 7
Khz.
13
22.5
Usado por la
tecnologa
celular GSM
2.4
22.5
10 coeficientes.
La voz suena un
poco "robtica"
8, 16, 32
2.15-24.6
(NB)
4-44.2
(WB)
30 ( NB )
34 ( WB )
Ing. Alex Troya.
3/6

FIE
iLBC
DoD
CELP
EVRC
DVI
American
Department
of Defense
(DoD)
Gobierno de
USA
3GPP2
Interactive
Multimedia
Association
(IMA)
L16
SILK
Skype
Enhanced
Variable Rate
CODEC
DVI4 uses an
adaptive
delta
pulse
code
modulation
(ADPCM)
Uncompress
ed audio data
samples
Uncompress
ed audio data
samples
8
4.8
13.3
30
30
9.6/4.8/1.2
20
32
Variable
Muestrea
da
128
Variable
Muestrea
da
De 6 a 40
kbit/s
Variable
20
Se usa en redes
CDMA
El codec
Harmony est
basado en SILK
En los ltimos aos estn apareciendo nuevas versiones de los codecs clsicos G711, G722 y G729
conocidos como versiones 1 o versiones 2.
G 711.1
El nuevo codec G.711.1 ha sido aprobado por la ITU-T en marzo de 2008. El objetivo es que permita
interoperar con la infraestructura G.711 existente mejorando la calidad de la seal.
Provee dos capas encima de la capa actual G.711.

La primera capa mejora la calidad de G.711 en baja frecuencias (banda de 50 a 300 Herzios)
que habitualmente no se transmite con la norma G.711
La segunda extensin mejora la calidad de las altas frecuencias (banda de 4Khz a 7 Khz)
Se pueden aadir una o ambas capas incrementando el bitrate de 64 Kbps hasta 80 o 96
Kbps.
El aadir estas capas introduce un retraso de 5 ms.

Esta norma est pensada para telfonos de voz ip y multiconferencias.
Ing. Alex Troya.
4/6

FIE
G.729.1
Al igual que G.711.1 el codec G.729.1 es tambin un codec G.729 al que se le aaden capas para
mejorar la calidad del sonido a bajas y altas frecuencias para abarcar la banda desde 50Hz a 7 Khz. a
costa de incrementar el bitrate (cantidad de informacin que se manda por segundo). Tiene hasta 12
capas.
La capa principal es compatible con G729 y tiene un bitrate de 8 Kbps. La segunda llega hasta los 12
Kbps (incremento de 4kbps). Por cada nueva capa se aaden 2 Kbps hasta llegar a los 32 Kbps. A
estas velocidades mximas se podra transmitir musica con calidad (aunque inferior al codec G.722.2
al mismo bitrate)
Esta norma est pensada para telfonos IP, softphones, centralitas, gateways, centros de llamadas
(call centers), equipos de grabacin de voz o servidores de contestadores automticos.
Tambin se conoce como G729J o G729EV.
G.722.1 o SIREN 7
G722.1 o SIREN 7 provee un ancho de banda entre 50 HZ y 7Khz y opera con un bit rate de
24 kbps o 32 Kbps.
Se usa habitualmente para operaciones de manos libres en sistemas voip HD con baja
perdida de paquetes.
Existe un anexo llamado G.722.1 C o SIREN 14 que permite un ancho de banda de hasta 14
Khz y opera con un bitrate de 24, 32, y 48 kbit/s.
G.722.2 o AMR-WB ("Adaptive Multirate Wideband")

El codec AMR-WB es conocido como codec adaptativo multirate de banda ancha o codec G.722.2.
Se usa principalmente para compresin de voz en tecnologa mvil de tercera generacin.
El codec tiene 9 bitrates diferentes (23.85, 23.05, 19.85, 18.25, 15.85, 14.25, 12.65, 8.85 y
6.6 kbit/s).
El codec se basa en el principio ACELP (Algebraic Code Excited Linear Prediction),
prediccin adaptativa soportando transmisin discontinua DTX, usando algoritmos de
deteccin de voz VAD ( Voice Activity Detection) y conformt de ruido CNG (Comfort Noise
Generation )
El codec trabaja con un framesize de 20 ms e introduce un retardo de 25 ms.
GSM
En cuanto a la voz, el cdec GSM es una gran opcin para comprimir la informacin, ya que no existe
una gran diferencia, como en el caso descrito anteriormente de una tasa de bits de 64 kbps a una de
13 kbps.
El codificador procesa la seal de voz que est dividida en bloques de 20 ms. Cada bloque contiene
260 bits como se muestra en figura (188 +36 +36 = 260). Esto es razonable, ya que 260 bits / 20 ms =
13 000 bits/s =13kbits / s.
En la figura tambin se pueden ver las tres partes principales del codificador:
Anlisis de prediccin lineal (prediccin a corto plazo).
Prediccin a largo plazo
Anlisis de excitacin
Ing. Alex Troya.
5/6

FIE
Half-rate Cdec:
Tambin existe una versin de cdec GSM de tasa media, es el VSELP (Vector Self-Excited Linear
Predictor cdec), tiene una tasa de bit de 5.6 kbps. El codificador/decodificador VSELP utiliza hasta
un total de tres fuentes de excitacin.
La primera es el diccionario adaptativo (igual que en CELP). Las dos restantes son los dos (o uno)
diccionarios VSELP. En las implementaciones de 8 Kbps se usan dos diccionarios VSELP, cada uno
de los cuales contiene 128 vectores. A 4.8 Kbps se usa un solo diccionario que contiene 2048
vectores. Los diccionarios VSELP, debidos a su estructura, son muy robustos frente a posibles
errores. Estos diccionarios VSELP contienen vectores que se calculan como combinacin lineal de
unos vectores bsicos.
Requisitos para la codificacin de la voz en GSM
La forma ms sencilla para pasar una seal analgica a digital se implementa mediante convertidores
analgicos digitales, y viceversa. Pero estas tcnicas de digitalizacin no son las nicas empleadas
en transformar las seales en banda base analgica, en digitales y viceversa. La codificacin de la
voz en GSM debe tener los siguientes requisitos:
La redundancia inherente a la seal de voz humana se reducir significativamente. Hay una

gran cantidad de redundancia en los sonidos del lenguaje humano, y si eliminamos la
mayora de esta redundancia, quedar una gran cantidad de tiempo til para otros usuarios
en el canal. El proceso de la codificacin de voz se basa en quedarnos con la mnima
cantidad de informacin necesaria para reconstruir la seal de voz en el receptor.
La calidad de la transmisin de voz bajo la condiciones del canal de radio debe ser al menos
como la calidad ofrecida en los sistemas convencionales de telefona celular bajo las mismas
condiciones. - Las pausas en el flujo normal de las conversaciones telefnicas se deben
detectar para suspender (opcionalmente) la transmisin durante estos periodos. Esta
caracterstica reducir el trfico, la interferencia entre celdas y la duracin de las bateras de
los mviles de mano. Esta funcin se llama transmisin discontinua (DTX).
Los codecs GSM, proporcionan una codificacin con muy buenos y aceptables resultados en
cuanto a la calidad de la seal de la voz, su uso no es complejo, ya que como vimos no utiliza
algoritmos difciles de realizar para un computador sin muchas caractersticas, su principal
ventaja es la sencillez en sus operaciones.
Ing. Alex Troya.
6/6

Códecs de Voz

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Códecs de Voz

Cargado por

Copyright:

Formatos disponibles

ESCUELA SUPERIOR POLITCNICA DEL CHIMBORAZO

ESCUELA: ELECTRNICA TELECOMUNICACIONES Y REDES

1. Consultar los Cdecs de voz utilizados en el mercado, y los utilizados en GSM.

El Bit Rate indica la cantidad de informacin que se manda por segundo.

Octubre - Febrero 2016

Ing. Alex Troya.

ESCUELA SUPERIOR POLITCNICA DEL CHIMBORAZO

Octubre - Febrero 2016

Ing. Alex Troya.

ESCUELA SUPERIOR POLITCNICA DEL CHIMBORAZO

Octubre - Febrero 2016

40, 32, 24, 16

Bajo retardo (15

Ing. Alex Troya.

ESCUELA SUPERIOR POLITCNICA DEL CHIMBORAZO

Provee dos capas encima de la capa actual G.711.

El aadir estas capas introduce un retraso de 5 ms.

Octubre - Febrero 2016

Ing. Alex Troya.

ESCUELA SUPERIOR POLITCNICA DEL CHIMBORAZO

G.722.2 o AMR-WB ("Adaptive Multirate Wideband")

Octubre - Febrero 2016

Ing. Alex Troya.

ESCUELA SUPERIOR POLITCNICA DEL CHIMBORAZO

La redundancia inherente a la seal de voz humana se reducir significativamente. Hay una

Octubre - Febrero 2016

Ing. Alex Troya.

También podría gustarte