PEC03

AÑADIENDO SONIDOS (BASES
DEL PROCESADO DE AUDIO)
Adrian Rodriguez
UOC Integración Digital de Contenidos
Añadiendo sonidos (bases del procesado de audio)
Parte 1
1. Audios utilizados, indicando los que forman parte de la audioteca
y la muestra que se comparará
2. Análisis de los audios, con capturas de pantalla del Audacity
enseñando los valores obtenidos y comentando los puntos más
importantes de cada análisis realizado.
3. Explicación del procedimiento utilizado para realizar la
comparación de los audios y de los resultados obtenidos en cada
caso, explicando el motivo de porqué coinciden o no las
muestras.
Comenzaremos por aplicar un filtro de paso de bando porque en el contexto
de las comunicaciones se utilizan entre otras cosas para eliminar ruidos que
tengan frecuencias fuera de los límites de la voz humana que sitúa entre unos
300 Hz y 3400 Hz.
El filtro de paso de banda es un filtro que solo deja pasar las frecuencias
situadas dentro de una banda comprendida entre una frecuencia de corte
inferior y una frecuencia de corte superior. Las frecuencias bajas con una
frecuencia menor de f1 son eliminadas por el filtro. Y, por tanto, las
frecuencias altas con una frecuencia superior a f2 tampoco pasan a través del
filtro.
1Audio sin filtro de paso de banda
pág. 1
2Análisis de Frecuencia sin Filtro
3Análisis de Frecuencias con Filtro de paso de banda
pág. 2
Como se puede observar, gracias al filtro de paso de banda en el análisis de

frecuencia se puede ver con más claridad tanto el fundamental como los
armónicos.
Comparación Análisis de Frecuencia
4Análisis de Frecuencia
pág. 3
Comparación parte de la /A/ en Análisis de Frecuencia
5Comparación /A/
pág. 4
Comparación parte de la /O/ en Análisis de Frecuencia
6Comparación /O/
pág. 5
Comparación Espectrograma
7Comparación Espectrograma
pág. 6
Cada persona tiene sus propias características de generación de voz. De

hecho, podemos reconocer a las personas por su voz debido a estas
características específicas de cada uno.
Para analizar las voces he seguido los siguientes pasos:
A) Seleccionar toda la señal completa (Ctrl+A) y realizar el análisis de

espectro (En el caso de las vocales he seleccionado la parte en la que
suena específicamente dicha vocal)
B) La forma de onda de las vocales es una señal más o menos compleja,
pero que se repite periódicamente
C) Se obtiene una señal armónicamente compleja, donde se detecta un
primer pico significativo a una determinada frecuencia y
posteriormente, aparece una serie de armónicos que son los que le dan
el matiz tímbrico a la voz.
D) Por último, he obtenido el espectrograma que suele considerarse una
medida biométrica característica de la persona, como si se tratase de
una huella dactilar
En el espectrograma debemos interpretar la información de manera correcta

y con sumo cuidado. En el eje horizontal tenemos el tiempo mientras que en
el eje vertical tenemos la frecuencia. Los espectros se representan en colores,
asignando los colores más claros a aquellas frecuencias en las que se
producen amplitudes o picos significativos. En nuestro caso, podemos
observar que las voces de la misma persona tienen un color muy similar
(también debido a que ha sido grabado desde el mismo dispositivo), mientras
que los demás audios tienen un color diferente en el espectrograma. Además,
de que el espectrograma tiene variaciones en las formas, y, en los audios de
la misma persona es prácticamente idéntico.
Por otra parte, el análisis de espectro nos proporciona una estimación de las
características frecuenciales de la señal durante el tiempo de duración de la
ventana de análisis. Esto nos permite ver en una sola gráfica los diferentes
elementos de frecuencia que componen la señal, de un solo vistazo podemos
conocer la composición en frecuencia de señal compleja.
En la siguiente gráfica comparo los diferentes audios, utilizo 4 frecuencias de

muestra: 400 Hz, 1000 Hz, 1500 Hz y 2000 Hz. Esta Tabla, señala de manera
muy simbólica que los audios que proceden de la misma persona son el 5 y
6 dado que prácticamente tiene los mismos niveles de dB.
Frecuencia (Hz) Audio 1 (dB) Audio 2 (dB) Audio 3 (dB) Audio 4 (dB) Audio 5 (dB) Audio 6 (dB)
400 -69,2 -53,9 -85,3 -61,5 -41,8 -45,7
1000 -66,2 -67,7 -76,8 -70,5 -58,8 -68,75
1500 -59,7 -59,6 -54,7 -78,6 -55,8 -62,2
2000 -77,8 -52,8 -69,6 -88,1 -70,2 -70,2
pág. 7
Por otra parte, podemos comparar las gráficas también donde vemos que el
pico fundamental se sitúa prácticamente a los mismos Hz, y después vemos
los armónicos con una forma dibujada muy parecida. Aquí claramente se ven
diferencias con los demás audios.
También es importante comparar las vocales, en este caso: la A y la O. Y

nuevamente, vemos que las gráficas prácticamente son idénticas en su pico
fundamental y en los armónicos. Por tanto, los audios que son de la misma
persona son el 5 y el 6.
Parte 2
1. Esquema del proceso de digitalización
2. Explicación de cada una de las etapas del proceso
Para convertir la señal a digital podemos utilizar un convertidor A/D que es

un circuito que tiene como entradas la señal analógica y la frecuencia de
muestreo y que en su salida proporciona la secuencia de bits binaria asociada
a la codificación PCM de la señal.
Tenemos diferentes conceptos:
• Cuantificador: aproxima la tensión de la señal de entrada por un nivel

elegido entre un número finito de posibilidades. Un cuantificador de 16
niveles sólo admite 16 posibles valores de tensión en la salida.
• Codificador (PCM): asocia una palabra binaria a cada uno de estos
niveles finitos del cuantificador. En el caso de que el cuantificador sea
de 16 niveles se asignará una palabra de 4 bits a cada uno de los
niveles.
• El convertidor A/D es una realización práctica de un sistema de
digitalización que convierte la señal analógica en una secuencia de bits
codificada en PCM. Internamente, el convertidor aproxima la señal de
entrada a uno niveles de cuantificación, pero en la salida nos
proporciona directamente el código PCM asociado. Si conectamos un
convertidor D/A directamente en la salida de un convertidor A/D
obtendremos los niveles de cuantificación a los que ha sido aproximada
la señal de entrada.
pág. 8
El subsistema de muestreo se idéntica con los circuitos de muestreo y

mantenimiento que se encargan de congelar el nivel de tensión de la señal
de entrada en el instante de muestreo.
pág. 9

PEC03

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

PEC03

Cargado por

Copyright:

Formatos disponibles

AÑADIENDO SONIDOS (BASES

DEL PROCESADO DE AUDIO)

1Audio sin filtro de paso de banda

2Análisis de Frecuencia sin Filtro

3Análisis de Frecuencias con Filtro de paso de banda

Como se puede observar, gracias al filtro de paso de banda en el análisis de

Comparación Análisis de Frecuencia

Comparación parte de la /A/ en Análisis de Frecuencia

Comparación parte de la /O/ en Análisis de Frecuencia

Cada persona tiene sus propias características de generación de voz. De

Para analizar las voces he seguido los siguientes pasos:

A) Seleccionar toda la señal completa (Ctrl+A) y realizar el análisis de

En el espectrograma debemos interpretar la información de manera correcta

En la siguiente gráfica comparo los diferentes audios, utilizo 4 frecuencias de

También es importante comparar las vocales, en este caso: la A y la O. Y

Para convertir la señal a digital podemos utilizar un convertidor A/D que es

Tenemos diferentes conceptos:

• Cuantificador: aproxima la tensión de la señal de entrada por un nivel

El subsistema de muestreo se idéntica con los circuitos de muestreo y

También podría gustarte