Está en la página 1de 3

Determinacin de Parmetros en una Reconstruccion

de Una Seal De Audio


Andres Valencia (alejos0304@gmail.com)
Estalin Fuentes (andy_one@hotmail.es)
Escuela Superior Politcnica de Chimborazo
Riobamba, Ecuador

Resumen El presente artculo detalla las diferentes etapas que


se realiza para analizar paso a paso los parmetros que tiene una
seal de audio, adems de conocer sus diferentes etapas y que
significa cada una de ellas. Se analizar con Matlab para estudiar
ms a fondo cada uno de sus parmetros y los resultados de la
simulacin.

El grado de superposicin describe la cantidad del anterior


marco que se repite en la trama siguiente superposiciones de
25% y 50% son comunes. [2]

Palabras Clave:. LPC, SPEECH, FILTER.

No hay nada especial sobre el discurso de un audio en


perspectiva es simplemente como cualquier otro sonido, slo
cuando la escuchamos que nuestros cerebros comienzan a
interpretar una determinada seal. [3] Aparte de este
comportamiento interpretativo del cerebro humano, hay
caractersticas de audio dentro de la msica y otros sonidos
que son inherentemente discursos similares en sus
caractersticas espectrales y temporales Sin embargo el habla
en s, es un conjunto estructurado de sonidos continuos, en
virtud de su mecanismo de produccin. [4]

I.

INTRODUCCIN .

El procesamiento de audio incluye diferentes aplicaciones


tecnolgicas, como la reproduccin de msica en alta
fidelidad, el reconocimiento del habla o la sntesis del habla[1].
Se pretende combinar una explicacin terica de los
principales conceptos del procesamiento de audio y ver sus
aplicaciones ms relevantes, con una vertiente prctica que
permita lograr mejor algunos de los conceptos expuestos.
Se propone entonces la identificacin de algunos parmetros
espectrales que caracterizan y determinan la calidad de la voz,
de tal manera de lograr una mejor aproximacin en la
clasificacin de los mismos de acuerdo a sus propiedades, esto
se realiz a travs de un anlisis sistemtico mediante tcnicas
de procesado digital de seales. Estas tcnicas aplicadas a las
seales de voz digitalizada permitirn determinar las
propiedades espectrales. [1] As se dispondr de mayor
informacin objetiva para la clasificacin y determinacin de
la calidad de voz.
II.

MARCO TERICO

Segmentacin
Es necesaria no slo porque 256 es un cmodo tamao, pero
cuando cualquiera de las siguientes son verdaderas:
El audio es continua (es decir, no se puede esperar para una
muestra final llegue antes de comenzar el procesamiento)
La naturaleza de la seal de audio est cambiando
continuamente, o caractersticas a corto plazo son importantes
El tratamiento aplicado a cada bloque de las escalas de forma
no lineal en complejidad (es decir, un bloque doble de grande
sera cuatro o incluso ocho veces ms difcil para procesar). [2]

Speech

Caractersticas del speech


A pesar de que muchas diferencias entre los individuos, y la
existencia de muchos idiomas, el habla sigue las pautas
generales y en promedio tiene caractersticas nicas as como
las de volumen, distribucin de frecuencia, pitch rate and
syllabic rate. [4]
Estas caractersticas se han adaptado con respecto a medio
ambiente, la audicin y la produccin de la voz limitaciones,
pero los rpidos cambios en la sociedad durante el siglo
pasado han superado nuestra capacidad de adaptacin. [5]
El alfabeto fontico internacional (IPA) es la habitual mtodo
para describir y escribir los diferentes fonemas que recuperan
el habla.
Fsicamente, los sonidos del habla pueden describirse en
trminos de un contorno de tono y frecuencias de los
formantes.
De hecho esta descripcin constituye un mtodo de anlisis
utilizado por la mayora de los algoritmos de compresin de
voz
Formantes son frecuencias resonantes del tracto vocal que
aparecer en el espectro de voz como picos claros.
Formantes se han descrito como la ms sencilla caracterstica
importante en las comunicaciones de voz. [5]

cantidades variables. No afecta a la dinmica como la


compresin, y lo ideal es no cambiar el sonido de cualquier
manera que no sea puramente cambiar su volumen. [5]
Filtro pre-enfasis.
Es un filtro digital pasa alto a la seal de primer orden para las
formantes de frecuencias altas, se realiza para que no se pierda
informacin de la seal durante la segmentacin ya que en
frecuencias bajas se encuentra una gran cantidad de
informacin. As mismo a la seal de la componente DC la
remueve logrando aplanar espectralmente la seal. [6]
Ilustracin 1: speech

III. DETALLE DE LA IMPLEMENTACIN.

Cuantizacin
El proceso de cuantificacin es la reduccin de la cantidad de
informacin almacenada.
Es necesario reducir el nmero de bits necesarios para
almacenar el audio, pero sin comprometer la calidad
demasiado. [3]
Modulacin por impulsos codificados (PCM) es el formato
entregado por la mayora de los convertidores de analgico a
digital (ADC) y el formato de eleccin para la representacin
de audio en una computadora. La mayor parte de
procesamiento de seal digital discreto se basa en PCM. [7]

Ilustracin 3: seal original


function [energ,co]=
coeficientes(trama2,Ntramas,trama);
%%% CALCULAMOS ENERGIA y los coeficientes
co=lpc(trama2,10);
residuo2=filter(co,1,trama2);
energ=sum(residuo2.^2);

Ilustracin 2: cuantizacin
Parametrizacion

Ilustracin 4: coeficientes LPC

Normalmente, ocho o 10 coeficientes de prediccin lineal del


Consejo de Europa (LPC ).
LPC son polinomios generadores para un filtro digital que,
cuando es estimulado con un poco de seal de entrada, recrea
las caractersticas de las muestras originales.
Linear codificacin predictiva (LPC) se ha utilizado con xito,
en la codificacin de voz. [4]
Normalizacin
Normalizar audio es cambiar su volumen global en una
cantidad fija para alcanzar un nivel objetivo. Es diferente de
compresin que cambia de volumen en el tiempo en

Ilustracin 5: pitch

BIBLIOGRAFIA
[1]

[2]
[3]
[4]

Ilustracin 6: seal reconstruida

[5]
[6]

IV.EVALUACIN Y RESULTADOS
[7]

Empezamos con realizar la segmentacin que se la realiza con


la ventana de haming de 240 muestras, en un tiempo preestablecido.
Luego la normalizamos toda la seal con la ms alta
frecuencia para tener valores estables.
Luego aplicamos un filtro para sacar el pitch, que es la
frecuencia fundamental y la eliminamos, luego sacamos los
Lpc que vayamos a analizar, en este caso lo haremos con 10.
A su vez estos coeficientes deben ser cuantizados y
codificados y enviados desde el trasmisor.
Una vez que estamos en el trasmisor, que tenemos solo ruido,
debemos aplicar el proceso inverso, y reconstruir la seal a
partir de la enviada.
Una vez aplicada el proceso inverso, debemos tener una seal
casi idntica a la original.
En la ilustracin 5 podemos observar la frecuencia
fundamental, la cual va hacer removida al aplicar el filtro de
pre-nfasis
V. CONCLUSIONES
El proceso de normalizacin de la seal, sirve para obtener
valores estndares en toda la onda, y obtener la ganancia del
mismo.
La parametrizacion de una seal nos sirve para identificar paso
a paso cada una de las caractersticas de las seales, y a su vez
poder variar los parmetros de acorde a lo que se desee
estudiar y analizar.
Los filtros aplicados para obtener el pitch y los coeficientes
son filtros de pre-nfasis, que eliminan las frecuencias altas de
la seal.
El decodificador realiza el proceso inverso, para lograr
recuperar la seal, aunque esta no es recuperada en un 100%,
hay distorsiones que son imperceptibles al odo humano.

[1]

J. Vignolo. Introduccion al Procesamiento Digital de


Seales.Pontifica 2008Uiversidad Catolica de Valparaiso. 2008
[2] I. McLoughlin. Applied Speech and Audio Processing.
Cambridge University Press. 2009
[3] Richard G. Lyons Understanding Digital Signal Processing
Prentice Hall, 2001
[4] Julius O. Smith III, Introduction to Digital Filters with Audio
Applications. W3K, 2007
[5]Oppenheim, Schafer, Discrete Time Signal Processing. Pearson,
2010.
Rincn Pasaye, Jos Juan, Procesamiento Digital de Seales,
Facultad de Ingeniera Elctrica, Universidad Michoacana de San
Nicols De Hidalgo, Junio de 2009.
Dr. Martnez Castillo, Geovanni, IE-0527 Ingeniera de
Comunicaciones, Folleto de clase, II semestre 2010.

AUTORES
Andrs
Alejandro
Valencia
Enrquez. Naci en Santo Domingo
de los Colorados, Santo Domingo de
los Tschilas-Ecuador, el 03 de Abril
de 1990. Educacin bsica cursada
en la escuela UNE de la ciudad de
Santo Domingo de los Colorados.
Estudios secundarios realizados en el
Instituto Tcnico Superior Julio
Moreno
Espinoza.
Estudios
superiores realizados en la Escuela Superior Politcnica de
Chimborazo obteniendo el ttulo de Ingeniero en Electrnica,
Telecomunicaciones y Redes. Actualmente cursando la
Maestra en Sistemas de Telecomunicaciones.
Estalin Andrs Fuentes Salazar.
Nacido en Santo Domingo de los
Colorados, Santo Domingo de los
Tschilas-Ecuador, el 10 de Junio de
1990. Educacin bsica cursada en la
escuela 7 de Octubre de la ciudad
de Santo Domingo de los Colorados.
Estudios secundarios los realice en el
Instituto Tcnico de Comercio ITC
Amazonas.
Estudios
superiores
realizados en la Escuela Superior Politcnica de Chimborazo
obteniendo el ttulo de Ingeniero en Electrnica,
Telecomunicaciones y Redes. Actualmente cursando la
Maestra en Sistemas de Telecomunicaciones.