Final Señales

UNIVERSIDAD DE GUANAJUATO
DIVISIN DE CIENCIAS E INGENERIAS

CAMPUS LEN
ASIGNATURA: PROCESAMIENTO DIGITAL DE SEALES
PROYECTO FINAL
ANLISIS DE AUDIO: IDENTIFICADOR DE PATRONES DE DISCURSO
ALUMNOS:
ORTIZ MNDEZ SCAR IVN
REYES BARBA PAULINA ANDREA
PROFESOR:
DR. ARTURO GONZALES VEGA
INTRODUCCIN:
El procesamiento digital de audio es una rama importante del procesamiento de seales, que
encuentra aplicaciones en reas tan diversas como las telecomunicaciones, la composicin musical
o la interaccin persona-mquina. La codificacin/compresin basada en modelos de la percepcin
auditiva, la sntesis de sonido para la creacin musical, o la transcripcin automtica de msica, son
algunos ejemplos.
En este trabajo se analiz una seal de audio con el objetivo de reconocer la fontica de dicha seal,
y, que al compararla con una base de datos, podamos determinar que palabra fue dicha.
Particularmente, se gener un programa capaz de catalogar los monoslabos si y no.
PROCEDIMIENTO:
1. OBTENCIN DE LA SEAL/GRABACIN DE LA BASE DE DATOS
1.1 Marco teorico.
Muestreo:
La tasa o frecuencia de muestreo es el nmero de muestras por unidad de tiempo que se toman de
una seal continua para producir una seal discreta, durante el proceso necesario para convertirla de
analgica en digital.
Segn el teorema de muestreo de Nyquist-Shannon, para poder replicar con exactitud (es decir,
siendo matemticamente reversible en su totalidad) la forma de una onda es necesario que la
frecuencia de muestreo sea superior al doble de la mxima frecuencia a muestrear.
El proceso de muestreo es, desde el punto de vista matemtico perfectamente reversible, esto es, su
reconstruccin es exacta, no aproximada. Dicho de otro modo, desde el punto de vista matemtico al
que se refiere el teorema de muestreo de Nyquist-Shannon, la reconstruccin de una seal de 10
kHz es idntica tanto si se obtiene de una tasa de muestreo de 25000 muestras por segundo como
de una de 50000 muestras por segundo. No aporta nada incrementar la tasa de muestreo una vez
que sta cumple el criterio de Nyquist.
En la prctica y dado que no existen los filtros analgicos pasa-bajo ideales, se debe dejar un
margen entre la frecuencia mxima que se desea registrar y la frecuencia de Nyquist (frecuencia
crtica) que resulta de la tasa de muestreo elegida. Por ejemplo, para CD-Audio la frecuencia mxima
de los componentes a registrar y reproducir es de 20 kHz y la frecuencia crtica de la tasa de 44100
muestras por segundo empleada es de 22,05 kHz; un margen del 10% aproximadamente para esta
aplicacin).
Este margen es una necesidad que resulta de las limitaciones fsicas de un filtro de reconstruccin (o
filtro antialiasing) real, y no una consideracin que contemple el teorema.
Teora de muestreo para audio y video:
En audio, la mxima audiofrecuencia perceptible para el odo humano joven y sano est en torno a
los 20 kHz, por lo que tericamente una frecuencia de muestreo de 40000 sera suficiente para su
muestreo; no obstante, el estndar introducido por el CD, se estableci en 44100 muestras por
segundo. La frecuencia de muestreo ligeramente superior permite compensar los filtros utilizados
durante la conversin analgica-digital.
Hay que tener en cuenta que no todas las fuentes sonoras se aproximan a los 20 kHz que
corresponden a esta frecuencia mxima; la mayora de los sonidos est muy por debajo de sta. Por
ejemplo, si se va a grabar la voz de una soprano la mxima frecuencia que la cantante ser capaz de
producir no tendr armnicos de nivel significativo en la ltima octava (de 10 a 20 kHz), con lo que
utilizar una frecuencia de muestreo de 44100 muestras por segundo sera innecesario (se estara
empleando una capacidad de almacenamiento extra que se podra economizar).
El estndar del CD-Audio est fijado en 44100 muestras por segundo, pero esto no significa que esa
sea la frecuencia que utilizan todos los equipos. Los sistemas domsticos de baja calidad pueden
utilizar tasas de 22050 muestras por segundo o de 11025 muestras por segundo (limitando as la
frecuencia de los componentes que pueden formar la seal).
Algunas frecuencias de muestreo tpicas en sistemas de audio y vdeo aparecen resumidas en tabla
siguiente.
1.2 Aplicacin en MATLAB
La seal a comparar se obtiene directamente del micrfono de la computadora, los comandos para
capturarla son los siguientes.
La base de datos, fue grabada con las mismas sentencias. es muy importante usar el mismo tiempo
de duracin, y la misma frecuencia de muestreo, ya que para el posterior nalisis, una diferencia en
estos prametros generara diferencias en el tamao de las matrices.
Se utiliz la frecuencia de muestro de 44100 Hz ya que con sta garantizamos que se cumpla el
teorma de Nyquist para la frecuencia de 20k Hz la cual es la ms alta detectable por el odo
humano. Adems esta frecucia es la utilizada para el grabado de CD y MP3, debido a lo discutido
anteriormente.
2. PROCESAMIENTO DE LA SEAL
2.1 FILTRADO
Para evitar interferencias de agentes externos que generan altas frecuencias se le aplic un filtro
pasabajas con una frecuencia de corte de 5K Hz a la seal previemente obtenida. El filtro se diseo
usando fdatool en matlab.
2.2 NORMALIZACIN.
En el anlisis de audio se recomienda normalizar primero, para prevenir el Clipping.

El Clipping ocurre cuando una seal excede los lmites del diseo, causando distorsin por sus altos
componentes de frecuencia.
Matlab supone que cada elemento en el vector de sonido est escalado dentro de un rango entre -
1.0 y +1.0. Sin embargo, el audio que nosotros importamos fue probablemente fijado en formato de
16-bits o 24 bits (nuestro caso), que tiene una escala de varias miles de veces ms grandes que este.
Incluso si el audio fue presentado en el rango correcto, el procesarlo causa a menudo que las
muestras se extiendan ms all de su rango original.
3. COMPARACIN DE LA SEAL.
Se utiliz el mtodo del mean absolute error para comparar las matrices obtenidas, dicho mtodo
tiene una estructura como sigue:
Y el cual se ajust a nuestro cdigo de la siguiente manera:

4. CONCLUSIONES:
ste mtodo es realmente bueno?,En que se est trabajando en la
actualidad? Objetivos del desarrollo de la inteligencia artificial.
La comunicacin natural humano-mquina,es quizs la parte ms llamativa en la busqueda de
inteligencia artificial, ya que permite que un ordenador se comunique con nosotros y nosotros con l,
sin tener que aprender lenguajes de programacin ni miles de comandos con poco sentido.
Este es el rea de la inteligencia artificial llamada procesamiento de lenguaje natural.
La primera parte es que el ordenador sea capaz de entender una frase natural. Hay varias
posibilidades para lograrlo. Una de ellas, la ms simple y la cual se intent programar en este trbajo,
es buscar coincidencias en una base de datos de acciones predefinidas. En otras palabras, que
cuando a tu programa de control por voz le dices "Reproducir la lista de rock", lo que har ser
detectar la palabra "reproducir", la palabra "lista" y "rock" y, usando instrucciones que los
programadores han incluido explcitamente, buscara en tu msica una lista que sea "rock" y lo
reproducir.
Por ejemplo, cmo funcionan los asistentes de voz como Cortana, Siri o Google Now? Por un lado
tienen que pasar tu voz a un texto, y despus entender ese texto y hacer una accin. Para lo primero,
usan redes neuronales bastante complejas, que entrenan con muchsimos sonidos para que
traduzcan voz a texto de forma eficiente. De hecho, envan algunos comandos que t le dictas a
telfonos a humanos que los interpretan y se lo pasan de vuelta a la red neuronal para mejorarla
todava ms. Ahora bien, de lo que no son capaces es de mantener una conversacin y razonar. Eso
es un nivel ms alto, que requiere las tcnicas lgicas de deduccin.
La cuestin es que este enfoque es limitado. No podemos decir que un sistema es inteligente si lo
nico que hemos hecho ha sido preprogramarle las respuestas explcitamente. Queremos que un
sistema nos entienda incluso las frases que "oye" o "lee" por primera vez.
5. Referencias:
FRIES, Bruce y FRIES, Marty. Audio digital pr ctico. Ed. Anaya Multimedia. 2005. ISBN 84-
415-1892-0
RUMSEY, Francis y McCORMICK, Tim. Sonido y grabaci n. Introducci n a las t cnicas
sonoras
www.xataka.com/robotica-e-ia/estos-son-los-tipos-de-algoritmos-clave-en-la-busqueda-de la-
intel igencia-artificial+&cd=2&hl=es&ct=clnk&gl=mx

Final Señales

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Final Señales

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE GUANAJUATO

DIVISIN DE CIENCIAS E INGENERIAS

ASIGNATURA: PROCESAMIENTO DIGITAL DE SEALES

1.1 Marco teorico.

En el anlisis de audio se recomienda normalizar primero, para prevenir el Clipping.

Y el cual se ajust a nuestro cdigo de la siguiente manera:

Este es el rea de la inteligencia artificial llamada procesamiento de lenguaje natural.

También podría gustarte