Está en la página 1de 13

Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.

com
Proyecto de Diseo con Electrnica Integrada.
Pgina 1
DIGITALIZADOR DE VOZ
Gildardo Contreras Morales
dardogil19@hotmail.com


NDICE Y CONTENIDO DEL TRABAJO
1. Resumen.. Pg. 2
1.1 El proyecto a grandes rasgos (sntesis)... Pg. 2


2. Antecedentes Pg. 2
2.1 Que es la voz... Pg. 2
2.2 Rangos audibles......... Pg. 3
2.3 Tcnica de muestreo.. Pg. 3
2.4 PCM..... Pg. 4
2.5 Cuantizacin... Pg. 5
2.6 Unificando herramientas...... Pg. 7

3. Digitalizador de Voz... Pg. 8
3.1 Consideraciones Pg. 8
3.2 Primera etapa: obtencin de la voz. Pg. 9
3.3 Segunda etapa: Amplificacin de la seal de la voz... Pg. 10
3.4 Tercera etapa: Filtrado de la seal de la voz.. Pg. 11
3.5 Cuarta etapa: digitalizacin de la voz..... Pg. 12

4. Resultados, Conclusiones Y Recomendaciones.... Pg. 14
4.1 Resultados ......... Pg. 14
4.2 Conclusiones... Pg. 14
4.3 Recomendaciones... Pg. 14

5. Referencias bibliogrficasPg. 15










Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 2
1).- RESUMEN:
La civilizacin est entrando en una era de modernizacin constante, donde la
actualizacin es un tema que confiere especial atencin. Todo cuanto se conoce se est
digitalizando ya sea para mejorar funcionamiento, facilitar, economizar, comunicar entre
otros En la implementacin del presente proyecto se realiza una digitalizacin de la voz,
esto es, convertir los efectos sonoros de la voz en una codificacin digital, para posteriormente
utilizar sta informacin en otros diseos. sta transformacin a digital puede ser interpretada
en algn ordenador con la ayuda de algn otro circuito realizar una funcin de aplicacin
particular; citando un ejemplo: podra ser activacin de voz cuando se requiera cierta
seguridad, puesto que el circuito a tratar obedecer a variaciones como el tono de la voz.
Utiliza la tcnica de muestreo adems de una cuantificacin la cual no estar entregando los
uno`s y ceros correspondientes de la voz. Cabe destacar que la digitalizacin es algo que bien
puede realizarse por medio de software como por medios circuitales como es el caso
presentado.

1.1).- EL PROYECTO GRANDES RAZGOS (SNTESIS)
El proceso de Digitalizar la voz se lleva a cabo por medio de etapas. Puesto que
estamos hablando de digitalizar algo que de antemano se sabe es de naturaleza anloga, se
procede a la obtencin de la voz mediante un micrfono que ser conectado a un circuito que
nos realizar una primera conversin de la seal (voz), a partir de sta etapa ya contamos con
unos valores de voltajes mediante las conversiones realizadas por el micrfono o piezo-
elctrico. La siguiente etapa tiene la tarea de amplificar lo que capta el micrfono, para poder
trabajar. Inmediatamente tendremos un filtro que como es de imaginar se trata de un filtro pasa
banda, seleccionado previamente y bajo las caractersticas propias de la voz humana. Despus
de realizar el filtrado y delimitacin, se llega a la etapa donde se realiza la digitalizacin con la
ayuda del Circuito Integrado ADC0804. La ltima etapa consta de utilizar un Bus que ser la
conexin directa con el ordenador o algn otro medio.

2).- ANTECEDENTES:
2.1).- Qu es la Voz?
La voz es una forma de energa de naturaleza analgica. Puesto que se en la Laringe
donde se forma el sonido de la voz, estamos hablando de ondas sonoras producidas por
diferentes presiones del aire, mismas que estn dadas por todo el conjunto de rganos que
intervienen en ello desde la nariz hasta los pulmones son los que determinan el tipo de
sonoridad de la voz..
Por lo tanto, la voz puede ser medida y cuantificable electrnicamente debido a que se
trata de un fenmeno relacionado con la presin y eso es algo que se puede medir. Las
frecuencias de la voz quedan dentro del rango entre cero y 10 khz para efectos de acaparar
todas las frecuencias que sta genera.



Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 3
2.2).-Rangos audibles.
ste termino hace referencia a aquellas frecuencias que pueden ser escuchadas por un
ser humano. Tales frecuencias estn dentro del rango que va desde los 20hz hasta los 20khz.
Es importante decir que despus de ello, no percibimos nada y entra en otro campo de
aplicacin, de igual manera las que estn por debajo del rango audible.
stos datos dan idea de los rangos que ms adelante se deben utilizar para el diseo, puesto
que gracias a ello se podrn delimitar los rangos de trabajo de los circuitos y as hacer ms
preciso y fcil el mismo.

2.3).-Tcnica de muestreo
Si una seal contnua, S(t), tiene una banda de frecuencia tal que fmsea la mayor
frecuencia comprendida dentro de dicha banda, dicha seal podr reconstruirse sin distorsin a
partir de muestras de la seal tomadas a una frecuencia fs siendo
fs >2 fm. (1)


Figura 1. Esquema simplificado del proceso de muestreo.


El interruptor no es del tipo mecnico, puesto que por lo general fs es de bastante valor.
Suelen emplearse transistores de efecto campo como interruptores, para cumplir los
requerimientos que se le exigen entre los que se encuentran:
Una elevada resistencia de aislamiento cuando los interruptores (transistores) estn
desconectados.
Una baja resistencia si los interruptores estn conectados o cerrados.
Una elevada velocidad de conmutacin entre los dos estados de los interruptores.

En la siguiente figura se ofrece las formas de las tres seales principales:

Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 4

Figura 2. Proceso de muestreo.

S(t) Seal a muestrear.
d Seal muestreadora.
S
d
(t) Seal muestreada.

2.4).- PCM, Modulacin por Codificacin de Pulsos.
Se basa en el anterior teorema de muestreo: " Si una seal f(t) se muestrea a intervalos
regulares de tiempo con una frecuencia mayor que el doble de la frecuencia significativa ms
alta de la seal, entonces las muestras as obtenidas contienen toda la informacin de la seal
original. La funcin f(t) se puede reconstruir a partir de estas muestras mediante la utilizacin
de un filtro paso - bajo". Es decir, se debe muestrear la seal original con el doble de
frecuencia que ella, ycon los valores obtenidos, normalizndolos a un nmero de bits dado
(por ejemplo, con 8 bits habra que distinguir entre 256 posibles valores de amplitud de la
seal original a cuantificar) se ha podido codificar dicha seal.

En el receptor, este proceso se invierte, pero por supuesto se ha perdido algo de
informacin al codificar, por lo que la seal obtenida no es exactamente igual que la original
(se le ha introducido ruido de cuantizacin). Hay tcnicas no lineales en las que es posible
reducir el ruido de cuantizacin muestreando a intervalos no siempre iguales.

PCM modifica los pulsos creados por PAM
1
para crear una seal completamente
digital. Para hacerlo, PCM, en primer lugar, cuantifica los pulsos de PAM. La cuantificacin
es un mtodo de asignacin de los valores ntegros a un rango especfico.


1
PAM: (Pulse Amplitude Modulation). Modulacin por amplitud de pulso. Se vara la amplitud de un pulso de
ancho constante y posicin constante, de acuerdo con la amplitud de la seal analgica. La PAM se usa como
forma intermedia de modulacin en PSK, QAM y PCM, aunque casi nunca se usa por s misma.

Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 5
La figura 3 muestra un mtodo simple de asignacin de signo y magnitud de los valores
para muestras cuantificadas. Cada valor es traducido en su equivalente binario 7-bits. El
octavo bit indica el signo.


Figura 3. Cuantificacin usando signo y magnitud.

2.5).- Cuantizacin.
Para procesar seales digitalmente no slo es necesario muestrear la seal analgica
sino tambin cuantizar la amplitud de esas seales a un nmero finito de niveles.
El tipo ms usual de cuantizacin es la cuantizacin uniforme, en el que los niveles son todos
iguales. La mayora usan un nmero de niveles que es una potencia de 2. Si
B
L 2 = , cada
uno de los niveles es codificado a un nmero binario de B bits. .

Supongamos que tenemos una seal x(t) cuyo fondo de escala D est dado por xmax-
xmin. Si cuantizamos x(t) con L niveles, la distancia entre dos niveles consecutivos o resolucin
se define como =D/L. Se denomina rango dinmico DR, a la relacin entre el fondo de
escala
D y la resolucin, de forma que DR=
B
2 . En decibelios,

DR (dB) = ( ) B
B
02 . 6 2 log 20
10
= (2)

Para una seal xS[n] cuantizada a xQ[n], el error estar entre - /2 y /2. Si L es grande
la distribucin de errores ser uniforme en ese intervalo. Para este caso
[ ] 12 /
2 2 2
= =

n (3)
Sustituyendo:

B D P dB SNR
L D P dB SNR
P dB SNR
s Q
s Q
s Q
6 log 20 8 . 10 log 10 ) (
log 20 log 20 8 . 10 log 10 ) (
12 log 10 log 10 log 10 ) (
2
+ + =
+ + =
+ =



(4)

Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 6
Donde hemos utilizado el hecho que
B
L 2 = .
La ecuacin sugiere que por cada bit que se aade al cuantizador, la relacin seal a
ruido de cuantizacin mejora en 6 dB.


Figura 3. Proceso de muestreo y reconstruccin de una seal irregular.


El muestreo es un procedimiento anlogo No es digital y se realiza con un circuito
"Tomar muestras y detener". La salida de este circuito es una secuencia de niveles de voltaje,
que se mandan a un convertidor de anlogo a digital. (CAD), mejor conocido como ADC.
Aqu los niveles de voltaje se convierten en palabras digitales que representan cada nivel de
toma de muestras. La precisin de toma de muestras depende en parte de la cantidad de bits en
las palabras digitales.

Mientras ms grande sea la cantidad de bits, ms bajo es el nivel de ruido y ms grande
ser el rango dinmico. La mayora de los analizadores TRF usan palabras de 12 bits y eso
produce un rango dinmico de alrededor de 70 dB. Palabras de 14 bits pueden realizar un
rango dinmico de 80 dB.

Se puede ver que la proporcin de muestreo determina la frecuencia ms alta en la
seal que se podr codificar. La forma de onda de que se tomaron muestras no puede conocer
nada acerca de lo que se pasa en la seal entre los tiempos de muestreo. Claude Shannon que
desarroll la rama de las matemticas que se llama teora de la informacin, determin que
para codificar toda la informacin contenida en las muestras de una seal, la frecuencia de
muestreo debe ser por lo menos el doble de la frecuencia ms alta presente en la seal. Este
hecho a veces es llamado el criterio Nyquist.



Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 7
2.6).-Unificando Herramientas.

Figura 4. Diagrama a Bloques del sistema utilizando todas las tcnicas y herramientas descritas.

Como se puede ver a partir de las figuras anteriores (figura 4), la exactitud de la
reproduccin digital de una seal analgica depende del nmero de pruebas tomadas. Usando
PAM y PCM se puede reproducir una onda con exactitud si se toma una infinidad de pruebas,
o se puede reproducir de forma ms generalizada si se toman 3 pruebas. La cuestin es:
cuntas muestras son suficientes?.
Actualmente, se requiere poca informacin para la reconstruccin de seal analgica.
En lo referente al Teorema de Nyquist, para asegurarse que la reproduccin exacta de una
seal analgica original usando PAM, la tasa de prueba debe ser al menos el doble de la
frecuencia mxima de la seal original. De este modo, si deseamos hacer muestra con la
informacin de voz de un telfono que tiene como frecuencia mxima 3300 HZ, la tasa de
muestra debe ser de 6600 pruebas/s. En la prctica, actualmente se toman 8000 muestras para
compensar las imperfecciones del proceso.

3).- DIGITALIZADOR DE VOZ.
Existen dos tendencias para realizar la digitalizacin de la voz con velocidades ms
lentas. La Modulacin Diferencial de Impulsos Codificados (DPCM), que consiste en trocear
la banda vocal en cinco intervalos llegando a obtener 16 kbit/s, que an mantiene los
parmetros de la persona que habla, es decir del timbre. Esto permitira utilizar canales de
FM en VHF (144MHz) de 25 kHz, si bien la tendencia es pasar a 12.5 kHz de ancho de banda

Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 8
por canal, con lo que debera reducirse la velocidad de emisin de la voz digitalizada bajando
por debajo de los 16 kbit/s.
Otra tcnica es la del Sintetizador o LPC. Se basa en el estudio de la voz, del que se
deduce que slo se utilizan unos 40 fonemas y de estos slo 10 por segundo. Tericamente
con un ancho de banda de 400 a 600 Hz debera poderse enviar a voz. Actualmente con esta
tcnica se hacen sntesis de mensajes pregrabados. Se extraen los formatos de la voz y e ah
todos los fonemas parmetros LPC se pueden introducir en una ROM. Con un generador de
ruido y los parmetros de la ROM se reproduce la voz aceptablemente. Despus de considerar
ciertas cuestiones tericas importantes para la comprensin de la digitalizacin de la voz, se
procede a describir por etapas el circuito del que lleva por nombre ste proyecto.

3.1).-Consideraciones.
Para comenzar con el tema en cuestin, se puede decir que ste proceso consta de 2
etapas y se conoce como Modulacin por Cdigo de Pulso (PCM) La seal vocal tiene
componentes de frecuencia que pueden llegar a los 10 kHz, sin embargo la mayor parte de los
sonidos vocales tienen energa espectral significativa hasta los 5 kHz.
La frecuencia de muestreo depender del tipo de aplicacin, para seales de voz se
adopta un rango de 6Khz. a 20 kHz. Dependiendo de la resolucin que se desee. Otra
consideracin que se debe tener en cuenta es la cuantificacin de la seal, la cual involucra la
conversin de la amplitud de los valores muestreados a forma digital usando un numero de
determinado de bits.
El nmero de bits usado afectar la calidad de la voz muestreada y determinar la
cantidad de informacin a almacenar.
Para cada instante de muestreo, el convertidor analgico-digital compara la seal
muestreada con una serie de niveles de cuantificacin predefinidos. El nmero de niveles N a
usar, determina la precisin del anlisis y por tanto el nmero de bits necesarios. Cada bit
adicional que se agrega contribuye en mejorar la relacin de seal a ruido en aproximadamente
6dB.
La seal de voz exhibe un rango dinmico de unos 50dB. a 60 dB. Por lo que resultara
suficiente una cuantificacin de 8 a 9 bits para una buena calidad de voz. Sin embargo
generalmente se usa de 11 a 20 bits en aplicaciones de procesamiento de voz de alta calidad.
Como se haba mencionado al principio, la voz humana es obviamente analgica, es
decir, no presenta cambios bruscos. La voz adaptada por un micrfono para ser analizada, no
representa una seal con pendiente muy elevadas, mas si una serie curvas complejas. En forma
simplificada podra representarse por una seal senoidal cambiante en frecuencia y en
amplitud.
La seal elctrica recogida por el micrfono es la imagen de la voz de la que proviene, tambin
una seal analgica, resultando muy fcil de utilizar en los equipos electrnicos que
usualmente conocemos, como son radios, amplificadores, tocadiscos, cassettes, telfono, etc, y
cuyo comn denominador es su funcionamiento analgico.


Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 9


Figura 5. Representacin analgica de la voz.

3.2).-Primera etapa:
Obtencin de la voz.
Debe emplearse un micrfono que de preferencia sea electrec
2
, y alimentarlo de
acuerdo al circuito de polarizacin mostrado.
El micrfono convierte el sonido en una seal elctrica equivalente, el tipo de
micrfono recomendado para sta etapa es el de condensador ya que es el mejor para medir el
nivel de presin sonora, Puesto que combina precisin estabilidad y una excelente respuesta en
frecuencia de 20 kHz. A 20,000 kHz. Deber tener una respuesta o ms lineal posible en el
rango audible. El circuito de polarizacin del micrfono consta de las resistencias R1 y R2 que
constituyen el divisor de voltaje y de un capacitor C1 para la polarizacin del micrfono.



Figura 6. Circuito de Polarizacin para el micrfono
3
.

2
Llamado tambin micrfono de condensador electret o, simplemente, electret.
Es una variante del micrfono de condensador que utiliza un electrodo (fluorocarbonato o policabonato de
flouroro) laminal de plstico que al estar polarizado no necesita alimentacin. Que las placas estn polarizadas
significa que estn cargadas a perpetuidad desde el mismo momento de su fabricacin (son polarizados una sola
vez y pueden durar muchos aos).


Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 10
3.3).-Segunda etapa:
Amplificacin de la seal de la voz.
Dado que a la salida del micrfono la amplitud de voltaje es muy pequea, se procede
a utilizar un circuito que amplifique lo suficiente para que sta seal sea captada por el filtro
Paso-Banda, del tal manera haciendo uso del amplificador LM386 se logra una amplificacin
deseada. Es posible utilizar algn otro circuito amplificador como el caso del TDA2002,
incluso el conocido amplificador LM741, puesto que el objetivo de esta etapa es slo
amplificar la seal.
El diagrama de conexin es muestra enseguida para un circuito utilizando un L386,
puesto que por sus caractersticas es el ms idneo ya que es para audio.


Figura 7. Diagrama de polarizacin y conexin del amplificadorutilizando un LM386.

3.4).-Tercera etapa:
Filtrado de la seal de voz.
Para filtrar la seal se deber emplear un filtro Paso-Banda como filtro selectivo en
frecuencia; slo permite pasar frecuencias entre los 300 Hz y los 3 kHZ de entre otras que
pudiesen estar en el circuito. Con ste arreglo de frecuencia se obtiene un a ancho de banda de
2.7 kHz.
Mediante la ecuacin clsica para el ancho de banda, que se enuncia a continuacin por la
ecuacin 5.
L H
f f B = (5)
Hz kHz B 300 3 =
kHz B 7 . 2 =

Ahora es necesario elegir una frecuencia de resonancia 948.7Hz con la siguiente ecuacin (6):


3
El circuito se conecta a la entrada de un osciloscopio para verificar la correcta de salida del mismo.

Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 11
) 3 )( 300 ( kHz Hz fR = (6)

Sustituyendo
Hz fR 7 . 948 =

Ahora bien, a partir de la medida de la selectividad del filtro, se puede decir que y
calificar como un circuito de banda de banda ancha por la relacin de 5 . 0 Q
La ecuacin que nos ilustra esto es la ecuacin 7 que a continuacin se describe:

B
fR
Q = (7)

Sustituyendo

kHz
Hz
Q
7 . 2
7 . 948
=
352 . 0 = Q

El filtro est conectado en cascada
4
, as que de sta manera se logra una etapa de
ganancia. La primera etapa es un circuito, un Paso-Bajo de 3kHz, cuya salida est conectada a
la entrada de la segunda etapa de un circuito Paso-Alto de 300Hz. ste par de circuitos en
cascada forman el filtro activo de Paso-Banda como se muestra a continuacin.



Figura 8. Amplificador Paso-Banda.

4
Una conexin en cascada significa que la salida de un circuito se encuentra conectada a la entrada de otro.

Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 12
3.5).-Cuarta etapa:
Digitalizacin de la voz.
En sta etapa es donde a partir del teorema de muestreo, se comienza el diseo, puesto
que ste se debe cumplir.
Recordando la ecuacin (1) tenemos que.
MAX S
f f 2 =
En donde la frecuencia de muestreo
S
f estar dada por la resistencia y el capacitor que se
conectan al convertidor ADC0804 en la terminal CLK IN, y cuyos valores estarn en funcin
de la
MAX
f que se dese digitalizar.
Es justo mencionar que en este convertidor se trabaja con un voltaje de referencia dado
por Vcc/2, el cual se obtendr utilizando un simple divisor de voltaje.

A continuacin se muestra el circuito completo y con un bus para permitir la
transmisin de datos como tal hacia un ordenador por citar un ejemplo.



Figura 9. Circuito Digitalizador de Voz completo.






Ing. Gildardo Contreras Morales, Cdigo;398691723, dardogil19@hotmail.com
Proyecto de Diseo con Electrnica Integrada.
Pgina 13
4).- RESULTADOS, CONCLUSIONES Y RECOMENDACIONES.
4.1).- Resultados
El circuito en cuestin trabaja aceptablemente. Para sacar ms provecho de dicho
diseo, es necesario trabajar los datos que arroja el circuito mediante la pc, donde se pueden
obtener mucho ms aplicaciones e innovaciones incluso, he aqu donde comienza algn nuevo
proyecto. Como podra es el caso de un reconocedor de voz inteligente que reconozca incluso
el timbre de voz de alguna persona en cuestin.

4.2).- Conclusiones
ste circuito slo digitaliza la voz ya que se diseo para ello, si se quieren hacer
pruebas con algn otro tipo de audio, sern necesario nuevos clculos y consideraciones. Ya
que los clculos fueron tomados para las caractersticas esenciales que produce la voz.

Se debe recordar que primero se realiza un estudio acerca de lo que se quiere y partir
del fenmeno inicial es como se procede a trabajar

4.3).- Recomendaciones
Esencialmente se recomienda el estudio acerca de amplificadores operacionales para
una mejor comprensin y desarrollo e incluso la oportunidad de experimentar con diferentes
frecuencias.
Los amplificadores a estudiar, filtros para ser exactos, son:
Filtro Paso-Bajo.
Filtro Alto.
Filtro Pasa-Banda.
Estos son los ms esenciales dentro del proyecto.
As mismo es necesaria la comprensin de lo que el teorema del muestreo realiza para poder
realizar el trabajo, ya que todo se basa en ello.

5).- REFERENCIAS BIBLIOGRFICAS.
[1] Weyn Tomasi, Sistemas de Comunicaciones Electrnicas (Ed. Prentice Hall, Mxico), (2003).
[2] Apuntes electrnica integrada, http://proton.ucting.udg.mx/materias/ET201/index.html
[3] espectro de la voz, http://www.ehu.es/acustica/espanol/musica/vohues/vohues.html
[4] Wikipedia: Que es la voz, http://es.wikipedia.org/wiki/Espectro_de_frecuencias
[5] Referencias de circuitera , http://webelectronica.com.ar
[6] Tcnica del muestreo: http://es.wikipedia.org/wiki/Muestreo_en_estad%C3%ADstica
[7] Circuitos de electrnica, http://www.unicrom.com/Tut_ADC.asp
[8] Weyn Tomasi, Sistemas de Comunicaciones Electrnicas PCM (Ed. Prentice Hall , Mxico), (2003).
[9] Weyn Tomasi, Sistemas de Comunicaciones Electrnicas PAM (Ed. Prentice Hall, Mxico), (2003).
[10] Cooglin F. Roberto & Driscoll F. Frederick, Amplificadores Operacionales y Circuitos Intetgrados Lineales
(Ed. Pearson Educaction, quinta edicion).

También podría gustarte