Está en la página 1de 53

3.

- AUDIO/SONIDO
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
3.10.

INTRODUCCIN.
PRINCIPIOS DEL SONIDO.
CARACTERSTICAS DE LOS SONIDOS.
HARDWARE PARA SONIDO
DIGITALIZACIN DEL SONIDO.
EDICIN DE SONIDO DIGITAL.
EL ESTNDAR M.I.D.I.
FORMATOS DE ARCHIVOS DE AUDIO.
SISTEMAS DE AUDIO
SONIDO EN INTERNET
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Introduccin.
z

El sonido es un fenmeno fsico


fundamentalmente analgico.

Para tratamiento digital

Fenmeno fsico se
seal el
elctrica -> se
seal digital

Forma de capturarlo:
Grabacin y conversin
Instrumentos musicales electrnicos
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Cmo se produce el sonido?


z
z
z

El sonido se produce por la interaccin de un objeto


que vibra, un medio de transmisin y un receptor.
Atenuacin con la distancia y obstculos
Una onda de presin se transmite a travs de un
medio, como el aire, y produce una sensacin
llamada auditiva, al perturbar el estado de reposo de
las estructuras del odo.
Vibraciones impulsos el
elctricos

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Generacin del sonido


z

z
z

El tmpano vibra las partculas de aire que la


rodean y provocar la vibracin de los huesos
del odo interno.
Vibraciones -> seales neuronales (accin de
la membrana basilar)
Grado de intensidad dependiente de la
frecuencia -> profundidad de penetracin

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Caractersticas de los sonidos (I).


Las caractersticas de los sonidos que nos permiten
identificarlos y diferenciarlos se pueden resumir en las
siguientes:

INTENSIDAD: AMPLITUD DE LA ONDA SONORA.

z
z

Indica a cunto se alejan las partculas (y por tanto el tmpano)


tmpano) de
su posicin de reposo en cada periodo de vibracin.
El odo responde a una rango de intensidades muy grande (desde
un sonido casi imperceptible al umbral del dolor).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Caractersticas del sonido (II).

INTENSIDAD: AMPLITUD DE LA ONDA SONORA.


z
z

Muchos sonidos presentan un patrn claro de intensidad que


vara con el tiempo. A este patrn se le llama ENVOLVENTE.
Ejemplo1: Un piano presenta un fuerte golpe de gran
intensidad inicial, que decae ms o menos rpidamente hasta
desaparecer.
Ejemplo2: Una flauta presenta una envolvente ms aplanada,
ya que no existe golpe inicial, sino una intensidad del sonido
mantenida mientras dura la nota.
Medida de la intensidad: decibelios (referencia umbral)

dB = 10 log10

a2
2
a ref

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Caractersticas del sonido (III).


z

En la siguiente tabla podemos ver la intensidad en dB de


algunos sonidos representativos.
Descripcin

Nivel (dB)

Intensidad

Umbral del dolor

130

1013

Concierto heavy metal

120

1012

Martillazos sobre metal

110

1011

Trfico de vehculos

70

107

Conversacin normal

60

106

Restaurante concurrido

50

105

Casa en la ciudad

40

104

Iglesia vaca

30

103

Estudio de grabacin

20

102

Umbral de audicin

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Caractersticas del sonido (IV).

FRECUENCIA Y PERIODO: SON DOS CONCEPTOS


QUE REPRESENTAN EL MISMO FENMENO FSICO Y
QUE ESTN INVERSAMENTE RELACIONADOS.
z

FRECUENCIA: Mide cuantas vibraciones se producen por


segundo (se miden en ciclos por segundo o hercios -> Hz.
Los humanos somos capaces de percibir frecuencias de
entre 20 y 20.000 Hz).
Hz).
PERIODO: Cuantas fracciones de segundo dura una
vibracin (se mide en segundos).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Caractersticas del sonido (V).

TONO: CARACTER
CARACTERSTICA PERCEPTIVA QUE SOLO CAPTAMOS EN
LOS SONIDOS PERI
PERIDICOS: LOS QUE TIENEN UNA FRECUENCIA
MS O MENOS CONSTANTE (agudo o grave).

TIMBRE: CONJUNTO DE FRECUENCIAS QUE SE PUEDEN


ENCONTRAR EN UN SONIDO EN MAYOR O MENOR PROPORCIN.
z

Dos instrumentos musicales distintos, como un violn y una flauta,


flauta, que estn
interpretando la misma nota (frecuencia) con la misma intensidad,
intensidad, son
claramente diferenciables -> TIMBRE o FORMA DE ONDA.

Movimientos complejos descomponibles en movimientos simples

Por ello, el timbre corresponde al conjunto de frecuencias que se


se pueden
encontrar en un sonido en mayor o menor proporcin.
A la frecuencia que aparece con ms fuerza , si la hay, se llama frecuencia
fundamental, el resto son armnicos

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Caractersticas del sonido (VI)

Figura 6. Espectros de frecuencias

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Hardware bsico para sonido


z

Tarjeta de sonido

Micrfono

Altavoces

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Elementos de una tarjeta de sonido (I).


z
z

El elemento hardware bsico para realizar las tareas relacionadas


relacionadas
con el sonido en un ordenador es la tarjeta de sonido.
sonido.
En los ordenadores personales, las podemos encontrar en BUS
ISA (obsoletas), PCI,
PCI, integradas en la placa base, y tarjetas
externas (PCMCIA, USB,..).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Elementos de una tarjeta de sonido (II).


z

Aparte de las capacidades de muestrear y reproducir sonidos (ADC


y DAC), la mayora de las tarjetas de sonido disponen de los
siguientes elementos:

Un CHIP DE SNTESIS de efectos sonoros por tabla de ondas o por


modulacin de frecuencia: se usa para emular instrumentos MIDI sin
necesidad de conectar un verdadero instrumento de este tipo a la
tarjeta.
Un MEZCLADOR:
MEZCLADOR: capaz de seleccionar y combinar las seales
procedentes del micrfono, entrada de lnea, CD/DVD, DAC y chip de
sntesis, y dirigir esta salida combinada a la salida de altavoces,
altavoces, a la de
auriculares, o al ADC.
CONTROLADOR DE UN LECTOR DE CDCD-ROM: menos frecuente en
las nuevas tarjetas.
PROCESADOR DE AUDIO, DSP (Digital Sound Processor)
Processor):
procesador de audio capaz de realizar operaciones sobre el audio en
tiempo real.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Elementos de una tarjeta de sonido (III).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Elementos de una tarjeta de sonido (IV).


z

Las tarjetas de sonido para relacionarse con el exterior suelen


disponer de las siguientes conexiones:

SALIDA ANALGICA AMPLIFICADA PARA ALTAVOCES: suele


entregar una seal amplificada de 2 a 4 voltios. Se usa
habitualmente para conectar los altavoces.
SALIDA ANALGICA SIN AMPLIFICAR (Line
(Line Out)
Out): proviene del
mezclador y se entrega sin amplificar, para conectar la tarjeta de
sonido a un amplificador externo.
MICRFONO.
ENTRADA ANALGICA AUXILIAR (Line
(Line In):
In): permite introducir en
la tarjeta una seal proveniente de una fuente externa, como una
radio, un equipo de msica, etc.
CONECTOR MIDI / JOYSTICK:
JOYSTICK: permite la conexin a un joystick
analgico o bien sirve de interfaz para la conexin con otros
dispositivos MIDI como teclado, sintetizadores, etc.
SALIDA DIGITAL (las tarjetas ms recientes) /5.1
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Elementos de una tarjeta de sonido (V).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Elementos de una tarjeta de sonido (VI).


z

En cuanto a las capacidades y prestaciones de una


tarjeta de sonido, debemos destacar:
NMERO DE BITS DE LOS ADC y DAC: en las primeras
tarjetas haba que conformarse con slo 8 bits (256 niveles de
seal diferentes). En la actualidad, la mayora son de 16 bits
(65.536 niveles). Ej:
Ej: SB Audigy 4 Pro 24 bits

Nota: SB64, SB128, etc no indican el nmero de bits de


codificacin, sino el nmero de voces MIDI que es capaz de
generar su chip de sntesis.

MXIMA FRECUENCIA DE MUESTREO: +44.000 khz


FULL DUPLEX: otra caracterstica presente en algunas tarjetas
de sonido recientes, es la capacidad de grabar (ADC) y
reproducir (DAC) al mismo tiempo.

Enhanced (con diferentes frecuencias de muestreo)


Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

El DAC (I).
z

El elemento clave en la digitalizacin del audio es el


conversor analgico / digital o DAC, que transforma la
seal de audio en una secuencia de datos binarios.

Estos conversores se caracterizan por una serie de


propiedades:

FRECUENCIA DE MUESTREO (nmero de muestras por


segundo)
RESOLUCIN DE LA MUESTRA (nmero de bits para
codificar)
UMBRAL DE SENSIBILIDAD Y TOLERANCIA.
LINEALIDAD DE LA RESPUESTA Y RUIDO.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

El DAC (II).
UMBRAL DE SENSIBILIDAD y TOLERANCIA:

Niveles mnimo y mximo de intensidad que pueden recoger y


adems, dos mediciones del mismo sonido, deben dar el
mismo resultado.
Una de las diferencias principales entre una tarjeta de sonido
normal y una profesional es la tolerancia (depende de los
controles de calidad en la fabricacin del chip).

RUIDO:

Ruido es todo aquello que se oye pero no debera escucharse.


Los DAC tambin tienen ruido aunque muy poco.
Si se combina un ruido elevado con un circuito poco preciso,
podemos encontrar que la toma de muestras puede llegar a
distorsionar la grabacin <=> Esto es lo que ocurre con las
tarjetas de sonido de baja calidad.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

El DAC (III).
z

LINEALIDAD:

Un DAC tiene respuesta en frecuencia.


Los objetos que se comportan bien a una frecuencia puede que
no se comporten bien a otra; incluso pueden dar resultados
errneos.
La razn de que haya altavoces de dos o tres vas es que cada
uno de los conos que los forman slo responden bien en una
franja estrecha del espectro auditivo (tweeter
(tweeter -> agudos, woofer
-> graves).
Todo tiene una respuesta en frecuencia caracterstica, desde el
micrfono hasta los cables, pasando por el DAC y las
membranas de los altavoces.
Por norma, un dispositivo es mejor cuanto ms lineal es su
respuesta, esto es, respuestas similares para frecuencia
diversas
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

10

Micrfonos
z
z
z

Energa acstica (sonido)-> energa elctrica (audio)


Amplifica la seal original para ser copiada en forma
elctrica.
Calidad de la copia

Perfeccin del micro


Ruido
Localizacin
Acstica de la sala

Tu equipo sonar como suene el peor de los


componentes

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Tipos principales de micrfonos

De mano: 30, separacin (seseo)


Personal
z
z

Micrfono/Audfono: retransmisiones deportivas (2


seales: audio e indicaciones del director).
Inalmbrico: conectado a un radio transmisor. Audio
como radio frecuencia. Distancia e interferencias

No visibles
z
z
z

Boom: fijos o mviles, tipo plataforma, controlados a


distancia
Suspendido: fijados en un lugar, calidad dependiente de
posicin
Oculto: detrs de algn elemento, efecto de proximidad,
varios micrfonos ocultos
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

11

Altavoces
z

Transforma la energa elctrica en mecnica,


de modo inverso al micrfono
1.- Cono o diafragma
2.- Campana
3.- Yugo
4.- Imn permanente
5.- Bobina mvil
6.- Araa
7.- Tapa de retencin de polvo
8.- Hilos de conexin de la
bobina
9.- Bornes de conexin

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Tipos de altavoces
z
z
z
z

Cubrimiento del espectro audible. Mnimo 2


altavoces (altas y bajas frecuencias)
Divisin del espectro en partes (vas)
Altavoces de 2,3,4 vas
Atendiendo a la gama de frecuencias

Graves (woofer)
Medios (midrange)
Agudos (tweeter)
Otros para sistemas multiva: subwoofer, midbass

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

12

Altavoces de 2-3 vas

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Sistemas de altavoces
z
z
z

Dependen del nmero y tipo de altavoces que


se empleen.
Sonido estreo: 2 altavoces.
Sonido envolvente/3D:

4 altavoces (2 delanteros y 2 traseros).


Mayor realismo.

Virtual Surround:

Sonido envolvente 3D con 2 altavoces.


Simulacin por hardware

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

13

Sistemas de altavoces 5.1


z
z
z
z
z
z

Dolby Digital, DTS (DVD)


Altavoces frontales (estreo): msica y
efectos de sonido principalmente
Altavoz central: accin principal y dilogos
Altavoces surround (envolvente): sensacin
de profundidad, efectos especiales.
Altavoz subwoofer: frecuencias ms bajas,
sensacin ms envolvente msica y efectos
Colocacin
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Sistemas de altavoces 6.1 y 7.1


z

6.1

5.1 con el agregado de un canal central en la parte


posterior de la sala.

7.1

6.1 con altavoces a izquierda y derecha en la parte


trasera de la sala.
Para el sistema SDDS, 7.1 es igual a 5.1 pero
agregando altavoces centrales derechos e
izquierdos adicionales al frente del oyente para
mejorar la puesta del sonido.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

14

Digitalizacin del sonido (I).


z

Los humanos no percibimos todas las ondas que se propagan a


nuestro alrededor (slo percibimos el espectro de 20Hz a 20Khz).

Si queremos construir un sistema que grabe el sonido que nos


rodea, no nos interesa que grabe todo, sino slo aquellas
porciones del espectro de frecuencias que podemos percibir
DIGITALIZACI
DIGITALIZACIN.

Para digitalizar la seal analgica de entrada tenemos que tener


en cuenta varias cosas:

Cual es la frecuencia de muestreo necesaria para efectuar un buen


buen
registro de la seal de entrada? TEOREMA DE NYQUIST EL
DOBLE DE LA M
MXIMA FRECUENCIA QUE QUEREMOS GRABAR
(20Khz) La frecuencia de muestreo debe ser de unos 44Khz.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Digitalizacin del sonido (II).

Cul es la diferencia mnima que tenemos que registrar en la


amplitud de las ondas? Una codificaci
codificacin con 16 bits nos
proporciona m
ms de 64.000 intervalos de codificaci
codificacin.

DIGITALIZACIN:

FRECUENCIA DE MUESTREO O DISCRETIZACIN TEMPORAL:


medida del valor de la seal original a intervalos regulares de tiempo.
BITS DE CODIFICACIN O CUANTIZACIN O DISCRETIZACIN
DE LA AMPLITUD: aproximacin de cada valor medido al valor entero
entero
ms prximo.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

15

Digitalizacin del sonido (III).


z

La digitalizacin consiste en convertir los valores de intensidad


intensidad
de la seal en valores numricos que la representen.

Para ello se utilizan circuitos conversores de ANALGICO a


DIGITAL (analog to digital converter ADC) que llevan a cabo
una conversin o lectura cada cierto tiempo.

A cada lectura se la llama muestra y el nmero de muestras


que se toman por segundo FRECUENCIA DE MUESTREO.
MUESTREO.

Para volcar una seal al exterior en forma de sonido (digital to


analog converter DAC), conectado a un amplificador de
salida y a un altavoz.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Digitalizacin del sonido (IV).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

16

Digitalizacin del sonido (V).


z

La precisin con la que el ADC codifica los valores de la seal


(nmero de bits de la representacin digital o tamao de la
palabra del convertidor), tiene una repercusin directa en la
calidad de la misma.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Digitalizacin del sonido (VI).


z

La frecuencia de muestreo tambin tiene una influencia clave en la


exactitud de la seal (teorema de Nyquist y Aliasing).
Aliasing).

La frecuencia de muestreo debe ser al menos doble que la mxima


frecuencia de la seal que pretendemos obtener (por tanto, la
frecuencia de muestreo debe ser superior a 40.000 muestras por
segundo).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

17

Edicin de sonido digital (I).


z

Una de las mayores ventajas del sonido digital es la


enorme flexibilidad que ofrece a la hora de editar el
sonido.

Podemos clasificar las tcnicas de edicin de sonido


digital atendiendo al aspecto del sonido que modifican:

MODIFICACIN DE LA DIMENSIN TEMPORAL:


Podemos realizar las siguientes acciones:
z
z
z
z

Cortar, copiar y pegar.


Cambio de sentido.
Eliminar silencios.
Insertar silencios.
silencios.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Edicin de sonido digital (II).

MODIFICACIN DE LA AMPLITUD MEDIANTE


OPERACIONES DE MULTIPLICACIN: Podemos realizar
las siguientes acciones:
z Modificar la ganancia.
ganancia.
z Silenciar.
Silenciar.
z Umbral de ruido (noise gate).
gate).
z Normalizar respecto de la mayor amplitud de onda.
onda.
z Fundido de entrada y de salida (fade in y fade out):
son dos envolventes muy utilizados, para dar comienzo o
final progresivo
z Modulacin de la amplitud con una seal peridica.
z Inversin.
Inversin.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

18

Edicin de sonido digital (III).

MODIFICACIN DE LA FRECUENCIA:
z

Cambio de la frecuencia de reproduccin: si un sonido muestreado a 44,1


khz se reproduce a 22,05 Khz,
Khz, sonar una octava ms grave y durar el
doble de tiempo.
Remuestreo:
Remuestreo: a partir de las muestras de un sonido digital, aumentar o
disminuir su frecuencia de muestreo, aadiendo o eliminando muestras
muestras
respectivamente. Para pasar de 44,1 Khz a 22,05 Khz,
Khz, se elimina una
muestra de cada dos. Para pasar de 22,05 Khz a 44,1 Khz,
Khz, se crea por
interpolacin una nueva muestra entre cada dos.
Transposicin: es un trmino musical que significa subir o bajar la altura de
una meloda uno o ms semitonos. La transposicin supone una variacin
variacin de
la duracin del sonido: dura ms cuanto ms grave, y menos cuanto
cuanto ms
agudo.
El pitch bend o modificacin continua de la frecuencia: es similar a la
transposici
transposicin, pero en vez de realizarse en intervalos discretos (semitonos)
se lleva a cabo de forma continua. Se puede definir la evoluci
evolucin de la
frecuencia en el tiempo mediante una envolvente.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

El estndar M.I.D.I. (I)


z

Musical Instrument Digital Interface (INTERFAZ DIGITAL PARA INSTRUMENTOS


MUSICALES) Es un protocolo de comunicaciones de datos, capaz de permitir que
que
un instrumento musical pueda controlar a otro. Es un m
mtodo para describir la m
msica
mediante comandos.

Su meta inicial era conseguir que desde un teclado central se pudieran


pudieran controlar
distintos instrumentos musicales electr
electrnicos interconectados, pero con el uso de
ordenadores, el MIDI se convierte adem
adems en una herramienta para distintas
aplicaciones musicales: ayuda a la composici
composicin, docencia, edici
edicin de partituras...

La diferencia entre la informaci


informacin de audio y los datos MIDI es comparable a la que
existe entre un disco compacto con la novena sinfon
sinfona de Beethoven y su partitura, con
la diferencia a

adida
de
que el MIDI trata de partituras que han de ser entendidas
a
entendidas por
mquinas, no por seres humanos.

El instrumento controlador recibe el nombre de MASTER o MAESTRO,


MAESTRO, mientras que el
instrumento o instrumentos controlados reciben el nombre de ESCLAVOS.
ESCLAVOS.

Tambi
Tambin es posible desde un ordenador controlar la mayor
mayora de los instrumentos
musicales electr
electrnicos y capturar y almacenar la informaci
informacin que genera la ejecuci
ejecucin
de un int
intrprete sobre un instrumento.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

19

El estndar M.I.D.I. (II).


z

Transmisi
Transmisin as
asncrona

Su velocidad de transmisi
transmisin es de 31,25 Kbaudios.
Kbaudios.

Podemos distinguir tres aspectos en este est


estndar
de comunicaci
comunicacin:
Especificaciones f
fsicas: conectores, tensiones, etc.
Especificaciones de datos:notas.
Especificaciones de control: cambios de sonido,
velocidad, frecuencia, etc.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Interfaz M.I.D.I. (I).


z

La interfaz es el dispositivo electr


electrnico que se encarga de enviar y recibir
informaci
informacin M.I.D.I. hacia y desde otros dispositivos.

El interfaz MIDI transmite informaci


informacin digital por una l
lnea y recibe por otra.

Cada dispositivo debe contar con al menos una interfaz M.I.D.I.

El conector que recibe informaci


informacin recibe el nombre de M.I.D.I. IN: se encarga de
convertir los voltajes elctricos en datos digitales entendibles por el dispositivo.
dispositivo.

El conector que transmite informaci


informacin recibe el nombre de M.I.D.I. OUT: se
encarga de convertir los datos digitales generados por el dispositivo
dispositivo en series de
voltajes elctricos.
elctricos.

Algunos dispositivos tambi


tambin disponen de otro conector M.I.D.I. THRU que reenv
reenva
una copia de todo lo recibido por M.I.D.I. IN.
IN. De esta forma se puede organizar una
cadena de dispositivos conectados.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

20

Interfaz M.I.D.I. (II).


z

Los tres son conectores DIN hembra de 5 pines (de los cuales solo
se usan tres en realidad).

Los cables M.I.D.I. siempre conectan el MIDI OUT o el MIDI THRU de


un dispositivo con el MIDI IN de otro, y no deben tener una longitud
longitud
superior a 15 metros.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Interfaz M.I.D.I. (III).


z

Los cables MIDI, que utilizan forzosamente conectores DIN machos,


machos,
conectan el MIDI OUT o el MIDI THRU de un dispositivo con el MIDI
MIDI IN
de otro. Su construcci
construccin garantiza la transmisi
transmisin sin errores en
longitudes inferiores a 15 metros. En la figura siguiente se aprecian
aprecian las
conexiones internas de un cable MIDI.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

21

Los canales M.I.D.I. (I).


z

16 canales lgicos diferentes simultneos, que


permiten dirigir los mensajes individuales a 16
instrumentos distintos.

Mensajes identificados por nmero de canal

Un dispositivo controlador suele enviar por un nico


canal a la vez, mientras que un dispositivo receptor
(un sintetizador) puede ser configurado para recibir en
uno o varios canales simultneos.

Un instrumento puede estar sintonizado en modo


OMNI,
OMNI, lo cual implica que recibe de todos los canales.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Los canales M.I.D.I. (II).


z

Cada canal MIDI permite implementar un instrumento virtual


diferente. En un sintetizador hay que distinguir dos conceptos:

Capacidad polifnica: nmero mximo de notas que puede


reproducir simultneamente.
Capacidad multitmbrica:
multitmbrica: nmero mximo de instrumentos
musicales que se pueden reproducir simultneamente.

Los sintetizadores MIDI suelen tener una polifona de 32 o ms


notas y una capacidad multitmbrica de hasta 16 (lmite
determinado por los 16 canales de estndar MIDI).

La totalidad de las tarjetas de sonido son capaces de reproducir


varios instrumentos diferentes de forma simultnea

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

22

Los canales M.I.D.I. (III).


z

Los instrumentos que puede reproducir un sintetizador MIDI se


llaman programas. Para activar un instrumento determinado
basta con mandar un mensaje de Program Change junto con el
nmero de instrumento que se desee.

Un sintetizador que pueda generar cuatro instrumentos


simultneos (como por ejemplo una lnea de bajo, unos acordes
de piano, una seccin de cuerdas y una batera) deber como
mnimo poder recibir en cuatro canales MIDI diferentes. Un
aparato que satisface estas caractersticas se denomina
multitmbrico.
multitmbrico.

General MIDI (GM) que entre otros aspectos incluye:

Polifona mnima de 24 notas.


Capacidad multitmbrica de 16 canales.
Lista estndar de 128 instrumentos o programas (0 a 127 1 a 128).
128).
Caja de ritmos en el canal 10 con una lista estndar de 59 sonidos
sonidos
de percusin.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Tipos de conexiones M.I.D.I. (I).


z

Los diferentes tipos de conexiones que nos podemos encontrar


entre elementos MIDI son las siguientes:

CONEXIONADO BSICO: Consiste en un dispositivo


MAESTRO que transmite informacin y otro ESCLAVO que
recibe informacin.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

23

Tipos de conexiones M.I.D.I. (II).

CONEXIONADO ENCADENADO DAISY o SERIE: Consiste en varios


dispositivos M.I.D.I. Conectados en serie a travs del conector M.I.D.I. THRU.

Aunque en teora la interconexin va MIDI THRU es transparente, en la prctica


se produce una distorsin que puede acarrear la perdida de mensajes
mensajes tras ms
de tres enlaces. Por ello, en sistemas complejos con muchos dispositivos,
dispositivos, es
aconsejable utilizar un dispositivo hardware adicional que centraliza
centraliza y
redistribuye todos los mensajes, denominado MIDI patch bay

Configuracin MIDI compuesta por tres sintetizadores


(solo el sintetizador A puede actuar como controlador o maestro)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Tipos de conexiones M.I.D.I. (III).

Configuracin MIDI compuesta por tres sintetizadores y un ordenador


ordenador
(solo el sintetizador A puede actuar como controlador o maestro)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

24

Tipos de conexiones M.I.D.I. (IV).

CONEXIONADO PARALELO: Se pueden utilizar elementos como


MIDI Thru Box o MIDI Patch Bay que son cajas derivadoras con una
entrada y varias salidas (MIDI THRU BOX) o varias entradas y varias
varias
salidas (MIDI PATCH BAY).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Mensajes M.I.D.I. (I).


z

La especificacin MIDI determina tambin con precisin el


formato de los datos y el orden y disposicin de los mensajes que
que
se pueden transmitir.

Existen diferentes tipos de mensajes MIDI y cada uno de ellos


tiene un tamao fijo (normalmente dos o tres bytes).

Todo dispositivo MIDI dispone de al menos un microprocesador


capaz de interpretar algunos de estos mensajes, aunque no es
imprescindible que los entienda todos (cuando un dispositivo
recibe un mensaje que no es capaz de interpretar, simplemente lo
ignora y pasa al siguiente).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

25

Mensajes M.I.D.I. (II).


z

Un mensaje MIDI est formado por:

Existen dos grandes grupos de mensajes:

1 byte de status, que tiene siempre el bit ms significativo a 1.


1. Los tres bits
siguientes codifican el tipo de mensaje y los cuatro bits menos significativos
codifican el canal.
1 o 2 bytes de datos, segn el tipo de mensaje, con el bit ms significativo
significativo
siempre a 0.

MENSAJES DE CANAL (CHANNEL MESSAGES).


MENSAJES DE SISTEMA (SYSTEM MESSAGES).

MENSAJES DE CANAL (CHANNEL MESSAGE): Estn dirigidos a


instrumentos en particular.
z

MENSAJES DE VOZ DE CANAL: Por medio de estos mensajes, se reciben y


transmiten las acciones realizadas por el usuario al tocar el teclado
teclado o cualquier
otro controlador.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Mensajes M.I.D.I. (II).


z

MENSAJES DE MODO DE CANAL: Determinan cmo respondern los


teclados o elementos esclavos o cmo recibirn la informacin transmitida
transmitida
por los maestros.

Modo 1: Omni activado / polifnico (el elemento debe reaccionar sea cual sea
el canal y podr tocar varias notas a la vez).
Modo 2: Omni activado / monofnico (el elemento debe reaccionar sea cual
sea el canal y slo podr tocar una nota cada vez).
Modo 3: Omni desactivado / polifnico (slo debe reaccionar a las
instrucciones por un canal y podr tocar varias notas a la vez).
Modo 4: Omni desactivado / monofnico (slo debe reaccionar a las
instrucciones por un canal y slo podr tocar una nota cada vez).
vez).

MENSAJES DE SISTEMA (SYSTEM MESSAGES): Estn dirigidos al


sistema M.I.D.I. y no necesitan estar asignados a un canal especfico.
especfico.
Su byte de status comienza por 1111. Se utilizan para manejar por
por
control remoto desde el maestro los instrumentos M.I.D.I. Se dividen
dividen en
tres grupos:
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

26

Mensajes M.I.D.I. (III).


z

MENSAJES DE SISTEMA COMN: Se utilizan para llevar a cabo funciones


M.I.D.I. Como por ejemplo: controlar secuenciadores,
secuenciadores, ordenadores y cajas
de ritmo (seleccin de cancin, afinacin, etc).
etc).
MENSAJES DE TIEMPO REAL: Se utilizan para sincronizar los diferentes
instrumentos electrnicos (Reloj, mensaje de inicio, continuar, mensajes de
final, etc).
etc).
MENSAJES DE SISTEMAS EXCLUSIVOS: Se utilizan para enviar mensajes
entre dispositivos de la misma marca. Se trata pues de mensajes especficos
que estn pensados para ser procesador por determinados dispositivos
dispositivos
M.I.D.I.

El estndar M.I.D.I. ha incorporado sucesivas mejoras a los


largo de los aos ampliando el nmero de mensajes y
dispositivos soportados.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Resumen Mensajes M.I.D.I.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

27

Dispositivos usados en M.I.D.I.

SINTETIZADORES
MDULO DE SONIDOS
TECLADO MAESTRO
SAMPLER
CAJA DE RITMOS
SECUENCIADOR HARD
MUSICAL WORKSTATION
PATCH BAY MIDI
M.I.D.I. MERGE BOX
M.I.D.I. THRU BOX
MEZCLADOR (MERGE) M.I.D.I.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Formatos de archivo de audio


z

WAV

MP3

VQF

OGG VORBIS

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

28

Formatos de archivos de audio


z

Histricamente, cada modelo de ordenador o programa defini su


propio formato de fichero para almacenar la informacin de
sonido. Algunos de estos formatos han perdurado y se han
convertido en los ms usados actualmente.

Podemos distinguir dos estilos de formato:


Contienen una cabecera que indica los parmetros empleados en la
codificacin (frecuencia de muestreo, nmero de bits, stereo/mono,
stereo/mono,
etc)
etc) (ej
(ej:: au,
au, aif,
aif, wav,..)
wav,..)
De tipo raw o crudo que no contienen ms informacin que los
propios datos (ej: snd)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Formato WAV
Bytes

Contenido Usual

Propsito/Descripcin

00 - 03

"RIFF"

Bloque de identificacin (sin comillas).

04 - 07

???

Entero largo. Tamao del fichero en bytes, incluyendo cabecera.

08 - 11

"WAVE"

Otro identificador.

12 - 15

"fmt "

Otro identificador

16 -19

16, 0, 0, 0

Tamao de la cabecera hasta este punto. (byte menos sig,., byte ms sig)

20 - 21

1, 0

Etiqueta de formato. (Algo as como la versin del tipo de formato utilizado).

22 - 23

1, 0 (mono) ; 2,0 (estreo)

Nmero de canales (2 si es estreo).

24 - 27

???

Frecuencia de muestreo (muestras/segundo).

28 - 31

???

Nmero medio de bytes/segundo.

32 - 33

1, 0

Bytes por muestra

34 - 35

8, 0

Nmero de Bits por muestra (normalmente 8, 16 32).

36 39

"data"

Marcador que indica el comienzo de los datos de las muestras.

40 - 43

???

Nmero de bytes muestreados.

Resto

???

Muestras (cuantizacin uniforme)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

29

Formato MP3 (I).


z

MP3 significa MPEG 1 Layer 3, tercer nivel de compresin del MPEG 1.

El proceso de codificacin utilizado en MP3 es denominado


codificacin perceptual
perceptual y se basa en las pequeas imperfecciones
del odo humano. Eliminando aquellos datos que no sern percibidos
percibidos por
el oyente , podemos reducir la cantidad de datos a almacenar.

La fundamentacin matemtica es muy compleja y es un proceso lento.

Aplicando las tcnicas del MP3, se consigue reducir el tamao que


que
ocupa una pieza musical en un factor entre 10 y 12 a 1.

Segn el clculo anterior, reducimos el espacio necesario para


almacenar 1 minuto de msica estreo de calidad CD de 10MB a 1MB.
1MB.

Almacenamiento MP3 en CDCD-ROM, ms de 11 horas! con calidad casi


de CD
CD.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Capas de compresin MPEG

Formato

Compresin

Kb/seg

Layer1

4a1

384

6a1

256

8a1

192

10 a 1

128

12 a 1

112

Layer2

Layer3

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

30

Compresin MP3 (I)


z

El formato MP3 utiliza unos cuantos trucos para comprimir el


sonido, fundamentalmente tcnicas de codificacin de percepcin
que aprovechan la manera en la que el odo humano percibe el
sonido. Algunas claves son:

UMBRAL MNIMO DE AUDICIN: El umbral mnimo de audicin


humano no es lineal. De acuerdo con la ley de Fletcher y Munson,
Munson, se
representa por una curva entre 2 y 5 KHz. Cualquier sonido situado
fuera de este margen puede no codificarse, ya que no ser percibido
percibido
de todas formas.

EFECTO MSCARA: Hay una serie de propiedades de ocultacin


(masking efects)
efects) del odo humano, de forma que los sonidos fuertes
no dejan or a los dbiles. Para conseguir aprovechar esta
caracterstica, mp3 filtra los sonidos ms dbiles cuando hay sonidos
sonidos
muy fuertes a la vez.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Compresin MP3 (II)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

31

Compresin MP3 (III)

RESERVA DE BYTES: MP3 usa partes de los fragmentos que pueden


codificarse en un tamao inferior para almacenar parte de los que
que
requieren un nmero determinado de bytes/seg.

FUSIN DE ESTREO: En muchas msicas, en frecuencias


determinadas, el odo humano no puede distinguir el origen espacial
espacial de
los sonidos de un canal u otro del estreo. En este caso, MP3 puede
puede
fusionar las dos seales en una sola (mono).

CODIFICACIN DE HUFFMAN: El cdigo Huffman se aplica al final de


la compresin.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Estructura archivo MP3 (I)


z

Grupos de frames que contienen una fraccin


de segundo de datos de audio (1152 muestras)

Cada frame tiene una cabecera de 32 bits de


metadatos, de la siguiente forma:

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

32

Estructura archivo MP3 (II)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Estructura archivo MP3 (III)


Seal

Longitud
(bits)

Posicin
(bits)

Descripcin

11

(31-21)

Sincronizacin (todos los bits a


1)

(20,19)

Versin MPEG Audio


00 - MPEG Versin 2.5
01 - reserved
10 - MPEG Versin 2
(ISO/IEC 13818-3)
11 - MPEG Versin 1
(ISO/IEC 11172-3)

(18,17)

Descripcin de nivel
00 - reserved
01 - Layer III
10 - Layer II
11 - Layer I

(16)

Bit de Proteccin
0 Protegido por CRC
1 - No protegido

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

33

Estructura archivo MP3 (IV)


E

( 1 5 ,1 2 )

B itr a te e n k b p s
b its
V 1 ,L 1 V 1 ,L 2

V 1 ,L 3

V 2 ,L 1

V 2 , L 2 &

0 0 0 0

L ib r e

L ib r e

L ib r e

L ib r e

L ib r e

0 0 0 1

3 2

3 2

3 2

3 2

0 0 1 0

6 4

4 8

4 0

4 8

1 6

0 0 1 1

9 6

5 6

4 8

5 6

2 4

0 1 0 0

1 2 8

6 4

5 6

6 4

3 2

0 1 0 1

1 6 0

8 0

6 4

8 0

4 0

0 1 1 0

1 9 2

9 6

8 0

9 6

4 8

0 1 1 1

2 2 4

1 1 2

9 6

1 1 2

5 6

1 0 0 0

2 5 6

1 2 8

1 1 2

1 2 8

6 4

1 0 0 1

2 8 8

1 6 0

1 2 8

1 4 4

8 0

1 0 1 0

3 2 0

1 9 2

1 6 0

1 6 0

9 6

1 0 1 1

3 5 2

2 2 4

1 9 2

1 7 6

1 1 2

1 1 0 0

3 8 4

2 5 6

2 2 4

1 9 2

1 2 8

1 1 0 1

4 1 6

3 2 0

2 5 6

2 2 4

1 4 4

1 1 1 0

4 4 8

3 8 4

3 2 0

2 5 6

1 6 0

1 1 1 1

M a l

M a l

M a l

M a l

M a l

V 1 - M P E G V e r s i n
V 2 - M P E G V e r s i n
L 1 - L a y e r I

1
2

V e r s i n

L 3

2 .5

L 2 - L a y e r II
L 3 - L a y e r III
" lib r e " : f o r m a to lib r e . D e b e s e r c o n s ta n t e y p o r d e b a jo d e l m x im o
p e r m itid o . N o tie n e p o r q u s e r a c e p ta d o p o r u n d e c o d ific a d o r .
" m a l" : v a lo r n o p e r m itid o .
A lg u n o s fic h e r o s M P E G u s a n b itr a te v a r ia b le (V B R ). C a d a fr a m e p u e d e
p o s e e r u n b ita r e d ife r e n te . E s ta c a r a c te r s tic a e s s o p o r ta d a p o r lo s
d e c o d ific a d o r e s L a y e r III, n o p o r to d o s lo s d e L a y e r I y II

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Estructura archivo MP3 (IV)


F 2

(11,10) Frecuencia de muestreo


bits MPEG1 MPEG2 MPEG2.5
00 44100 Hz 22050 Hz 11025 Hz
01 48000 Hz 24000 Hz 12000 Hz
10 32000 Hz 16000 Hz 8000 Hz
11 reserv.

G 1

(9)

reserv.

reserv.

Bit de ajuste
0 - frame no ajustado
1 - frame ajustado con un slot extra
Sirve para asegurarnos que cada frame cumple los requisitos del bitrate.

H 1

(8)

Bit Privado, informativo. Si no existe, se pone un checksum de 16 bits


antes de los datos de audio

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

34

Estructura archivo MP3 (V)


I 2

(7,6) Modo
00 - Stereo
01 - Joint stereo (Stereo)
10 - Dual channel (2 mono channels)
11 - Single channel (Mono)
Nota: Los archivos de canal dual se construyen a partir de dos mono
independientes, cada uno usa la mitad del bitrate.

J 2

(5,4) Extensin de Modo (para Joint stereo)


Determinados directa y dinmicamente por un codificador. Se divide el rango
de frecuencias en 32 subbandas. Para Layer I y II los bits determinan las
bandas donde se aplica el estreo intenso. Para Layer III determinan qu tipo
de estreo se usa (intenso o MS)
Layer I y II
valor Layer I & II

Layer III
Intenso MS

00

bandas 4 a 31

off

off

01

bandas 8 a 31

on

off

10

bandas 12 a 31

off

on

11

bandas 16 a 31

on

on

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Estructura archivo MP3 (VI)


K 1

(3)

Copyright
0 - Audio sin copyright
1 - Audio con copyright

L 1

(2)

Originalidad
0 - Copia
1 - Original

M 2

(1,0) nfasis
00 - no
01 - 50/15 ms
10 reservado
11 - CCIT J.17
Indica al decodificador si el fichero ha de ser re-ecualizado. No se suele usar

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

35

Proceso de codificacin MP3

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

MP3 y sonido surround


z

MP3 tradicional no es multicanal

Extensin multicanal en 2004 compatible con MP3 stereo

Bitrate similar al MP3 stereo

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

36

MP3 ... MP4


z

http://www.vialicensing.com/products/mpeg4aac/standard.html

Fue creado por la empresa Global Music Outlet (GMO) (www.globalmusic.com


(www.globalmusic.com ).

Pretende terminar con la piratera.

La extensin de los MP4 es AAC (Advanced


(Advanced Audio Coding)
Coding) y, entre las ventajas tcnicas
estn:
El archivo ocupa un treinta por ciento menos de espacio que los MP3, por lo que su velocidad de
bajada es muy superior.
Tiene una compresin de ratio de 16:1 (11:1 para mp3) por lo que un archivo de 3 minutos ocupa
aproximadamente 2.3 MB.

Entre las desventajas, encontramos:

Los archivos MP4 no pueden ser listados para escuchar como un disco
disco entero o varios temas
seguidos, cosa que si es posible con cualquier reproductor (como el famoso Winamp)
Winamp) de MP3.
Al ser un archivo ejecutable (vienen con la extensin .exe
), cada cancin tiene su propio reproductor.
.exe),
Pero GMO ya est trabajando para modificar eso en las futuras versiones.
versiones.
Otra de las contras es que an existe slo dos programas especficos
especficos para comprimir a MP4. Ellos son
el Quartex y el Homeboy,
Homeboy, de menor calidad.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

VQF
z

- popular que MP3, - tamao, + calidad

VENTAJAS:

Los archivos VQF son aproximadamente un 3030-35% ms


pequeos que los archivos MP3.
La calidad del sonido es mucho mejor que MP3, ya que tiene
un 99% de la calidad del CD original.

INCONVENIENTES:

Los archivos MP3 ocupan un 1515-20% de la capacidad de


procesamiento del ordenador y un archivo VQF ocupa un
30%.
Son difciles de encontrar todava.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

37

OGG VORBIS
z
z
z
z
z
z

GNU
Mayor calidad que MP3 para un mismo
tamao de fichero
Usa principios matemticos diferentes a MP3
Genera archivos ms pequeos que MP3
para VBR
No tiene lmite de muestreo terico
Mltiples canales (MP3 -> 2)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Estructura de un archivo OGG (I)


z

3 cabeceras

Identificacin
Comentarios
Configuracin

Comienzo de cabecera
1) [tipo] : valor de 8 bits (1 I ,3 Cm,5 Cf)
2) 0x76, 0x6f, 0x72, 0x62, 0x69, 0x73: 'v','o','r','b','i','s'

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

38

Estructura de un archivo OGG (II)


z

Cabecera de informacin

1) [vorbis_version] = 32 bits. Suele estar a 0.


2) [canales_audios] = 8 bits. Valor mayor que 0.
3) [ratio_muestreo_audio] =32 bits Valor mayor que 0.
4) [bitrate_max] = 32 bits
5) [bitrate_nominal] = 32 bits. No se pone nada cuando se
codifica con VBR.
6) [bitrate_min] = 32 bits
7) [tamao_bloque_0] = 2 exponente (4 bits) Valores
posibles_ 64, 128,256,512,1024,2048, 4096, 8192.
8) [tamao_bloque_1] = 2 exponente (4 bits) Debe ser mayor
o igual que el campo anterior
9) [bandera_framing] = 1 bit. Debe valer 1.Comienzo de
cabecera

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Estructura de un archivo OGG (III)


z

Cabecera de comentarios

1) [vendor_length] = 32 bits
2) [vendor_string] = UTF-8 vector con longitud [vendor_length]
3) [longitud_lista_comentarios] = 32 bits
4) iterar de 1 a longitud_lista_comentarios {
5) [longitud] = 32 bits
6) comentario = UTF-8 vector como octetos de longitud [longitud] octets
}
7) [bit_framing] = 1 bit
8) if ( [bit_framing] a 0 o fin de paquete ) then ERROR

Estructura comentario

comment[0]="ARTIST=me";
comment[1]="TITLE=the sound of Vorbis";

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

39

Estructura de un archivo OGG (IV)


z

Cabecera de comentarios

TITLE: Nombre de la pista o trabajo


VERSION: Para diferenciar versiones de una misma pista.
ALBUM: Nombre del lbum al que pertenece la pista.
TRACKNUMBER: Nmero de pista.
ARTIST: Nombre del compositor.
PERFORMER: Cantante.
COPYRIGHT: Quien tiene los derechos.
LICENSE: Informacin sobre la licencia
ORGANIZATION: Productora
DESCRIPTION: Descripcin del contenido.
GENRE: Gnero
DATE: Fecha de grabacin.
LOCATION: Localidad de grabacin.
CONTACT: Informacin de contacto.
ISRC: Nmero ISRC para la pista.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Estructura de un archivo OGG (V)


z

Cabecera de configuracin

Informacin necesaria para decodificar


Configuraciones de codebooks
Valores de transformaciones en dominio temporal
Floors
Residuos
Mapeo de canales
Modo

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

40

Sistemas de
Grabacin/Reproduccin de Audio
z

SRS

Dolby AC-3

Super Audio CD

HDCD

DVD-Audio
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

SRS
z

El sonido estreo de dos canales ha alcanzado unas cotas de calidad


calidad
excepcionales y puede reproducir en cierta forma algunos elementos
elementos de
movimiento de sonido SIN EMBARGO, NO SIRVE PARA DISTINGUIR SI EL
SONIDO NOS VIENE DESDE ATR
ATRS O POR ARRIBA.

El sistema SRS es un sistema de reproduccin (no de grabacin) que


que aprovecha
las grabaciones estreo para producir un efecto de <<realce>> lateral.
lateral. El sonido
parece que adquiere cuerpo al activar un filtro SRS.

En realidad, el sonido sigue siendo estreo, ya que es imposible obtener un


efecto de volumen con slo dos altavoces, pero el odo es ms sensible
sensible a las
altas frecuencias que a las bajas y a los sonidos laterales que a los frontales.

Por tanto, el SRS toma las diferencias entre las seales izquierda
izquierda y derecha y
<<les sube el volumen>>. Esta elevacin de volumen de ciertas frecuencias
frecuencias
hacen que el cerebro crea que viene de los lados, cuando en realidad
realidad vienen de
frente.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

41

DOLBY SURROUND PROLOGIC


El sistema DOLBY SURROUND PROLOGIC es uno de los
sistemas de gestin y control de sonido envolvente que ms se ha
difundido a nivel domstico. El sistema emplea cinco altavoces
independientes apoyados por un refuerzo de graves.

El altavoz frontal se encarga de reproducir los dilogos.


Los delanteros izquierdo y derecho ofrecen los efectos especiales
especiales de
banda sonora.
Los traseros izquierdo y derecho apoyan a los delanteros consiguiendo
consiguiendo
el efecto envolvente.

Este sistema es analgico y presenta algunos inconvenientes. Para


Para
solucionar estos inconvenientes los laboratorios Dolby desarrollaron
el DOLBY DIGITAL ACAC-3.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Dolby Digital AC-3 (I).


z

Los mtodos de tratamiento del sonido en Dolby Digital es a travs de la


codificacin del audio por medio de algoritmos de compresin y en
en
codificacin multicanal.
multicanal.

Por medio de la codificacin multicanal se consigue una mejor


percepcin de las diferentes frecuencias que se obtienen en un solo
solo
sonido.

Los algoritmos de compresin se fundamentan en dos fenmenos


principalmente:

La curva de sensibilidad del odo.


El fenmeno de enmascaramiento.

Como sabemos, el odo humano detecta sonidos entre 20Hz y 20Khz.


Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

42

Dolby Digital AC-3 (II)


6 CANALES DE AUDIO (5.1)
Frontal izquierdo (20Hz a 20Khz).
Frontal derecho (20Hz a 20Khz).
Central (20Hz a 20Khz).
Surround trasero izq. (20Hz a 20Khz).
Surround trasero der. (20Hz a 20Khz).
Subwoofer de baja frecuencia
(limitado a graves).

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Dolby Digital AC-3 (III).


z

Dolby Digital emplea la tecnologa de procesado del


sonido basado en AC3 (Audio Code Number 3) ->
Sistema de codificacin digital desarrollado para
almacenar y transmitir seales multicanal digitales.

Este sistema consigue la la separacin entre canales


posibilitando que sonidos individualizados lleguen
desde mltiples direcciones al oyente.

En los CDs y Laser Discs,


Discs, se emplea audio digital en
formato PCM. En esta codificacin, se muestrea la
onda analgica de 16 bits 44.100 veces por segundo.
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

43

Dolby Digital AC-3 (IV).


z

Para almacenar 5.1 canales separados de informaci


informacin, una forma
de reducir la cantidad resultante de bits podr
podra ser reduciendo el
nmero de bits de cuantificaci
cuantificacin, (es decir, pasar de 16 a 10 bits)
pero sin un aumento del nivel de ruido del sistema.

DD utiliza algoritmos complejos para calcular la distribuci


distribucin
ptima de los bits sin ninguna degradaci
degradacin audible del sonido.

Sin embargo, cuanto menos son los bits usados en la codificacin


para describir una seal de audio, mayor es el ruido. cmo
soluciona esto Dolby Digital?. Los hace de dos forma:

FILTRADO DIGITAL.

ENMASCARAMIENTO.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Super Audio CD (I)


z

Evolucin del CD (Sony & Philips)

Codificacin Direct Stream Digital

Tipos de Super Audio CDs

1 capa (lector SACD)


Doble capa (lector SACD)
Hbridos (lector CD)

Disco multicanal

Proteccin de contenido

PSP-PDM
Acceso contenido/disco
Control reproduccin
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

44

Super Audio CD (II)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Comparativa CD - SACD
Aspecto

Super Audio CD

CD

Dimetro (mm)

120

120

Grosor (mm)

12

12

Tamao pista(micras)

074

16

Capacidad (Mbytes)

4700

780

Longitud de onda (nm)

650

780

Apertura numrica

06

045

Codificacin Audio

DSD

PCM Lineal

Frecuencia de muestreo (kHz)

28224

441

Tamao unidad sampleo (bit)

16

Canales

2,3,3.1,4,4.1,5,5.1

Pistas

255

99

ndices

255

99

Tiempo de reproduccin estreo

109

74

Tiempo de reproduccin multicanal

70-80

Datos adicionales (kbps)

73-900

432

Rango de frecuencias (Hz)

DC-100000 (DSD)

5-20000

Rango dinmico (dB)

>120

96

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

45

HDCD
z

Mejorar calidad CD permitiendo


compatibilidad

Cuantificacin 20 bits

Rango dinmico 120 dB

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

SDDS
z

Sony Dynamic Digital Sound

5 canales detrs de la pantalla


Subwoofer
2 traseros

Sonido multicanal 7.1 para salas de cine

Doblado a Dolby Digital o DTS, no para DVD

ATRAC

SDDS vs THX

THX: qu, cmo y dnde colocar cada elemento y


manejo de acstica del local
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

46

DVD-Audio: Caractersticas
z
z
z
z
z
z
z
z

Audio multicanal con proteccin anticopia


Reproduccin CDs
Niveles de calidad y canales flexibles
Extensibilidad
Contenidos multimedia
Sistema de navegacin amigable
Conectividad a Internet
Codificacin

LPCM
MLP
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Formatos DVD-Audio
Formato

Contenido

DVD-Audio (no video)

Disco de audio con texto, mens e imgenes


opcionales

DVD-Audio (con vdeo)

Aade vdeo (subconjunto de la especificacin


DVD-Vdeo)

DVD-Video

Vdeo sin contenido DVD-Audio

Hbrido

DVD-Audio y DVD-Vdeo ms una capa CD.

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

47

DVD-Audio: Estructura de disco

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

DVD-Audio: Codificacin

Parmetro

Audio

Codificacin

LPCM o MLP

Frecuencia de muestreo (kHz)


Bits por muestra
Canales mximos

Bitrate mximo

44.1/48/88.2/96/ 176.4/192
16/20/24
6 (@ 96 kHz) o
2 (@ 176.4/192 kHz)
9.6 Mb/s

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

48

DVD-Audio: Configuraciones

Frecuencia de muestreo
(kHz)

Cuantizacin

2 canales

4 canales

44.1/48

16 a 24

LPCM/MLP

96/88.2

16

LPCM/MLP

96/88.2

20 o 24

192/176.4

16 a 24

6 canales

LPCM/MLP

MLP

MLP

No

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

DVD-Audio: Tiempos de reproduccin


Tiempo de reproduccin
Canales de audio

Configuracin
Capa simple

Capa doble

2 canales

192kHz, 24bits

120 mins

215 mins

6 canales

96kHz, 24bits

86 mins

156 mins

2 canales

44.1kHz, 16 bits

13 hrs

23.6 hrs

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

49

Comparativa de sistemas de audio digital


HDCD

CD

SACD

DVD-Audio

Codificacin

PCM

PCM

PDM (Basado en DSD)

Cuantificacin

16 bits

20 bits

1 bit

PCM
12 / 16 / 20 24 bits

Capacidad

650Mb

650Mb

1,9Gb Monocapa
3,9Gb Bicapa
2,6Gb - Hbrido

Canales

2 (estreo)

2 (estreo)

Hasta 6

Hasta 6

Respuesta en Frecuencia

5 - 20KHz

5 -22KHz

0 -100KHz

0 - 96KHz (max)

Dinmica

96dB

120dB

120 dB

144dB

Frecuencia de Muestreo (estreo)

44,1KHz

44,1KHz

2.882,4KHz

44,1 / 88,2 / 176,4KHz

48 / 96 / 192KHz

Frecuencia de Muestreo (multicanal)

no disponible

no disponible

2.882,4KHz

44,1 / 88,2KHz
48 / 96KHz

Velocidad de Transferencia de Datos

1,4Mbps

1,4Mbps

2,8Mbps

Variable hasta 9,6


Mbps

4,7Gb Monocapa
8,5Gb Bicapa
17Gb Bicapa de
Doble Cara

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Sonido en Internet (I)


Ventajas

a).- Al abrir
la pgina

Archivos
Transportables
desde el servidor
al cliente

b) - A eleccin

Presentacin audible
mientras el usuario visualiza
la pgina
La calidad del sonido no se
pierde, se reproducen como
fueron creados

La pagina no se vuelve lenta


El usuario puede saber si
cuenta con el software
necesario para la
reproduccin
Dan la opcin al usuario de
elegir el archivo que desea
escuchar cuando el desee
La calidad del sonido no se
pierde, se reproducen como
fueron creados

Desventajas
Ocupan tiempo antes de presentar la
pgina, esto pueden desesperar al
usuario.
Ocupan espacio de disco duro.
Puede ser que el archivo sea de un
formato que el visualizador no
pueda reproducir

El usuario tiene que esperar a que el


archivo sea transportado en su
totalidad, esto implica tiempo

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

50

Sonido en Internet (II)


a).- Al abrir
la pgina

La pgina no se vuelve lenta y


casi es visualizada en el momento
en que se escucha el audio

2.Archivos en
tiempo real

La pagina no se vuelve lenta


b)- A eleccin
Dan la opcin al usuario de elegir
el archivo que desea escuchar
cuando el desee
Algunos reproductores tienen la
opcin de adelantar - regresar o
detener en el momento que se
desee

Puede que no se cuente con el


software necesario para la reproduccin,
cosa que se soluciona fcilmente ya que
la mayora de los reproductores son
gratuitos y se encuentran con facilidad
en la Web
La calidad del sonido vara segn el
propsito, y la velocidad de la red
Puede que no se cuente con el
software necesario para la reproduccin,
cosa que se soluciona fcilmente ya que
la mayora de los reproductores son
gratuitos y se encuentran con facilidad
en la Web
La calidad del sonido vara segn el
propsito, y la velocidad de la red

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Insercin de sonido en web


z

Comandos HTML
<EMBED SRC="BLUES.MID" height="60" width="144" autostart="true" ><

Atributos

Frontpage

SCR. Localizacin del archivo


ALIGN. Alinea el objeto en la pgina (top, middle, bottom,
baseline)
HEIGHT. Altura del objeto
WIDTH. Ancho del objeto
Autostart. Permite decidir la ejecucin automtica o manual.
Insertar/Sonido de Fondo
Insertar /Objeto/ Archivo de Sonido

Dreamweaver (prcticas)
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

51

Streaming
z

Tecnologa de transmisin y emisin de audio/vdeo


a travs de Internet

Proceso de streaming

Compresin (con/sin prdida)


Troceado
Envo por Internet

Protocolos de streaming

RTSP/UDP
HTTP
Formatos propietarios
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Formatos de Streaming (I)


z

RealMedia/Real Audio

Netshow

UNIX/Windows
Mltiples tipos de medios como ficheros separados de forma simultnea (SMIL)
Velocidad adaptada a la conexin del usuario
Buffering, deteccin y compensacin de errores
Multicast
Inicio por peticin del usuario
No muy adecuado para sonidos interactivos y bucles de sonido
Windows NT/2000, no soporta SMIL
Todos los medios en un fichero ASF.
Integracin con herramientas de Microsoft (Media Player, Media Server, )

QuickTime

Mac/Windows
RTSP con Mac OS X Server, HTTP; RTP
Arquitectura de cdecs bsicos + adicionales que se descargan en segundo plano
Acepta MP3, Flash, MIDI y casi cualquier formato de audio.

Flash

Beatnik Rich Music Format

Streaming Audio MP3, alta integracin con Real Media. Animaciones combinando ambas tecnologas
Basado HTML
Bandas sonoras y composiciones que cambian por acciones del usuario
Usa MIDI (menos tamao que Flash)

Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

52

Formatos de Streaming (II)


z

Liquid Audio

Transmisin segura de msica por Internet


Componentes
z
z
z

Liquifier Pro: Codificador calidad CD, proteccin copia.


Huella digital, letras, crditos.
Liquid Server: Publicacin y alojamiento de Liquid
Tracks
Liquid Player: Reproductor que permite compra de Liquid
Tracks en Windows/Mac a travs de Internet y
visualizacin de fotos, letras o promociones contenidas
en el audio
Liquid Express: Permite en tiempo real y segura la
distribucin y gestin profesional de audio
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

Eleccin del formato adecuado


z
z
z

Sonidos interactivos: Flash, Beatnik


Reproduccin continua: RealMedia, MP3, Windows Media, QuickTime
Coste:

z
z
z
z

Software cliente
Software servidor
Ancho de banda necesario

Curva de aprendizaje: RealMedia mucha documentacin y herramientas


automatizadas.
Escala de distribucin
Fidelidad y compresin de audio: MP3
Rendimiento para ancho de banda reducidos

Adaptabilidad de conexin
z
z

Tamao paquetes
z

Bueno: RealMedia
Malo: Flash, Shockwave
Bueno: Beatnik

Rendimiento servidor: Eventos en directo, codificacin en tiempo real y


streaming

Lderes: RealMedia, WindowsMedia, Shoutcast(MP3)


RM/WM negocian ancho de banda lo que asegura reproduccin continua
Subcontratacin de distribucin de contenidos para transmisiones a gran escala
Sistemas Multimedia e Interaccin Grfica - Curso 2005/06

53

También podría gustarte