Está en la página 1de 53

3.

- AUDIO/SONIDO
3.1. INTRODUCCIÓN.
3.2. PRINCIPIOS DEL SONIDO.
3.3. CARACTERÍSTICAS DE LOS SONIDOS.
3.4. HARDWARE PARA SONIDO
3.5. DIGITALIZACIÓN DEL SONIDO.
3.6. EDICIÓN DE SONIDO DIGITAL.
3.7. EL ESTÁNDAR M.I.D.I.
3.8. FORMATOS DE ARCHIVOS DE AUDIO.
3.9. SISTEMAS DE AUDIO
3.10. SONIDO EN INTERNET
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Introducción.
z El sonido es un fenómeno físico
fundamentalmente analógico.

z Para tratamiento digital


– Fenómeno físico Æ señ
señal elé
eléctrica -> señ
señal digital

z Forma de capturarlo:
– Grabación y conversión
– Instrumentos musicales electrónicos

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

1
¿Cómo se produce el sonido?
z El sonido se produce por la interacción de un objeto
que vibra, un medio de transmisión y un receptor.
z Atenuación con la distancia y obstáculos
z Una onda de presión se transmite a través de un
medio, como el aire, y produce una sensación
llamada auditiva, al perturbar el estado de reposo de
las estructuras del oído.
z Vibraciones Æ impulsos eléeléctricos

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Generación del sonido


z El tímpano vibra las partículas de aire que la
rodean y provocará la vibración de los huesos
del oído interno.
z Vibraciones -> señales neuronales (acción de
la membrana basilar)
z Grado de intensidad dependiente de la
frecuencia -> profundidad de penetración

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

2
Características de los sonidos (I).
z Las características de los sonidos que nos permiten
identificarlos y diferenciarlos se pueden resumir en las
siguientes:

– INTENSIDAD: AMPLITUD DE LA ONDA SONORA.


z Indica a cuánto se alejan las partículas (y por tanto el tímpano)
tímpano) de
su posición de reposo en cada periodo de vibración.
z El oído responde a una rango de intensidades muy grande (desde
un sonido casi imperceptible al umbral del dolor).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Características del sonido (II).


– INTENSIDAD: AMPLITUD DE LA ONDA SONORA.
z Muchos sonidos presentan un patrón claro de intensidad que
varía con el tiempo. A este patrón se le llama ENVOLVENTE.
z Ejemplo1: Un piano presenta un fuerte golpe de gran
intensidad inicial, que decae más o menos rápidamente hasta
desaparecer.
z Ejemplo2: Una flauta presenta una envolvente más aplanada,
ya que no existe golpe inicial, sino una intensidad del sonido
mantenida mientras dura la nota.
z Medida de la intensidad: decibelios (referencia umbral)

a2
dB = 10 log10 2
a ref
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

3
Características del sonido (III).
z En la siguiente tabla podemos ver la intensidad en dB de
algunos sonidos representativos.
Descripción Nivel (dB) Intensidad
Umbral del dolor 130 1013
Concierto heavy metal 120 1012
Martillazos sobre metal 110 1011
Tráfico de vehículos 70 107
Conversación normal 60 106
Restaurante concurrido 50 105
Casa en la ciudad 40 104
Iglesia vacía 30 103
Estudio de grabación 20 102
Umbral de audición 0 1

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Características del sonido (IV).


– FRECUENCIA Y PERIODO: SON DOS CONCEPTOS
QUE REPRESENTAN EL MISMO FENÓMENO FÍSICO Y
QUE ESTÁN INVERSAMENTE RELACIONADOS.
z FRECUENCIA: Mide cuantas vibraciones se producen por
segundo (se miden en ciclos por segundo o hercios -> Hz.
Los humanos somos capaces de percibir frecuencias de
entre 20 y 20.000 Hz).
Hz).
z PERIODO: Cuantas fracciones de segundo dura una
vibración (se mide en segundos).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

4
Características del sonido (V).

– TONO: CARACTERÍ
CARACTERÍSTICA PERCEPTIVA QUE SOLO CAPTAMOS EN
LOS SONIDOS PERIÓ
PERIÓDICOS: LOS QUE TIENEN UNA FRECUENCIA
MÁS O MENOS CONSTANTE (agudo o grave).

– TIMBRE: CONJUNTO DE FRECUENCIAS QUE SE PUEDEN


ENCONTRAR EN UN SONIDO EN MAYOR O MENOR PROPORCIÓN.
z Dos instrumentos musicales distintos, como un violín y una flauta,
flauta, que estén
interpretando la misma nota (frecuencia) con la misma intensidad,
intensidad, son
claramente diferenciables -> TIMBRE o FORMA DE ONDA.

z Movimientos complejos descomponibles en movimientos simples

z Por ello, el timbre corresponde al conjunto de frecuencias que se


se pueden
encontrar en un sonido en mayor o menor proporción.
z A la frecuencia que aparece con más fuerza , si la hay, se llama frecuencia
fundamental, el resto son armónicos

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Características del sonido (VI)

Figura 6. Espectros de frecuencias

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

5
Hardware básico para sonido

z Tarjeta de sonido

z Micrófono

z Altavoces

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Elementos de una tarjeta de sonido (I).


z El elemento hardware básico para realizar las tareas relacionadas
relacionadas
con el sonido en un ordenador es la tarjeta de sonido.
sonido.
z En los ordenadores personales, las podemos encontrar en BUS
ISA (obsoletas), PCI,
PCI, integradas en la placa base, y tarjetas
externas (PCMCIA, USB,..).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

6
Elementos de una tarjeta de sonido (II).
z Aparte de las capacidades de muestrear y reproducir sonidos (ADC
y DAC), la mayoría de las tarjetas de sonido disponen de los
siguientes elementos:

– Un CHIP DE SÍNTESIS de efectos sonoros por tabla de ondas o por


modulación de frecuencia: se usa para emular instrumentos MIDI sin
necesidad de conectar un verdadero instrumento de este tipo a la
tarjeta.
– Un MEZCLADOR:
MEZCLADOR: capaz de seleccionar y combinar las señales
procedentes del micrófono, entrada de línea, CD/DVD, DAC y chip de
síntesis, y dirigir esta salida combinada a la salida de altavoces,
altavoces, a la de
auriculares, o al ADC.
– CONTROLADOR DE UN LECTOR DE CD- CD-ROM: menos frecuente en
las nuevas tarjetas.
– PROCESADOR DE AUDIO, DSP (Digital Sound Processor) Processor):
procesador de audio capaz de realizar operaciones sobre el audio en
tiempo real.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Elementos de una tarjeta de sonido (III).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

7
Elementos de una tarjeta de sonido (IV).
z Las tarjetas de sonido para relacionarse con el exterior suelen
disponer de las siguientes conexiones:
– SALIDA ANALÓGICA AMPLIFICADA PARA ALTAVOCES: suele
entregar una señal amplificada de 2 a 4 voltios. Se usa
habitualmente para conectar los altavoces.
– SALIDA ANALÓGICA SIN AMPLIFICAR (Line (Line Out)
Out): proviene del
mezclador y se entrega sin amplificar, para conectar la tarjeta de
sonido a un amplificador externo.
– MICRÓFONO.
– ENTRADA ANALÓGICA AUXILIAR (Line (Line In):
In): permite introducir en
la tarjeta una señal proveniente de una fuente externa, como una
radio, un equipo de música, etc.
– CONECTOR MIDI / JOYSTICK:
JOYSTICK: permite la conexión a un joystick
analógico o bien sirve de interfaz para la conexión con otros
dispositivos MIDI como teclado, sintetizadores, etc.
– SALIDA DIGITAL (las tarjetas más recientes) /5.1
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Elementos de una tarjeta de sonido (V).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

8
Elementos de una tarjeta de sonido (VI).
z En cuanto a las capacidades y prestaciones de una
tarjeta de sonido, debemos destacar:
– NÚMERO DE BITS DE LOS ADC y DAC: en las primeras
tarjetas había que conformarse con sólo 8 bits (256 niveles de
señal diferentes). En la actualidad, la mayoría son de 16 bits
(65.536 niveles). Ej:
Ej: SB Audigy 4 Pro 24 bits
z Nota: SB64, SB128, etc no indican el número de bits de
codificación, sino el número de voces MIDI que es capaz de
generar su chip de síntesis.
– MÁXIMA FRECUENCIA DE MUESTREO: +44.000 khz
– FULL DUPLEX: otra característica presente en algunas tarjetas
de sonido recientes, es la capacidad de grabar (ADC) y
reproducir (DAC) al mismo tiempo.
z Enhanced (con diferentes frecuencias de muestreo)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

El DAC (I).
z El elemento clave en la digitalización del audio es el
conversor analógico / digital o DAC, que transforma la
señal de audio en una secuencia de datos binarios.

z Estos conversores se caracterizan por una serie de


propiedades:
– FRECUENCIA DE MUESTREO (número de muestras por
segundo)
– RESOLUCIÓN DE LA MUESTRA (número de bits para
codificar)
– UMBRAL DE SENSIBILIDAD Y TOLERANCIA.
– LINEALIDAD DE LA RESPUESTA Y RUIDO.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

9
El DAC (II).
z UMBRAL DE SENSIBILIDAD y TOLERANCIA:
– Niveles mínimo y máximo de intensidad que pueden recoger y
además, dos mediciones del mismo sonido, deben dar el
mismo resultado.
– Una de las diferencias principales entre una tarjeta de sonido
normal y una profesional es la tolerancia (depende de los
controles de calidad en la fabricación del chip).

z RUIDO:
– Ruido es todo aquello que se oye pero no debería escucharse.
– Los DAC también tienen ruido aunque muy poco.
– Si se combina un ruido elevado con un circuito poco preciso,
podemos encontrar que la toma de muestras puede llegar a
distorsionar la grabación <=> Esto es lo que ocurre con las
tarjetas de sonido de baja calidad.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

El DAC (III).

z LINEALIDAD:
– Un DAC tiene respuesta en frecuencia.
– Los objetos que se comportan bien a una frecuencia puede que
no se comporten bien a otra; incluso pueden dar resultados
erróneos.
– La razón de que haya altavoces de dos o tres vías es que cada
uno de los conos que los forman sólo responden bien en una
franja estrecha del espectro auditivo (tweeter
(tweeter -> agudos, woofer
-> graves).
– Todo tiene una respuesta en frecuencia característica, desde el
micrófono hasta los cables, pasando por el DAC y las
membranas de los altavoces.
– Por norma, un dispositivo es mejor cuanto más lineal es su
respuesta, esto es, respuestas similares para frecuencia
diversas

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

10
Micrófonos
z Energía acústica (sonido)-> energía eléctrica (audio)
z Amplifica la señal original para ser copiada en forma
eléctrica.
z Calidad de la copia
– Perfección del micro
– Ruido
– Localización
– Acústica de la sala
z “Tu equipo sonará como suene el peor de los
componentes”

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Tipos principales de micrófonos


– De mano: 30º, separación (seseo)
– Personal
z Micrófono/Audífono: retransmisiones deportivas (2
señales: audio e indicaciones del director).
z Inalámbrico: conectado a un radio transmisor. Audio
como radio frecuencia. Distancia e interferencias
– No visibles
z Boom: fijos o móviles, tipo plataforma, controlados a
distancia
z Suspendido: fijados en un lugar, calidad dependiente de
posición
z Oculto: detrás de algún elemento, efecto de proximidad,
varios micrófonos ocultos

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

11
Altavoces
z Transforma la energía eléctrica en mecánica,
de modo inverso al micrófono

1.- Cono o diafragma


2.- Campana
3.- Yugo
4.- Imán permanente
5.- Bobina móvil
6.- Araña
7.- Tapa de retención de polvo
8.- Hilos de conexión de la
bobina
9.- Bornes de conexión

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Tipos de altavoces
z Cubrimiento del espectro audible. Mínimo 2
altavoces (altas y bajas frecuencias)
z División del espectro en partes (vías)
z Altavoces de 2,3,4 vías
z Atendiendo a la gama de frecuencias
– Graves (woofer)
– Medios (midrange)
– Agudos (tweeter)
– Otros para sistemas multivía: subwoofer, midbass

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

12
Altavoces de 2-3 vías

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Sistemas de altavoces
z Dependen del número y tipo de altavoces que
se empleen.
z Sonido estéreo: 2 altavoces.
z Sonido envolvente/3D:
– 4 altavoces (2 delanteros y 2 traseros).
– Mayor realismo.
z Virtual Surround:
– Sonido envolvente 3D con 2 altavoces.
– Simulación por hardware

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

13
Sistemas de altavoces 5.1
z Dolby Digital, DTS (DVD)
z Altavoces frontales (estéreo): música y
efectos de sonido principalmente
z Altavoz central: acción principal y diálogos
z Altavoces surround (envolvente): sensación
de profundidad, efectos especiales.
z Altavoz subwoofer: frecuencias más bajas,
sensación más envolvente música y efectos
z Colocación

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Sistemas de altavoces 6.1 y 7.1


z 6.1
– 5.1 con el agregado de un canal central en la parte
posterior de la sala.

z 7.1
– 6.1 con altavoces a izquierda y derecha en la parte
trasera de la sala.
– Para el sistema SDDS, 7.1 es igual a 5.1 pero
agregando altavoces centrales derechos e
izquierdos adicionales al frente del oyente para
mejorar la puesta del sonido.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

14
Digitalización del sonido (I).
z Los humanos no percibimos todas las ondas que se propagan a
nuestro alrededor (sólo percibimos el espectro de 20Hz a 20Khz).

z Si queremos construir un sistema que grabe el sonido que nos


rodea, no nos interesa que grabe todo, sino sólo aquellas
porciones del espectro de frecuencias que podemos percibir Ù
DIGITALIZACIÓ
DIGITALIZACIÓN.

z Para digitalizar la señal analógica de entrada tenemos que tener


en cuenta varias cosas:
– ¿Cual es la frecuencia de muestreo necesaria para efectuar un buen
buen
registro de la señal de entrada? Ù TEOREMA DE NYQUIST Ù EL
DOBLE DE LA MÁ MÁXIMA FRECUENCIA QUE QUEREMOS GRABAR
(20Khz) Ù La frecuencia de muestreo debe ser de unos 44Khz.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Digitalización del sonido (II).

– ¿Cuál es la diferencia mínima que tenemos que registrar en la


amplitud de las ondas? Ù Una codificació
codificación con 16 bits nos
proporciona má
más de 64.000 intervalos de codificació
codificación.

z DIGITALIZACIÓN:
– FRECUENCIA DE MUESTREO O DISCRETIZACIÓN TEMPORAL:
medida del valor de la señal original a intervalos regulares de tiempo.
– BITS DE CODIFICACIÓN O CUANTIZACIÓN O DISCRETIZACIÓN
DE LA AMPLITUD: aproximación de cada valor medido al valor entero entero
más próximo.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

15
Digitalización del sonido (III).

z La digitalización consiste en convertir los valores de intensidad


intensidad
de la señal en valores numéricos que la representen.

z Para ello se utilizan circuitos conversores de ANALÓGICO a


DIGITAL (analog to digital converter Ù ADC) que llevan a cabo
una conversión o lectura cada cierto tiempo.

z A cada lectura se la llama muestra y el número de muestras


que se toman por segundo FRECUENCIA DE MUESTREO.
MUESTREO.

z Para volcar una señal al exterior en forma de sonido (digital to


analog converter Ù DAC), conectado a un amplificador de
salida y a un altavoz.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Digitalización del sonido (IV).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

16
Digitalización del sonido (V).
z La precisión con la que el ADC codifica los valores de la señal
(número de bits de la representación digital o tamaño de la
palabra del convertidor), tiene una repercusión directa en la
calidad de la misma.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Digitalización del sonido (VI).


z La frecuencia de muestreo también tiene una influencia clave en la
exactitud de la señal (teorema de Nyquist y Aliasing).
Aliasing).

z La frecuencia de muestreo debe ser al menos doble que la máxima


frecuencia de la señal que pretendemos obtener (por tanto, la
frecuencia de muestreo debe ser superior a 40.000 muestras por
segundo).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

17
Edición de sonido digital (I).
z Una de las mayores ventajas del sonido digital es la
enorme flexibilidad que ofrece a la hora de editar el
sonido.

z Podemos clasificar las técnicas de edición de sonido


digital atendiendo al aspecto del sonido que modifican:
– MODIFICACIÓN DE LA DIMENSIÓN TEMPORAL:
Podemos realizar las siguientes acciones:
z Cortar, copiar y pegar.
z Cambio de sentido.
z Eliminar silencios.
z Insertar silencios.
silencios.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Edición de sonido digital (II).


– MODIFICACIÓN DE LA AMPLITUD MEDIANTE
OPERACIONES DE MULTIPLICACIÓN: Podemos realizar
las siguientes acciones:
z Modificar la ganancia.
ganancia.
z Silenciar.
Silenciar.
z Umbral de ruido (“noise gate”).
gate”).
z Normalizar respecto de la mayor amplitud de onda.onda.
z Fundido de entrada y de salida (“fade in” y “fade out”):
son dos envolventes muy utilizados, para dar comienzo o
final progresivo
z Modulación de la amplitud con una señal periódica.
z Inversión.
Inversión.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

18
Edición de sonido digital (III).
– MODIFICACIÓN DE LA FRECUENCIA:
z Cambio de la frecuencia de reproducción: si un sonido muestreado a 44,1
khz se reproduce a 22,05 Khz,
Khz, sonará una octava más grave y durará el
doble de tiempo.
z Remuestreo:
Remuestreo: a partir de las muestras de un sonido digital, aumentar o
disminuir su frecuencia de muestreo, añadiendo o eliminando muestras
muestras
respectivamente. Para pasar de 44,1 Khz a 22,05 Khz,
Khz, se elimina una
muestra de cada dos. Para pasar de 22,05 Khz a 44,1 Khz,Khz, se crea por
interpolación una nueva muestra entre cada dos.
z Transposición: es un término musical que significa subir o bajar la altura de
una melodía uno o más semitonos. La transposición supone una variación
variación de
la duración del sonido: dura más cuanto más grave, y menos cuanto
cuanto más
agudo.
z El “pitch bend” o modificación continua de la frecuencia: es similar a la
transposició
transposición, pero en vez de realizarse en intervalos discretos (semitonos)
se lleva a cabo de forma continua. Se puede definir la evolució
evolución de la
frecuencia en el tiempo mediante una envolvente.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

El estándar M.I.D.I. (I)


z Musical Instrument Digital Interface (INTERFAZ DIGITAL PARA INSTRUMENTOS
MUSICALES) Ù Es un protocolo de comunicaciones de datos, capaz de permitir que que
un instrumento musical pueda controlar a otro. Es un mé
método para describir la mú
música
mediante comandos.

z Su meta inicial era conseguir que desde un teclado central se pudieran


pudieran controlar
distintos instrumentos musicales electró
electrónicos interconectados, pero con el uso de
ordenadores, el MIDI se convierte ademá además en una herramienta para distintas
aplicaciones musicales: ayuda a la composició
composición, docencia, edició
edición de partituras...

z La diferencia entre la informació


información de audio y los datos MIDI es comparable a la que
existe entre un disco compacto con la novena sinfoní
sinfonía de Beethoven y su partitura, con
la diferencia añ
añ adida de que el MIDI trata de partituras que han de ser entendidas
entendidas por
máquinas, no por seres humanos.

z El instrumento controlador recibe el nombre de MASTER o MAESTRO,


MAESTRO, mientras que el
instrumento o instrumentos controlados reciben el nombre de ESCLAVOS.
ESCLAVOS.

z Tambié
También es posible desde un ordenador controlar la mayorí
mayoría de los instrumentos
musicales electró
electrónicos y capturar y almacenar la informació
información que genera la ejecució
ejecución
de un inté
intérprete sobre un instrumento.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

19
El estándar M.I.D.I. (II).

z Transmisió
Transmisión así
asíncrona

z Su velocidad de transmisió
transmisión es de 31,25 Kbaudios.
Kbaudios.

z Podemos distinguir tres aspectos en este estáestándar


de comunicació
comunicación:
– Especificaciones fí
físicas: conectores, tensiones, etc.
– Especificaciones de datos:notas.
– Especificaciones de control: cambios de sonido,
velocidad, frecuencia, etc.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Interfaz M.I.D.I. (I).


z La interfaz es el dispositivo electró
electrónico que se encarga de enviar y recibir
informació
información M.I.D.I. hacia y desde otros dispositivos.

z El interfaz MIDI transmite informació


información digital por una lí
línea y recibe por otra.

z Cada dispositivo debe contar con al menos una interfaz M.I.D.I.

z El conector que recibe informació


información recibe el nombre de M.I.D.I. IN: se encarga de
convertir los voltajes eléctricos en datos digitales entendibles por el dispositivo.
dispositivo.

z El conector que transmite informació


información recibe el nombre de M.I.D.I. OUT: se
encarga de convertir los datos digitales generados por el dispositivo
dispositivo en series de
voltajes eléctricos.
eléctricos.

z Algunos dispositivos tambié


también disponen de otro conector M.I.D.I. THRU que reenví
reenvía
una copia de todo lo recibido por M.I.D.I. IN.
IN. De esta forma se puede organizar una
cadena de dispositivos conectados.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

20
Interfaz M.I.D.I. (II).
z Los tres son conectores DIN hembra de 5 pines (de los cuales solo
se usan tres en realidad).

z Los cables M.I.D.I. siempre conectan el MIDI OUT o el MIDI THRU de


un dispositivo con el MIDI IN de otro, y no deben tener una longitud
longitud
superior a 15 metros.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Interfaz M.I.D.I. (III).


z Los cables MIDI, que utilizan forzosamente conectores DIN machos,
machos,
conectan el MIDI OUT o el MIDI THRU de un dispositivo con el MIDIMIDI IN
de otro. Su construcció
construcción garantiza la transmisió
transmisión sin errores en
longitudes inferiores a 15 metros. En la figura siguiente se aprecian
aprecian las
conexiones internas de un cable MIDI.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

21
Los canales M.I.D.I. (I).
z 16 canales lógicos diferentes simultáneos, que
permiten dirigir los mensajes individuales a 16
instrumentos distintos.

z Mensajes identificados por número de canal

z Un dispositivo controlador suele enviar por un único


canal a la vez, mientras que un dispositivo receptor
(un sintetizador) puede ser configurado para recibir en
uno o varios canales simultáneos.

z Un instrumento puede estar sintonizado en modo


OMNI,
OMNI, lo cual implica que recibe de todos los canales.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Los canales M.I.D.I. (II).

z Cada canal MIDI permite implementar un instrumento virtual


diferente. En un sintetizador hay que distinguir dos conceptos:
– Capacidad polifónica: número máximo de notas que puede
reproducir simultáneamente.
– Capacidad multitímbrica:
multitímbrica: número máximo de instrumentos
musicales que se pueden reproducir simultáneamente.

z Los sintetizadores MIDI suelen tener una polifonía de 32 o más


notas y una capacidad multitímbrica de hasta 16 (límite
determinado por los 16 canales de estándar MIDI).

z La totalidad de las tarjetas de sonido son capaces de reproducir


varios instrumentos diferentes de forma simultánea

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

22
Los canales M.I.D.I. (III).
z Los instrumentos que puede reproducir un sintetizador MIDI se
llaman programas. Para activar un instrumento determinado
basta con mandar un mensaje de Program Change junto con el
número de instrumento que se desee.

z Un sintetizador que pueda generar cuatro instrumentos


simultáneos (como por ejemplo una línea de bajo, unos acordes
de piano, una sección de cuerdas y una batería) deberá como
mínimo poder recibir en cuatro canales MIDI diferentes. Un
aparato que satisface estas características se denomina
multitímbrico.
multitímbrico.

z General MIDI (GM) que entre otros aspectos incluye:


– Polifonía mínima de 24 notas.
– Capacidad multitímbrica de 16 canales.
– Lista estándar de 128 instrumentos o programas (0 a 127 ó 1 a 128).
128).
– Caja de ritmos en el canal 10 con una lista estándar de 59 sonidos
sonidos
de percusión.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Tipos de conexiones M.I.D.I. (I).


z Los diferentes tipos de conexiones que nos podemos encontrar
entre elementos MIDI son las siguientes:
– CONEXIONADO BÁSICO: Consiste en un dispositivo
MAESTRO que transmite información y otro ESCLAVO que
recibe información.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

23
Tipos de conexiones M.I.D.I. (II).
– CONEXIONADO ENCADENADO DAISY o SERIE: Consiste en varios
dispositivos M.I.D.I. Conectados en serie a través del conector M.I.D.I. THRU.

– Aunque en teoría la interconexión vía MIDI THRU es transparente, en la práctica


se produce una distorsión que puede acarrear la perdida de mensajes
mensajes tras más
de tres enlaces. Por ello, en sistemas complejos con muchos dispositivos,
dispositivos, es
aconsejable utilizar un dispositivo hardware adicional que centraliza
centraliza y
redistribuye todos los mensajes, denominado MIDI patch bay

Configuración MIDI compuesta por tres sintetizadores


(solo el sintetizador A puede actuar como controlador o maestro)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Tipos de conexiones M.I.D.I. (III).

Configuración MIDI compuesta por tres sintetizadores y un ordenador


ordenador
(solo el sintetizador A puede actuar como controlador o maestro)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

24
Tipos de conexiones M.I.D.I. (IV).
– CONEXIONADO PARALELO: Se pueden utilizar elementos como
MIDI Thru Box o MIDI Patch Bay que son cajas derivadoras con una
entrada y varias salidas (MIDI THRU BOX) o varias entradas y varias
varias
salidas (MIDI PATCH BAY).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Mensajes M.I.D.I. (I).


z La especificación MIDI determina también con precisión el
formato de los datos y el orden y disposición de los mensajes que
que
se pueden transmitir.

z Existen diferentes tipos de mensajes MIDI y cada uno de ellos


tiene un tamaño fijo (normalmente dos o tres bytes).

z Todo dispositivo MIDI dispone de al menos un microprocesador


capaz de interpretar algunos de estos mensajes, aunque no es
imprescindible que los entienda todos (cuando un dispositivo
recibe un mensaje que no es capaz de interpretar, simplemente lo
ignora y pasa al siguiente).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

25
Mensajes M.I.D.I. (II).
z Un mensaje MIDI está formado por:
– 1 byte de status, que tiene siempre el bit más significativo a 1.
1. Los tres bits
siguientes codifican el tipo de mensaje y los cuatro bits menos significativos
codifican el canal.
– 1 o 2 bytes de datos, según el tipo de mensaje, con el bit más significativo
significativo
siempre a 0.

z Existen dos grandes grupos de mensajes:


– MENSAJES DE CANAL (CHANNEL MESSAGES).
– MENSAJES DE SISTEMA (SYSTEM MESSAGES).

z MENSAJES DE CANAL (CHANNEL MESSAGE): Están dirigidos a


instrumentos en particular.
z MENSAJES DE VOZ DE CANAL: Por medio de estos mensajes, se reciben y
transmiten las acciones realizadas por el usuario al tocar el teclado
teclado o cualquier
otro controlador.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Mensajes M.I.D.I. (II).

z MENSAJES DE MODO DE CANAL: Determinan cómo responderán los


teclados o elementos esclavos o cómo recibirán la información transmitida
transmitida
por los maestros.
– Modo 1: Omni activado / polifónico (el elemento debe reaccionar sea cual sea
el canal y podrá tocar varias notas a la vez).
– Modo 2: Omni activado / monofónico (el elemento debe reaccionar sea cual
sea el canal y sólo podrá tocar una nota cada vez).
– Modo 3: Omni desactivado / polifónico (sólo debe reaccionar a las
instrucciones por un canal y podrá tocar varias notas a la vez).
– Modo 4: Omni desactivado / monofónico (sólo debe reaccionar a las
instrucciones por un canal y sólo podrá tocar una nota cada vez).
vez).

– MENSAJES DE SISTEMA (SYSTEM MESSAGES): Están dirigidos al


sistema M.I.D.I. y no necesitan estar asignados a un canal específico.
específico.
Su byte de status comienza por 1111. Se utilizan para manejar por
por
control remoto desde el maestro los instrumentos M.I.D.I. Se dividen
dividen en
tres grupos:
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

26
Mensajes M.I.D.I. (III).

z MENSAJES DE SISTEMA COMÚN: Se utilizan para llevar a cabo funciones


M.I.D.I. Como por ejemplo: controlar secuenciadores,
secuenciadores, ordenadores y cajas
de ritmo (selección de canción, afinación, etc).
etc).
z MENSAJES DE TIEMPO REAL: Se utilizan para sincronizar los diferentes
instrumentos electrónicos (Reloj, mensaje de inicio, continuar, mensajes de
final, etc).
etc).
z MENSAJES DE SISTEMAS EXCLUSIVOS: Se utilizan para enviar mensajes
entre dispositivos de la misma marca. Se trata pues de mensajes específicos
que están pensados para ser procesador por determinados dispositivos
dispositivos
M.I.D.I.

z El estándar M.I.D.I. ha incorporado sucesivas mejoras a los


largo de los años ampliando el número de mensajes y
dispositivos soportados.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Resumen Mensajes M.I.D.I.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

27
Dispositivos usados en M.I.D.I.

– SINTETIZADORES
– MÓDULO DE SONIDOS
– TECLADO MAESTRO
– SAMPLER
– CAJA DE RITMOS
– SECUENCIADOR “HARD”
– MUSICAL WORKSTATION
– PATCH BAY MIDI
– M.I.D.I. MERGE BOX
– M.I.D.I. THRU BOX
– MEZCLADOR (MERGE) M.I.D.I.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Formatos de archivo de audio

z WAV

z MP3

z VQF

z OGG VORBIS

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

28
Formatos de archivos de audio

z Históricamente, cada modelo de ordenador o programa definió su


propio formato de fichero para almacenar la información de
sonido. Algunos de estos formatos han perdurado y se han
convertido en los más usados actualmente.

z Podemos distinguir dos estilos de formato:


– Contienen una cabecera que indica los parámetros empleados en la
codificación (frecuencia de muestreo, número de bits, stereo/mono,
stereo/mono,
etc)
etc) (ej
(ej:: au,
au, aif,
aif, wav,..)
wav,..)
– De tipo “raw” o crudo que no contienen más información que los
propios datos (ej: snd)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Formato WAV
Bytes Contenido Usual Propósito/Descripción

00 - 03 "RIFF" Bloque de identificación (sin comillas).

04 - 07 ??? Entero largo. Tamaño del fichero en bytes, incluyendo cabecera.

08 - 11 "WAVE" Otro identificador.

12 - 15 "fmt " Otro identificador

16 -19 16, 0, 0, 0 Tamaño de la cabecera hasta este punto. (byte menos sig,…., byte más sig)

20 - 21 1, 0 Etiqueta de formato. (Algo así como la versión del tipo de formato utilizado).

22 - 23 1, 0 (mono) ; 2,0 (estéreo) Número de canales (2 si es estéreo).

24 - 27 ??? Frecuencia de muestreo (muestras/segundo).

28 - 31 ??? Número medio de bytes/segundo.

32 - 33 1, 0 Bytes por muestra

34 - 35 8, 0 Número de Bits por muestra (normalmente 8, 16 ó 32).

36 – 39 "data" Marcador que indica el comienzo de los datos de las muestras.

40 - 43 ??? Número de bytes muestreados.

Resto ??? Muestras (cuantización uniforme)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

29
Formato MP3 (I).

z MP3 significa MPEG 1 Layer 3, tercer nivel de compresión del MPEG 1.

z El proceso de codificación utilizado en MP3 es denominado


“codificación perceptual”
perceptual” y se basa en las pequeñas imperfecciones
del oído humano. Eliminando aquellos datos que no serán percibidos
percibidos por
el oyente , podemos reducir la cantidad de datos a almacenar.

z La fundamentación matemática es muy compleja y es un proceso lento.

z Aplicando las técnicas del MP3, se consigue reducir el tamaño que


que
ocupa una pieza musical en un factor entre 10 y 12 a 1.

z Según el cálculo anterior, reducimos el espacio necesario para


almacenar 1 minuto de música estéreo de calidad CD de 10MB a 1MB.
1MB.

z Almacenamiento MP3 en CD-


CD-ROM, más de ¡11 horas! con “calidad casi
de CD”
CD”.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Capas de compresión MPEG

Formato Compresión Kb/seg

Layer1 4a1 384

6a1 256
Layer2 8a1 192

10 a 1 128
Layer3 12 a 1 112

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

30
Compresión MP3 (I)

z El formato MP3 utiliza unos cuantos trucos para comprimir el


sonido, fundamentalmente técnicas de codificación de percepción
que aprovechan la manera en la que el oído humano percibe el
sonido. Algunas claves son:
– UMBRAL MÍNIMO DE AUDICIÓN: El umbral mínimo de audición
humano no es lineal. De acuerdo con la ley de Fletcher y Munson,
Munson, se
representa por una curva entre 2 y 5 KHz. Cualquier sonido situado
fuera de este margen puede no codificarse, ya que no será percibido
percibido
de todas formas.

– EFECTO MÁSCARA: Hay una serie de propiedades de ocultación


(masking efects)
efects) del oído humano, de forma que los sonidos fuertes
no dejan oír a los débiles. Para conseguir aprovechar esta
característica, mp3 filtra los sonidos más débiles cuando hay sonidos
sonidos
muy fuertes a la vez.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Compresión MP3 (II)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

31
Compresión MP3 (III)
– RESERVA DE BYTES: MP3 usa partes de los fragmentos que pueden
codificarse en un tamaño inferior para almacenar parte de los que
que
requieren un número determinado de bytes/seg.

– FUSIÓN DE ESTÉREO: En muchas músicas, en frecuencias


determinadas, el oído humano no puede distinguir el origen espacial
espacial de
los sonidos de un canal u otro del estéreo. En este caso, MP3 puede
puede
fusionar las dos señales en una sola (mono).

– CODIFICACIÓN DE HUFFMAN: El código Huffman se aplica al final de


la compresión.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Estructura archivo MP3 (I)


z Grupos de frames que contienen una fracción
de segundo de datos de audio (1152 muestras)

z Cada frame tiene una cabecera de 32 bits de


metadatos, de la siguiente forma:

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

32
Estructura archivo MP3 (II)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Estructura archivo MP3 (III)


Señal Longitud Posición Descripción
(bits) (bits)
A 11 (31-21) Sincronización (todos los bits a
1)
B 2 (20,19) Versión MPEG Audio
00 - MPEG Versión 2.5
01 - reserved
10 - MPEG Versión 2
(ISO/IEC 13818-3)
11 - MPEG Versión 1
(ISO/IEC 11172-3)

C 2 (18,17) Descripción de nivel


00 - reserved
01 - Layer III
10 - Layer II
11 - Layer I
D 1 (16) Bit de Protección
0 – Protegido por CRC
1 - No protegido

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

33
Estructura archivo MP3 (IV)
E 4 ( 1 5 ,1 2 ) B itr a te e n k b p s
b its V 1 ,L 1 V 1 ,L 2 V 1 ,L 3 V 2 ,L 1 V 2 , L 2 & L 3
0 0 0 0 L ib r e L ib r e L ib r e L ib r e L ib r e
0 0 0 1 3 2 3 2 3 2 3 2 8
0 0 1 0 6 4 4 8 4 0 4 8 1 6
0 0 1 1 9 6 5 6 4 8 5 6 2 4
0 1 0 0 1 2 8 6 4 5 6 6 4 3 2
0 1 0 1 1 6 0 8 0 6 4 8 0 4 0
0 1 1 0 1 9 2 9 6 8 0 9 6 4 8
0 1 1 1 2 2 4 1 1 2 9 6 1 1 2 5 6
1 0 0 0 2 5 6 1 2 8 1 1 2 1 2 8 6 4
1 0 0 1 2 8 8 1 6 0 1 2 8 1 4 4 8 0
1 0 1 0 3 2 0 1 9 2 1 6 0 1 6 0 9 6
1 0 1 1 3 5 2 2 2 4 1 9 2 1 7 6 1 1 2
1 1 0 0 3 8 4 2 5 6 2 2 4 1 9 2 1 2 8
1 1 0 1 4 1 6 3 2 0 2 5 6 2 2 4 1 4 4
1 1 1 0 4 4 8 3 8 4 3 2 0 2 5 6 1 6 0
1 1 1 1 M a l M a l M a l M a l M a l

V 1 - M P E G V e r s ió n 1
V 2 - M P E G V e r s ió n 2 y V e r s ió n 2 .5
L 1 - L a y e r I

L 2 - L a y e r II

L 3 - L a y e r III

" lib r e " : f o r m a to lib r e . D e b e s e r c o n s ta n t e y p o r d e b a jo d e l m á x im o


p e r m itid o . N o tie n e p o r q u é s e r a c e p ta d o p o r u n d e c o d ific a d o r .
" m a l" : v a lo r n o p e r m itid o .

A lg u n o s fic h e r o s M P E G u s a n b itr a te v a r ia b le (V B R ). C a d a fr a m e p u e d e
p o s e e r u n b ita r e d ife r e n te . E s ta c a r a c te r ís tic a e s s o p o r ta d a p o r lo s
d e c o d ific a d o r e s L a y e r III, n o p o r to d o s lo s d e L a y e r I y II

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Estructura archivo MP3 (IV)

F 2 (11,10) Frecuencia de muestreo


bits MPEG1 MPEG2 MPEG2.5
00 44100 Hz 22050 Hz 11025 Hz
01 48000 Hz 24000 Hz 12000 Hz
10 32000 Hz 16000 Hz 8000 Hz
11 reserv. reserv. reserv.

G 1 (9) Bit de ajuste


0 - frame no ajustado
1 - frame ajustado con un slot extra

Sirve para asegurarnos que cada frame cumple los requisitos del bitrate.
H 1 (8) Bit Privado, informativo. Si no existe, se pone un checksum de 16 bits
antes de los datos de audio

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

34
Estructura archivo MP3 (V)
I 2 (7,6) Modo
00 - Stereo
01 - Joint stereo (Stereo)
10 - Dual channel (2 mono channels)
11 - Single channel (Mono)

Nota: Los archivos de canal dual se construyen a partir de dos mono


independientes, cada uno usa la mitad del bitrate.
J 2 (5,4) Extensión de Modo (para Joint stereo)

Determinados directa y dinámicamente por un codificador. Se divide el rango


de frecuencias en 32 subbandas. Para Layer I y II los bits determinan las
bandas donde se aplica el estéreo intenso. Para Layer III determinan qué tipo
de estéreo se usa (intenso o MS)

Layer I y II Layer III


valor Layer I & II Intenso MS
00 bandas 4 a 31 off off
01 bandas 8 a 31 on off
10 bandas 12 a 31 off on
11 bandas 16 a 31 on on

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Estructura archivo MP3 (VI)


K 1 (3) Copyright
0 - Audio sin copyright
1 - Audio con copyright
L 1 (2) Originalidad
0 - Copia
1 - Original
M 2 (1,0) Énfasis
00 - no
01 - 50/15 ms
10 – reservado
11 - CCIT J.17

Indica al decodificador si el fichero ha de ser re-ecualizado. No se suele usar

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

35
Proceso de codificación MP3

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

MP3 y sonido surround


z MP3 tradicional no es multicanal

z Extensión multicanal en 2004 compatible con MP3 stereo

z Bitrate similar al MP3 stereo

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

36
MP3 ... MP4
z http://www.vialicensing.com/products/mpeg4aac/standard.html

z Fue creado por la empresa Global Music Outlet (GMO) (www.globalmusic.com


(www.globalmusic.com ).

z Pretende terminar con la piratería.

z €€€

z La extensión de los MP4 es AAC (Advanced


(Advanced Audio Coding)
Coding) y, entre las ventajas técnicas
están:
– El archivo ocupa un treinta por ciento menos de espacio que los MP3, por lo que su velocidad de
bajada es muy superior.
– Tiene una compresión de ratio de 16:1 (11:1 para mp3) por lo que un archivo de 3 minutos ocupa
aproximadamente 2.3 MB.

z Entre las desventajas, encontramos:


– Los archivos MP4 no pueden ser listados para escuchar como un discodisco entero o varios temas
seguidos, cosa que si es posible con cualquier reproductor (como el famoso Winamp)
Winamp) de MP3.
– Al ser un archivo ejecutable (vienen con la extensión .exe
.exe),
), cada canción tiene su propio reproductor.
Pero GMO ya está trabajando para modificar eso en las futuras versiones.
versiones.
– Otra de las contras es que aún existe sólo dos programas específicos
específicos para comprimir a MP4. Ellos son
el Quartex y el Homeboy,
Homeboy, de menor calidad.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

VQF
z - popular que MP3, - tamaño, + calidad

z VENTAJAS:
– Los archivos VQF son aproximadamente un 30-
30-35% más
pequeños que los archivos MP3.
– La calidad del sonido es mucho mejor que MP3, ya que tiene
un 99% de la calidad del CD original.

z INCONVENIENTES:
– Los archivos MP3 ocupan un 15-15-20% de la capacidad de
procesamiento del ordenador y un archivo VQF ocupa un
30%.
– Son difíciles de encontrar todavía.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

37
OGG VORBIS
z GNU
z Mayor calidad que MP3 para un mismo
tamaño de fichero
z Usa principios matemáticos diferentes a MP3
z Genera archivos más pequeños que MP3
para VBR
z No tiene límite de muestreo teórico
z Múltiples canales (MP3 -> 2)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Estructura de un archivo OGG (I)


z 3 cabeceras
– Identificación
– Comentarios
– Configuración
z Comienzo de cabecera

1) [tipo] : valor de 8 bits (1 I ,3 Cm,5 Cf)


2) 0x76, 0x6f, 0x72, 0x62, 0x69, 0x73: 'v','o','r','b','i','s'

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

38
Estructura de un archivo OGG (II)
z Cabecera de información
– 1) [vorbis_version] = 32 bits. Suele estar a 0.
– 2) [canales_audios] = 8 bits. Valor mayor que 0.
– 3) [ratio_muestreo_audio] =32 bits Valor mayor que 0.
– 4) [bitrate_max] = 32 bits
– 5) [bitrate_nominal] = 32 bits. No se pone nada cuando se
codifica con VBR.
– 6) [bitrate_min] = 32 bits
– 7) [tamaño_bloque_0] = 2 exponente (4 bits) Valores
posibles_ 64, 128,256,512,1024,2048, 4096, 8192.
– 8) [tamaño_bloque_1] = 2 exponente (4 bits) Debe ser mayor
o igual que el campo anterior
– 9) [bandera_framing] = 1 bit. Debe valer 1.Comienzo de
cabecera

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Estructura de un archivo OGG (III)


z Cabecera de comentarios
– 1) [vendor_length] = 32 bits
– 2) [vendor_string] = UTF-8 vector con longitud [vendor_length]
– 3) [longitud_lista_comentarios] = 32 bits
– 4) iterar de 1 a longitud_lista_comentarios {
– 5) [longitud] = 32 bits
– 6) comentario = UTF-8 vector como octetos de longitud [longitud] octets
– }
– 7) [bit_framing] = 1 bit
– 8) if ( [bit_framing] a 0 o fin de paquete ) then ERROR

z Estructura comentario
– comment[0]="ARTIST=me";
– comment[1]="TITLE=the sound of Vorbis";

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

39
Estructura de un archivo OGG (IV)
z Cabecera de comentarios
– TITLE: Nombre de la pista o trabajo
– VERSION: Para diferenciar versiones de una misma pista.
– ALBUM: Nombre del álbum al que pertenece la pista.
– TRACKNUMBER: Número de pista.
– ARTIST: Nombre del compositor.
– PERFORMER: Cantante.
– COPYRIGHT: Quien tiene los derechos.
– LICENSE: Información sobre la licencia
– ORGANIZATION: Productora
– DESCRIPTION: Descripción del contenido.
– GENRE: Género
– DATE: Fecha de grabación.
– LOCATION: Localidad de grabación.
– CONTACT: Información de contacto.
– ISRC: Número ISRC para la pista.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Estructura de un archivo OGG (V)


z Cabecera de configuración
– Información necesaria para decodificar
– Configuraciones de codebooks
– Valores de transformaciones en dominio temporal
– Floors
– Residuos
– Mapeo de canales
– Modo

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

40
Sistemas de
Grabación/Reproducción de Audio

z SRS

z Dolby AC-3

z Super Audio CD

z HDCD

z DVD-Audio
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

SRS

z El sonido estéreo de dos canales ha alcanzado unas cotas de calidad


calidad
excepcionales y puede reproducir en cierta forma algunos elementos
elementos de
movimiento de sonido Ù SIN EMBARGO, NO SIRVE PARA DISTINGUIR SI EL
SONIDO NOS VIENE DESDE ATRÁ ATRÁS O POR ARRIBA.

z El sistema SRS es un sistema de reproducción (no de grabación) que


que aprovecha
las grabaciones estéreo para producir un efecto de <<realce>> lateral.
lateral. El sonido
parece que adquiere cuerpo al activar un filtro SRS.

z En realidad, el sonido sigue siendo estéreo, ya que es imposible obtener un


efecto de volumen con sólo dos altavoces, pero el oído es más sensible
sensible a las
altas frecuencias que a las bajas y a los sonidos laterales que a los frontales.

z Por tanto, el SRS toma las diferencias entre las señales izquierda
izquierda y derecha y
<<les sube el volumen>>. Esta elevación de volumen de ciertas frecuencias
frecuencias
hacen que el cerebro crea que viene de los lados, cuando en realidad
realidad vienen de
frente.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

41
DOLBY SURROUND PROLOGIC

z El sistema DOLBY SURROUND PROLOGIC es uno de los


sistemas de gestión y control de sonido envolvente que más se ha
difundido a nivel doméstico. El sistema emplea cinco altavoces
independientes apoyados por un refuerzo de graves.
– El altavoz frontal se encarga de reproducir los diálogos.
– Los delanteros izquierdo y derecho ofrecen los efectos especiales
especiales de
banda sonora.
– Los traseros izquierdo y derecho apoyan a los delanteros consiguiendo
consiguiendo
el efecto envolvente.

z Este sistema es analógico y presenta algunos inconvenientes. Para


Para
solucionar estos inconvenientes los laboratorios Dolby desarrollaron
el DOLBY DIGITAL AC-AC-3.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Dolby Digital AC-3 (I).

z Los métodos de tratamiento del sonido en Dolby Digital es a través de la


codificación del audio por medio de algoritmos de compresión y en
en
codificación multicanal.
multicanal.

z Por medio de la codificación multicanal se consigue una mejor


percepción de las diferentes frecuencias que se obtienen en un solo
solo
sonido.

z Los algoritmos de compresión se fundamentan en dos fenómenos


principalmente:
– La curva de sensibilidad del oído.
– El fenómeno de enmascaramiento.

z Como sabemos, el oído humano detecta sonidos entre 20Hz y 20Khz.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

42
Dolby Digital AC-3 (II)

6 CANALES DE AUDIO (5.1)

• Frontal izquierdo (20Hz a 20Khz).


• Frontal derecho (20Hz a 20Khz).
• Central (20Hz a 20Khz).
• Surround trasero izq. (20Hz a 20Khz).
• Surround trasero der. (20Hz a 20Khz).
• Subwoofer de baja frecuencia
(limitado a graves).

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Dolby Digital AC-3 (III).


z Dolby Digital emplea la tecnología de procesado del
sonido basado en AC3 (Audio Code Number 3) ->
Sistema de codificación digital desarrollado para
almacenar y transmitir señales multicanal digitales.

z Este sistema consigue la la separación entre canales


posibilitando que sonidos individualizados lleguen
desde múltiples direcciones al oyente.

z En los CDs y Laser Discs,


Discs, se emplea audio digital en
formato PCM. En esta codificación, se muestrea la
onda analógica de 16 bits 44.100 veces por segundo.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

43
Dolby Digital AC-3 (IV).
z Para almacenar 5.1 canales separados de informació
información, una forma
de reducir la cantidad resultante de bits podrí
podría ser reduciendo el
número de bits de cuantificació
cuantificación, (es decir, pasar de 16 a 10 bits)
pero sin un aumento del nivel de ruido del sistema.

z DD utiliza algoritmos complejos para calcular la distribució


distribución
óptima de los bits sin ninguna degradació
degradación audible del sonido.

z Sin embargo, cuanto menos son los bits usados en la codificación


para describir una señal de audio, mayor es el ruido. ¿cómo
soluciona esto Dolby Digital?. Los hace de dos forma:
– FILTRADO DIGITAL.
– ENMASCARAMIENTO.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Super Audio CD (I)


z Evolución del CD (Sony & Philips)

z Codificación Direct Stream Digital

z Tipos de Super Audio CDs


– 1 capa (lector SACD)
– Doble capa (lector SACD)
– Híbridos (lector CD)

z Disco multicanal

z Protección de contenido
– PSP-PDM
– Acceso contenido/disco
– Control reproducción
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

44
Super Audio CD (II)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Comparativa CD - SACD
Aspecto Super Audio CD CD

Diámetro (mm) 120 120

Grosor (mm) 1’2 1’2

Tamaño pista(micras) 0’74 1’6

Capacidad (Mbytes) 4700 780

Longitud de onda (nm) 650 780

Apertura numérica 0’6 0’45

Codificación Audio DSD PCM Lineal

Frecuencia de muestreo (kHz) 2822’4 44’1

Tamaño unidad sampleo (bit) 1 16

Canales 2,3,3.1,4,4.1,5,5.1 2

Pistas 255 99

Índices 255 99

Tiempo de reproducción estéreo 109 74

Tiempo de reproducción multicanal 70-80 -

Datos adicionales (kbps) 73-900 43’2

Rango de frecuencias (Hz) DC-100000 (DSD) 5-20000

Rango dinámico (dB) >120 96

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

45
HDCD

z Mejorar calidad CD permitiendo


compatibilidad

z Cuantificación 20 bits

z Rango dinámico 120 dB

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

SDDS
z Sony Dynamic Digital Sound
– 5 canales detrás de la pantalla
– Subwoofer
– 2 traseros
z Sonido multicanal 7.1 para salas de cine
– Doblado a Dolby Digital o DTS, no para DVD

z ATRAC

z SDDS vs THX
– THX: qué, cómo y dónde colocar cada elemento y
manejo de acústica del local
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

46
DVD-Audio: Características
z Audio multicanal con protección anticopia
z Reproducción CDs
z Niveles de calidad y canales flexibles
z Extensibilidad
z Contenidos multimedia
z Sistema de navegación amigable
z Conectividad a Internet
z Codificación
– LPCM
– MLP

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Formatos DVD-Audio

Formato Contenido

DVD-Audio (no video) Disco de audio con texto, menús e imágenes


opcionales

DVD-Audio (con vídeo) Añade vídeo (subconjunto de la especificación


DVD-Vídeo)

DVD-Video Vídeo sin contenido DVD-Audio

Híbrido DVD-Audio y DVD-Vídeo más una capa CD.

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

47
DVD-Audio: Estructura de disco

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

DVD-Audio: Codificación

Parámetro Audio
Codificación LPCM o MLP

Frecuencia de muestreo (kHz) 44.1/48/88.2/96/ 176.4/192

Bits por muestra 16/20/24

Canales máximos 6 (@ 96 kHz) o


2 (@ 176.4/192 kHz)

Bitrate máximo 9.6 Mb/s

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

48
DVD-Audio: Configuraciones

Frecuencia de muestreo
Cuantización 2 canales 4 canales 6 canales
(kHz)

44.1/48 16 a 24 LPCM/MLP

96/88.2 16 LPCM/MLP

96/88.2 20 o 24 LPCM/MLP MLP

192/176.4 16 a 24 MLP No

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

DVD-Audio: Tiempos de reproducción

Tiempo de reproducción
Canales de audio Configuración
Capa simple Capa doble

2 canales 192kHz, 24bits 120 mins 215 mins

6 canales 96kHz, 24bits 86 mins 156 mins

2 canales 44.1kHz, 16 bits 13 hrs 23.6 hrs

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

49
Comparativa de sistemas de audio digital
CD HDCD SACD DVD-Audio

Codificación PCM PCM PDM (Basado en DSD) PCM

Cuantificación 16 bits 20 bits 1 bit 12 / 16 / 20 ó 24 bits

1,9Gb – Monocapa
3,9Gb – Bicapa 4,7Gb – Monocapa
2,6Gb - Híbrido 8,5Gb – Bicapa
Capacidad 650Mb 650Mb
17Gb – Bicapa de
Doble Cara

Canales 2 (estéreo) 2 (estéreo) Hasta 6 Hasta 6

Respuesta en Frecuencia 5 - 20KHz 5 -22KHz 0 -100KHz 0 - 96KHz (max)

Dinámica 96dB 120dB 120 dB 144dB

44,1 / 88,2 / 176,4KHz


Frecuencia de Muestreo (estéreo) 44,1KHz 44,1KHz 2.882,4KHz ó
48 / 96 / 192KHz

44,1 / 88,2KHz ó
Frecuencia de Muestreo (multicanal) no disponible no disponible 2.882,4KHz
48 / 96KHz

Variable hasta 9,6


Velocidad de Transferencia de Datos 1,4Mbps 1,4Mbps 2,8Mbps
Mbps
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Sonido en Internet (I)


Ventajas Desventajas

• Ocupan tiempo antes de presentar la


a).- Al abrir • Presentación audible página, esto pueden desesperar al
la página mientras el usuario visualiza usuario.
la página • Ocupan espacio de disco duro.
Archivos • La calidad del sonido no se • Puede ser que el archivo sea de un
Transportables pierde, se reproducen como formato que el visualizador no
desde el servidor fueron creados pueda reproducir
al cliente

• El usuario tiene que esperar a que el


• La pagina no se vuelve lenta archivo sea transportado en su
• El usuario puede saber si totalidad, esto implica tiempo
b) - A elección cuenta con el software
necesario para la
reproducción
• Dan la opción al usuario de
elegir el archivo que desea
escuchar cuando el desee
• La calidad del sonido no se
pierde, se reproducen como
fueron creados

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

50
Sonido en Internet (II)
•La página no se vuelve lenta y •Puede que no se cuente con el
a).- Al abrir casi es visualizada en el momento software necesario para la reproducción,
la página en que se escucha el audio cosa que se soluciona fácilmente ya que
la mayoría de los reproductores son
2.- gratuitos y se encuentran con facilidad
Archivos en en la Web
tiempo real •La calidad del sonido varía según el
propósito, y la velocidad de la red

• Puede que no se cuente con el


•La pagina no se vuelve lenta software necesario para la reproducción,
b)- A elección cosa que se soluciona fácilmente ya que
•Dan la opción al usuario de elegir la mayoría de los reproductores son
el archivo que desea escuchar gratuitos y se encuentran con facilidad
cuando el desee en la Web
• La calidad del sonido varía según el
•Algunos reproductores tienen la propósito, y la velocidad de la red
opción de adelantar - regresar o
detener en el momento que se
desee

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Inserción de sonido en web


z Comandos HTML
<EMBED SRC="BLUES.MID" height="60" width="144" autostart="true" ><

z Atributos
– SCR. Localización del archivo
– ALIGN. Alinea el objeto en la página (top, middle, bottom,
baseline)
– HEIGHT. Altura del objeto
– WIDTH. Ancho del objeto
– Autostart. Permite decidir la ejecución automática o manual.
z Frontpage
– Insertar/Sonido de Fondo
– Insertar /Objeto/ Archivo de Sonido
z Dreamweaver (prácticas)
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

51
Streaming
z Tecnología de transmisión y emisión de audio/vídeo
a través de Internet

z Proceso de streaming
– Compresión (con/sin pérdida)
– Troceado
– Envío por Internet

z Protocolos de streaming
– RTSP/UDP
– HTTP
– Formatos propietarios
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Formatos de Streaming (I)


z RealMedia/Real Audio
– UNIX/Windows
– Múltiples tipos de medios como ficheros separados de forma simultánea (SMIL)
– Velocidad adaptada a la conexión del usuario
– Buffering, detección y compensación de errores
– Multicast
– Inicio por petición del usuario
– No muy adecuado para sonidos interactivos y bucles de sonido
z Netshow
– Windows NT/2000, no soporta SMIL
– Todos los medios en un fichero ASF.
– Integración con herramientas de Microsoft (Media Player, Media Server, …)
z QuickTime
– Mac/Windows
– RTSP con Mac OS X Server, HTTP; RTP
– Arquitectura de códecs básicos + adicionales que se descargan en segundo plano
– Acepta MP3, Flash, MIDI y casi cualquier formato de audio.
z Flash
– Streaming Audio MP3, alta integración con Real Media. Animaciones combinando ambas tecnologías
z Beatnik Rich Music Format
– Basado HTML
– Bandas sonoras y composiciones que cambian por acciones del usuario
– Usa MIDI (menos tamaño que Flash)

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

52
Formatos de Streaming (II)
z Liquid Audio
– Transmisión segura de música por Internet
– Componentes
z Liquifier Pro: Codificador calidad CD, protección copia.
Huella digital, letras, créditos.
z Liquid Server: Publicación y alojamiento de Liquid
Tracks
z Liquid Player: Reproductor que permite compra de Liquid
Tracks en Windows/Mac a través de Internet y
visualización de fotos, letras o promociones contenidas
en el audio
z Liquid Express: Permite en tiempo real y segura la
distribución y gestión profesional de audio

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

Elección del formato adecuado


z Sonidos interactivos: Flash, Beatnik
z Reproducción continua: RealMedia, MP3, Windows Media, QuickTime
z Coste:
– Software cliente
– Software servidor
– Ancho de banda necesario
z Curva de aprendizaje: RealMedia mucha documentación y herramientas
automatizadas.
z Escala de distribución
z Fidelidad y compresión de audio: MP3
z Rendimiento para ancho de banda reducidos
– Adaptabilidad de conexión
z Bueno: RealMedia
z Malo: Flash, Shockwave
– Tamaño paquetes
z Bueno: Beatnik
z Rendimiento servidor: Eventos en directo, codificación en tiempo real y
streaming
– Líderes: RealMedia, WindowsMedia, Shoutcast(MP3)
– RM/WM negocian ancho de banda lo que asegura reproducción continua
– Subcontratación de distribución de contenidos para transmisiones a gran escala

Sistemas Multimedia e Interacción Gráfica - Curso 2005/06

53

También podría gustarte