Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema5 PDF
Tema5 PDF
- AUDIO/SONIDO
3.1. INTRODUCCIÓN.
3.2. PRINCIPIOS DEL SONIDO.
3.3. CARACTERÍSTICAS DE LOS SONIDOS.
3.4. HARDWARE PARA SONIDO
3.5. DIGITALIZACIÓN DEL SONIDO.
3.6. EDICIÓN DE SONIDO DIGITAL.
3.7. EL ESTÁNDAR M.I.D.I.
3.8. FORMATOS DE ARCHIVOS DE AUDIO.
3.9. SISTEMAS DE AUDIO
3.10. SONIDO EN INTERNET
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
Introducción.
z El sonido es un fenómeno físico
fundamentalmente analógico.
z Forma de capturarlo:
– Grabación y conversión
– Instrumentos musicales electrónicos
1
¿Cómo se produce el sonido?
z El sonido se produce por la interacción de un objeto
que vibra, un medio de transmisión y un receptor.
z Atenuación con la distancia y obstáculos
z Una onda de presión se transmite a través de un
medio, como el aire, y produce una sensación
llamada auditiva, al perturbar el estado de reposo de
las estructuras del oído.
z Vibraciones Æ impulsos eléeléctricos
2
Características de los sonidos (I).
z Las características de los sonidos que nos permiten
identificarlos y diferenciarlos se pueden resumir en las
siguientes:
a2
dB = 10 log10 2
a ref
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
3
Características del sonido (III).
z En la siguiente tabla podemos ver la intensidad en dB de
algunos sonidos representativos.
Descripción Nivel (dB) Intensidad
Umbral del dolor 130 1013
Concierto heavy metal 120 1012
Martillazos sobre metal 110 1011
Tráfico de vehículos 70 107
Conversación normal 60 106
Restaurante concurrido 50 105
Casa en la ciudad 40 104
Iglesia vacía 30 103
Estudio de grabación 20 102
Umbral de audición 0 1
4
Características del sonido (V).
– TONO: CARACTERÍ
CARACTERÍSTICA PERCEPTIVA QUE SOLO CAPTAMOS EN
LOS SONIDOS PERIÓ
PERIÓDICOS: LOS QUE TIENEN UNA FRECUENCIA
MÁS O MENOS CONSTANTE (agudo o grave).
5
Hardware básico para sonido
z Tarjeta de sonido
z Micrófono
z Altavoces
6
Elementos de una tarjeta de sonido (II).
z Aparte de las capacidades de muestrear y reproducir sonidos (ADC
y DAC), la mayoría de las tarjetas de sonido disponen de los
siguientes elementos:
7
Elementos de una tarjeta de sonido (IV).
z Las tarjetas de sonido para relacionarse con el exterior suelen
disponer de las siguientes conexiones:
– SALIDA ANALÓGICA AMPLIFICADA PARA ALTAVOCES: suele
entregar una señal amplificada de 2 a 4 voltios. Se usa
habitualmente para conectar los altavoces.
– SALIDA ANALÓGICA SIN AMPLIFICAR (Line (Line Out)
Out): proviene del
mezclador y se entrega sin amplificar, para conectar la tarjeta de
sonido a un amplificador externo.
– MICRÓFONO.
– ENTRADA ANALÓGICA AUXILIAR (Line (Line In):
In): permite introducir en
la tarjeta una señal proveniente de una fuente externa, como una
radio, un equipo de música, etc.
– CONECTOR MIDI / JOYSTICK:
JOYSTICK: permite la conexión a un joystick
analógico o bien sirve de interfaz para la conexión con otros
dispositivos MIDI como teclado, sintetizadores, etc.
– SALIDA DIGITAL (las tarjetas más recientes) /5.1
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
8
Elementos de una tarjeta de sonido (VI).
z En cuanto a las capacidades y prestaciones de una
tarjeta de sonido, debemos destacar:
– NÚMERO DE BITS DE LOS ADC y DAC: en las primeras
tarjetas había que conformarse con sólo 8 bits (256 niveles de
señal diferentes). En la actualidad, la mayoría son de 16 bits
(65.536 niveles). Ej:
Ej: SB Audigy 4 Pro 24 bits
z Nota: SB64, SB128, etc no indican el número de bits de
codificación, sino el número de voces MIDI que es capaz de
generar su chip de síntesis.
– MÁXIMA FRECUENCIA DE MUESTREO: +44.000 khz
– FULL DUPLEX: otra característica presente en algunas tarjetas
de sonido recientes, es la capacidad de grabar (ADC) y
reproducir (DAC) al mismo tiempo.
z Enhanced (con diferentes frecuencias de muestreo)
El DAC (I).
z El elemento clave en la digitalización del audio es el
conversor analógico / digital o DAC, que transforma la
señal de audio en una secuencia de datos binarios.
9
El DAC (II).
z UMBRAL DE SENSIBILIDAD y TOLERANCIA:
– Niveles mínimo y máximo de intensidad que pueden recoger y
además, dos mediciones del mismo sonido, deben dar el
mismo resultado.
– Una de las diferencias principales entre una tarjeta de sonido
normal y una profesional es la tolerancia (depende de los
controles de calidad en la fabricación del chip).
z RUIDO:
– Ruido es todo aquello que se oye pero no debería escucharse.
– Los DAC también tienen ruido aunque muy poco.
– Si se combina un ruido elevado con un circuito poco preciso,
podemos encontrar que la toma de muestras puede llegar a
distorsionar la grabación <=> Esto es lo que ocurre con las
tarjetas de sonido de baja calidad.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
El DAC (III).
z LINEALIDAD:
– Un DAC tiene respuesta en frecuencia.
– Los objetos que se comportan bien a una frecuencia puede que
no se comporten bien a otra; incluso pueden dar resultados
erróneos.
– La razón de que haya altavoces de dos o tres vías es que cada
uno de los conos que los forman sólo responden bien en una
franja estrecha del espectro auditivo (tweeter
(tweeter -> agudos, woofer
-> graves).
– Todo tiene una respuesta en frecuencia característica, desde el
micrófono hasta los cables, pasando por el DAC y las
membranas de los altavoces.
– Por norma, un dispositivo es mejor cuanto más lineal es su
respuesta, esto es, respuestas similares para frecuencia
diversas
10
Micrófonos
z Energía acústica (sonido)-> energía eléctrica (audio)
z Amplifica la señal original para ser copiada en forma
eléctrica.
z Calidad de la copia
– Perfección del micro
– Ruido
– Localización
– Acústica de la sala
z “Tu equipo sonará como suene el peor de los
componentes”
11
Altavoces
z Transforma la energía eléctrica en mecánica,
de modo inverso al micrófono
Tipos de altavoces
z Cubrimiento del espectro audible. Mínimo 2
altavoces (altas y bajas frecuencias)
z División del espectro en partes (vías)
z Altavoces de 2,3,4 vías
z Atendiendo a la gama de frecuencias
– Graves (woofer)
– Medios (midrange)
– Agudos (tweeter)
– Otros para sistemas multivía: subwoofer, midbass
12
Altavoces de 2-3 vías
Sistemas de altavoces
z Dependen del número y tipo de altavoces que
se empleen.
z Sonido estéreo: 2 altavoces.
z Sonido envolvente/3D:
– 4 altavoces (2 delanteros y 2 traseros).
– Mayor realismo.
z Virtual Surround:
– Sonido envolvente 3D con 2 altavoces.
– Simulación por hardware
13
Sistemas de altavoces 5.1
z Dolby Digital, DTS (DVD)
z Altavoces frontales (estéreo): música y
efectos de sonido principalmente
z Altavoz central: acción principal y diálogos
z Altavoces surround (envolvente): sensación
de profundidad, efectos especiales.
z Altavoz subwoofer: frecuencias más bajas,
sensación más envolvente música y efectos
z Colocación
z 7.1
– 6.1 con altavoces a izquierda y derecha en la parte
trasera de la sala.
– Para el sistema SDDS, 7.1 es igual a 5.1 pero
agregando altavoces centrales derechos e
izquierdos adicionales al frente del oyente para
mejorar la puesta del sonido.
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
14
Digitalización del sonido (I).
z Los humanos no percibimos todas las ondas que se propagan a
nuestro alrededor (sólo percibimos el espectro de 20Hz a 20Khz).
z DIGITALIZACIÓN:
– FRECUENCIA DE MUESTREO O DISCRETIZACIÓN TEMPORAL:
medida del valor de la señal original a intervalos regulares de tiempo.
– BITS DE CODIFICACIÓN O CUANTIZACIÓN O DISCRETIZACIÓN
DE LA AMPLITUD: aproximación de cada valor medido al valor entero entero
más próximo.
15
Digitalización del sonido (III).
16
Digitalización del sonido (V).
z La precisión con la que el ADC codifica los valores de la señal
(número de bits de la representación digital o tamaño de la
palabra del convertidor), tiene una repercusión directa en la
calidad de la misma.
17
Edición de sonido digital (I).
z Una de las mayores ventajas del sonido digital es la
enorme flexibilidad que ofrece a la hora de editar el
sonido.
18
Edición de sonido digital (III).
– MODIFICACIÓN DE LA FRECUENCIA:
z Cambio de la frecuencia de reproducción: si un sonido muestreado a 44,1
khz se reproduce a 22,05 Khz,
Khz, sonará una octava más grave y durará el
doble de tiempo.
z Remuestreo:
Remuestreo: a partir de las muestras de un sonido digital, aumentar o
disminuir su frecuencia de muestreo, añadiendo o eliminando muestras
muestras
respectivamente. Para pasar de 44,1 Khz a 22,05 Khz,
Khz, se elimina una
muestra de cada dos. Para pasar de 22,05 Khz a 44,1 Khz,Khz, se crea por
interpolación una nueva muestra entre cada dos.
z Transposición: es un término musical que significa subir o bajar la altura de
una melodía uno o más semitonos. La transposición supone una variación
variación de
la duración del sonido: dura más cuanto más grave, y menos cuanto
cuanto más
agudo.
z El “pitch bend” o modificación continua de la frecuencia: es similar a la
transposició
transposición, pero en vez de realizarse en intervalos discretos (semitonos)
se lleva a cabo de forma continua. Se puede definir la evolució
evolución de la
frecuencia en el tiempo mediante una envolvente.
z Tambié
También es posible desde un ordenador controlar la mayorí
mayoría de los instrumentos
musicales electró
electrónicos y capturar y almacenar la informació
información que genera la ejecució
ejecución
de un inté
intérprete sobre un instrumento.
19
El estándar M.I.D.I. (II).
z Transmisió
Transmisión así
asíncrona
z Su velocidad de transmisió
transmisión es de 31,25 Kbaudios.
Kbaudios.
20
Interfaz M.I.D.I. (II).
z Los tres son conectores DIN hembra de 5 pines (de los cuales solo
se usan tres en realidad).
21
Los canales M.I.D.I. (I).
z 16 canales lógicos diferentes simultáneos, que
permiten dirigir los mensajes individuales a 16
instrumentos distintos.
22
Los canales M.I.D.I. (III).
z Los instrumentos que puede reproducir un sintetizador MIDI se
llaman programas. Para activar un instrumento determinado
basta con mandar un mensaje de Program Change junto con el
número de instrumento que se desee.
23
Tipos de conexiones M.I.D.I. (II).
– CONEXIONADO ENCADENADO DAISY o SERIE: Consiste en varios
dispositivos M.I.D.I. Conectados en serie a través del conector M.I.D.I. THRU.
24
Tipos de conexiones M.I.D.I. (IV).
– CONEXIONADO PARALELO: Se pueden utilizar elementos como
MIDI Thru Box o MIDI Patch Bay que son cajas derivadoras con una
entrada y varias salidas (MIDI THRU BOX) o varias entradas y varias
varias
salidas (MIDI PATCH BAY).
25
Mensajes M.I.D.I. (II).
z Un mensaje MIDI está formado por:
– 1 byte de status, que tiene siempre el bit más significativo a 1.
1. Los tres bits
siguientes codifican el tipo de mensaje y los cuatro bits menos significativos
codifican el canal.
– 1 o 2 bytes de datos, según el tipo de mensaje, con el bit más significativo
significativo
siempre a 0.
26
Mensajes M.I.D.I. (III).
27
Dispositivos usados en M.I.D.I.
– SINTETIZADORES
– MÓDULO DE SONIDOS
– TECLADO MAESTRO
– SAMPLER
– CAJA DE RITMOS
– SECUENCIADOR “HARD”
– MUSICAL WORKSTATION
– PATCH BAY MIDI
– M.I.D.I. MERGE BOX
– M.I.D.I. THRU BOX
– MEZCLADOR (MERGE) M.I.D.I.
z WAV
z MP3
z VQF
z OGG VORBIS
28
Formatos de archivos de audio
Formato WAV
Bytes Contenido Usual Propósito/Descripción
16 -19 16, 0, 0, 0 Tamaño de la cabecera hasta este punto. (byte menos sig,…., byte más sig)
20 - 21 1, 0 Etiqueta de formato. (Algo así como la versión del tipo de formato utilizado).
29
Formato MP3 (I).
6a1 256
Layer2 8a1 192
10 a 1 128
Layer3 12 a 1 112
30
Compresión MP3 (I)
31
Compresión MP3 (III)
– RESERVA DE BYTES: MP3 usa partes de los fragmentos que pueden
codificarse en un tamaño inferior para almacenar parte de los que
que
requieren un número determinado de bytes/seg.
32
Estructura archivo MP3 (II)
33
Estructura archivo MP3 (IV)
E 4 ( 1 5 ,1 2 ) B itr a te e n k b p s
b its V 1 ,L 1 V 1 ,L 2 V 1 ,L 3 V 2 ,L 1 V 2 , L 2 & L 3
0 0 0 0 L ib r e L ib r e L ib r e L ib r e L ib r e
0 0 0 1 3 2 3 2 3 2 3 2 8
0 0 1 0 6 4 4 8 4 0 4 8 1 6
0 0 1 1 9 6 5 6 4 8 5 6 2 4
0 1 0 0 1 2 8 6 4 5 6 6 4 3 2
0 1 0 1 1 6 0 8 0 6 4 8 0 4 0
0 1 1 0 1 9 2 9 6 8 0 9 6 4 8
0 1 1 1 2 2 4 1 1 2 9 6 1 1 2 5 6
1 0 0 0 2 5 6 1 2 8 1 1 2 1 2 8 6 4
1 0 0 1 2 8 8 1 6 0 1 2 8 1 4 4 8 0
1 0 1 0 3 2 0 1 9 2 1 6 0 1 6 0 9 6
1 0 1 1 3 5 2 2 2 4 1 9 2 1 7 6 1 1 2
1 1 0 0 3 8 4 2 5 6 2 2 4 1 9 2 1 2 8
1 1 0 1 4 1 6 3 2 0 2 5 6 2 2 4 1 4 4
1 1 1 0 4 4 8 3 8 4 3 2 0 2 5 6 1 6 0
1 1 1 1 M a l M a l M a l M a l M a l
V 1 - M P E G V e r s ió n 1
V 2 - M P E G V e r s ió n 2 y V e r s ió n 2 .5
L 1 - L a y e r I
L 2 - L a y e r II
L 3 - L a y e r III
A lg u n o s fic h e r o s M P E G u s a n b itr a te v a r ia b le (V B R ). C a d a fr a m e p u e d e
p o s e e r u n b ita r e d ife r e n te . E s ta c a r a c te r ís tic a e s s o p o r ta d a p o r lo s
d e c o d ific a d o r e s L a y e r III, n o p o r to d o s lo s d e L a y e r I y II
Sirve para asegurarnos que cada frame cumple los requisitos del bitrate.
H 1 (8) Bit Privado, informativo. Si no existe, se pone un checksum de 16 bits
antes de los datos de audio
34
Estructura archivo MP3 (V)
I 2 (7,6) Modo
00 - Stereo
01 - Joint stereo (Stereo)
10 - Dual channel (2 mono channels)
11 - Single channel (Mono)
35
Proceso de codificación MP3
36
MP3 ... MP4
z http://www.vialicensing.com/products/mpeg4aac/standard.html
z €€€
VQF
z - popular que MP3, - tamaño, + calidad
z VENTAJAS:
– Los archivos VQF son aproximadamente un 30-
30-35% más
pequeños que los archivos MP3.
– La calidad del sonido es mucho mejor que MP3, ya que tiene
un 99% de la calidad del CD original.
z INCONVENIENTES:
– Los archivos MP3 ocupan un 15-15-20% de la capacidad de
procesamiento del ordenador y un archivo VQF ocupa un
30%.
– Son difíciles de encontrar todavía.
37
OGG VORBIS
z GNU
z Mayor calidad que MP3 para un mismo
tamaño de fichero
z Usa principios matemáticos diferentes a MP3
z Genera archivos más pequeños que MP3
para VBR
z No tiene límite de muestreo teórico
z Múltiples canales (MP3 -> 2)
38
Estructura de un archivo OGG (II)
z Cabecera de información
– 1) [vorbis_version] = 32 bits. Suele estar a 0.
– 2) [canales_audios] = 8 bits. Valor mayor que 0.
– 3) [ratio_muestreo_audio] =32 bits Valor mayor que 0.
– 4) [bitrate_max] = 32 bits
– 5) [bitrate_nominal] = 32 bits. No se pone nada cuando se
codifica con VBR.
– 6) [bitrate_min] = 32 bits
– 7) [tamaño_bloque_0] = 2 exponente (4 bits) Valores
posibles_ 64, 128,256,512,1024,2048, 4096, 8192.
– 8) [tamaño_bloque_1] = 2 exponente (4 bits) Debe ser mayor
o igual que el campo anterior
– 9) [bandera_framing] = 1 bit. Debe valer 1.Comienzo de
cabecera
z Estructura comentario
– comment[0]="ARTIST=me";
– comment[1]="TITLE=the sound of Vorbis";
39
Estructura de un archivo OGG (IV)
z Cabecera de comentarios
– TITLE: Nombre de la pista o trabajo
– VERSION: Para diferenciar versiones de una misma pista.
– ALBUM: Nombre del álbum al que pertenece la pista.
– TRACKNUMBER: Número de pista.
– ARTIST: Nombre del compositor.
– PERFORMER: Cantante.
– COPYRIGHT: Quien tiene los derechos.
– LICENSE: Información sobre la licencia
– ORGANIZATION: Productora
– DESCRIPTION: Descripción del contenido.
– GENRE: Género
– DATE: Fecha de grabación.
– LOCATION: Localidad de grabación.
– CONTACT: Información de contacto.
– ISRC: Número ISRC para la pista.
40
Sistemas de
Grabación/Reproducción de Audio
z SRS
z Dolby AC-3
z Super Audio CD
z HDCD
z DVD-Audio
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
SRS
z Por tanto, el SRS toma las diferencias entre las señales izquierda
izquierda y derecha y
<<les sube el volumen>>. Esta elevación de volumen de ciertas frecuencias
frecuencias
hacen que el cerebro crea que viene de los lados, cuando en realidad
realidad vienen de
frente.
41
DOLBY SURROUND PROLOGIC
42
Dolby Digital AC-3 (II)
43
Dolby Digital AC-3 (IV).
z Para almacenar 5.1 canales separados de informació
información, una forma
de reducir la cantidad resultante de bits podrí
podría ser reduciendo el
número de bits de cuantificació
cuantificación, (es decir, pasar de 16 a 10 bits)
pero sin un aumento del nivel de ruido del sistema.
z Disco multicanal
z Protección de contenido
– PSP-PDM
– Acceso contenido/disco
– Control reproducción
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
44
Super Audio CD (II)
Comparativa CD - SACD
Aspecto Super Audio CD CD
Canales 2,3,3.1,4,4.1,5,5.1 2
Pistas 255 99
Índices 255 99
45
HDCD
z Cuantificación 20 bits
SDDS
z Sony Dynamic Digital Sound
– 5 canales detrás de la pantalla
– Subwoofer
– 2 traseros
z Sonido multicanal 7.1 para salas de cine
– Doblado a Dolby Digital o DTS, no para DVD
z ATRAC
z SDDS vs THX
– THX: qué, cómo y dónde colocar cada elemento y
manejo de acústica del local
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
46
DVD-Audio: Características
z Audio multicanal con protección anticopia
z Reproducción CDs
z Niveles de calidad y canales flexibles
z Extensibilidad
z Contenidos multimedia
z Sistema de navegación amigable
z Conectividad a Internet
z Codificación
– LPCM
– MLP
Formatos DVD-Audio
Formato Contenido
47
DVD-Audio: Estructura de disco
DVD-Audio: Codificación
Parámetro Audio
Codificación LPCM o MLP
48
DVD-Audio: Configuraciones
Frecuencia de muestreo
Cuantización 2 canales 4 canales 6 canales
(kHz)
44.1/48 16 a 24 LPCM/MLP
96/88.2 16 LPCM/MLP
192/176.4 16 a 24 MLP No
Tiempo de reproducción
Canales de audio Configuración
Capa simple Capa doble
49
Comparativa de sistemas de audio digital
CD HDCD SACD DVD-Audio
1,9Gb – Monocapa
3,9Gb – Bicapa 4,7Gb – Monocapa
2,6Gb - Híbrido 8,5Gb – Bicapa
Capacidad 650Mb 650Mb
17Gb – Bicapa de
Doble Cara
44,1 / 88,2KHz ó
Frecuencia de Muestreo (multicanal) no disponible no disponible 2.882,4KHz
48 / 96KHz
50
Sonido en Internet (II)
•La página no se vuelve lenta y •Puede que no se cuente con el
a).- Al abrir casi es visualizada en el momento software necesario para la reproducción,
la página en que se escucha el audio cosa que se soluciona fácilmente ya que
la mayoría de los reproductores son
2.- gratuitos y se encuentran con facilidad
Archivos en en la Web
tiempo real •La calidad del sonido varía según el
propósito, y la velocidad de la red
z Atributos
– SCR. Localización del archivo
– ALIGN. Alinea el objeto en la página (top, middle, bottom,
baseline)
– HEIGHT. Altura del objeto
– WIDTH. Ancho del objeto
– Autostart. Permite decidir la ejecución automática o manual.
z Frontpage
– Insertar/Sonido de Fondo
– Insertar /Objeto/ Archivo de Sonido
z Dreamweaver (prácticas)
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
51
Streaming
z Tecnología de transmisión y emisión de audio/vídeo
a través de Internet
z Proceso de streaming
– Compresión (con/sin pérdida)
– Troceado
– Envío por Internet
z Protocolos de streaming
– RTSP/UDP
– HTTP
– Formatos propietarios
Sistemas Multimedia e Interacción Gráfica - Curso 2005/06
52
Formatos de Streaming (II)
z Liquid Audio
– Transmisión segura de música por Internet
– Componentes
z Liquifier Pro: Codificador calidad CD, protección copia.
Huella digital, letras, créditos.
z Liquid Server: Publicación y alojamiento de Liquid
Tracks
z Liquid Player: Reproductor que permite compra de Liquid
Tracks en Windows/Mac a través de Internet y
visualización de fotos, letras o promociones contenidas
en el audio
z Liquid Express: Permite en tiempo real y segura la
distribución y gestión profesional de audio
53