Está en la página 1de 454

LA RESTAURACIÓN DE AUDIO

GUSTAVO ADOLFO VALENCIA ZAPATA


NICOLÁS RAMÍREZ ECHEVERRI

UNIVERSIDAD PONTIFICIA BOLIVARIANA


FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
MEDELLÍN
2005
LA RESTAURACIÓN DE AUDIO

GUSTAVO ADOLFO VALENCIA ZAPATA


NICOLÁS RAMÍREZ ECHEVERRI

Trabajo de grado para optar al título de Ingeniero Electrónico e Ingeniero


Electricista

Director
JOSÉ RICARDO ZAPATA
Ingeniero Electrónico

UNIVERSIDAD PONTIFICIA BOLIVARIANA


FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
MEDELLÍN
2005
Nota de aceptación

_________________

_________________

_________________

_________________

_________________
Presidente del jurado

_________________
Jurado

_________________
Jurado

Medellín, 19 de julio de 2005


A Libia, Flor, Natalia, Flavio y Gabriel, mi familia

A quienes les debo todo.

Gustavo Adolfo Valencia Zapata


A mi familia

Nicolás Ramírez Echeverri


Mi reino es tan amplio como el universo y mis ambiciones no tienen límites.
Siempre voy avanzando, liberando espíritus y sopesando mundos, sin miedo,
sin compasión, sin amor, sin Dios. Me llamo Ciencia.

- Gustave Flaubert

El miedo y la ignorancia degradan nuestra mente, engendran oscuridad. La


Ciencia es el algoritmo restaurador que ilumina el camino a la libertad.

- Gustavo Valencia
- Nicolás Ramírez
AGRADECIMIENTOS

Agradecemos a nuestras familias, guías y participes de nuestros logros y a


nuestra Alma Mater.

Agradecimientos especiales a:

José Ricardo Zapata, nuestro director.


Hernán Valencia Gallón, quien con su apoyo y dedicación hizo posible este
trabajo.
Radio Bolivariana por su apoyo y calidad humana.
Finalmente, a nosotros.
CONTENIDO

Pag.
INTRODUCCIÓN ................................................................................... 34
1. CONCEPTOS DE SONIDO Y RESTAURACIÓN DE AUDIO¡Error! Marcador no
definido.
1.1. PRINCIPIOS BÁSICOS DE AUDIO............. ¡Error! Marcador no definido.
1.1.1. Onda.. .............................................. ¡Error! Marcador no definido.
1.1.2. Tipos de ondas................................... ¡Error! Marcador no definido.
1.1.2.1. Monodimensionales.......................... ¡Error! Marcador no definido.
1.1.2.2. Bidimensionales. ............................. ¡Error! Marcador no definido.
1.1.3. Algunos parámetros............................ ¡Error! Marcador no definido.
1.1.3.1. Periodo. ......................................... ¡Error! Marcador no definido.
1.1.3.2. Frecuencia...................................... ¡Error! Marcador no definido.
1.1.3.3. Fase.. ............................................ ¡Error! Marcador no definido.
1.1.3.4. Longitud de onda............................. ¡Error! Marcador no definido.
1.1.3.5. Amplitud ........................................ ¡Error! Marcador no definido.
1.1.3.6. Rapidez de la onda. ......................... ¡Error! Marcador no definido.
1.1.4. Sonido. ............................................. ¡Error! Marcador no definido.
1.1.4.1. Ondas de presión sonora. ................. ¡Error! Marcador no definido.
1.1.4.2. Características del sonido. ................ ¡Error! Marcador no definido.
1.1.4.3. Campos de investigación .................. ¡Error! Marcador no definido.
1.2. HISTORIA DE LA TECNOLOGÍA DE GRABACIÓN¡Error! Marcador no
definido.
1.2.1. La Historia......................................... ¡Error! Marcador no definido.
1.3. PRINCIPIOS BÁSICOS DE LA RESTAURACIÓN DE AUDIO. ............. ¡Error!
Marcador no definido.
1.3.1. Restauración tradicional de audio. ........ ¡Error! Marcador no definido.
1.3.2. Ruidos o degradaciones....................... ¡Error! Marcador no definido.
1.3.3. Clasificación de degradaciones. ............ ¡Error! Marcador no definido.
1.3.3.1. Clicks............................................. ¡Error! Marcador no definido.
1.3.3.2. Scratches. ...................................... ¡Error! Marcador no definido.
1.3.3.3. Crackles.. ....................................... ¡Error! Marcador no definido.
1.3.3.4. Thumps.......................................... ¡Error! Marcador no definido.
1.3.3.5. Distorsión....................................... ¡Error! Marcador no definido.
1.3.3.6. Clipping ......................................... ¡Error! Marcador no definido.
1.3.3.7. Hiss ............................................... ¡Error! Marcador no definido.
1.3.3.8. Buzz. ............................................. ¡Error! Marcador no definido.
1.3.3.9. Hum. ............................................. ¡Error! Marcador no definido.
1.3.3.10. Flutter y wow ................................ ¡Error! Marcador no definido.
2. FORMATOS DE AUDIO ANALÓGICO ........... ¡Error! Marcador no definido.
2.1. AUDIO ANALÓGICO ............................... ¡Error! Marcador no definido.
2.1.1. Limitaciones del audio analógico. ......... ¡Error! Marcador no definido.
2.2. FORMATO ............................................ ¡Error! Marcador no definido.
2.3. FORMATOS DE AUDIO ANALÓGICOS........ ¡Error! Marcador no definido.
2.3.1. Cilindro de cera de Edison. .................. ¡Error! Marcador no definido.
2.3.2. Disco de 78 RPM. ............................... ¡Error! Marcador no definido.
2.3.3. Alambre............................................ ¡Error! Marcador no definido.
2.3.4. Cinta de carrete a carrete o de carrete abierto.¡Error! Marcador no
definido.
2.3.5. Disco de vinilo. .................................. ¡Error! Marcador no definido.
2.3.6. Cartucho RCA o RCA sound tape cartridge.¡Error! Marcador no
definido.
2.3.7. Sanyo micro pack 35 .......................... ¡Error! Marcador no definido.
2.3.8. Cartucho de 4 pistas ........................... ¡Error! Marcador no definido.
2.3.9. Cartucho de 8 pistas ........................... ¡Error! Marcador no definido.
2.3.10. Casete de audio compacto.. ............... ¡Error! Marcador no definido.
2.3.11. Playtape.......................................... ¡Error! Marcador no definido.
2.3.12. Microcasete ..................................... ¡Error! Marcador no definido.
2.3.13. Elcaset. ........................................... ¡Error! Marcador no definido.
3. DEGRADACIONES Y TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE LOS
MEDIOS DE ALMACENAMIENTO ANALOGICOS . ¡Error! Marcador no definido.
3.1. DEGRADACIONES DE LOS SOPORTES MAGNÉTICOS¡Error! Marcador no
definido.
3.1.1. Otros Factores que inciden en la conservación de los soportes
magnéticos................................................. ¡Error! Marcador no definido.
3.1.1.1. La calidad de las cintas..................... ¡Error! Marcador no definido.
3.1.1.2. Las condiciones de almacenamiento. .. ¡Error! Marcador no definido.
3.1.1.3. El número de reproducciones. ........... ¡Error! Marcador no definido.
3.1.1.4. Polvo y suciedad.............................. ¡Error! Marcador no definido.
3.1.1.5. Campos magnéticos. ........................ ¡Error! Marcador no definido.
3.2. Degradaciones de los discos analógicos .... ¡Error! Marcador no definido.
3.2.1. Degradaciones en discos de acetato. ..... ¡Error! Marcador no definido.
3.2.2. Degradaciones en discos de ebonita ...... ¡Error! Marcador no definido.
3.2.3. Degradaciones en discos de vinilo......... ¡Error! Marcador no definido.
3.3. TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE LOS MEDIOS DE
ALMACENAMIENTO ANALOGICOS................... ¡Error! Marcador no definido.
3.3.1. Tratamiento físico de las cintas magnéticas¡Error! Marcador no
definido.
3.3.1.1. Determinación del tipo de cinta ......... ¡Error! Marcador no definido.
3.3.1.2. Determinación del estado de la cinta. . ¡Error! Marcador no definido.
3.3.1.3. Proceso de horneado de una cinta magnética¡Error! Marcador no
definido.
3.3.1.4. Tratamiento de una cinta magnética con problemas menores... ¡Error!
Marcador no definido.
3.3.2. Tratamiento físico de las degradaciones en discos analógicos...... ¡Error!
Marcador no definido.
3.3.2.1. Degradaciones químicas.. ................. ¡Error! Marcador no definido.
3.3.2.2. Degradaciones físicas ....................... ¡Error! Marcador no definido.
4. CAPTURA DE SEÑALES DE AUDIO ANALOGICO¡Error! Marcador no
definido.
4.1. FUNDAMENTOS DEL SONIDO DIGITAL ..... ¡Error! Marcador no definido.
4.1.1. Audio Analógico. ................................ ¡Error! Marcador no definido.
4.1.2. Audio Digital...................................... ¡Error! Marcador no definido.
4.1.2.1. Historia del audio digital. .................. ¡Error! Marcador no definido.
4.2. CAPTURA Y DIGITALIZACIÓN DE SEÑALES DE AUDIO.¡Error! Marcador
no definido.
4.2.1. Muestreo de señales de audio.. ............ ¡Error! Marcador no definido.
4.2.1.1. Muestreo con frecuencias inferiores o aliasing.¡Error! Marcador no
definido.
4.2.2. Cuantización...................................... ¡Error! Marcador no definido.
4.2.3. Codificación. ...................................... ¡Error! Marcador no definido.
4.2.3.1. Digitalización .................................. ¡Error! Marcador no definido.
4.3. REPRODUCCIÓN DE LA SEÑAL DE AUDIO DIGITAL¡Error! Marcador no
definido.
4.3.1. Conversor digital-analógico.................. ¡Error! Marcador no definido.
4.3.2. Tipos de conversores digital-analógico... ¡Error! Marcador no definido.
4.3.2.1. Conversores serie. ........................... ¡Error! Marcador no definido.
4.3.2.2. Conversores paralelos. ..................... ¡Error! Marcador no definido.
4.4. CRITERIOS PARA LA SELECCIÓN DE EQUIPOS¡Error! Marcador no
definido.
4.4.1. Equipos de reproducción de audio analógico.¡Error! Marcador no
definido.
4.4.2. Conversores análogo-digital y digital–análogo.¡Error! Marcador no
definido.
4.4.2.1. Resolución de los ADC/DAC............... ¡Error! Marcador no definido.
4.4.2.2. Frecuencia de muestreo de los ADC/DAC..¡Error! Marcador no
definido.
4.4.2.3. Interfaz de comunicación de los ADC/ DAC.¡Error! Marcador no
definido.
4.4.2.4. Tipos de ADC/DAC para audio. .......... ¡Error! Marcador no definido.
5. TRATAMIENTO DIGITAL DE SEÑALES DE AUDIO PARA SU RESTAURACIÓN
................................................................ ¡Error! Marcador no definido.
5.1. PROGRAMA PARA EDICIÓN Y MANIPULACIÓN DEL AUDIO DIGITAL ¡Error!
Marcador no definido.
5.1.1. Editor gráfico de audio digital............... ¡Error! Marcador no definido.
5.1.1.1. Elección de un editor gráfico de audio. ¡Error! Marcador no definido.
5.1.1.2. Efectos que utilizan retardos. ............ ¡Error! Marcador no definido.
5.1.1.3. Procesadores de rango dinámico. ....... ¡Error! Marcador no definido.
5.1.1.4. Filtros.. .......................................... ¡Error! Marcador no definido.
5.1.1.5. Dither ............................................ ¡Error! Marcador no definido.
5.1.2. Multipistas de audio digital .................. ¡Error! Marcador no definido.
5.1.3. Secuenciador MIDI ............................. ¡Error! Marcador no definido.
6. TECNOLOGÍAS DE RESTAURACIÓN DIGITAL DE AUDIO¡Error! Marcador no
definido.
6.1. TECNOLOGÍAS DE MODIFICACIÓN .......... ¡Error! Marcador no definido.
6.1.1. Procesos de modificación..................... ¡Error! Marcador no definido.
6.1.1.1. De-thumping .................................. ¡Error! Marcador no definido.
6.1.1.2. De-clicking ..................................... ¡Error! Marcador no definido.
6.1.1.3. De-hissing ...................................... ¡Error! Marcador no definido.
6.1.1.4. De-scratching ................................. ¡Error! Marcador no definido.
6.2. TECNOLOGÍAS DE SUSTITUCIÓN ............ ¡Error! Marcador no definido.
7. FORMATOS Y MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL..... ¡Error!
Marcador no definido.
7.1. FORMATOS DE ARCHIVO DE AUDIO DIGITAL¡Error! Marcador no
definido.
7.1.1. Tamaños en el audio digital. ................ ¡Error! Marcador no definido.
7.1.2. Compresión de archivos de audio ......... ¡Error! Marcador no definido.
7.1.2.1. Compresión y descompresion de Datos..¡Error! Marcador no
definido.
7.2. MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL¡Error! Marcador no
definido.
7.2.1. ADAT................................................ ¡Error! Marcador no definido.
7.2.2. DAT.................................................. ¡Error! Marcador no definido.
7.2.3. DDS. ................................................ ¡Error! Marcador no definido.
7.2.4. DASH.. ............................................. ¡Error! Marcador no definido.
7.2.5. DCC.. ............................................... ¡Error! Marcador no definido.
7.2.6. MD. .................................................. ¡Error! Marcador no definido.
7.2.7. CD ................................................... ¡Error! Marcador no definido.
7.2.8. CD-ROM............................................ ¡Error! Marcador no definido.
7.2.9. CD-R. ............................................... ¡Error! Marcador no definido.
7.2.10. CD-RW............................................ ¡Error! Marcador no definido.
7.2.11. CD+G. ............................................ ¡Error! Marcador no definido.
7.2.12. CD-i. .............................................. ¡Error! Marcador no definido.
7.2.13. UMD. .............................................. ¡Error! Marcador no definido.
7.2.14. DD-CD. ........................................... ¡Error! Marcador no definido.
7.2.15. MultiLevel........................................ ¡Error! Marcador no definido.
7.2.16. MO. ................................................ ¡Error! Marcador no definido.
7.2.17. SA.................................................. ¡Error! Marcador no definido.
7.2.18. DVD. .............................................. ¡Error! Marcador no definido.
7.2.19. DVD-R.. .......................................... ¡Error! Marcador no definido.
7.2.20. DVD-RW.......................................... ¡Error! Marcador no definido.
7.2.21. DVD+R. .......................................... ¡Error! Marcador no definido.
7.2.22. DVD+RW......................................... ¡Error! Marcador no definido.
7.2.23. DVD-RAM.. ...................................... ¡Error! Marcador no definido.
7.2.24. SACD.............................................. ¡Error! Marcador no definido.
7.2.25. DD. ................................................ ¡Error! Marcador no definido.
7.2.26. BD ................................................. ¡Error! Marcador no definido.
7.2.27. HD-DVD .......................................... ¡Error! Marcador no definido.
8. EQUIPOS DE ALMACENAMIENTO ................ ¡Error! Marcador no definido.
8.1. PERFIL DE UN DAW BASADO EN COMPUTADOR¡Error! Marcador no
definido.
8.1.1. Estabilidad ........................................ ¡Error! Marcador no definido.
8.1.2. El sistema operativo. .......................... ¡Error! Marcador no definido.
8.1.3. Procesador ........................................ ¡Error! Marcador no definido.
8.1.4. Mainboard o tarjeta madre. ................. ¡Error! Marcador no definido.
8.1.5. Memoria RAM. ................................... ¡Error! Marcador no definido.
8.1.6. Capacidad de almacenamiento. ............ ¡Error! Marcador no definido.
8.1.7. Tarjeta de video................................. ¡Error! Marcador no definido.
8.1.8. Monitor ............................................. ¡Error! Marcador no definido.
8.1.9. Dispositivos de grabación de medios externos.¡Error! Marcador no
definido.
8.1.10. Tarjeta de sonido. ............................ ¡Error! Marcador no definido.
8.1.11. Ruido acústico.................................. ¡Error! Marcador no definido.
9. TRABAJO CON LA EMISORA DE LA UNIVERSIDAD PONTIFICIA BOLIVARIANA
................................................................ ¡Error! Marcador no definido.
9.1. HISTORIA. ........................................... ¡Error! Marcador no definido.
9.2. EXPERIENCIAS EN LA EMISORA DE LA UNIVERSIDAD PONTIFICIA
BOLIVARIANA. ............................................ ¡Error! Marcador no definido.
10. CONCLUSIONES..................................... ¡Error! Marcador no definido.
BIBLIOGRAFÍA ................................................................................... 282
ANEXOS ............................................................................................ 295
LISTA DE FIGURAS

Pag.
Figura 1. Onda senoidal................................ ¡Error! Marcador no definido.
Figura 2. Octavas con imágenes de instrumentos musicales.¡Error! Marcador
no definido.
Figura 3. Amplitud y frecuencia de una onda sonora.¡Error! Marcador no
definido.
Figura 4. Fonógrafo de Edison ....................... ¡Error! Marcador no definido.
Figura 5. Sistema de Oberlin ......................... ¡Error! Marcador no definido.
Figura 6. Magnetófono AEG-BASF. ................. ¡Error! Marcador no definido.
Figura 7. Diagrama de modelos de separación. ¡Error! Marcador no definido.
Figura 8. Onda senoidal con clicks.................. ¡Error! Marcador no definido.
Figura 9. Onda senoidal con crackles. ............. ¡Error! Marcador no definido.
Figura 10. Onda senoidal con thumps. ............ ¡Error! Marcador no definido.
Figura 11. Onda senoidal con clipping............. ¡Error! Marcador no definido.
Figura 12. Onda senoidal con hiss .................. ¡Error! Marcador no definido.
Figura 13. Imagen aumentada de la superficie de un disco.¡Error! Marcador
no definido.
Figura 14. Cilindro de cera de Edison.............. ¡Error! Marcador no definido.
Figura 15. Disco de ebonita de 7" y 55 RPM .... ¡Error! Marcador no definido.
Figura 16. Carretes de alambre ..................... ¡Error! Marcador no definido.
Figura 17. Imagen de un carrete abierto de 7” con cinta de ¼”. ........... ¡Error!
Marcador no definido.
Figura 18. Disco de vinilo. ............................ ¡Error! Marcador no definido.
Figura 19. RCA Sound Tape Cartridge............. ¡Error! Marcador no definido.
Figura 20. Sanyo micro pack 35. ................... ¡Error! Marcador no definido.
Figura 21. Cartucho de 4 pistas. .................... ¡Error! Marcador no definido.
Figura 22. Cartucho de 8 pistas ..................... ¡Error! Marcador no definido.
Figura 23. Audio casete compacto.................. ¡Error! Marcador no definido.
Figura 24. Imagen de un cartucho Playtape en su empaque original. .... ¡Error!
Marcador no definido.
Figura 25. Microcasete. Fuente ...................... ¡Error! Marcador no definido.
Figura 26. Imagen comparativa de diversos cartuchos.¡Error! Marcador no
definido.
Figura 27. Corte transversal de una cinta magnética donde se observan las
diferentes capas que la conforman. .......... ¡Error! Marcador no definido.
Figura 28. Cintas magnéticas deformadas por exposición al calor ......... ¡Error!
Marcador no definido.
Figura 29. Consecuencias de la pérdida de aglomerante en un reproductor de
cintas de carrete abierto. ........................ ¡Error! Marcador no definido.
Figura 30. Cinta magnética con síndrome de sticky shed¡Error! Marcador no
definido.
Figura 31. Imagen que ilustra el tamaño relativo de las suciedades al espacio
entre la cinta y la cabeza reproductora...... ¡Error! Marcador no definido.
Figura 32. Imagen aumentada de un disco con polvo y suciedad. ......... ¡Error!
Marcador no definido.
Figura 33. Disco de vinilo con crecimiento de hongos en su superficie ... ¡Error!
Marcador no definido.
Figura 34. Cinta de acetato ........................... ¡Error! Marcador no definido.
Figura 35. Cinta de poliéster ......................... ¡Error! Marcador no definido.
Figura 36. Cinta mal rebobinada .................... ¡Error! Marcador no definido.
Figura 37. Maquina limpiadora de discos. ........ ¡Error! Marcador no definido.
Figura 38. Diagrama de bloques de sistema de captura de audio tipo sucio y
limpio................................................... ¡Error! Marcador no definido.
Figura 39. Sistema de captura de audio tipo sucio.¡Error! Marcador no
definido.
Figura 40. Sistema captura de audio tipo limpio.¡Error! Marcador no
definido.
Figura 41. Muestreo de una señal senoidal. ..... ¡Error! Marcador no definido.
Figura 42. PAM de una onda senoidal. ............ ¡Error! Marcador no definido.
Figura 43. Generación de PCM. ...................... ¡Error! Marcador no definido.
Figura 44. DAC externo. ............................... ¡Error! Marcador no definido.
Figura 45. Reproductores de discos analógicos. ¡Error! Marcador no definido.
Figura 46. Procedimiento de restauración digital para fonogramas. ....... ¡Error!
Marcador no definido.
Figura 47. Proceso de captura y almacenamiento digital de audio. ........ ¡Error!
Marcador no definido.
Figura 48. Proceso de reproducción de la señal digital restaurada. ........ ¡Error!
Marcador no definido.
Figura 49. Señal senoidal de 1 Hz muestreadas a diferentes resoluciones (k) y
frecuencias de muestreo (fm). ................. ¡Error! Marcador no definido.
Figura 50. Conector RCA. ............................. ¡Error! Marcador no definido.
Figura 51. Forma grafica del balanceo de señales de audio.¡Error! Marcador
no definido.
Figura 52. Conector ¼”. ............................... ¡Error! Marcador no definido.
Figura 53. Conector XLR (Cannon). ................ ¡Error! Marcador no definido.
Figura 54. Conectores de audio. a) RCA, b) ¼” y c) XLR macho hembra. ¡Error!
Marcador no definido.
Figura 55. Cables balanceados a balanceados. . ¡Error! Marcador no definido.
Figura 56. Cables No balanceados a balanceados.¡Error! Marcador no
definido.
Figura 57. Tipos de conversores de audio........ ¡Error! Marcador no definido.
Figura 58. Chips DSP de audio....................... ¡Error! Marcador no definido.
Figura 59. Análisis espectral de una pista de audio en Sound Forge. ..... ¡Error!
Marcador no definido.
Figura 60. Análisis tridimensional espectral de una pista de audio en Wavelab.
........................................................... ¡Error! Marcador no definido.
Figura 61. Funciones de transferencia de procesadores de rango dinámico.
........................................................... ¡Error! Marcador no definido.
Figura 62. Curvas de respuestas de filtros....... ¡Error! Marcador no definido.
Figura 63. Respuesta de ecualizador con 6 bandas de filtrado. ............. ¡Error!
Marcador no definido.
Figura 64. Ecualizador gráfico de Audition. ...... ¡Error! Marcador no definido.
Figura 65. Ecualizador paramétrico de Sound Forge.¡Error! Marcador no
definido.
Figura 66. Hardware de ecualizador grafico de audio.¡Error! Marcador no
definido.
Figura 67. Programa de restauración de audio de CEDAR.¡Error! Marcador no
definido.
Figura 68. Programa de restauración de audio de SONIC Solutions ....... ¡Error!
Marcador no definido.
Figura 69. Programa de restauración de audio de Steimberg Clean ...... ¡Error!
Marcador no definido.
Figura 70. Programa de restauración de audio de Waves.¡Error! Marcador no
definido.
Figura 71. Programa de restauración de audio de Bias, inc.¡Error! Marcador
no definido.
Figura 72. Detección de segmento con ruido. .. ¡Error! Marcador no definido.
Figura 73. Eliminación del ruido..................... ¡Error! Marcador no definido.
Figura 74. Sustitución del ruido. .................... ¡Error! Marcador no definido.
Figura 75. Señal de audio con clicks y señal restaurada.¡Error! Marcador no
definido.
Figura 76. Representación de un click en el tiempo y el espectro. ......... ¡Error!
Marcador no definido.
Figura 77. Señal de audio con thumps y señal restaurada.¡Error! Marcador
no definido.
Figura 78. Representación de thumps el tiempo y el espectro. ............. ¡Error!
Marcador no definido.
Figura 79. Diagrama de bloques de-thumping.. ¡Error! Marcador no definido.
Figura 80. Diagrama de bloques de de-clicking por algoritmos AR......... ¡Error!
Marcador no definido.
Figura 81. Diagrama de bloques de de-hissing por STSA¡Error! Marcador no
definido.
Figura 82. Diagrama de bloques de tecnología de sustitución.¡Error! Marcador
no definido.
Figura 83. Medios de almacenamiento a) ADAT, b) DAT y c) DDS. ........ ¡Error!
Marcador no definido.
Figura 84. Formato DASH ............................. ¡Error! Marcador no definido.
Figura 85. Disco MD..................................... ¡Error! Marcador no definido.
Figura 86. Formato CD. ................................ ¡Error! Marcador no definido.
Figura 87. Formato UMD............................... ¡Error! Marcador no definido.
Figura 88. Formato DD-CD............................ ¡Error! Marcador no definido.
Figura 89. Formato MO................................. ¡Error! Marcador no definido.
Figura 90. Formato SA. ................................ ¡Error! Marcador no definido.
Figura 91. Formatos DVD. ............................ ¡Error! Marcador no definido.
Figura 92. Formato DVD-RAM........................ ¡Error! Marcador no definido.
Figura 93. Formato SACD híbrido................... ¡Error! Marcador no definido.
Figura 94. Formato Blu-ray ........................... ¡Error! Marcador no definido.
Figura 95. Formato HD DVD.......................... ¡Error! Marcador no definido.
Figura 96. Fonoteca de la emisora de la Universidad Pontificia Bolivariana.
Colección de cintas magnéticas. ............... ¡Error! Marcador no definido.
Figura 97. Fonoteca de la emisora de la Universidad Pontificia Bolivariana.
Colección de discos. ............................... ¡Error! Marcador no definido.
Figura 98. Discos analógicos de audio de la emisora radio Bolivariana. .. ¡Error!
Marcador no definido.
Figura 99. Carretes abiertos de audio analógico de la emisora radio
Bolivariana............................................ ¡Error! Marcador no definido.
Figura 100. Conversor de audio y video DAC-100¡Error! Marcador no
definido.
Figura 101. Exposición introductoria a la restauración de audio. ........... ¡Error!
Marcador no definido.
Figura 102. Exposición de restauración de audio digital¡Error! Marcador no
definido.
Figura 103. Exposición de tecnologías de audio digital.¡Error! Marcador no
definido.
Figura 104. Cinta magnética de audio con síndrome de sticky shed ...... ¡Error!
Marcador no definido.
Figura 105. Fonógrafos. ............................... ¡Error! Marcador no definido.
Figura 106. Amberola................................... ¡Error! Marcador no definido.
Figura 107. Gramófonos ............................... ¡Error! Marcador no definido.
Figura 108. Grabadores y reproductores de alambre¡Error! Marcador no
definido.
Figura 109. Grabadores y reproductores de carrete abierto.¡Error! Marcador
no definido.
Figura 110. Tocadiscos.. ............................... ¡Error! Marcador no definido.
Figura 111 Tocadiscos óptico o láser. ............. ¡Error! Marcador no definido.
Figura 112. Grabador y reproductor de cartuchos RCA.¡Error! Marcador no
definido.
Figura 113. Sanyo Micro Pack 35. .................. ¡Error! Marcador no definido.
Figura 114. Grabadores y reproductores de cartuchos de 4 pistas......... ¡Error!
Marcador no definido.
Figura 115. Grabadores y reproductores de cartuchos de 8 pistas. a) Portátil,
b) De mesa, c) De automóvil ................... ¡Error! Marcador no definido.
Figura 116. Grabadores y reproductores de casete de audio compacto. . ¡Error!
Marcador no definido.
Figura 117. Playtape .................................... ¡Error! Marcador no definido.
Figura 118. Grabadores y reproductroes de microcasete..¡Error! Marcador no
definido.
Figura 119. Grabador y reproductor Elcaset..... ¡Error! Marcador no definido.
Figura 120. ADC/DAC móvil Audiophile USB. ... ¡Error! Marcador no definido.
Figura 121. ADC/DAC móvil FireWire Audiophile.¡Error! Marcador no
definido.
Figura 122. ADC/DAC móvil FireWire Solo. ...... ¡Error! Marcador no definido.
Figura 123. ADC/DAC móvil Waveterminal U24 ¡Error! Marcador no definido.
Figura 124. ADC/DAC móvil PHASE 26 USB. .... ¡Error! Marcador no definido.
Figura 125. ADC/DAC móvil PHASE 88 rack FireWire 751.¡Error! Marcador no
definido.
Figura 126. ADC/DAC móvil tipo rack MOTU 896HD.¡Error! Marcador no
definido.
Figura 127. ADC/DAC móvil tipo rack MOTU HD192.¡Error! Marcador no
definido.
Figura 128. ADC/DAC móvil ADI-2. ................ ¡Error! Marcador no definido.
Figura 129. ADC/DAC estático Delta 1010LT.... ¡Error! Marcador no definido.
Figura 130. ADC/DAC estático Delta 44 .......... ¡Error! Marcador no definido.
Figura 131. ADC/DAC estático Terratec phase 28¡Error! Marcador no
definido.
Figura 132. ADC/DAC estático PHASE 28. ....... ¡Error! Marcador no definido.
Figura 133. Grabador y reproductor ADAT....... ¡Error! Marcador no definido.
Figura 134. Grabador y reproductor DAT......... ¡Error! Marcador no definido.
Figura 135. Grabador y reproductor móvil DAT.¡Error! Marcador no
definido.
Figura 136. Grabador y reproductor portátil DAT¡Error! Marcador no
definido.
Figura 137. Grabador y reproductor interno DDS.¡Error! Marcador no
definido.
Figura 138. Grabador y reproductor externo DDS.¡Error! Marcador no
definido.
Figura 139. Grabador y reproductor DCC. ....... ¡Error! Marcador no definido.
Figura 140. Reproductor portátil DCC ............. ¡Error! Marcador no definido.
Figura 141. Grabador y reproductor MD. ......... ¡Error! Marcador no definido.
Figura 142. Grabador y reproductor móvil MD. ¡Error! Marcador no definido.
Figura 143. Grabador y reproductor portátil MD.¡Error! Marcador no
definido.
Figura 144. Reproductor de CD...................... ¡Error! Marcador no definido.
Figura 145. Grabador y reproductor de CD. ..... ¡Error! Marcador no definido.
Figura 146. Sega Saturn............................... ¡Error! Marcador no definido.
Figura 147. CD-I. ........................................ ¡Error! Marcador no definido.
Figura 148. PlayStation portátil. .................... ¡Error! Marcador no definido.
Figura 149. DD-CD RW................................. ¡Error! Marcador no definido.
Figura 150. Grabador y reproductor externo MO¡Error! Marcador no
definido.
Figura 151. Grabador y reproductor portátil SA.¡Error! Marcador no
definido.
Figura 152. Reproductor portátil SA. .............. ¡Error! Marcador no definido.
Figura 153. Grabador y reproductor de DVD .... ¡Error! Marcador no definido.
Figura 154. Reproductor de DVD. .................. ¡Error! Marcador no definido.
Figura 155. Reproductor portátil DVD ............. ¡Error! Marcador no definido.
Figura 156. PlayStation2. ............................. ¡Error! Marcador no definido.
Figura 157. Grabador y reproductor externo.... ¡Error! Marcador no definido.
Figura 158. Reproductor SACD. ..................... ¡Error! Marcador no definido.
Figura 159. PlayStation3. ............................. ¡Error! Marcador no definido.
Figura 160. Grabador y reproductor Blu-ray. ... ¡Error! Marcador no definido.
Figura 161. Grabador y reproductor HD DVD. .. ¡Error! Marcador no definido.
Figura 162. Señal AR ................................... ¡Error! Marcador no definido.
Figura 163. Estimación de la señal AR por la ecuación de Yule-Walker... ¡Error!
Marcador no definido.
Figura 164. Fase asociado a valores de frecuencia del modelo senosoidal.
........................................................... ¡Error! Marcador no definido.
Figura 165. Función de coste para marcos bayesianos.¡Error! Marcador no
definido.
Figura 166. Señal con ruidos impulsivos. ........ ¡Error! Marcador no definido.
Figura 167. Señal de detección eD .................. ¡Error! Marcador no definido.
Figura 168. Localización de 37 clikcs con umbral λ=66.81.¡Error! Marcador
no definido.
Figura 169. Localización del defecto a partir de la muestra k=419, entre las
muestras 417 y 428. .............................. ¡Error! Marcador no definido.
Figura 170. Resultado de la interpolación. ....... ¡Error! Marcador no definido.
Figura 171. Suma de señales senosoidales una exponencial que decae
exhibiendo una discontinuidad de ruido blanco.¡Error! Marcador no
definido.
Figura 172. Máximos locales de la CWT .......... ¡Error! Marcador no definido.
Figura 173. Proyección ortogonal para Matching Pursuit¡Error! Marcador no
definido.
Figura 174. Algoritmo de atenuación espectral. ¡Error! Marcador no definido.
LISTA DE TABLAS

Pag.
Tabla 1. Condiciones óptimas de almacenamiento de una cinta magnética.
........................................................... ¡Error! Marcador no definido.
Tabla 2. Tiempos de horneado de una cinta magnética.¡Error! Marcador no
definido.
Tabla 3. Problemas menores de las cintas magnéticas.¡Error! Marcador no
definido.
Tabla 4. Relación longitud de código y niveles de cuantización. ............ ¡Error!
Marcador no definido.
Tabla 5. Formatos de Plug-ins por DSP ........... ¡Error! Marcador no definido.
Tabla 6. Estándares de grabación de DAT. ...... ¡Error! Marcador no definido.
Tabla 7. Categorías de formatos DDS ............. ¡Error! Marcador no definido.
Tabla 8. Resumen del algoritmo de Kalman. .... ¡Error! Marcador no definido.
LISTA DE ANEXOS

Pag.
ANEXO A. Dispositivos reproductores y/o grabadores de audio analógico¡Error!
Marcador no definido.
ANEXO B. Conversores análogo-digital y digital-análogo de audio......... ¡Error!
Marcador no definido.
ANEXO C. Dispositivos reproductores y/o grabadores de audio digital ... ¡Error!
Marcador no definido.
ANEXO D. Formatos de compresión de audio con perdidas “Lossy” y audio
multicanal............................................ ¡Error! Marcador no definido.
ANEXO E. Algirtmos de modelación matemática de señales de audio, deteccion
de ruidos y restauración.......................... ¡Error! Marcador no definido.
ANEXO F. Anteproyecto ................................ ¡Error! Marcador no definido.
ANEXO G. Paper publicable ........................... ¡Error! Marcador no definido.
GLOSARIO

Aglomerante: en una cinta magnética, se refiere al componente que


mantiene unidas las partículas magnéticas a la base de poliéster.

Ancho de banda: diferencia entre las frecuencias máxima y mínima que


permite pasar un filtro pasabanda o un dispositivo cualquiera.

Audiophile: individuo que tiene un alto interés en el audio de alta calidad.

Bit: digito binario.

Blue Book: normatividad que rige los estándares técnicos de calidad del
formato CD+G

Buffer: porción de memoria aislada, presente en varios dispositivos


electrónicos para almacenar información de manera temporal de manera que
este pueda operar sin verse interferido por otro.

Byte: 8 bits.
Chipset: conjunto de circuitos integrados auxiliares necesarios por un sistema
para realizar una tarea. Este conjunto se encuentra presente en las Tarjetas
Madre de los computadores y determinan sus características técnicas como
puertos, capacidad de gráficos, capacidad de procesamiento de audio, etc.

Codecs: abreviatura de Compresor-Decompresor. Describe una especificación


implementada en software, hardware o una combinación de ambos, capaz de
transformar un archivo con un flujo de datos o una señal. Los codecs pueden
codificar el flujo o la señal (a menudo para la transmisión, el almacenaje o el
cifrado) y recuperarlo o descifrarlo del mismo modo para la reproducción o la
manipulación en un formato más apropiado para estas operaciones. Los códecs
son usados a menudo en videoconferencias y emisiones de medios de
comunicación.

Codificación de fuente: tiene como objetivo comprimir la información


generada por una fuente eliminando posibles redundancias. Hay dos grandes
grupos de métodos de codificación de fuente: en los denominados lossless, la
información generada por la fuente se conserva en su totalidad, de manera
que es posible recuperarla exactamente; en los llamados lossy, se sacrifica la
fidelidad estricta a la información original por con el objeto de obtener una
mayor tasa de compresión.

Codificación entrópica: codificación sin perdida de información e


independiente del tipo de información.

Codigo ASCII: American Standard Code for Information Interchange (Código


Estadounidense Estándar para el Intercambio de Información) es un código de
caracteres basado en el alfabeto latino tal como se usa en inglés moderno y
otras lenguas occidentales. Casi todos los sistemas informáticos de hoy en día
utilizan el código ASCII o una extensión compatible para representar textos y
para el control de dispositivos que manejan texto.
Define 128 códigos posibles, dividido en 4 grupos de 32 caracteres, (7 bits de
información por código), aunque utiliza menos de la mitad, para caracteres de
control, alfabéticos (no incluye minúsculas), numéricos y signos de puntuación.
Su principal ventaja, aparte de constituir un estándar, consiste en la
ordenación alfabética de los códigos.
Copyright: o derechos de autor. Es una forma de protección proporcionada
por las leyes vigentes en la mayoría de los países para los autores de obras
originales incluyendo obras literarias, dramáticas, musicales, artísticas e
intelectuales.

Declorización: fenómeno químico que ocurre cuando el PVC se descompone


en cloruro de hidrógeno.

Disco óptico: disco circular y plano usualmente construido en policarbonato y


un material especial (por lo general aluminio) donde se almacenan datos que
se accesan mediante la iluminación de este material especial con un láser.

Dither: ruido de bajo nivel (típicamente equivalente a un error menor que un


bit) agregado a una señal analógica previamente a su muestreo y
digitalización. Mejora cualitativamente el ruido de digitalización, eliminando
componentes similares a la distorsión que se producen en señales de bajo
nivel.

Dolby: sistema de reducción de ruido complementario utilizado en el registro


magnético. Actúa comprimiendo los agudos durante la grabación, y
expandiéndolo durante la reproducción. Existen tres variantes: Dolby A
(profesional), Dolby B (consumo) y Dolby C (intermedio).

Ecualización: acción de corregir o compensar la respuesta en frecuencia de


un sistema para hacerla mas plana.
Escaneo helicoidal: es una tecnología que ha incrementado, en gran medida,
la capacidad de las unidades compactas de cinta. Las tecnologías de grabación
tanto longitudinales como de exploración helicoidal se basan en principios de
magnetización para grabar datos en las cintas. Las diferencias básica
existentes entre ambas es el patrón con el que se graban los datos, y el
posicionamiento de los cabezales empleados para leer, escribir y borrar los
datos. La grabación longitudinal convencional registra una pista de datos en
forma recta a través del ancho de una cinta de pista única, limitada en tamaño
por el ancho de la cinta. La grabación por exploración helicoidal agrupa más
datos en la cinta, ubicando dicha cinta con un ángulo de 5 grados respecto de
los cabezales de grabación. Toda pista de datos es una diagonal de 3 pulgadas
de longitud. La cinta magnética empleada en las grabaciones por exploración
helicoidal debe ser de alta calidad.

Extensión: en informática, es el grupo de letras (generalmente tres) que


acompaña el nombre de un archivo y suele indicar el tipo de información que
guarda el archivo.

Ferrita: material cerámico ferromagnético, compuesto por hierro, boro y


bario, estroncio o molibdeno.
Las ferritas tienen una alta permeabilidad magnética, lo cual les permite
almacenar campos magnéticos con más fuerza que el hierro.

Ficheros: un archivo o fichero informático es una entidad lógica compuesta


por una secuencia finita de bytes, almacenada en un sistema de archivos
ubicada en la memoria secundaria de un ordenador. Los archivos son
agrupados en directorios dentro del sistema de archivos y son identificados por
un nombre de archivo. El nombre forma la identificación única en relación a los
otros archivos en el mismo directorio.

Firmware: o Programación en Firme, es un bloque de instrucciones de


programa para propósitos específicos, grabado en una memoria tipo ROM, que
establece la lógica de más bajo nivel que controla los circuitos electrónicos de
un dispositivo de cualquier tipo. Al estar integrado en la electrónica del
dispositivo es en parte hardware, pero también es software, ya que
proporciona lógica y se dispone en algún tipo de lenguaje de programación.
Funcionalmente, el firmware es el intermediario (interfaz) entre las órdenes
externas que recibe el dispositivo y su electrónica, ya que es el encargado de
controlar a ésta última para ejecutar correctamente dichas órdenes externas.

Flaking off: fenómeno físico que ocurre en las cintas magnéticas que consiste
en el desprendimiento de las partículas metálicas de su base.

Formato de propiedad: formato con derechos de autor o Copyright.

Frame: muestra temporal de una pista de audio.

Front side bus: canal de información de un procesador con los otros


dispositivos de un computador.

Goma Laca: material que se obtiene a partir de un líquido que segrega el


insecto Laca o Laccifer Lacca habitante de las selvas de Asma, India y
Tailandia.

Green Book: normatividad que rige los estándares técnicos de calidad del
formato CD-i.

Hardware: se denomina hardware o soporte físico al conjunto de elementos


materiales que componen un computador. En dicho conjunto se incluyen los
dispositivos electrónicos y electromecánicos, circuitos, cables, tarjetas,
armarios o cajas, periféricos de todo tipo y otros elementos físicos.
i.i.d.: en teoría de probabilidades, una secuencia de variables aleatorias es
independiente e idénticamente distribuida (i.i.d), si todas poseen la misma
distribución de probabilidad y son mutuamente independientes.

Inteligible: que puede ser entendido. Que se oye clara y distintamente.

Interfaz: conexión de un dispositivo electrónico con el exterior.


Intermodulacion: modulación mutua entre dos tonos senoidales.

iPOD: reproductor de música digital basado en un disco duro creado por Apple
Computer. Puede reproducir archivos MP3, WAV, AAC/M4A, AIFF y Apple
Lossless. La capacidad del disco duro es de hasta 60 GB.

Java: lenguaje de programación expresamente diseñado para usarse en el


entorno distribuido de Internet. Se diseñó para que se "pareciera" al lenguaje
C++, pero es más sencillo de usar que éste y obliga a una visión de la
programación completamente orientada a objetos.

Latencia: tiempo que transcurre entre el inicio y el final de una acción. En


audio digital, es el tiempo que transcurre entre el momento en que el
computador capta un sonido y lo reproduce.

LCD: visor de cristal liquido de muy bajo consumo.

Lenguaje C: es un lenguaje de programación creado en 1969 por Ken


Thompson y Dennis M. Ritchie en los Laboratorios Bell basándose en los
lenguajes BCPL y B. Al igual que sus dos predecesores, es un lenguaje
orientado a la implementación de Sistemas Operativos (los sistemas operativos
Linux y UNIX están escritos mayormente en C), pero se ha convertido en un
lenguaje de propósito general de los más usados.
Mac: es el nombre de una serie de computadores fabricados y comercializados
por Apple Computer desde 1984. Apple autorizó a otras compañías, como
Motorola, Umax o PowerComputing para la fabricación de clones Macintosh en
los 90, aunque en la actualidad sólo Apple comercializa computadores
Macintosh o Mac.

Mapear: localizar y representar gráficamente la distribución relativa de las


partes de un todo.
Masterización: es el proceso de limpieza y optimización final de cualquier tipo
de producción de audio antes de que ésta salga al Mercado.

Material ignífugo: material resistente al fuego.

Metadata: la literatura especializada define los Metadata o Meta Tags, como


"Datos acerca de los datos" o "información acerca de la información" . A través
de esta metodología es posible describir el contenido de un recurso de
aprendizaje. Otra definición es: información sobre objetos web, comprensible
por máquinas.

Los metadata proporcionan un buen método para controlar la forma en que los
sitios web son indexados por los motores de búsqueda. También mejoran la
opción de encontrar páginas con poco texto, como es el caso de sitios
construidos con "Frame".

Mylar: material construido a base de poliéster desarrollado por la compañía


Dupont. Muy empleado para la fabricación de cintas magnéticas.

Orange Book: documento publicado por Philips que contiene los estándares y
especificaciones técnicas de los formatos MO, CD-R, CD-RW.

PC: (Personal Computer). Término genérico utilizado para referirse a


computadores que son compatibles con las especificación de IBM.
Playback: reproducir un fonograma o pista de audio.

Playstation: consola de juegos creada por Sony en la decada de los 90. Fue
desarrollada por Sony después de fallar un acuerdo con Nintendo para
desarrollar un añadido para la consola Super Nintendo lamado SNES
PlayStation.

Plug-ins: un plug-in (o plugin) es un programa de computador que interactúa


con otro programa para aportarle una función o utilidad específica,
generalmente muy específica. Los plugins típicos tienen la función de
reproducir determinados formatos de gráficos, reproducir datos multimedia,
codificar/decodificar emails, filtrar imágenes de programas gráficos, entre
otras.

Se utilizan como una forma de expansión programas de forma modular, de


forma que se puedan añadir nuevas funcionalidades sin afectar a las ya
existentes ni complicar el desarrollo del programa principal.

Pro Tools: plataforma computacional para producción y edición digital de


audio desarrollada por Digidesign. Usada ampliamente en la televisión, el cine
y la industria de la música.

Purple Book: normatividad que rige los estándares técnicos de calidad del
formato DD-CD.

Rack: armazón modular metálico de ancho estándar sobre cuyos rieles


metálicos laterales se atornillan los diferentes procesadores, efectos, paneles
de conexionado y hasta pequeñas consolas previstas para ser montadas en el.

Rango dinamico: diferencia en dB entre los niveles máximo y mínimo de una


señal.
Red book: documento publicado por Philips y Sony que contiene los
estándares y especificaciones técnicas del formato CD.

SATA (Serial ATA): interface de transmision de información de mayor


velocidad que su predecesor, el ATA, para la transferencia de información
desde y a un disco duro.

SCSI (Small Computer System Interface): interface para transmisión de


datos en un computador mas rápida que la SATA. Usualmente utilizada para
conexión de discos duros.

Silica Gel: sustancia granular y porosa sintetizada a partir del silicato de sodio
que tiene la propiedad de absorber la humedad.

Síndrome de sticky shed: fenómeno químico que ocurre, debido a la


humedad, en las cintas magnéticas de poliéster que consiste en la degradación
del aglomerante volviéndolo pegajoso.

Síndrome de vinegar: nombre que recibe el síndrome de sticky shed en las


cintas de acetato.

Sintetizador: instrumento musical electrónico diseñado para producir sonido


generado artificialmente, usando técnicas como síntesis aditiva, substractiva,
de frecuencia modulada, de modulación física o modulación de fase, para crear
sonidos.

Sistemas Embebidos: computador de propósito especial que esta


completamente encapsulado en el dispositivo que controla.

Software: es la parte lógica del computador, esto es, el conjunto de


programas que puede ejecutar el hardware para la realización de las tareas de
computación a las que se destina. Es el conjunto de instrucciones que permite
la utilización del equipo.

Software de Código fuente abierto: software cuyo código fuente esta disponible
para cualquiera que desee verlo, extenderlo, desarrollarlo y mejorarlo.

Subarmónicos: es un tono que dispone de una relación interválica --respecto


a dicha nota-- que se ajusta a algún intervalo natural de los armónicos
(respecto su fundamental). Es decir, los subarmónicos de una nota son los
tonos de los cuales la nota se puede considerar armónico.

Surfactante: los surfactantes o tensoactivos son sustancias que disminuyen la


tensión superficial de un líquido. Cuando se utilizan en la tecnología doméstica
se denominan como emulgentes o emulsionantes; esto es, sustancias que
permiten conseguir o mantener una emulsión.
Entre los tensoactivos se encuentran las sustancias sintéticas que se utilizan
regularmente en el lavado, entre las que se incluyen productos como
detergentes para lavar la ropa, lavavajillas, productos para eliminar el polvo de
superficies, y champús.

Sustancia antifúngica: sustancia que evita el crecimiento y la proliferación


de hongos.

Ticks: impulsos de corta duración y baja amplitud. Normalmente relacionados


con los clicks.

TFT (Thin film transistor): o transistor de capa fina. Es un tipo especial de


transistor de efecto de campo donde sus contactos metálicos, su capa
semiconductora y su capa dieléctrica están hechos en capas muy delgadas.

TFT LCD: variante del LCD donde se utilizan TFTs proporcionando mayor
estabilidad a la imagen.
Video CD: CD que además de almacenar audio almacena imágenes y video.

White Book: documento publicado por Philips, Sony, Matsushita y JVC que
contiene los estándares y especificaciones técnicas del formato Video CD.

Yellow Book: documento publicado por Philips y Sony que contiene los
estándares y especificaciones técnicas del formato CD-ROM. Fue la primera
extensión del Red Book.

Zoom: término utilizado para definir el factor de ampliación o reducción con el


que se visualiza un objeto. Normalmente se expresa en porcentajes, donde el
100% es el tamaño real.
RESUMEN

La restauración de audio es una disciplina que abarca tópicos que hace


articulaciones entre la física y el audio. Para entender claramente el proceso de
restauración de audio es necesario, inicialmente, abordar conceptualmente la
teoría ondulatoria para identificar los parámetros asociados con algunas
características de la percepción musical.

El proceso de la restauración de audio ha pasado por muchas etapas y, a lo


largo de la historia, se han creado diversos mecanismos para contrarrestar el
ruido de las grabaciones analógicas y mejorar la calidad del sonido grabado.
Sin embargo, nunca se había estado tan cerca de la perfección como ahora, en
una época en la que el audio digital, los formatos digitales y la computación,
con sus programas de restauración digital de audio, proveen de poderosas e
ilimitadas herramientas para terminar definitivamente con las imperfecciones
del audio analógico. Es claro que esta perfección no sería posible si no se
toman una serie de acciones correctivas, previas a la digitalización, sobre los
medios analógicos y si la humanidad no hubiera contado con los grandes
genios que han desarrollado los modelos matemáticos en los que descansan
todos los algoritmos de restauración de señales presentes en los programas de
restauración digital de audio.
34

INTRODUCCIÓN

Desde finales de 1800, época en la que comenzó una nueva era en el mundo
musical, la investigación referida al tema del audio se ha centrado
principalmente en dos aspectos: el desarrollo de métodos que permitan
registrar el sonido lo más parecido al original (originalidad y fidelidad), y el
desarrollo de mecanismos que permitan escucharlo con una calidad tal cual fue
grabado. Estos dos aspectos han generado, dentro de la ciencia que es el
audio, múltiples disciplinas, entre ellas la restauración del audio. Esta disciplina
se viene aplicando empíricamente desde la aparición del primer mecanismo
para registrar sonidos: el fonógrafo.

A partir del momento en que Thomas Alva Edison presentó su cilindro de cera
con tecnología de grabación en surco, se dio comienzo a una nueva tecnología
cuyo primer objetivo, logrado por Edison, fue plasmar sonidos en un medio o
soporte físico para ser escuchados posteriormente. Cuando llegó a concebirse
que éste era un avance tecnológico totalmente nuevo, significó la oportunidad
de desarrollar el mundo musical, pero, como toda tecnología que se respete,
también representó un gran desafío para la industria que ella misma generó.

En una época en que la Ingeniería de Materiales no había nacido, los medios


utilizados para registrar el sonido presentaban una serie de limitaciones
constructivas que los hacían vulnerables y estaban muy propensos a la
destrucción y desgaste. Sin embargo, esto no fue un inconveniente para que
35

esta industria progresara, ya que a la humanidad, dichosa y expectante, con lo


que esta nueva era representaba, sólo le importaba escuchar su voz o la
genialidad de Mozart y los grandes genios del mundo de la música en cualquier
momento. Esto dio fuerzas y permitió el desarrollo de nuevos métodos de
grabación y reproducción y otras formas de almacenamiento, unas mejores
que otras, o más exitosas, pero todas con alguna innovación respecto a la
anterior y con el mismo propósito: almacenar y reproducir el mejor sonido.

La primera evolución de estos métodos de grabación y reproducción, fue el


disco de ebonita, también con tecnología de grabación en surco, muy aceptado
pero aún muy frágil química y físicamente. Posteriormente, surgió la grabación
en alambre, cuyo principio de grabación magnético dio pie al desarrollo de la
cinta magnética, en la que ésta terminó convirtiéndose en la mejor forma de
almacenar sonido junto con la última evolución del disco de surco: el de vinilo.
Estos métodos de grabación, basados en la impresión de la onda de audio
sobre el medio, es lo que se conoce como Grabación analógica. Este tipo de
grabación fue la forma predominante de grabar audio durante muchos años, a
pesar de que sus soportes se destruían fácilmente, se perdía su información y
contenía ruidos indeseados, hasta que llegó el audio digital, el “audio
perpetuo”, y con él, el sendero óptimo de la digitalización.

La era digital le abrió al audio las puertas de la eternidad, la fidelidad y la


limpieza mediante su digitalización y tratamiento digital, procedimientos que
permiten, a través de una sucesión de elementos perfectamente sincronizados,
tomar una caduca señal analógica y convertirla en una saludable señal digital
mediante su restauración.

La restauración digital de audio es un procedimiento complejo que implica


considerar unas medidas, tanto desde el punto de vista físico como digital,
36

antes y después del tratamiento, con el fin de obtener un resultado óptimo y


duradero.

Desde lo físico, las consideraciones que deben asumirse permiten una


identificación del medio que se va a restaurar, sus características técnicas y
constructivas, así como la posibilidad de ejecutar sobre él una restauración
física. La cual, si el medio lo permite, debe ser llevada a cabo con sumo
cuidado, ya que del excelente mecanismo de esta etapa dependen la eficiencia
del tratamiento digital y, obviamente, sus resultados.

En lo que respecta a lo digital, las consideraciones están enmarcados dentro de


lo técnico, ya que implican la identificación de parámetros que influyen
directamente en la calidad del audio digitalizado y la correcta selección de los
dispositivos de captura que, de acuerdo con las necesidades, pueden presentar
características constructivas y especificaciones técnicas muy diferentes.
También en este nivel, se encuentra el proceso de restauración digital a cargo
de los programas de edición gráfica de audio, que son los encargados, por
medio de poderosos algoritmos matemáticos que utilizan predicciones
probabilísticas, de detectar los ruidos indeseados y reconstruir la señal de
audio original. Además, tiene la posibilidad de agregar efectos con el fin de
optimizar y enriquecer el sonido.

Finalmente, se debe recordar que es de suma importancia la selección del


equipo que se encargará de almacenar y procesar el audio digitalizado y
restaurado, ya que debe cumplir con unas especificaciones mínimas para
garantizar un efectivo proceso de restauración, almacenamiento y traslado de
la señal restaurada a un medio digital externo, con especificaciones técnicas
superiores y características constructivas mucho más estables que los frágiles
medios analógicos.
37

Todo este proceso sobre la señal de audio es precisamente lo que se intenta


ilustrar y analizar en este trabajo, recorriendo en forma secuencial el
procedimiento de la restauración digital, desde la identificación del problema
para proseguir con la formulación de la solución y, posteriormente, ejecutar las
acciones adecuadas, las cuales incluyen la captura, el almacenamiento, el
tratamiento digital y la reproducción de la señal.

Adicionalmente, para facilitar la comprensión de todo el procedimiento, se


recurre, inicialmente, a la aclaración de algunos conceptos referentes al audio
y a su restauración.

En términos pedagógicos, vale la pena agregar que se han utilizado una serie
de imágenes y gráficas, con el objeto de hacer mayor claridad en unos
procesos que tienen un alto grado de complejidad en su descripción, y que
permiten, entonces, complementar cada una de las etapas que están
implicados en cada proceso descrito. Vale la pena resaltar que se han hecho
algunas recomendaciones de marcas de equipos con el objeto de permitir la
selección de quienes tienen la tarea fundamental y delicada de trabajar
profesionalmente con el sonido. No hacemos tales recomendaciones con otro
fin.

Finalmente, se brindó apoyo a la emisora de la Universidad Pontificia


Bolivariana, Radio Bolivariana, como uno de los principales objetivos de este
trabajo de grado, ya que esta se encuentra actualmente en una etapa de
transición entre el audio analógico y el digital y comenzando un proyecto de
restauración del audio de su fonoteca analógica.
38

1. CONCEPTOS DE SONIDO Y RESTAURACIÓN DE AUDIO

1.1. PRINCIPIOS BÁSICOS DE AUDIO

El propósito fundamental de este capítulo es definir denotativamente cada uno


de los conceptos que determinan, en un área del saber, los comportamientos y
características del sonido y su restauración. Es pertinente aclarar que estos
conceptos se definen para que haya una mayor comprensión del tema por
parte del lector.

Dentro de los principios básicos de audio es preciso comenzar con el concepto


de onda y sus tipologías. Se verá, entonces, su definición más básica:

1.1.1. Onda. Una onda es una perturbación que se propaga en un medio


material o en el vacío. Sin importar la naturaleza de tales perturbaciones, las
ondas tienen un comportamiento similar. La teoría general sobre ondas se
emplea para describir el sonido e, igualmente, los fenómenos sonoros permiten
entender más claramente la teoría general de ondas.

Para propagarse, algunas ondas precisan de la existencia de un medio material


que cumpla con la función de soporte de la perturbación; éstas,
genéricamente, se denominan ondas mecánicas. El sonido es un tipo de onda
mecánica que se propaga únicamente en presencia de un medio elástico que
soporta la perturbación. Las ondas que se forman en la superficie del agua y
las ondas en cuerdas, son ejemplos claros de lo que se denomina ondas
mecánicas y corresponden a compresiones, deformaciones y, en general, a
39

perturbaciones del medio en el que se propagan por medio del mismo.


También existen ondas que pueden propagarse en ausencia de un medio
material, es decir, en el vacío. Son las ondas electromagnéticas o campos
electromagnéticos; a esta segunda categoría pertenecen las ondas luminosas.

Independientemente de su naturaleza, existen algunas características que son


comunes a todas las ondas, y que en conjunto definen el llamado
comportamiento ondulatorio.

1.1.2. Tipos de ondas

1.1.2.1. Monodimensionales. Son aquellas que se propagan en el espacio


a lo largo de una sola dirección.

1.1.2.2. Bidimensionales. Se propagan en cualquiera de las direcciones de


un plano de una superficie. Se denominan también ondas superficiales.

Atendiendo a la periodicidad de la perturbación local que las origina, las ondas


se clasifican en:

Periódicas. Corresponden a la propagación de perturbaciones de


características periódicas como vibraciones u oscilaciones, las que suponen
variaciones repetitivas de alguna propiedad.

No periódicas. La perturbación que las origina se da aisladamente en el


tiempo y en el caso de que se repita, las perturbaciones sucesivas tienen
características diferentes. Las ondas aisladas se denominan también pulsos.
40

De acuerdo con que la dirección de propagación coincida o no con la dirección


en la que se produce la perturbación, las ondas pueden ser:

Longitudinales. El movimiento del medio alcanzado por la perturbación se


efectúa en la dirección de avance de la onda. El sonido es un ejemplo de una
onda no periódica longitudinal.

Transversales. La perturbación del medio se lleva a cabo en dirección


perpendicular a la de propagación.

1.1.3. Algunos parámetros. Para avanzar en el estudio del sonido, es


conveniente repasar las características de la oscilación más sencilla. En la
figura 1, se puede apreciar una onda senoidal. Algunos elementos que
caracterizan estas ondas son:

1.1.3.1. Periodo. (T) El periodo es el tiempo T que tarda la onda en


recorrer un ciclo, es decir, lo que se demora para volver a su posición inicial.
Cuando la onda se repite, se dice entonces que la onda es periódica.

1.1.3.2. Frecuencia. (f) Es el número de veces o ciclos que se presentan


por unidad de tiempo (número de veces que la onda se repite por segundo).
En otras palabras, la frecuencia es la rapidez con la que la onda se repite por sí
misma.

La frecuencia y el período están relacionados por las siguientes expresiones:

f=1/T [=] Herz (1.1)


41

T=1/f [=] Segundos (1.2)

1.5

Cresta
1

0.5 Nodo
Amplitud

-0.5
T

-1

Valle
-1.5
0 10 20 30 40

Tiempo (seg)

Figura 1. Onda senoidal.

La frecuencia se mide en ciclos/segundos o, mejor, en Hertz, que es la unidad


que se ha adoptado internacionalmente y que corresponde a una unidad
estándar en el ámbito global.

1.1.3.3. Fase. ( ϕ ) Mide la cantidad de ciclo de señal que ha transcurrido a

partir de un instante de tiempo de referencia cualquiera. La fase se mide


generalmente en grados (º), y va desde los 0º hasta 360º.
42

1.1.3.4. Longitud de onda. ( λ ) En una onda periódica es la distancia entre


dos puntos idénticos de la onda. Por ejemplo, entre dos crestas consecutivas,
dos valles consecutivos o dos nodos no consecutivos. La longitud de onda se
mide generalmente centímetros o metros.

1.1.3.5. Amplitud. (A) Es el máximo valor que puede alcanzar la señal en el


eje vertical. La amplitud puede ser tomada positiva o negativamente. La
amplitud se mide normalmente para audio en voltios o decibeles.

1.1.3.6. Rapidez de la onda. (V) Es la magnitud de la velocidad de


propagación de la onda, la cual depende únicamente de las características del
medio y del tipo de onda, pues las ondas electromagnéticas son
independientes del medio de propagación.

1.1.4. Sonido. Sensación producida en el órgano del oído por el movimiento


vibratorio de los cuerpos y trasmitido por un medio elástico, como el aire.

El sonido está compuesto por ondas sonoras. Éstas tienen la virtud de


estimular el oído humano por medio de vibraciones y generar la sensación
sonora en nuestro cerebro. Estas vibraciones se propagan a través de un
medio elástico (el aire) y se producen por el desplazamiento de las moléculas
del aire causado por la acción de una presión externa o perturbación. Cada
molécula trasmite la vibración a la que está a su lado, provocando un
movimiento en forma de avalancha. De lo anterior, se puede inferir, entonces,
que el sonido es el resultado de estos desplazamientos.
43

1.1.4.1. Ondas de presión sonora. El oído es un órgano capacitado para


detectar cambios en la presión del aire. El sonido llega al oído en forma de
aumentos y disminuciones de tal presión. Estos aumentos y disminuciones son
repetitivos y se conocen con el nombre de ondas de presión sonoras. Cualquier
objeto real, es decir, que exista en el plano tangible, puede ser el origen de la
perturbación del aire que consiste en el aumento o la disminución en la presión
del mismo. La perturbación que este objeto realiza cuando vibra, involucra el
movimiento de las moléculas contenidas en el aire. El resultado de este
movimiento es la transmisión de energía acústica de un lugar a otro. Las ondas
de presión sonora comienzan a propagarse a medida que las moléculas
comienzan a moverse desde la fuente.

1.1.4.2. Características del sonido. El sonido puede describirse en su


totalidad especificando tres características de su percepción: el tono, la
intensidad y el timbre. Estas características corresponden exactamente a tres
características físicas: la frecuencia, la amplitud y la composición armónica,
contenido espectral o forma de onda. Para hacer una explicación simple de
tales conceptos puede decirse que la intensidad, que depende de la amplitud,
distingue un sonido fuerte de uno débil; el tono depende de la frecuencia, y
distingue un sonido agudo (tono alto) de otro grave (tono bajo); y el timbre,
que depende de la forma de la onda, distingue dos sonidos de la misma o
diferente intensidad y del mismo tono, pero producidos por distintas fuentes ya
que tienen distintos contenidos en sus armónicos.

Para ilustrar más claramente estas definiciones, se puede utilizar un ejemplo


sencillo: dos cantantes pueden interpretar la misma melodía en el mismo tono
y con la misma intensidad, pero no con igual timbre de voz.
44

Compresión y rarefacción. Las regiones donde un gran número de


moléculas se agrupan y se articulan entre sí se llaman compresiones o
regiones de alta presión. Las regiones cuya presencia de moléculas es escasa
se conocen como rarefacciones o regiones de baja presión.

Cuando las ondas de presión sonora comienzan a propagarse, a medida que


las moléculas se empiezan a mover desde la fuente, las moléculas pasan la
energía de una a otra originando una reacción en cadena por los continuos
choques entre ellas. Estos choques involucran dos pasos en un ciclo, que son la
compresión y la rarefacción.

Frecuencia y altura. Cuando una onda de presión sonora pasa por el proceso
de compresión-rarefacción se dice que ha completado un ciclo de movimiento
o vibración. El número de ciclos o vibraciones que realiza una onda de presión
sonora en un segundo, es lo que se conoce con el nombre de frecuencia y ésta
es una característica física del sonido. El Hertzio o Hertz (Hz) es la unidad de
medida de la frecuencia y describe la relación entre el número de ciclos de
compresión–rarefacción que ocurre en un segundo. Para los seres humanos
esta característica física está asociada con la altura de un sonido que, en
términos cualitativos simples, puede definirse como lo grave o lo agudo del
mismo. Así, una onda de altura grave tiene un número de ciclos por segundo
menor que una onda de altura aguda.

Número de ciclos/ Tiempo [=] Hertzio o Hertz (Hz.) (1.3)


El oído humano puede percibir frecuencias en un rango de 20 hasta 20.000 Hz,
aproximadamente. Este rango audible de las frecuencias que pueden ser
detectadas por el oído humano, está dividido en diez partes llamadas octavas.
Cada octava es la relación tonal de 2 a 1 entre dos frecuencias. Es decir, una
relación del doble del valor de una de ellas. Por ejemplo, entre 20 y 40 Hz
45

existe una octava (20 multiplicado por 2, da como resultado 40 Hz), entre 40 y
80 Hz existe otra octava (40 multiplicado por 2, da como resultado 80 Hz). Las
frecuencias correspondientes a las primeras cuatro octavas (20 a 320 Hz)
hacen parte de lo que se denomina el rango de las frecuencias bajas o bajos.
Las frecuencias correspondientes a las segundas cuatro octavas (320 a 5.120
Hz) hacen parte de lo que se conoce como el rango de las frecuencias medias o
medios. Las frecuencias correspondientes a las dos últimas octavas (5.120 a
20.460 Hz) hacen parte de lo que se conoce como el rango de las frecuencias
altas. En la siguiente figura se observa la relación de octavas utilizando
algunos instrumentos musicales.

Amplitud y volumen. Como se mencionó anteriormente, cuando una onda


de presión sonora pasa por el proceso de compresión-rarefacción, se dice que
ha completado un ciclo de movimiento oscilatorio o vibración. Pero no sólo
ocurre esto, pues también hay un determinado número de moléculas que son
desplazadas. Este número de moléculas desplazadas depende de la intensidad
de la vibración. La intensidad es directamente proporcional al número de
moléculas desplazadas. La cantidad de moléculas desplazadas determina, por
lo tanto, el tamaño de la onda, que es lo que se conoce con el nombre de
amplitud. Esta característica física del sonido está asociada subjetivamente con
la percepción de lo que comúnmente se conoce como volumen.
46

Primera Segunda Tercera Cuarta Quinta Sexta Séptima Octava Novena Déc ima
Octava octava octava oct ava octava octava octava octava octava octava

20 40 80 160 320 640 1280 2560 5120 10240 20460

Frecuencias Bajas Frecuencias Medias Frecuencias Altas

Guitarra eléctrica

Platos
Voz humana
Violonchelo
Tuba

Tumbadora Trompeta

Figura 2. Octavas con imágenes de instrumentos musicales.


Fuente: Música. Galería de imágenes de ABCMúsicos. [en linea]. s.l.: ABCMúsicos, s.f.
<http://www.abcmusicos.com/modules.php?name=coppermine>
[consulta: 10 Mar. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

El Decibelio o Decibel (dB) es una medida adimensional del valor relativo que
se asigna a una señal para cuantificar su amplitud. Este valor expresa la
relación de dos valores o cantidades de igual naturaleza (niveles de presión
sonora, niveles de potencia, niveles de voltaje) donde uno de ellos sirve de
base de cálculo o referencia. El audio esta comprendido entre 0 y 130 dB.

Velocidad. La velocidad de la onda describe la rapidez con la que ésta se


mueve en un medio determinado. Para las ondas de presión sonora, el medio
en el cual se mueve está constituido por las moléculas de aire. Las variaciones
en la temperatura del aire inciden en la densidad del mismo y tienen un efecto
47

sobre la velocidad de las ondas de presión sonora. Dicho efecto se puede


calcular a partir de la expresión:

γPo
V= (1.4)
ρo

Donde:
γ es el índice adiabático del gas.
Po es la presión.
ρo es la densidad.

Si el medio elástico es el aire entonces:

γ = 1.4
Po = 1.013x105 Pa
ρo = 1.293 Kg/m3

Se obtiene para la velocidad de propagación del sonido en el aire: V= 331 m/s.

Longitud de onda. Es la distancia que existe entre el comienzo y el final de


un ciclo de compresión-rarefacción. Ésta puede ser calculada por la relación
entre la velocidad de una onda de presión sonora y la frecuencia de la misma,
como se establece en la siguiente ecuación:

λ = V F [=] metros (1.5)


48

Donde:
λ (Lambda) es la longitud de onda expresada en metros.
V es la velocidad del sonido en el aire a 23 grados centígrados (que es igual a
344 metros por segundo).
F es la frecuencia expresada en Hz.

Fase. Es la diferencia de tiempo que existe entre dos ondas de presión sonora
en un punto dado del ciclo de compresión-rarefacción en el que ocurren. Para
entender este fenómeno, se supone una onda senoidal como la onda de
presión sonora más sencilla, pudiendo ser dividida en intervalos que ocurren
con regularidad. Estos intervalos son medidos en grados. En la primera parte
del ciclo, se tiene (en el punto de arranque de la onda de presión sonora) una
compresión nula, y por tanto, una amplitud nula. Este punto se referencia a 0
grados. La máxima compresión y amplitud se presenta a los 90 grados. La
rarefacción y, por ende, la amplitud, vuelven a ser nulas en 180 grados.

En 270 grados se obtiene una máxima rarefacción y amplitud pero en sentido


negativo. En 360 grados se completa el ciclo de movimiento y se verifica una
amplitud nula. Si dos ondas coinciden en su punto de arranque y
desplazamiento se dice que están en fase. De no ser así, entonces se dice que
están en desfase. A continuación en la figura 3 se pueden observar las zonas
de compresión y rarefacción de una onda senoidal.

El estudio del sonido ha adquirido un carácter multidisciplinar porque abarca


varios campos de la física, tiene desarrollos teóricos y prácticos de gran
relevancia, que lo proyectan hacia una ciencia de la ingeniería. Este aspecto es
de suma importancia para nuestro trabajo ya que pone de relieve su vigencia
en el campo que nos compete.
49

1.5
1 ciclo o
Compresión período
1
Amplitud(Volt)

0.5

270º
0 90º 180º 360º

-0.5

-1
Rarefacción

-1.5
0 10 20 30 40

Tiempo o wt (Radianes)

Figura 3. Amplitud y frecuencia de una onda sonora.

1.1.4.3. Campos de investigación

En este apartado se intenta hacer algunos acercamientos teóricos por


investigaciones previas que pueden tener aplicabilidad en varios campos
interdisciplinarios e integrales de nuestro saber específico.

Acústica física. Estudia las características y propiedades de las


vibraciones sonoras audibles (20 a 20.000Hz), sus tipos y los diferentes
medios por los que se propaga. Como una extensión de la acústica física
se estudian también otras vibraciones como las que se describen a
continuación:
50

• Vibraciones ultrasónicas. Son las que presentan frecuencias por


encima del umbral de sensibilidad humana, es decir, frecuencias
mayores a los 20.000 Hz.

Algunas de sus aplicaciones se evidencian en medicina (terapia y


ecografía), en oceanografía (medición de profundidades, detección de
iceberg, funcionamiento del sónar, entre otras).

• Vibraciones infrasónicas. Son las que presentan frecuencias por


debajo del umbral de sensibilidad humana, es decir, frecuencias
menores de 20 Hz.

Algunas de sus aplicaciones están orientadas a la atenuación o


eliminación de frecuencias perjudiciales para la salud.

Las fuentes generadoras de vibraciones infrasónicas son de dos tipos:


fuentes artificiales como motores, sistemas de ventilación y sistemas
de calefacción y fuentes naturales como tormentas, terremotos,
fuertes vientos y, en general, todo fenómeno que suponga movimiento
de grandes masas

Se ha descubierto que los infrasonidos de baja intensidad provocan


mareos, náuseas y vómitos, los infrasonidos de alta intensidad
producen fricciones entre los órganos internos que pueden producir
hemorragias internas.

Acústica fisiológica y psicoacústica. Estudian las características y el


comportamiento del oído humano y de las cuerdas vocales; las reacciones
del hombre respecto al estímulo sonoro y los criterios psicoacústicos para
la ponderación de la sonoridad y nocividad del sonido (audiometría). En
51

este campo se incluye el estudio del ruido y su influencia en el organismo


humano.

Electroacústica. Trata del diseño de los transductores


electromecánicos, de las técnicas de conversión mutua de energía
eléctrica en mecánica y de los sistemas de registro y reproducción del
sonido. La tecnología de la alta fidelidad es una aplicación de la
electroacústica. Con ella se consigue una reproducción sonora de
excepcional calidad.

Acústica arquitectónica. Se encarga, específicamente de la absorción y


aislamiento del sonido en ambientes cerrados como en los edificios. Busca
la prevención del eco y el control de los efectos de reverberación en los
auditorios y salas de música.

Acústica musical. Estudia las leyes de las combinaciones armónicas de


las vibraciones sonoras producidas por generadores mecánicos y
electrónicos, lo que comúnmente es llamado como instrumentos
musicales, incluida la voz humana.

Lingüística y fonética. Estudian la estructuración del lenguaje, los


formantes del sonido y la producción de la palabra, mediante
sintetizadores1.

1
CARRETERO MONTERO, Alfonso. Sistemas de sonido: definiciones de sonido y
campos que lo estudian [en linea]. s.l. ALFOCAMO WEB, 1999, actualizada 9 Sep. 2004
<http://www.terra.es/personal/alfocamo/Sonido.htm> [consulta: 12 Mar. 2005]
52

1.2. HISTORIA DE LA TECNOLOGÍA DE GRABACIÓN

Se considera oportuno, y muy pertinente, hacer un recorrido histórico por los


aspectos más relevantes del mundo de la tecnología de la grabación, pues es
un aspecto muy significativo ya que se trata de un tema que no nació por
generación espontánea, es decir, existen unos datos, unos paradigmas y,
sobre todo, unos acontecimientos históricos que han determinado el
conocimiento humano.

Thomas Alva Edison inventó el fonógrafo, primer ingenio capaz de grabar y


reproducir en formato analógico el sonido, cuyo desarrollo abrió nuevas
posibilidades en el campo de la comunicación. Desde entonces, muchos
esfuerzos se han hecho para encontrar los mejores caminos para grabar y
reproducir sonidos. A mediados de los años veinte, apareció el primer
grabador eléctrico y gradualmente las grabaciones electroacústicas.

El desarrollo de las computadoras, la invención de los transistores, a mediados


de los cincuentas, del microprocesador en los tempranos setentas, junto con la
habilidad de grabar los datos en medios magnéticos u ópticos, culminó en la
estandarización del formato del CD (Compact Disc) o disco compacto en 1980.

Hoy en día, con la tecnología digital disponible, es posible implementar


aplicaciones especializadas de audio. Por ejemplo, ésta es usada para mejorar
la calidad de modernas y antiguas técnicas de grabación y reproducción.
53

1.2.1. La Historia. En 1877 Thomas Alva Edison (1847-1931) creó un


aparato capaz de transformar la energía acústica en mecánica: el fonógrafo.
Los sonidos se grababan en un cilindro de cera; para escucharlos, una aguja,
unida a un audífono de considerable diámetro, debía recorrer los surcos para
recoger las ínfimas vibraciones allí escritas. Para hacer más comprensible este
sistema, hemos recurrido a la figura 4 que corresponde al fonógrafo de Edison.
En 1888, Emile Berliner (1851-1921) terminó su gramófono, este sistema no
se diferencia mucho en cuanto a los principios (aguja vibrante que transmite
vibración a un diafragma), pero incorpora una gran modificación, que posibilita
la comercialización masiva. Se trata del disco plano con surco en espiral. Estos
discos se prensaban sobre ebonita (una goma endurecida) y, aunque eran
menos costosos que los cilindros de cera, no alcanzaban la calidad sonora de
éstos, por lo que tomó un tiempo y algunos ajustes masificarlo.

Oberlin Smith publicó una descripción de un sistema de grabación magnética


en la edición de Sep. 8 de 1888 de Electrical World, basado en su propia visita
al laboratorio de Edison, 10 años antes. En la figura 5 se ve el sistema de
grabación magnética de Oberlin.

Su idea estaba basada en un electroimán y una cuerda cubierta de limaduras


de hierro. Probablemente haya construido un prototipo funcional, pero ninguno
ha sobrevivido hasta ahora.

La palabra hablada es traducida en señal eléctrica a través del micrófono A,


que es transmitida al sustrato C mediante la cabeza de grabación B. F Batería,
E carrete receptor, D carrete de entrega, J freno del carrete. Esta fue la
primera forma de grabación en alambre de acero.
54

Figura 4. Fonógrafo de Edison.


Fuente: Restauración de audio. Proceso de señales y aplicaciones en la restauración de
registros sonoros: las tecnologías de registro y reproducción de las señales sonoras.
[en linea]. Oviedo: Universidad de Oviedo, s.f.
<http://coco.ccu.uniovi.es/brahms/tecnologiasregistro/tecnologiasregistro.htm>
[consulta: 25 Feb. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás
55

D B
C
J E
F

Figura 5. Sistema de Oberlin.


Fuente: CABEZAS G, Alonso. Apunte reunificado de grabación de sonido: grabación de
sonido [en linea]. s.l. s.n. 2003 <http://z.tardis.cl/sd/ap_grab_1y2.fh11.pdf>
[consulta: 9 Feb. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

El principio fue redescubierto con bastante mayor éxito por Valdemar Poulsen
en 1894, empleado del telégrafo de Copenhagen. Éste, el telegráfono de
Poulsen, se puede considerar el primer modelo exitoso de un sistema de
grabación magnética de audio. Al expirar la patente de Poulsen, en 1918, se
abrió la posibilidad para que en Alemania se alcanzaran sucesivos desarrollos,
para culminar, en 1928, con la fórmula patentada por Fritz Pfleumer para
recubrir papel u otra cinta con polvo ferromagnético, dando origen al desarrollo
de la cinta magnética. Con este nuevo avance tecnológico, la empresa alemana
AEG decide, en 1930, comenzar a desarrollar el magnetófono basado en el
principio de Pfleumer. Dos años más tarde, BASF, industria alemana pionera en
la fabricación de polímeros y material ferromagnético, llega a un acuerdo con
AEG para la fabricación del formato que se reproduciría en su magnetófono, y
así, en 1934, BASF fabrica una cinta magnética con base en acetato de
celulosa con partículas de óxido férrico, y con ésta, la primera distribución
masiva de cinta magnética. Este es el magnetófono AEG-BASF.
56

Figura 6. Magnetófono AEG-BASF.


Fuente: CABEZAS G, Alonso. Apunte reunificado de grabación de sonido: grabación de
sonido [en linea]. s.l. s.n. 2003 <http://z.tardis.cl/sd/ap_grab_1y2.fh11.pdf>
[consulta: 9 Feb. 2005]

A pesar de estos progresos, hasta la segunda guerra mundial no se


perfeccionaron los procedimientos mecánico y magnético. Luego dio lugar al
nacimiento de los discos de vinilo de los 16, 33 1/3 y 45 revoluciones por
minuto (1948, disco de microsurcos de larga duración; 1958, disco
estereofónico). Para la grabación se emplea un disco de aluminio recubierto de
acetato y un buril (rubí tallado) que se desplaza de acuerdo con las vibraciones
sonoras. En 1965, apareció la cinta magnética, con distintos formatos. Hoy en
día, para la grabación del sonido, se emplean esencialmente dos técnicas: la
grabación por rayo láser y el procedimiento magnético.

El proceso de transformación de energía acústica en mecánica y magnética se


basaba en un procedimiento analógico. Las vibraciones producidas por los
sonidos eran representadas por surcos y niveles de imantación, cuyas
variaciones eran semejantes a las de los sonidos percibidos. En micrófonos y
altavoces hubo enormes progresos.
57

En los sistemas digitales se toman muestras del sonido hasta de 192.000


veces por segundo. La forma de cada una de estas “porciones” de sonido se
convierte en largas series intangibles de 0 y 1.

El Blu-ray disc, HD DVD (High Definition Density Digital Versatile Disc) y el


SACD (Super Audio CD) se consideran como lo más avanzado en el campo de
la alta fidelidad.

1.3. PRINCIPIOS BÁSICOS DE LA RESTAURACIÓN DE AUDIO.

De acuerdo con lo anterior, y siguiendo con la necesidad de definir algunos


conceptos y principios básicos que han determinado el mundo de la
reproducción de audio, se analizan los principios que se requieren en la
restauración del audio.

Desde los inicios de las grabaciones de audio se emplearon los formatos


analógicos de almacenamiento. Ejemplos típicos han sido los discos de vinilo,
casetes, cintas magnéticas, etc. Formatos que se describirán más
profundamente en el capítulo 2 de este trabajo. En la actualidad aún se debate
si los medios de almacenamiento digital permiten mayor fidelidad del sonido
que el ofrecido por los formatos analógicos. El audio analógico presenta una
gran desventaja originada por el deterioro al que se ven sometidos los
diferentes medios de almacenamiento. Muchos medios analógicos van
perdiendo calidad con el paso del tiempo, debido a daños en las cintas
magnéticas causados por la presencia de campos magnéticos cercanos, alta
temperatura, estiramiento o, en el caso de los discos, el polvo y otras
suciedades que producen distorsión. En cintas magnéticas se evidencia esto al
ver cómo factores como la humedad y la suciedad hacen perder su calidad. La
58

respuesta a estos inconvenientes se encuentra en la restauración de audio


mediante la digitalización y posterior tratamiento digital. Cualquier fuente de
audio se puede ver beneficiada por la aplicación de métodos de reducción
digital de ruido.

1.3.1. Restauración tradicional de audio. La restauración de audio


apunta básicamente a mejorar el sonido de grabaciones viejas o nuevas
deterioradas. El principal objetivo es reducir ruidos espurios, que normalmente
se introducen por los mecanismos de grabación y reproducción o playback;
mientras se trata, hasta donde sea posible, de conservar el sonido original.

El primer paso para la restauración típica de audio, es transferir el sonido de


viejos formatos analógicos a un formato digital. Esta tarea involucra localizar
las matrices originales, o las copias sonoras de mejor calidad, hallando el
mejor medio o equipo para su reproducción. La transferencia de formatos de
sonido viejos a modernos, como por ejemplo de 78 revoluciones por minita
(RPM) a los discos de vinilo, era una práctica común antes de la era del audio
digital. De los diferentes formatos de audio analógicos se hablará en el capítulo
2. La idea es mejorar las características de los formatos de almacenamiento
con rasgos de sistemas de grabación más avanzados. Otras mejoras relacionan
una capacidad de almacenamiento de datos más grande con un tiempo de vida
más largo, más fácil manejo y cuidado, fácil duplicación del material y mayor
acceso por parte del público. La restauración de audio va más allá de digitalizar
el audio analógico. Gracias al crecimiento tecnológico de los procesadores, un
mayor número de sofisticados y poderosos procesos de digitalización de datos,
han sido posibles en la práctica. Hoy en día, la restauración de audio se logra
por medio de algoritmos DSP (Procesamiento Digital de Señales) destinados a
suprimir ruidos espurios; perturbaciones introducidas por los viejos sistemas
de grabación y playback y, finalmente, la reconstrucción de la señal de audio.
59

1.3.2. Ruidos o degradaciones. El ruido, mezclado con una señal acústica


destinada a ser percibida por el hombre, constituye, generalmente, una parte
subjetiva de la misma que transporta información no útil y que perturba la
forma de onda de manera que modifica su significado, interfiriendo así la
comunicación de la parte útil. La parte útil transporta la información deseada y
el ruido transporta información sobre los elementos que han servido para
generar la señal, grabarla y transmitirla. El objetivo es implementar procesos
de separación de la señal útil del ruido, los que básicamente pueden ser
contenidos por dos tipos: en el primer modelo, se puede precisar la parte de
la señal que se considera ruido, procediendo a su eliminación. La señal
restante será la restaurada. En el segundo modelo, se puede precisar la parte
de la señal que es de interés, música o palabra. Se elimina la señal que no es
de interés y queda la señal restaurada. En la figura 7 se pueden complementar
gráficamente estos procesos descritos.

1.3.3. Clasificación de degradaciones. Los tipos de degradación,


comúnmente asociados con viejas grabaciones, pueden ser clasificados en
perturbaciones localizables y globales. Por ejemplo, impulsos cortos de ruido
(clicks, crackles, y pops) como también en baja frecuencia, pulsos largos,
(thumps) son localizables mientras continuas distorsiones de fondo o
interferencias como el ruido de la banda ancha (hiss), (buzz y hum),
distorsión, distorsión armónica son usualmente clasificados como
perturbaciones globales. Otros ejemplos de perturbaciones de audio incluyen
las distorsiones no lineales (clipping), ruido de superficie y modulación rápida o
lenta en frecuencia, (wow y flutter), respectivamente.
60

Señal de audio
con ruido

Modelos Matemáticos
Modelos matemáticos
para describir defectos
para describir audio
del audio

Figura 7. Diagrama de modelos de separación.


Fuente: Restauración de audio. Proceso de señales y aplicaciones en la restauración de
registros sonoros: ruidos o degradaciones. [en linea]. Oviedo: Universidad de Oviedo,
s.f. <http://coco.ccu.uniovi.es/brahms/tecnologiasregistro/tecnologiasregistro.htm>
[consulta: 25 Feb. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

• Perturbaciones localizables. Son discontinuidades en la forma de


onda, que afectan ciertas muestras en forma de impulsos como golpes
secos (clicks), crujidos (crackles), chasquidos (pops) y golpes (thumps).

Perturbaciones tipo impulso. Corto estallido de ruido. La palabra “impulso”


significa “la más corta perturbación posible”. En términos generales de audio,
un impulso sólo sería una muestra de corto tiempo. Un pop o un click y otras
formas de perturbaciones localizables se consideran impulsos desde la
percepción del oído.
61

1.3.3.1. Clicks. Son cortos estallidos al azar en el tiempo y en amplitud. Los


clicks se pueden percibir de diferentes maneras: al azar, como pequeños
‘ticks’ de ruido que pueden ocurrir en cualquier medio de grabación analógica.
Por ejemplo, la pobre calidad de un formato de 78 RPM podría contener
alrededor de 2,000 clicks por segundo de material grabado, con duraciones
que van de 20 µ s. a 40 ms. en el peor de los casos. Estas perturbaciones

normalmente son causadas por imperfecciones en pequeña escala en las


ranuras de la pared de un disco. Otras causas de estas imperfecciones pueden
ser la intrínseca porosidad del material del medio, sólidos que se adhieren a las
ranuras de las paredes, o la presencia de rayones superficiales.

1.3.3.2. Scratches. Son pulsos discontinuos de gran amplitud en tiempo y


en frecuencia, seguidos de una etapa transitoria de bajas frecuencias que está
asociada con la respuesta impulsiva del medio de reproducción. Posiblemente
producidos por arañazos o roturas en la superficie de los discos. Los scratches
son pulsos transitorios de duración mayor que la correspondiente a los clicks,
aproximadamente de 20 ms. y con una proporción relativamente alta de
contenido de energía de baja frecuencia, pero exhibiendo contenido frecuencial
a lo largo de todo el espectro. Dependiendo de la disposición del defecto en la
superficie del disco, los pulsos pueden evolucionar en forma casi periódica.

1.3.3.3. Crackles. Son degradaciones impulsivas de pequeña amplitud y


corta duración, causantes de una gran variedad de ruidos con diferentes tipos
de percepción sonora. Por ejemplo, existe un hongo que come los
componentes vegetales contenidos en el material de formatos de grabación
viejos de 78 RPM. Esto deja millones de huecos en la superficie del disco,
creando impulsos de perturbaciones en la forma de onda reproducida.
62

A continuación, y para permitir mayor comprensión de los argumentos


expuestos, se presentan dos gráficas que dejan visualizar, primero, una onda
senoidal con clicks, y, segundo, una onda senoidal con crackles.

Click
Click
Amplitud

Click

Tiempo (seg)

Figura 8. Onda senoidal con clicks.


63

Rarefacción
Crackle

Amplitud

Tiempo (seg)

Figura 9. Onda senoidal con crackles.

1.3.3.4. Thumps. Los Thumps, o golpes, surgen por la aparición de pulsos


largos, contenidos en bajas frecuencias que alteran la señal de audio. Estos
pulsos se relacionan con la respuesta mecánica del sistema o mecanismo de
playback a una excitación anormal. Por ejemplo, en un tocadiscos, la respuesta
del aparato conjunto de brazo y aguja (stylusarm) a grandes discontinuidades
en las ranuras de las paredes de un vinilo. Se esboza, a continuación, una
onda senoidal con thumps.
64

Amplitud

Tiempo (seg)

Figura 10. Onda senoidal con thumps.

• Perturbaciones globales. Las perturbaciones globales son aquellas


que afectan todas las muestras de la onda.

1.3.3.5. Distorsión. Es la adición de armónicos no deseados a la señal


original. Es una clase de perturbación muy general que cubre un amplio rango
de defectos de amplitud tipo no lineal relacionados con exceso de ranuras en
la pared del disco (clipping) y deformaciones. Básicamente existen 2 tipos de
distorsiones, armónica y de intermodulación.
65

• Distorsión armónica. Es la adición de nuevas frecuencias a una señal


que están relacionadas con la frecuencia de entrada en forma de
múltiplos. Así, por ejemplo, una señal con frecuencia de 400 Hz puede
distorsionarse con armónicos de 800 Hz, 1.200 Hz, etc.

• Distorsión de intermodulación. Distorsión que agrega nuevas


frecuencias que son la suma o resta de las frecuencias de entrada. Por
ejemplo, 800 y 1.000 Hz tendrían distorsión de intermodulación en 200
y 1.800 Hz.

1.3.3.6. Clipping. El clipping, o recorte, es una distorsión que consiste en


que una onda es recortada por la parte superior o por la parte inferior. Por
ejemplo, si fuese una señal senoidal, las partes superiores e inferiores de la
onda serían planas en vez de curvas. En la figura 11 se observa una onda
senoidal con clipping.

1.3.3.7. Hiss. Ruido de banda ancha. El ruido aleatorio de fondo es una


forma de degradación común a cualquier sistema de audio analógico:
almacenamiento y equipos de reproducción. En el caso de audio las señales de
ruido que, generalmente, el oyente las percibe como hiss, están compuestas
de ruidos presentes en los circuitos eléctricos, por irregularidades en el medio
de almacenamiento y por el ruido ambiental de las condiciones externas de
grabación. El hiss es común en todas las formas de registro, usualmente es
aditivo e independiente de la señal, y se manifiesta, en mayor grado, en las
cintas magnéticas. La figura 12 se muestra claramente una onda senoidal con
hiss.
66

Amplitud

Tiempo (seg)

Figura 11. Onda senoidal con clipping.

1.3.3.8. Buzz. El término buzz, o zumbido, se utiliza para hacer referencia a


varias degradaciones de audio. Involucra los ruidos producidos por problemas
de encendido y apagado de equipos. A menudo, estos ruidos asumen formas
compactas en el tiempo, regulares ticks en la señal. El buzz es usado para
describir sonidos producidos por fallas eléctricas como los problemas
relacionados con las conexiones de tierra. Éstos pueden llevar a una variedad
de ruidos no deseados como el simple hum o complicaciones armónicas.

1.3.3.9. Hum. Se refiere al ruido generado en dispositivos de audio u otros


dispositivos electrónicos por perturbaciones en la fuente de alimentación de
corriente directa con el que funciona el equipo. Se debe, específicamente, al
alto rizado causado por daños en algunos componentes del filtro asociado al
circuito rectificador de la fuente.
67

Amplitud

Tiempo (seg)

Figura 12. Onda senoidal con hiss.

1.3.3.10. Flutter y wow. Hacen parte de las distorsiones que se producen


en las variaciones en la velocidad de una cinta o disco, por la conmutación
defectuosa de cabezas lectoras o motores de los equipo de reproducción. Esto
conlleva a una desviación en la frecuencia de la señal durante la reproducción
(flutter sería el periodo más largo y wow el más corto), alterando la tonalidad
de la grabación original.
68

2. FORMATOS DE AUDIO ANALÓGICO

Como se anunció en el capítulo anterior, en éste capítulo se va a desplegar y a


profundizar algunos aspectos que están referidos a los formatos de audio. En
primera instancia, unas definiciones aclaratorias y, después, la profundización
temática y argumentativa de tales formatos.

2.1. AUDIO ANALÓGICO

El audio analógico puede definirse como la representación del sonido por medio
de su forma de onda natural o como ésta se vería en el mundo real.

Así pues, los dispositivos que graban sonido de forma análoga lo que hacen,
esencialmente, es imprimir la forma de onda en un medio. Esto se evidencia en
los discos en los que un torno dibuja surcos que simulan una onda de audio,
como se aprecia en siguiente figura. En las cintas magnéticas, el cabezal de
grabación genera una fuerza magnética proporcional a la señal que al aplicarla
a las partículas metálicas presentes en la cinta reaccionan produciendo un
campo magnético que va disminuyendo a medida que se mueve la cinta hasta
llegar al magnetismo remanente. Esto va generando un patrón de alineación
de las partículas magnéticas en la cinta que sigue las variaciones de la señal de
audio original y al pasar la cinta por la cabeza de reproducción esta genera una
corriente que adquiere una forma de onda de audio.
69

Figura 13. Imagen aumentada de la superficie de un disco. Sus surcos simulan una
onda de audio.
Fuente: MICROGRAPHIA. The microscopy of vinyl records: the record surface
[en linea]. s.p.i. <http://www.micrographia.com/projec/projapps/viny/viny0100.htm>
[consulta: 5 Abr. 2005]

2.1.1. Limitaciones del audio analógico. Durante el proceso de impresión


de la forma de onda en el medio analógico, se introducen ruidos que luego se
perciben en su reproducción. En el caso de los discos, algunos rayones y pops,
van empeorando en cada reproducción. En el caso de las cintas, su calidad y
velocidad de grabación limitan su fidelidad y el hiss que, aunque se ve
reducido con la técnica de reducción de ruido Dolby, no deja de ser uno de sus
peores problemas, además presenta muy bajo rango dinámico que en
promedio para sistemas de grabación y reproducción analógicos es de 70
contra 120 dBs de los sistemas digitales.

El principal enemigo de los formatos de audio analógicos es el desgaste y la


degradación del medio. Si se quiere extender su vida útil, es imperativo un
manejo y almacenamiento correctos.
70

En resumen, el audio analógico:

• Se registra en cintas magnéticas o discos analógicos.

• Se edita usando métodos lineales, como el doblaje en tiempo real o


corte y pegado de la cinta misma.

• Es una impresión directa de la forma de la onda sonora.

• Está sujeto a degradación significativa en la calidad ya que es duplicado


sucesivamente.

• Su rango dinámico es menor que el de los sistemas digitales y las ondas


de presión sonora que nos rodean

2.2. FORMATO

Un formato, como su mismo nombre lo indica, puede concebirse como la


manera mediante la cual los datos son organizados sistemáticamente para su
procesamiento, reproducción y transmisión. Los datos son, principalmente,
imágenes, sonidos, e información alfanumérica. Para cada clase de dato
existen diferentes formatos en los que se pueden organizar dichos datos. Estos
formatos pueden ser de dos clases: el formato analógico y el formato digital.
Dentro de cada uno de estos formatos existen divisiones que crean las
distinciones particulares. Por ejemplo, cuando se habla de formato “carta”, se
refiere a un formato en papel (analógico), con unas dimensiones de 216 X 279
mm. Otro ejemplo de formato analógico es un casete o un disco, medios que
se usaron por mucho tiempo y aún se usan como mecanismos para almacenar
sonidos. También se clasifican dentro del formato analógico las fotografías
convencionales sobre papel fotográfico o transparencias.
71

Los formatos digitales son otra manera de representar elementos utilizando


sistemas computarizados; éstos, en su más mínima expresión, se reducen a
secuencias de unos y ceros que, combinados entre sí, representan códigos que
pueden ser interpretados como letras, colores, frecuencias, entre otros. En el
capítulo 7 se hablará má profundamente de los formatos digitales.

2.3. FORMATOS DE AUDIO ANALÓGICOS

A continuación se describe en forma cronológica los diferentes formatos de


audio analógico. Sus respectivos reproductores podrán ser consultados en el
anexo A.

2.3.1. Cilindro de cera de Edison. En 1877 surgió el primer estándar de


grabación de la industria: el cilindro de cera de Edison fue la primera forma de
grabación análoga de audio y se ilustra a continuación. Estaba compuesto por
un cilindro construido en un material de consistencia similar a la cera de abeja,
pero más denso, envuelto en una fina lámina de estaño.

El proceso de grabación se fundamentaba en hacer rotar el cilindro, por medio


de una manivela, sobre el cual descansaba una aguja que, solidariamente
unida a un diafragma, recibía el sonido que era amplificado por un embudo. En
la medida que el diafragma vibraba, lo hacía la aguja, hendiendo la superficie
del cilindro con un patrón analógico al de la vibración del diafragma.
72

Figura 14. Cilindro de cera de Edison.


Fuente: CABEZAS G, Alonso. Apunte reunificado de grabación de sonido: grabación de
sonido [en linea]. s.l. s.n. 2003. <http://z.tardis.cl/sd/ap_grab_1y2.fh11.pdf>
[consulta: 9 Feb. 2005]

Para la reproducción, se hacía girar el cilindro en sentido contrario. Al invertir


el sentido de giro, se reducía la resistencia de la aguja que, en lugar de arañar
la superficie, seguía el camino descrito, trasmitiendo de vuelta la vibración al
diafragma, que la susurraba en el embudo de amplificación. La velocidad de
rotación variaba según la aplicación. Con el cilindro rotando a 90 RPM era
posible registrar casi 4 minutos de voz hablada. Más adelante, para
aplicaciones musicales (2-2,5 min.) se usaron velocidades entre 120 y 160
RPM.

En las primeras etapas de la fabricación de cilindros, sus dimensiones variaban


de acuerdo con el fabricante, pero en 1889, Edison Records, Columbia
Phonograph y otros fabricantes, se pusieron de acuerdo para estandarizar las
dimensiones del dispositivo en 10 cm. de longitud, 6 cm. de diámetro, con lo
cual se podían reproducir 2 minutos de audio.
73

Los primeros cilindros sólo podían ser escuchados unas doce veces y,
posteriormente, se entregaban como créditos para la compra de otros
cilindros. Otra característica es que la superficie podía suavizarse para volver a
grabar. Con el paso del tiempo el tipo de cera se fue mejorando hasta obtener
un cilindro que se podría reproducir más de 100 veces.

En 1906, la Indestructible Record Company cambió la cera por celuloide y el


cilindro ya se reproducía miles de veces, y, aunque era resistente a los golpes,
este material no podía ser suavizado para ser grabado otra vez. La respuesta
de la Edison Records fue hacer el cilindro en un tipo de plástico llamado
Amberol (conocidos como cilindros de Amberol) que, además de ser muy
resistente, permitió aumentar su capacidad de reproducción de 2 a 4 minutos.
El fonógrafo, para reproducir este tipo de cilindros mejorados, se conoció con
el nombre de Amberola.

2.3.2. Disco de 78 RPM. La grabación en disco fue experimentada por


varios inventores, entre ellos Thomas Alva Edison; pero el primero en
desarrollar un modelo funcional de esta tecnología fue el alemán Emil Berliner,
en 1884, que para entonces vivía y trabajaba en Washington. En 1887 obtuvo
patentes en Berlín y Washington para el disco y su equipo reproductor llamado
gramófono.

Los primeros discos fueron construidos en ebonita, pero dada su naturaleza


quebradiza, este material fue reemplazado por el shellac o la goma laca. La
producción en masa de discos de shellac comenzó en 1889 en Hanover,
Alemania, y sus primeras grabaciones fueron comercializadas en 1895. A partir
de este momento se convirtió en el medio de grabación más popular,
desplazando al cilindro de Edison de esta posición, ya que era más barato,
menos frágil y más fácil de almacenar.
74

Al comienzo, la velocidad de rotación era muy variable, pero, a partir de 1920,


los discos que rotaban 78 veces por minuto, se convirtieron en la medida
estándar. Fue así como obtuvieron el popular nombre de disco de 78 o 78’s.
Sin embargo, este término sólo se utilizó después de la Segunda Guerra
Mundial, para distinguirlo de otros formatos en disco que comenzaban a surgir.
Para entonces, otro material había aparecido en los discos de 78: el acetato,
con las ventajas de ser más resistente y proporcionar mejor calidad de sonido.

El tamaño de los discos también fue muy variable. Inicialmente su diámetro


fue de 7”, luego pasó a 10”, siendo éste el más popular y con capacidad de
almacenar 3 minutos de sonido por cada lado; luego 12”, utilizados,
principalmente, para música clásica, con capacidad de grabar 5 minutos de
música por cada lado. Veamos una representación gráfica de un disco de
ebonita.

Figura 15. Disco de ebonita de 7" y 55 RPM.


Fuente: MICROGRAPHIA. The microscopy of vinyl records: the record surface
[en linea]. s.p.i. <http://www.micrographia.com/projec/projapps/viny/viny0100.htm>
[consulta: 5 Abr. 2005]
75

2.3.3. Alambre. Este sistema de grabación utilizaba alambre delgado como


medio de almacenamiento del sonido. Su grabación y reproducción se hacía a
una velocidad de 24 pulgadas por segundo y sólo podía almacenar una pista de
audio, siendo la primera forma d e grabación magnética y muy confiable.

El alambre se almacenaba en carretes cuyas dimensiones iniciales fueron de


3 ¾” de diámetro y 1 ¼” de ancho, como se ilustra en la imagen izquierda de
la figura que aparece a continuación de este párrafo. Luego, sus dimensiones
se estandarizaron a 2 ¾” de diámetro y ¾” de ancho, como se ilustra en la
imagen derecha de la siguiente figura. Un carrete de dimensiones estándar
podía almacenar hasta 7200 pies de alambre, o sea, una hora de sonido, ya
que era muy delgado (un poco más que un cabello humano). Posteriormente,
se fabricaron carretes de 15 y 30 minutos. Este tipo de formato tuvo su era en
los años 30 y 40, sobre todo para la grabación de voz en dictáfonos y
telégrafos. Hasta que fue reemplazado definitivamente por la cinta magnética.

Figura 16. Carretes de alambre.


Fuente: Audio formats. Wire recorders: spool sizes. [en linea]. Waldoboro: video
interchange, 2005. <http://www.videointerchange.com/wire_recorder1.htm>
[consulta: 25 Feb. 2005]
76

2.3.4. Cinta de carrete a carrete o de carrete abierto. El carrete abierto


u open reel ilustrado a continuación, fue creado pensando en la forma de
almacenar la recién desarrollada cinta magnética, y su primer uso fue en los
magnetófonos de AEG, fabricados en 1934. En este tipo de formato, la cinta
magnética de audio está retenida en un carrete que la deja expuesta, a
diferencia de la cinta en cartucho o casete, que queda contenida
completamente dentro de él. Originalmente, no tenía nombre ya que todos los
grabadores magnéticos lo usaban. Cuando apareció el cartucho se bautizó
como carrete abierto.

Figura 17. Imagen de un carrete abierto de 7” con cinta de ¼”.


Fuente: B. SMITH, Daniel. Audio formats. Reel-to-reel tape recording. [en linea]. s.l.:
Wikipedia s.f. < http://en.wikipedia.org/wiki/Reel-to-reel_audio_tape_recording>
[consulta: 25 Feb. 2005]

La cinta en este tipo de formato se puede encontrar en dimensiones que van


desde ¼” hasta 2”, la más utilizada. Este formato presenta pistas grabables
monofónicas con anchuras de ¼”. En cintas de 2” se pueden grabar hasta 32
pistas discretas.
77

Algunas velocidades de grabación y sus aplicaciones fueron:

• 1 7/8 pulgadas por segundo (pps): la más lenta de las velocidades de


uso doméstico. Para grabaciones de voz muy extensas.

• 3 ¾ pps: la más común de las velocidades en las grabadoras de uso


doméstico.

• 7 ½ pps: la más alta de las velocidades domésticas y la más lenta de las


profesionales.

• 15 pps: grabaciones musicales profesionales y programación de radio.

• 30 pps: cuando se necesitaba alta respuesta en frecuencia.

A pesar de la aparición de la cinta en cartucho o casete, en 1963, el formato


de carrete abierto fue el medio preferido por los profesionales del audio debido
al ancho de sus pistas y a su velocidad de grabación. Este último factor y el
ancho del entrehierro del cabezal de reproducción definen la calidad del audio
grabado en una cinta magnética ya que influyen directamente en la respuesta
en frecuencia.

Si se graba una onda de frecuencia f en una cinta que se mueve a velocidad v


y sabiendo que un ciclo de la onda demora un tiempo T, la distancia recorrida
por la cinta durante un ciclo será:

v
d = vT = (2.1)
f
78

Esto significa que cada ciclo de la onda ocupara sobre la cinta una longitud
igual a d.

Para la fabricación de equipos reproductores de cintas magnéticas existe un


criterio que dice:

d
e≤ (2.2)
5

Donde e es el ancho del entrehierro del cabezal de reproducción.

Despejando d de la ecuación (2.2) y reemplazándola en la ecuación (2.1) se


tiene que:

v v
5e = → f = (2.3)
f 5e

De la ecuación (2.3) se deduce que la máxima frecuencia que se puede


obtener durante la reproducción de una cinta es directamente proporcional a la
velocidad de grabación de la cinta e inversamente proporcional al ancho del
entrehierro del cabezal de reproducción.

El carrete abierto fue ampliamente utilizado hasta 1980, cuando apareció


comercialmente el audio digital.
79

Los equipos de reproducción de este tipo de cintas son muy diversos en cuanto
a su forma, ya que es un asunto que define autónomamente cada fabricante.
Sin embargo, su funcionamiento es el mismo para todos ellos.

2.3.5. Disco de vinilo. En 1945, un ingeniero de la Columbia Broadcasting


System (CBS), llamado Peter Golmark, se concentró en el desarrollo de un
disco de larga duración. Tres años más tarde, el 21 de junio de 1948, presentó
el resultado de su trabajo: el disco de larga duración o "long play" (LP), que
podía hacer sonar, efectivamente, 45 minutos de música.

El disco, construido con cloruro de polivinilo (de allí su nombre) y de 30


centímetros de diámetro, era irrompible; característica que le daba ventaja
sobre los discos fonográficos en uso, que no habían cambiado desde el año
1895. Al contrario de los discos de 78 RPM, el LP giraba a 33 1/3 RPM. Sus
microsurcos eran tan finos como un cabello humano, lo que incrementaba
enormemente la calidad. Un LP contenía 118 surcos. Más aún, era más liviano
y ocupaba menos espacio. Lo que un coleccionista de discos de 78 RPM
acumulaba en 2,4 metros de estantería, ocupaba sólo medio metro con la
misma música grabada en LPs.

"Es el disco del futuro", decían al unísono vendedores y compradores, quienes,


al mismo tiempo que el disco, debían adquirir un tocadiscos que remplazaría
al viejo y anticuado gramófono. A largo plazo, el cambio resultaba económico,
pues un LP costaba menos que los cinco discos de 78 RPM necesarios para la
misma cantidad de música.

No obstante, el triunfo definitivo del LP tuvo que esperar, porque el rival, la


RCA-Víctor, no quiso embarcarse en la producción del LP, sino que sacó al
80

mercado, en 1949, su propio disco de 45 RPM. Se trataba de un disco que


necesitaba su propio tocadiscos y que fascinó a la juventud desde el comienzo.
Los aficionados a la música tenían que decidirse: aquí comenzó la guerra de las
velocidades. En 1950 la RCA-Víctor abandonó definitivamente la batalla por el
formato y adoptó el disco de larga duración. Los "singles" o sencillos de 45
RPM, sin embargo, siguieron siendo el formato favorito de la música popular
hasta entrados los años 80s. El disco de vinilo se mantuvo como el disco del
futuro sin variaciones hasta que, a partir de la década de los años 80s, fue
sustituido por el CD.

Los discos de vinilo más comunes fueron:

• 12” (30 cm) 33 1\3 RPM. Conocido como Long Play (LP) o larga
duración. En la siguiente figura se observa un LP de 12”. Tenía
capacidad para contener entre 5 y 10 canciones por cada lado.
• 7” (17.5 cm.) 45 RPM. Conocido como Single o sencillo, pues sólo
contenía una canción por cada lado.

• 10" (25 cm) 33 1\3 RPM, Long-play (LP) o larga duración de 10”.

Otros formatos menos comunes fueron:

• 12" (30 cm) 45 RPM. Extended-playing (EP), Maxi Single o Reproducción


extendida.

• 10" (25 cm) 45 RPM. Extended-playing (EP) o reproducción extendida.

• 7" (17.5 cm) 33 1\3 RPM. Extended-playing (EP) o reproducción


extendida.
81

La calidad del sonido en un disco de vinilo depende de la calidad del vinilo


usado para su fabricación. La mayoría de discos de vinilo eran fabricados en
vinilo reciclado. Sin embargo, para obtener mejor calidad de audio, algunas
veces se utilizaba vinilo sin reciclar (virgen) o “pesado”, como se le conoce.
Actualmente todos los discos de vinilo se fabrican en vinilo virgen.

Figura 18. Disco de vinilo.


Fuente: Audio formats. Viyl record. [en linea]. s.l.: Wikipedia, s.f.
<http://en.wikipedia.org/wiki/Vinyl_record>
[consulta: 25 Feb. 2005]

2.3.6. Cartucho RCA o RCA sound tape cartridge. En 1958 RCA (Radio
Corporation of America) introdujo al mercado este tipo de formato que fue uno
de los primeros intentos de incorporar la cinta dentro de un contenedor
portátil, que se hiciera más cómodo de llevar que las aparatosas cintas de
carrete abierto. En la siguiente figura se observan dos cartuchos RCA.

Las medidas de este cartucho eran de 5” x 7 1/8” x ½”, su velocidad era de 3


¾ pulgadas por segundo, con 30 minutos de audio en una cinta de ¼”, o 1 7/8
82

pulgadas por segundo. Bastaba mover una pequeña palanca en el dispositivo


reproductor y grabador.

La RCA intentó convertir su cartucho en un medio popular de música


pregrabada pero no fue más que un fracaso y para 1960 abandonó su
producción.

Figura 19. RCA Sound Tape Cartridge.


Fuente: Audio formats. RCA cartridge tapes. [en linea]. s.l.: Human Software
Corporation and Past reMasters, 2005.
< http://www.connell-labs.com/tape/RCACartridgeTapes.html>
[consulta: 27 Feb. 2005]

2.3.7. Sanyo micro pack 35. A principios de 1960 la compañía japonesa


Sanyo (tres océanos, en japonés), lanza la más temprana de las máquinas de
grabación y reproducción de dictado portátil para el ejecutivo de los años 60s:
la Sanyo micro pack 35, que se refiere gráficamente con la siguiente imagen.

La cinta estaba contenida en un cartucho transparente de 2.6 x 2.9 x 1.9


pulgadas y una de sus principales innovaciones es que la cinta estaba enrollada
83

en carretes dispuestos uno encima del otro, lo que redujo considerablemente


su tamaño.

Figura 20. Sanyo micro pack 35. Reproductor y cartucho.


Fuente: Audio formats. Vintage audio history: sanyo micro pack 35. [en linea].
Waldoboro: video interchange, 2005.
<http://www.videointerchange.com/audio_history.htm#Sanyo%20Micro%20Pack%20
35%20(Early%201960s%20)>
[consulta: 25 Feb. 2005]

2.3.8. Cartucho de 4 pistas. Este formato fue desarrollado en 1954 por


George Eash, pero sólo fue tenido en cuenta en 1956, cuando Earl “Madman”
Muntz, un mercader de autos usados, vio la oportunidad de incrementar la
venta de automóviles implementando el sistema en ellos. En la siguiente figura
se ilustra este formato.
84

Este tipo de formato fue popular en los automóviles pero no pasó de ahí,
además, pocos años después, llegó el cartucho de 8 pistas y el casete
compacto que lo desplazaron definitivamente de esta aplicación.

Originalmente, el cartucho tenía 4 pistas monofónicas o dos pistas con sonido


estéreo, pero luego se pudo doblar su tiempo de reproducción reduciendo el
ancho de las pistas a la mitad. Este mecanismo produjo, entonces, 4 pistas con
sonido estéreo. Sin embargo, esto hizo que se perdiera calidad en el sonido. El
cartucho de 4 pistas fue el precursor del medianamente exitoso cartucho de 8
pistas.

Figura 21. Cartucho de 4 pistas.


Fuente: Audio formats. Vintage audio history: stereo 4 track cartridge. [en linea].
Waldoboro: video interchange, 2005.
<http://www.videointerchange.com/audio_history.htm#Sanyo%20Micro%20Pack%20
35%20(Early%201960s%20)>
[consulta: 25 Feb. 2005]
85

2.3.9. Cartucho de 8 pistas. El ahora obsoleto cartucho de 8 pistas que se


observa en la siguiente imagen complementaria, tuvo su era durante los años
60s y 70s.

Después de que su creador, Bill Lear, diera un paseo a bordo de uno de los
automóviles de Earl “Madman” Muntz, equipado con equipos de cartuchos de 4
pistas, propuso a Ampex, Ford, Motorola y RCA Records, que, junto con su
compañía Lear Jet, desarrollaran un sistema de audio para autos de lujo. Así
nació el cartucho de 8 pistas o Estéreo-8.

El formato fue desarrollado en 1958 y estaba conformado por un carrete en el


que se enrollaba la cinta, la cual tenía sus dos extremos adheridos a un trozo
de lámina conductiva metálica de manera que se formara un loop continuo.
Cuando la cinta metálica pasaba a través de un par de contactos cercanos a la
cabeza de lectura del equipo reproductor se enviaba una señal que indicaba
terminación de la pista y la cabeza lectora se desplazaba a la siguiente pista
permitiendo una reproducción continua sin necesidad de rebobinar. Fue el
primer formato en utilizar la automatización para obtener una reproducción
continua.

El formato usaba cinta de ¼” dividida en 8 pistas que se grababan a 3.75


pulgadas por segundo, lo que permitía una calidad de sonido aceptable para
los estándares de la época.

Además de ser un logro en la industria automotriz, gracias a Ford, el cartucho


de 8 pistas fue el primer formato en cinta magnética en convertirse en un
verdadero éxito para la industria de la distribución comercial de música
pregrabada. A continuación se ilustra un cartucho de 8 pistas.
86

Así mismo, éste y el cartucho de 4 pistas, fueron los primeros formatos en ser
considerados como portátiles, pero en realidad estaban lejos de serlo.

Figura 22. Cartucho de 8 pistas.


Fuente: Audio formats. Vintage audio history: 8 track cartridge. [en linea]. Waldoboro:
video interchange, 2005.
<http://www.videointerchange.com/audio_history.htm#Sanyo%20Micro%20Pack%20
35%20(Early%201960s%20)>
[consulta: 25 Feb. 2005]

2.3.10. Casete de audio compacto. Este medio de almacenamiento


analógico de audio fue presentado por Philips en 1963. Consiste en una tira de
cinta BASF, enrollada dentro de una cubierta protectora de plástico que tiene
dos lados llamados A y B. A continuación se ilustra un casete de audio
compacto.

Paradójicamente, el formato analógico de cinta magnética más popular de la


historia nunca fue pensado para comercializarse en masa, pues éste estaba
pensado para la nueva línea de grabadoras de marca Philips, pero su tamaño
compacto, su fiabilidad, el bajo costo de manufactura, y la capacidad de grabar
audio estéreo, le otorgaron gran aceptación en el mercado.
87

Figura 23. Audio casete compacto.


Fuente: MICROGRAPHIA. The microscopy of vinyl records: the record surface
[en linea]. s.p.i. <http://en.wikipedia.org/wiki/Compact_cassette>
[consulta: 7 Abr. 2005]

Para 1965 comenzó su producción en masa, aunque su popularidad la alcanzó


en los comienzos de los años 70s, pues se convirtió en el formato en cinta
magnética de mayor consumo.

El formato consta de una cinta de 1/8” con 4 pistas corriendo a 1 7/8 pulgadas
por segundo por cada lado, posee 2 pistas estéreo, una para reproducirse o
grabarse con el casete puesto por el lado A y la otra, por el lado B.
Inicialmente se lograron 30 ó 45 minutos de música estéreo por cada lado.
Estas características eran suficientes para uso doméstico, pero no para uso
profesional, y por ello las cintas de carrete abierto siguieron siendo las
preferidas para aplicaciones que requerían mayor calidad.

La capacidad de este formato se distinguía por la longitud de la cinta medida


en minutos. Los más populares fueron los C60 (30 minutos por cada lado), los
C90 (45 minutos por cada lado) y los C120 (60 minutos por cada lado), esta
última, tenía un inconveniente por ser muy delgada y, por ende, arriesgaba su
destrucción durante su reproducción. Otras capacidades menos comunes
fueron las de los C46, C50, C74, C80, C100 y C110. Casetes de 180 minutos
88

(C180) e incluso de 240 minutos (C240) llegaron a fabricarse, pero la calidad


de su cinta era tal que no fueron adecuados para uso general.

Al principio, la cinta se fabricó en ferrita (Fe2O3), pero luego se usaron otros


materiales como el dióxido de cromo (CrO2) y el metal, para obtener mejor
calidad en el sonido. Además del material, se utilizaron sistemas de reducción
de ruido que se implementaban tanto en las grabadoras como en las máquinas
reproductoras. Uno de los sistemas más conocido fue el universal Dolby B. Los
sistemas de reproducción y grabación de este formato son muy diversos y aún
se fabrican y comercializan.

2.3.11. Playtape. En 1966 el cartucho de 8 pistas era el formato


dominante; sin embargo, no era un formato pequeño que entrara
completamente en la categoría de portátil. Entonces apareció el Playtape,
nombre que llevaba tanto el reproductor como el formato y ambos tenían la
virtud de ser, realmente, portátiles, pues se llegó a considerar como el
reemplazo del radio de transistores, pero solamente llego a ser una alternativa
de este.

Frank Stanton, innovador y creador del Playtape, concibió la idea durante los
años 40, mientras prestaba servicio en la Marina de Estados Unidos, en plena
guerra mundial, pero fue en 1966, cuando Sears y MGM records, después de
perfeccionar el primer modelo funcional, adquirido años antes de Stanton,
presentó al mundo el Playtape y fue un éxito casi instantáneo. En la siguiente
figura se ilustra un Playtape.
89

Figura 24. Imagen de un cartucho Playtape en su empaque original.


Fuente: M. HINTZE. Audio formats. The playtape. [en linea]. s.l.: M. HINTZE, 2005.
<http://mhintze.tripod.com/audio/playtape/pt-beatles_1.jpg>
[consulta: 25 Feb. 2005]

Los pequeños cartuchos medían 2 ¾” x 3 3/8” x ½” y alojaban un cinta


magnética de 1/8”, que contenía 2 pistas estéreo y tenían duraciones que iban
desde 8 hasta 24 minutos.

A pesar de estas características, inferiores a las de un cartucho de 8 pistas, el


playtape fue un éxito, pues su tamaño, más pequeño que el estéreo-8, lo
convirtió en el formato que permitió llevar la música a cualquier parte.

En septiembre de 1967 los cartuchos se clasificaron por colores, así:

• Rojo – Equivalente a un disco de 45 RPM “Sencillo”.

• Negro – Equivalente a un disco EP de 4 canciones.

• Azul – Infantiles.
90

• Blanco – Capacidad de 8 canciones como un LP.

• Gris – Narraciones y educativos.

Para principios de 1968 ya había en el mercado 3000 títulos en playtape.

2.3.12. Microcasete. Es un formato que posee las mismas características


de un casete compacto, con la diferencia de ser más pequeño y poseer una
velocidad de grabación más lenta, lo que implica que debe ser grabado
exclusivamente en grabadoras de microcasetes. Tiene diferentes capacidades
de almacenamiento, su cinta es de la misma dimensión y cuenta con la misma
cantidad de pistas, pero su gran diferencia radica en su velocidad de
grabación, es más lenta que la del casete compacto y esto hace posible que se
reduzca su tamaño, sin perder la capacidad de almacenamiento. Esta
característica hace que el microcasete sea de uso casi exclusivo para grabación
de voz en máquinas contestadoras y grabadoras para dictar textos o grabar
entrevistas. Rara vez se usa para grabar música. En la siguiente figura se
ilustra un microcasete.

Figura 25. Microcasete.


Fuente: Audio formats. Microcassette. [en linea]. s.l.: Wikipedia, s.f.
<http://en.wikipedia.org/wiki/Microcassette>
[consulta: 25 Feb. 2005]
91

2.3.13. Elcaset. Fue un formato de corta vida, creado por Sony en 1976.
Para entonces el sentimiento general era que el casete compacto nunca iba a
alcanzar los niveles de calidad de los sistemas de carrete abierto, así que la
intención del elcaset fue la de competir, con calidad, pero con la conveniencia
y comodidad de un casete compacto. El casete como tal era muy similar al
casete compacto, pero más grande. El nombre elcaset tiene su origen en L-
cassette o Large cassette.

Sus dimensiones eran de 6” x 4 1/8” x ¾”. Albergaba una cinta de ¼” con


cuatro pistas corriendo a 3.75 pulgadas por segundo, lo cual era mucho mejor
que los 1 7/8 de pulgadas por segundo del casete compacto. Sin embargo, el
formato fue un fracaso comercial puesto que los reproductores eran costosos y
para la mayoría de la gente la calidad del casete compacto era adecuada y los
beneficios de elcaset resultaban muy limitados. No obstante, el sistema era
técnicamente excelente y para 1976 dicha tecnología era considerada como
adelantada para la época. En la siguiente figura se ilustra una comparación del
tamaño del cartucho RCA, casete compacto y elcaset.
92

Figura 26. Imagen comparativa de diversos cartuchos. De arriba hacia abajo: casete
compacto, elcaset, RCA sound tape cartridge.
Fuente: Audio formats. RCA cartridge tapes. [en linea]. s.l.: Human Software
Corporation and Past reMasters, 2005.
<http://www.connell-labs.com/tape/RCACartridgeTapes.html>
[consulta: 27 Feb. 2005]
93

3. DEGRADACIONES Y TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE


LOS MEDIOS DE ALMACENAMIENTO ANALOGICOS

3.1. DEGRADACIONES DE LOS SOPORTES MAGNÉTICOS

Las cintas magnéticas de audio se componen de una base de poliéster y una


serie de capas superpuestas de distinta composición química y de diversa
flexibilidad y resistencia a la tracción como se muestra en la figura a
continuación. Estos elementos son los siguientes:

• Base de poliéster (polietilterephtalato, Mylar®)

• Adhesivo aglomerante (poliuretano)

• Partículas de óxidos metálicos (dióxido de cromo, dióxido de hierro etc.),


que están integradas en el adhesivo. Adicionalmente, en las cintas de
alta calidad, se incorpora una sustancia antifúngica para prevenir la
proliferación de hongos.

• Capa inferior de carbono, que protege la cinta de rayones, minimiza las


cargas de electricidad estática y disminuye los rozamientos mecánicos.
94

Figura 27. Corte transversal de una cinta magnética donde se observan las diferentes
capas que la conforman.
Fuente: VAN BOGART, John. Magnetic tape storage and handling. What can go wrong
with magnetic media?. [en linea]. s.l.: National Media Laboratory, 1995.
<http://www.clir.org/pubs/reports/pub54/2what_wrong.html>
[consulta: 16 Mar. 2005]
* Editada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás

Cuando las cintas se exponen a condiciones de humedad y temperatura


inadecuadas, las distintas capas que las componen sufren procesos de
contracción y expansión, como podemos advertir en la siguiente gráfica. Estas
variaciones producen daños en la superficie magnética, incluso, irreparables:
pueden romper el aglomerante y hacer que las partículas metálicas se
desprendan de su base plástica. Se trata de un fenómeno descrito en la
literatura especializada como flaking off.
95

Figura 28. Cintas magnéticas deformadas por exposición al calor.


Fuentes: FONTAINE, Jean Marc (izq). Audio formats. Typology and history: mechanical
integrity [en linea]. s.l.: FONTAINE, Jean Marc, 2005.
<http://webworld.unesco.org/safeguarding/en/loupe/vmagn_h36.htm>
[consulta: 1 Mar. 2005]
HESS, Richard L. (der).Audio formats. Vignettes Media Audio Tape Restoration &
Mastering: resources. [en linea]. s.l.: HESS, Richard L, 2004.
<http://www.richardhess.com/tape>
[consulta: 2 Mar. 2005]

El principal problema relacionado con la conservación de las cintas magnéticas


radica en la estabilidad del aglomerante, es decir, el componente que mantiene
unidas las partículas magnéticas al soporte plástico. Las condiciones
ambientales inadecuadas (principalmente la temperatura y la humedad)
degradan el adhesivo a través de la hidrolización del poliuretano, su
componente principal, volviéndolo pegajoso y haciendo imposible su lectura
hasta destruir la cinta, como se ilustra en la figura 29. A este efecto, de
naturaleza química, se le conoce con el nombre de sticky shed que se
evidencia en la figura 30.
96

Figura 29. Consecuencias de la pérdida de aglomerante en un reproductor de cintas de


carrete abierto.
Fuente: Austrian Academy of Sciences. Sound archives. Typology and history:
Humidity [en linea]. s.l.: Austrian Academy of Sciences, 2005.
<http://webworld.unesco.org/safeguarding/en/loupe/vmagn_h39.htm>
[consulta: 1 Mar. 2005]

Figura 30. Cinta magnética con pérdida de aglomerante o síndrome de sticky shed.
Fuente: FONTAINE, Jean Marc. Audio formats. Typology and history: temperature [en
linea]. s.l.: FONTAINE, Jean Marc, 2005.
<http://webworld.unesco.org/safeguarding/en/loupe/vmagn_h43.htm>
[consulta: 1 Mar. 2005]
97

Un almacenamiento inapropiado, bajo condiciones de humedad excesiva, crea


problemas adicionales, favoreciendo la proliferación de hongos, que también
pueden causar severos daños en el aglomerante, produciendo la destrucción
del soporte y la contaminación de otros documentos magnéticos mediante la
liberación de esporas.

3.1.1. Otros Factores que inciden en la conservación de los soportes


magnéticos

3.1.1.1. La calidad de las cintas. Respecto a la calidad de las cintas


utilizadas, éstas han de cumplir la norma ANSI X3.40-1981; un estándar que
especifica las características físicas mínimas de una cinta de calidad aceptable.
Así, los materiales magnéticos han de tener cobertura de protección en su
dorso, para reducir las cargas de electricidad estática acumulada y evitar el
desplazamiento de los residuos hacia los cabezales de lectura.

3.1.1.2. Las condiciones de almacenamiento. Las condiciones de


almacenamiento deben ser sometidas a un control estricto, con el objetivo de
evitar las diferencias extremas de temperatura y humedad, así como para
prevenir la suciedad originada por las huellas digitales, el polvo, los cabezales
sucios, resultado de un manejo poco cuidadoso.

Una alternativa para el almacenamiento de cintas en un entorno húmedo


consiste en almacenar cada unidad en bolsas de plástico selladas. Las cintas
deben almacenarse verticalmente para evitar deformaciones, además, hacer
copias de seguridad de cada unidad almacenada, comprobando su estado y
rebobinándolas cada seis meses.
98

La utilización de materiales ignífugos es otro elemento que hay que tener en


cuenta. Por ello se recomienda evitar los muebles de madera. No se aconsejan
los sistemas antiincendios mediante aspersores, pues, en caso de dispararse
accidentalmente, provocarán graves daños en el material depositado.
Paralelamente, la iluminación debe ser controlada, manteniendo las
grabaciones en un lugar oscuro, mientras no sean consultadas. Si se dispone
de iluminación, mediante tubos fluorescentes, deberán acoplarse filtros para
mantener la radiación ultravioleta por debajo de los 75µw/lm
(microwatios/lumen).

Tabla 1. Condiciones óptimas de almacenamiento de una cinta magnética.

Condiciones ambientales recomendadas de almacenamiento


Temperatura ±/24h ±/año HR ±/24h ±/año
O O O % O O
C C C C C
Para Entre 5 y 10 ±1 ±2 30 ±5 ±5
preservación
Para uso Alrededor de ±1 ±2 40 ±5 ±5
normal 20

Fuente: FONTAINE, Jean Marc. Audio formats. Typology and history: temperature [en
linea]. s.l.: FONTAINE, Jean Marc, 2005.
<http://webworld.unesco.org/safeguarding/en/txt_magn.htm>
[consulta: 1 Mar. 2005]
* Editada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás

3.1.1.3. El número de reproducciones. Es otro factor que hay que tener


en cuenta ya que la vida útil de una cinta depende de su frecuencia de uso,
sobre todo, si no se tienen en cuenta las recomendaciones de almacenamiento
y mantenimiento del equipo reproductor.
99

3.1.1.4. Polvo y suciedad. Contaminan la superficie de la cinta e impiden


el contacto pleno entre ésta y la cabeza de reproducción que, a la larga, puede
impedir la lectura de la cinta. Además, la acumulación de polvo y suciedad
atrapada entre espiras puede tener efectos abrasivos sobre la cinta y causar
su deformación. En la siguiente figura se observan los tamaños relativos de
las suciedades.

Figura 31. Imagen que ilustra el tamaño relativo de las suciedades al espacio entre la
cinta y la cabeza reproductora.
Fuente: VAN BOGART, John. Magnetic tape storage and handling. How Can You
Prevent Magnetic Tape from Degrading Prematurely? [en linea]. s.l.: National Media
Laboratory, 1995.
<http://www.clir.org/pubs/reports/pub54/5premature_degrade.html>
[consulta: 16 Mar. 2005]
* Editada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás

3.1.1.5. Campos magnéticos. La presencia de campos magnéticos muy


intensos cerca de un soporte magnético puede ocasionar la pérdida de
información, ya que las partículas magnéticas presentes en la cinta pierden su
100

patrón de alineación. Por esto es importante mantener la cinta en lugares


apartados de fuentes de campos magnéticos.

En cuanto a los dispositivos de lectura, deben observarse principalmente dos


pautas:

• Someter a los equipos reproductores a una limpieza frecuente, ya que


es habitual el desprendimiento de residuos de la propia cinta (a veces,
de aspecto pegajoso o polvoriento) que dificultan la reproducción de
datos. Además, todos los dispositivos de arrastre y lectura han de ser
ajustados periódicamente, para mantener un perfecto alineamiento de
los diversos componentes mecánicos y evitar erosiones y plegamientos
en el soporte magnético

• La tensión de enrollamiento de la cinta no debe sobrepasar el 1% de los


límites aconsejados por el fabricante, pues de otra forma, se producirán
deformaciones en los bordes de la cinta que alterarán su lectura

3.2. Degradaciones de los discos analógicos

3.2.1. Degradaciones en discos de acetato. Previo al advenimiento de la


cinta magnética, la mayoría de grabaciones se hacían en discos de acetato. La
composición química de estos discos debía guardar la proporción adecuada
entre facilidad de grabación y calidad del sonido resultante.

Desde 1930, la mayoría de discos de acetato eran construidos en una base de


aluminio cubierta con nitrocelulosa plastificada con aceite de castor. Debido a
las propiedades inherentes a la nitrocelulosa, los discos de acetato son los
medios de grabación de sonido menos estables. La caída del recubrimiento de
101

nitrocelulosa, por la pérdida del aceite de castor plastificante, es su principal


causa de degradación. La caída gradual del plastificante causa
quebrantamiento progresivo y pérdida permanente de información. Además, el
acetato de nitrocelulosa se descompone continuamente y con el tiempo puede
reaccionar con vapor de agua u oxígeno para crear ácidos que actúan como
catalizadores de otras reacciones químicas, que se ven aceleradas por altas
temperaturas y niveles altos de humedad.

3.2.2. Degradaciones en discos de ebonita. La vulcanización es un


proceso para tratar caucho crudo con sulfuro o componentes de sulfuro en
diferentes proporciones y a diferentes temperaturas. El resultado es un
aumento en la dureza y elasticidad del caucho.

La ebonita, en la oscuridad, es estable, retiene su apariencia y propiedades


muy bien, pero en presencia de luz o calor, el material pierde sulfuro y, por
ello, se vuelve quebradizo y pierde su brillo. La luz, en presencia de humedad,
induce a la creación de óxidos de sulfuro y ácido sulfúrico que degradan el
material. Además, la ebonita también presenta complicaciones durante la
fabricación de los discos, ya que durante el proceso de enfriamiento, éstos
tienden a contraerse de manera dispareja ocasionando deformaciones en su
superficie.

Además de estos inconvenientes, está el mayor problema del disco de ebonita:


su superficie áspera introduce un enorme ruido de fondo afectando
notoriamente la calidad del sonido.
102

3.2.3. Degradaciones en discos de vinilo. Hasta ahora, el vinilo ha


probado ser el material más estable que se ha usado en la fabricación de
grabaciones sonoras analógicas. Sin embargo, su vida útil no es indefinida.
Estos discos están hechos, en su mayoría, de PVC (cloruro de polivinilo) y un
pequeño porcentaje de materiales de relleno, estabilizadores, pigmentos,
sustancias antiestáticas, etc.

El cloruro de polivinilo se degrada químicamente cuando se expone a luz


ultravioleta o calor, lo cual puede ser el catalizador de una declorización que
eventualmente produce cloruro de hidrógeno (HCI) (que, a su vez, al
combinarse con agua, produce ácido clorhídrico) del PVC como resultado de
una termo-degradación.

Además de todas las degradaciones químicas que pueden sufrir los diferentes
materiales utilizados en los discos, están el polvo, la suciedad y los hongos
que los afectan igualmente y a sus equipos reproductores. Un disco con
exceso de polvo y suciedad como el que se observa en la figura 32, puede
ocasionar que la música no se escuche con fluidez sino con leves
interrupciones que se oyen como ausencia de sonido, pops y otros ruidos.
Además, durante su barrido, la aguja puede recoger estos agentes externos y
ocasionar rayones en otros discos en el momento de ser reproducidos. Los
hongos ilustrados en la figura 33 producen descomposición del material y
pueden infectar otros discos cercanos.
103

Figura 32. Imagen aumentada de un disco con polvo y suciedad.


Fuente: GODSILL, Simon and RAYNER, Peter. Digital audio restoration. Paris: CAPPÉ,
Olivier, 1997. 71p.

Figura 33. Disco de vinilo con crecimiento de hongos en su superficie.


Fuente: MICROGRAPHIA. The microscopy of vinyl records: biological agents of vinyl
degradation [en linea]. s.p.i.
<http://www.micrographia.com/projec/projapps/viny/viny0200.htm>
[consulta: 5 Abr. 2005]
104

3.3. TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE LOS MEDIOS DE


ALMACENAMIENTO ANALOGICOS

Después de haber analizado los distintos formatos de audio analógicos y las


descripciones en cuanto a sus formas de degradación, es preciso abordar la
etapa más crítica del proceso de restauración de audio. Pero antes de ellos, se
hace necesario tener presente que el audio no es únicamente lo que se
restaura, pues también se restaura su soporte físico. Es esto, precisamente, lo
que la hace crítica, pues un error, por mínimo que parezca, puede acarrear la
destrucción del el medio para “reconstruir”.

Se utiliza el término reconstruir entre comillas, pues los procesos que se llevan
a cabo en esta etapa son realizados en medios que pueden estar muy
deteriorados pero en condiciones físicas estables y enteros; ya que a niveles de
degradación muy severos, como medios con partes faltantes, quemados, o
cintas de acetato con síndrome de vinegar o en condiciones en las que el
medio ya no es reproducibles en ningún equipo, haciendo que los procesos
descritos en esta etapa ya no sean aplicables.

El proceso se aplica generalmente para cintas magnéticas discos, ya que son


los medios más comunes que se presentan para restaurar. No se incluyen los
cilindros de Edison ni las grabaciones en alambre, ya que conseguirlos en
condiciones de ser reproducibles es difícil y no de menor dificultad es encontrar
sus reproductores en buenas condiciones.

Los procesos aquí descritos, aunque pueden ser ejecutados con el único fin de
restaurar el medio físico analógico (cinta o disco) para prolongar su vida útil,
deberían ser concebidos como la antesala de un tratamiento digital, pues lo
105

ideal es reconstruir para digitalizar la información y de esta manera garantizar


una vida prolongada a los recuerdos sonoros que en cintas magnéticas o
discos, (a pesar de los tratamientos) tarde o temprano terminarían por
deteriorarse definitivamente.

3.3.1. Tratamiento físico de las cintas magnéticas Tal vez las cintas
magnéticas fueron el medio de almacenamiento de audio analógico más común
debido a su versatilidad, además, se podían grabar una y otra vez con facilidad
y eran portátiles. Sin embargo, paradójicamente, esta ventaja puede ser su
peor enemigo ya que si no se conservan y manipulan adecuadamente se
convierten en el medio más propenso a degradarse. De todas formas, la mejor
manera de conservar las cintas magnéticas es llevando su contenido a un
medio de almacenamiento digital y, preferiblemente, óptico, puesto que las
cintas magnéticas digitales actuales, aunque sus componentes y procesos de
manufactura han mejorado, pueden sufrir de todos los problemas inherentes a
este medio.

Los procesos que se describen a continuación aplican únicamente para cintas


en carrete abierto ya que para cartuchos cerrados estos procesos son muy
laboriosos y complejos.

El primer factor para llevar a cabo este proceso de “reconstrucción” es


determinar el estado y tipo de la cinta que se va a restaurar.
106

3.3.1.1. Determinación del tipo de cinta. La cinta magnética se


encuentra principalmente en dos tipos de material: poliéster y acetato.

Aunque el acetato en las cintas magnéticas se dejó de usar hace mucho


tiempo, éste fue reemplazado por el poliéster, gracias a sus características más
estables de composición. Hoy en día se encuentran muchas cintas de acetato
que tienen la posibilidad de ser restauradas.

Para reconocer si una cinta es de acetato o de poliéster basta con un


procedimiento simple: se ponen en posición de contraluz y allí se debe
observar lo siguiente: si la cinta es traslucida, como se muestra en la figura
34, es acetato, si la cinta es opaca, como se muestra en la figura 35, es
poliéster. Este procedimiento es fácil de llevar a cabo, pero es fundamental
para reconocer sus características.

Figura 34. Cinta de acetato


Fuente: CILETTI, Eddie. If I Knew you were comino I’d have baked a tape!: goo “U”.
[en linea]. s.l.: CILETTI, Eddie. 1998.
<http://www.tangible-technology.com/tape/baking1.html> [consulta: 6 Abr. 2005]
107

Figura 35. Cinta de poliéster.


Fuente: CILETTI, Eddie. If I Knew you were comino I’d have baked a tape!: goo “U”.
[en linea]. s.l.: CILETTI, Eddie. 1998.
<http://www.tangible-technology.com/tape/baking1.html> [consulta: 6 Abr. 2005]

3.3.1.2. Determinación del estado de la cinta. Verificar el estado de una


cinta magnética determina la magnitud de la restauración para ejecutar.

A continuación se mencionan los pasos a seguir para determinar el estado de


una cinta magnética.

• Revisar el contenedor de la cinta para determinar su integridad


estructural.

El deterioro del soporte físico es un síntoma fehaciente de un manejo


inadecuado, y como éste es el protector de la cinta con el contacto
externo directo, es importante verificar su estado ya que de encontrarse
muy deteriorado, es posible pensar que su cinta también se encuentre
en malas condiciones. Si el contenedor se encuentra en mal estado, pero
la cinta está bien, se debe llevar a un soporte en buen estado.

• Explorar el interior del contenedor y los bordes de la cinta, para


observar que no presenten coloraciones y sustancias extrañas que
108

indican la presencia de hongos, factor común en cintas expuestas a alta


humedad. De presentarse esta situación, se debe aislar la cinta para
evitar la propagación de estos hongos en otras cintas. Posteriormente,
se debe terminar la inspección y proceder a su limpieza, ya que los
hongos dañan las cintas y suelen ser peligrosos para la salud.

• Observar si en los bordes de la cinta hay presencia de polvos blancos o


residuos cristalinos y si dentro del contenedor se presentan algunas
coloraciones amarillentas que indiquen óxido. La presencia de estos
elementos indica que la cinta tiende a degradarse. En este punto no es
necesario hornearla, pero se debe considerar la posibilidad de llevar su
información a otro medio que esté en buenas condiciones.

• Observar los bordes de la cinta y el interior del contenedor con el fin de


detectar partículas sólidas y signos de óxido, que puedan manifestar
contaminación líquida. Las partículas sólidas en la cinta pueden bloquear
la señal de reproducción y ocasionar rayones tanto en la cinta como en
la cabeza de lectura. Aspirar delicadamente la cinta y el contenedor
puede solucionar temporalmente este problema. La contaminación
líquida acelera la degradación de la cinta.

• Reproducir la cinta y observar si hay residuos blancos o en la cabeza de


reproducción. Si se confirma, entonces se infiere que existe pérdida de
lubricante.

• Oler la cinta. En cintas de poliéster, cuando se hidroliza el poliuretano


del aglomerante se crean esteres que producen olores astringentes, así
se determina que la cinta sufre del síndrome de Sticky Shed. En este
estado la cinta se encuentra en proceso de autodestrucción, lo que
indica que requiere atención inmediata. El tratamiento correctivo en este
punto consiste en hornear la cinta. Se debe estar seguro de que el
problema de la cinta es el síndrome de Sticky Shed y no de lubricante,
109

pues hornear una cinta con defecto de lubricante empeora este


problema. Cuando la base se comienza a degradar, en cintas de acetato,
se produce un olor a vinagre, signo de que la cinta sufre del síndrome de
Vinegar. Lamentablemente, en este punto, las cintas de acetato no
tienen reparación.

De acuerdo con el estado de la cinta se utilizan las herramientas y


tratamientos correspondientes para cada caso en particular.

Como es claro que el tratamiento de horneado es el más delicado de todos, a


continuación se describe el proceso en forma detallada y se mencionan algunos
aspectos para tener en cuenta para su correcta ejecución.

Más adelante se detalla el tratamiento para problemas menores.

3.3.1.3. Proceso de horneado de una cinta magnética. Hornear una


cinta estabiliza el poliuretano del aglomerante, detiene su hidrolización y
elimina la sustancia pegajosa que se produce y que es la causante de los
problemas de la degradación.

Consideraciones que se deben tener en cuenta previamente al horneado:

• Antes de someter la cinta a este proceso, se recomienda, si es posible,


sacarle una copia, ya que un descuido puede ser catastrófico y es
preferible tener la grabación con un sonido deficiente que perderla
completamente.

• El proceso de hornear una cinta magnética corrige temporalmente el


problema del síndrome de Sticky Shed, mas no es un tratamiento
110

definitivo ni absoluto. De este proceso se obtiene una cinta que puede


funcionar perfectamente por unas semanas, tiempo suficiente para
llevar su información a un medio más estable, preferiblemente en
formato digital.

• No se deben utilizar hornos de gas ya que éste produce vapor de agua


cuando se quema.

• Utilizar un horno que tenga excelente control de temperatura y con un


termómetro de buena exactitud para asegurarse de que la temperatura
de horneado es la adecuada.

• No utilizar hornos de microondas. El calor generado por las microondas


es excesivo y este es un proceso que, en términos culinarios, debe ser
“a fuego lento”. Además, el campo electromagnético generado por el
horno, puede ocasionar pérdida de información de la cinta.

• El proceso de horneado afecta el lubricante de la cinta, por lo tanto, no


se recomienda hornear una cinta más de dos o tres veces.

• No deben presentarse salientes de cinta por los lados, como se ilustra en


la figura 36. Estas finas salientes de cinta, al calentarse individualmente,
pueden deformar la cinta.
111

Figura 36. Cinta mal rebobinada. Se pueden ver las salientes de cinta que al calentarse
pueden traer otros problemas.
Fuente: CILETTI, Eddie. If I Knew you were comino I’d have baked a tape!: goo “U”.
[en linea]. s.l.: CILETTI, Eddie. 1998.
<http://www.tangible-technology.com/tape/baking1.html> [consulta: 6 Abr. 2005]

• No se deben hornear cintas de acetato. El síndrome de Vinegar no tiene


corrección. Además, con el calor, el acetato se vuelve quebradizo y
pierde tensión.

Teniendo en cuenta las sugerencias anteriores, se comienza a hornear la cinta


precalentando el horno a temperatura de horneado, por 30 minutos, antes de
introducirla. La temperatura de horneado puede estar entre 50 y 60º C. para
cintas de cualquier dimensión y sus tiempos de horneado varían de acuerdo
con la siguiente tabla.
112

Tabla 2. Tiempos de horneado de una cinta magnética.

ANCHURA DE LA CINTA TIEMPO DE HORNEADO


¼-pulgada 1 a 4 horas
½-pulgada 2 a 5 horas
1-pulgada 3 a 6 horas
2-pulgadas 4 a 8 horas

Fuente: CILETTI, Eddie. If I Knew you were comino I’d have baked a tape!: goo “U”.
[en linea]. s.l.: CILETTI, Eddie, 1998.
<http://www.tangible-technology.com/tape/baking1.html> [consulta: 6 Abr. 2005]

Se debe dar vuelta a la cinta cada 30 ó 45 minutos. Los tiempos de horneado


son muy variantes ya que dependen del fabricante, de la condición y del
número de carretes de cinta que se estén horneando a la vez. Por esta razón,
la mejor manera de verificar si la cinta está lista es tomando un tramo de cinta
de 15 cm. y pasarle periódicamente un paño suave (que no desprenda
partículas) por la superficie, hasta que los residuos sobre el paño sean
mínimos. Después de hornear la cinta, y antes de reproducirla, se recomienda
dejarla enfriar por un tiempo no menor al tiempo de horneado.

El resultado de este proceso debe ser el de una cinta en óptimas condiciones,


es decir, lista para reproducirse y digitalizarse.

Para mantener la cinta en estas condiciones, mientras se llega la hora de


digitalizar, se recomienda almacenarlas en bolsas plásticas bien selladas y con
bolsas de silica gel para contrarrestar la humedad.
113

3.3.1.4. Tratamiento de una cinta magnética con problemas menores.

Tabla 3. Problemas menores de las cintas magnéticas.

PROBLEMA PROCEDIMIENTO
Enjuagar la cinta con agua destilada
Agua y dejarla secar a temperatura
ambiente.
Limpiar con agua jabonosa y
Pantano o agua sucia enjuagar con agua destilada. Dejar
secar a temperatura ambiente
Limpiar la cinta en una solución de
HCI para remover la sal y otras
Agua salada o marina suciedades marinas. Enjuagar con
agua limpia y dejar secar a
temperatura ambiente.
Utilizar una aspiradora para extraer
toda la cantidad posible del
Polvo, hollín y partículas sólidas contaminante tanto de la cinta como
del contenedor. Limpiar el contenedor
con un paño húmedo.
Si el problema solo afectó el soporte
físico, basta con reemplazarlo.
Si además deformó la cinta no hay
Calor nada que se pueda hacer para
arreglar la deformación. Sin embargo
en estas condiciones la cinta no
pierde demasiado la calidad y puede
ser reproducida.
114

Aislar la cinta y el soporte físico de


otros medios ya que se pueden
contaminar.
Aspirar la cinta y el contenedor
delicadamente.
Utilizar un cepillo suave para limpiar
Hongos restos de contaminación.
Reproducir la cinta en un equipo
limpiador de cintas con la aplicación
previa de un fungicida.
Evitar soplar ya que dispersaría los
hongos en el ambiente, que, además,
son nocivos para la salud.
Si se vio afectado el soporte físico,
Golpes llevar la cinta a uno en buenas
condiciones.
Limpiar la cinta con un paño seco y
Perdida de lubricante suave. Puede ser necesario aplicarle
un poco de lubricante.

Fuente: UNESCO. Audiovisual archives: A practical reader: magnetic tape


deterioration: recognition, recovery and prevention. [en linea]. s.l.: UNESCO, s.f.
<http://www.unesco.org/webworld/ramp/html/r9704e/r9704e00.htm#Contens>
[consulta: 6 Abr. 2005]
* Traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
115

3.3.2. Tratamiento físico de las degradaciones en discos analógicos

A diferencia de las cintas magnéticas, los discos son menos propensos a las
degradaciones, siempre y cuando estén en condiciones de almacenamiento
adecuadas, ya que, usualmente, se prefiere trasladar la información del disco a
una cinta magnética para aprovechar su versatilidad, y, a su vez, contribuir a
incrementar la vida útil del disco ya que se está disminuyendo su
manipulación.

El párrafo anterior no quiere decir que la intención de este capítulo sea


sostener que todos los discos se van a encontrar en buenas condiciones,
simplemente se está concluyendo que ésta es una razón más de porqué un
disco puede llegar a durar más que una cinta magnética. Esto quiere decir, en
última instancia, que un disco nunca se encuentra en condiciones óptimas de
ser digitalizado sin un previo tratamiento, ya que requiere un sencillo proceso
de limpieza, como mínimo, para discos mantenidos en condiciones óptimas de
conservación, y hasta tratamientos en máquinas especializadas o procesos de
presión en caliente para discos deformados.

3.3.2.1. Degradaciones químicas. Para las degradaciones químicas que


sufren los discos analógicos, causadas por la descomposición o reacción de sus
componentes con otras sustancias del medio, hasta el momento no han sido
descubiertos tratamientos correctivos. Por esta razón, el tratamiento que debe
aplicarse, después de percibir la degradación, es la limpieza del disco y el
traslado de la información a otro medio, ya que en este punto el disco está
próximo a destruirse completamente.
116

3.3.2.2. Degradaciones físicas

Polvo y contaminantes sólidos. El polvo y la contaminación por partículas


sólidas constituyen la degradación más común en discos. Afortunadamente,
existen métodos muy eficientes para combatirla, basados en procesos de
limpieza en los que la variación está en el fluido utilizado para ello. El problema
de esta degradación se produce cuando ha causado rayones que originan
saltos y ocasionan pérdida de información. Físicamente no es posible
eliminarlos, pero se puede aplicar un tratamiento artesanal que consiste en
suavizar el rayón por medio de un elemento puntiagudo en los puntos por
donde pasa la aguja y así lograr que ésta pueda seguir su barrido por la
superficie del disco sin deslizarse.

El tratamiento de limpieza de un disco consta de un primer paso en el que se


eliminan las suciedades más livianas y superficiales del disco, tarea que se
puede realizar soplando el disco con aire a presión. Puede hacerse con un
aerosol de aire comprimido o cualquier otro medio que garantice un aire seco
sin humedad. No se recomienda soplar con la boca, pues el aire expulsado es
muy húmedo. Para esta tarea también se puede utilizar un cepillo suave con
cerdas de fibra de carbono.

No se debe limpiar el disco con paños o piezas de tela secas. El polvo se


mantiene adherido a la superficie del disco por atracción electrostática, y la
fricción, al pasar el paño seco sólo contribuirá a aumentar la carga
electrostática en el disco atrayendo más partículas de polvo.

Luego de la limpieza superficial, el segundo paso consiste en una limpieza un


poco más profunda mediante la aplicación de una solución de agua destilada y
117

un surfactante como el tetracloruro de carbono (Ccl4) para desengrasar. Ésta


debe hacerse humedeciendo un paño con la solución, luego se aplica en la
superficie del disco en dirección de las manecillas del reloj. Por último, se
enjuaga con agua destilada.

En discos de ebonita se recomienda ejecutar esta limpieza lo más rápido


posible ya que este material tiende a absorber rápidamente los fluidos.

Se utiliza agua destilada ya que presenta las siguientes ventajas:

• Su composición química es conocida con precisión

• No deja residuos

• Es segura y no tóxica

• Es económica

• Es fácil de conseguir

• Dispersa cargas estáticas

Además del agua destilada, en el mercado se pueden adquirir otros líquidos


para limpiar discos con muy buenos resultados. Para estos casos, se
recomienda seguir las instrucciones de limpieza del fabricante.

Este es el método de limpieza más sencillo y más barato que se puede aplicar.
Sin embargo, si se quieren resultados óptimos, se puede recurrir a máquinas
especializadas en limpieza de discos en la que sólo es cuestión de aplicar el
118

fluido limpiador y ésta se encarga del resto. Los resultados de esta limpieza
son óptimos. En la figura 37 se ilustra una máquina especializada en limpieza
de discos.

Figura 37. Maquina limpiadora de discos.


Fuente: NITTY GRITTY. Cleaning systems. [en linea]. s.p.i.
<http://www.nittygrittyinc.com>
[consulta: 6 Abr. 2005]

Algunos fabricantes de estos aparatos son:

• Nitty Gritty www.nittygrittyinc.com

• VPI Industries www.vpiindustries.com

• Spin-Clean www.garage-a-records.com/spin.html

• Keith Monks www.keithmonks-rcm.co.uk

Para mayor información consultar sus páginas Web.


119

Deformaciones. La consecuencia del calor excesivo en un disco es la


deformación. Esta degradación es muy delicada de tratar, pues requiere de un
proceso en que el disco puede quebrarse fácilmente.

El tratamiento sólo es aplicable a discos de vinilo y consiste en presionar el


disco entre dos láminas de vidrio y calentar, utilizando un secador de aire
caliente hasta que el disco esté lo más plano posible. Al terminar este proceso
se debe dejar enfriar el disco antes de reproducirlo.

La delicadeza del procedimiento consiste en que la presión debe ir


aumentándose lenta y cuidadosamente cada cierto tiempo ya que si se aplica
más presión de la requerida en algún momento puede quebrarse el disco.

Este proceso, aunque deja el disco en condiciones aptas para ser reproducido,
no mejora su calidad sonora.
120

4. CAPTURA DE SEÑALES DE AUDIO ANALOGICO

Para comenzar un proceso de restauración y grabación digital de audio es


necesario preparar una serie de dispositivos que cooperen en la captura de la
señal. Buscando con ello almacenarla en el disco duro de un computador,
donde la señal puede ser sometida a procesos de restauración digital.

De acuerdo con la edad de los registros de audio o fonogramas y los equipos


de reproducción, se puede concluir, entonces, que son muy diferentes la
sucesión de operaciones y el conjunto de dispositivos que es preciso poner en
juego para la captura de señales de audio analógico.

La captura de audio analógico se puede dividir en dos tipos generales,


dependiendo de las posibilidades de los equipos reproductores. Cuando el
equipo reproductor posee salidas eléctricas de audio analógico la captura es del
tipo limpio; cuando el equipo reproductor no posee salidas eléctricas de
audio analógico la captura es del tipo sucio. Así, por ejemplo, para registros
soportados en cilindros de cera, se necesita capturar el sonido con ayuda de
micrófonos. Esta etapa requiere una planificación cuidadosa (posiblemente
varios micrófonos dispuestos en posiciones estratégicas) donde se filtran
aquellas señales sonoras, ajenas a la normal reproducción del registro.

En el caso de soportes más modernos, como LP y casetes, se puede prescindir


de la captura mediante micrófono. En la figura 38 se observan los tipos de
captura de señales analógicas de audio.
121

Registro de Equipo Amplificador Conversor


Micrófono Señal digital
audio reproductor A/D

Sistema de captura tipo sucio

Registro de Equipo Conversor


Amplificador Señal digital
audio reproductor A/D

Sistema de captura tipo limpio

Figura 38. Diagrama de bloques de sistema de captura de audio tipo sucio y limpio.

Para ilustrar estos tipos de captura se muestran a continuación, en las figuras


39 y 40, los sistemas con ejemplos particulares de equipos utilizados para la
captura tipo sucio y limpio, respectivamente.

Señal
Digital

Gramófono Micrófono Amplificador Convensor A/D

Figura 39. Sistema de captura de audio tipo sucio.


Fuente: Phonophan. Antique Phonographs for Sale [en línea]. s.l.: Phonophan, 2005.
<http://www.phonophan.com/sales.html> [consulta: 27 May. 2005]
Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/index.php?do=products.family>
[consulta: 3 Abr. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás
122

Señal
Digital

Carrete abierto Amplificador Convensor A/D

Figura 40. Sistema captura de audio tipo limpio.


Fuente: Audio recorder. Reel-to-reel recorder. [en linea]. s.l.: Wikipedia, s.f.
<http://en.wikipedia.org/wiki/Image:Reel-to-reel_recorder_tc-630.jpg>
[consulta: 25 Feb. 2005]
Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/index.php?do=products.family>
[consulta: 3 Abr. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

4.1. FUNDAMENTOS DEL SONIDO DIGITAL

Es muy pertinente argumentar que cuando se habla de fundamentos, se alude


a aquellos soportes teóricos en los que está cimentada una hipótesis de
cualquier orden. En este caso, se trata del sonido digital y sus bases
conceptuales. Las ondas de presión sonora son analógicas, es decir, son
señales continuas en el tiempo que tienen la capacidad de fluctuar en la
amplitud, gradualmente. En el audio analógico existe una relación directa y
casi lineal entre cambios en la presión del aire y los del flujo de corriente en un
circuito. En otras palabras, lo que se quiere expresar es que las señales
eléctricas que fluyen por los circuitos de los equipos de grabación y
reproducción de audio, son análogas a las ondas de presión sonora que han
transducido.
123

Las ondas de presión sonora pueden ser digitalizadas, es decir, pueden


convertirse en patrones de números que constituyen una codificación de las
mismas.

4.1.1. Audio Analógico. Entendido el fenómeno físico del sonido, y el de las


ondas de presión sonora, el audio analógico hace referencia a los procesos de
grabación y registros analógicos de particular interés. En el caso de una
grabación o un registro analógico, los cambios en la presión del aire originados
por una onda sonora, hacen vibrar la membrana del dispositivo transductor
(micrófono) que convierte la energía acústica en energía eléctrica. Los
movimientos de la membrana producen pequeñas diferencias de voltaje, las
que, a su vez, son trasladadas a una cinta o disco, donde quedan grabadas
como una réplica casi exacta de la señal sonora. Dichas diferencias de voltaje
son proporcionales con el movimiento de la membrana del micrófono y, a
mayor vibración, mayor diferencia de señal eléctrica será trasladada al formato
de almacenamiento, creando una copia que es análoga a las ondas de presión
sonora que llegaron al micrófono. Posteriormente, el cabezal de reproducción
del grabador o de la máquina reproductora se encargará de convertir esas
variaciones en señales que, amplificadas a través de circuitos y parlantes,
llegarán al oído humano.

4.1.2. Audio Digital. El audio digital está conformado por ficheros


informáticos (archivos) que se encuentran almacenados en un computador o
en algún medio de almacenamiento de audio digital, como el CD, para su
posterior reproducción o tratamiento digital. Estos ficheros se obtienen por la
grabación (digitalización) del sonido real (ondas de presión sonara), ya sea
procedente de la voz, instrumentos musicales acústicos o electrónicos,
grabaciones analógicas, entre otras. Este proceso de digitalización, también
denominado muestreo y retención (sample and hold), se realiza gracias a los
denominados Conversores Análogo-Digital (ADC). Éstos son unos dispositivos
124

que, de acuerdo con sus parámetros, toman muestras del sonido y lo


convierten en números para almacenar en el computador.

Además del ADC, existe un dispositivo dual llamado Conversor Digital-


Análogo (DAC), que brinda la posibilidad de escuchar el sonido digitalizado en
el computador o en cualquier otro reproductor de audio digital, convirtiendo los
números almacenados en el computador o cualquier medio digital en señales
eléctricas para luego filtrarlas y obtener una señal sonora válida.
Posteriormente se ahondará más profundamente sobre este dispositivo y de
los procesos para transformar una señal digital de audio en una señal sonora.

Una de las ventajas del audio digital sobre el analógico, es la posibilidad de


almacenamiento de la información en forma perdurable, es decir, sin sufrir los
padecimientos a los que normalmente están expuestos los medios de
almacenamiento analógicos.

En un tratamiento de audio, y en particular la restauración, la información


digital puede ser manipulada con facilidad. Lo contrario ocurre en lo que tiene
que ver con la información analógica en un disco o cinta, pues dicha
información se almacena en surcos y alineamientos de partículas magnéticas,
respectivamente, lo que hace poco efectivo tal proceso.

Otra ventaja es que permite realizar un tratamiento DSP (Procesamiento


Digital de Señales) sobre la señal para introducir modificaciones como efectos
y mejoras, cambios y transformaciones imposibles o muy difíciles de lograr
analógicamente. Un ejemplo de esto es permitir la restauración, por medios
digitales, de una señal de audio degradada, o efectuar la compresión o
implementación de efectos de retardos y reverberaciones, entre otros.
125

4.1.2.1. Historia del audio digital.

En este apartado es de suma trascendencia volver sobre las condiciones


históricas en las que se presentaron las primeras alusiones al audio
digital.

Los primeros experimentos en audio digital datan de finales de los


cincuenta, cuando Max Mathews, ingeniero y compositor estadounidense,
obtuvo en los laboratorios Bell los primeros sonidos generados por
computador. En esta época el bajo nivel de potencia de las computadoras
no permitía una velocidad suficiente para digitalizar el sonido. Los
experimentos intentaban obtener sonidos sintéticos, generando los
números en el computador.

Tras muchos experimentos, que ayudaron a comprender mejor la


naturaleza del sonido digital, el primer grabador comercial, el Sony PCM-
1, se hizo realidad en 1977. El conversor era de 13 bits y utilizaba como
soporte cintas de Video Beta. Pero al año siguiente, el modelo PCM-1600
ya utilizaba conversión de 16 bits. En 1982 apareció el CD, desarrollado
conjuntamente por Sony y Phillips, con un éxito fulminante.

Los primeros sistemas domésticos de grabación digital llegaron durante


los últimos años de la década de los ochentas, inicialmente con la cinta
DAT (Digital Audio Tape) o cinta de audio digital y, posteriormente, con el
DCC (Digital Compact Cassette) o casete digital compacto, el MiniDisc y
varios formatos de multipistas digitales (Alesis, Tascam, etc.). Las
tarjetas de sonido para computadores, dotadas de ADC y DAC, aparecidas
126

en los últimos años, han supuesto la definitiva democratización del sonido


digital2.

4.2. CAPTURA Y DIGITALIZACIÓN DE SEÑALES DE AUDIO.

En los sistemas de audio digital, la señal analógica se discretiza en función del


tiempo, es decir, se capturan muestras de la señal original en un intervalo de
tiempo. Este proceso se denomina muestreo o sampling. Igualmente, se
discretiza la amplitud o cuantiza, asignando un código numérico para
diferentes valores de la amplitud de la señal en idénticos intervalos de tiempo.
Estos códigos se llaman niveles discretos y el proceso se denomina
cuantización.

4.2.1. Muestreo de señales de audio. Como se mencionó anteriormente,


la palabra muestreo está referida a la acción de capturar muestras en
intervalos de tiempo regulares. Para digitalizar un sonido es necesario
muestrearlo con una frecuencia particular. El teorema del muestreo, o teorema
de Nyquist, indica cuál debe ser esta frecuencia. Dicho teorema establece que
la frecuencia de muestreo debe ser mínimo dos veces la frecuencia máxima de
la señal para capturar si se quiere tener una buena réplica de la señal original.
Así, por ejemplo, para muestrear correctamente una señal de X Hz, se requiere
como mínimo una frecuencia de muestreo de 2X Hz. De acuerdo con lo
esbozado teóricamente en el capítulo 1, en los campos de investigación del
sonido, la acústica física indica que el oído humano es capaz de percibir

2
JORDÀ PUIG, Sergi. Principios del Sonido Digital: breve historia del audio digital.
[en linea]. s.l. JORDÀ PUIG, Sergi, 2003.
<http://www.ccapitalia.net/reso/articulos/audiodigital/pdf/02-SonidoDigital.pdf>
[consulta: 25 Mar. 2005]
127

frecuencias sonoras de 20 Hz hasta aproximadamente 20.000 Hz. Lo que


implica, entonces, que para muestrear correctamente cualquier sonido la
frecuencia de muestreo deberá ser superior o igual a 40.000 Hz. De aquí
proceden los famosos 44.100 Hz. utilizados en los CDs de audio. En la figura
41 se observa el muestreo para una señal senoidal.

Nivel 1
1

0.8 Señal analógica

0.6
Nivel 2

0.4
Amplitud

0.2 Señal digital


Nivel 3
0

-0.2

-0.4 Nivel 4

-0.6

-0.8
Nivel 5
-1
0 0.2 0.4 0.6 0.8 1

Tiempo (seg)

Figura 41. Muestreo de una señal senoidal.

4.2.1.1. Muestreo con frecuencias inferiores o aliasing. Si en el caso de


la acústica física se muestrea a una frecuencia inferior, como por ejemplo a
20.000 Hz, los resultados obtenidos serán correctos para las frecuencias por
debajo de los 10.000 Hz, (la mitad de la frecuencia de muestreo). Para
aplicaciones que no requieran de la máxima fidelidad, estas cifras son
suficientes. Sin embargo, el sonido será un poco menos fiel, pero, aún así, se
128

parecerá al original ya que normalmente la zona frecuencial con mayor energía


o sensibilidad al oído humano se encuentra aproximadamente entre los 1.000
y los 3.000 Hz.

Al seleccionar la frecuencia de muestreo por debajo del doble de la frecuencia


de la señal sonora que se va a capturar, o sea, por debajo de 40.000 Hz, se
genera un problema adicional: el surgimiento de señales de frecuencias
fantasmas que realmente no pertenecen al sonido original y que alteran el
sonido muestreado. Este fenómeno recibe el nombre de aliasing, o espectro
plegadizo.

El efecto de aliasing genera, generalmente, dos señales fantasmas, que se


caracterizan por ser:

• Una, de frecuencia fi (f inferior) igual a la frecuencia de muestreo fm


menos la frecuencia de la señal muestreada fa. Como se muestra en la
ecuación 4.1.

fi = fm – fa (4.1)

• Otra, de frecuencia fs (f superior) igual a la frecuencia de muestreo fm


más la frecuencia de la señal muestreada fa. Como se muestra en la
ecuación 4.2.

fs = fm – fa (4.2)

Para evitar estas señales fantasmas, cuando se desee muestrear a frecuencias


inferiores a 40.000 Hz, se debe filtrar previamente la señal a capturar (fa),
eliminando todos los valores por encima de la mitad de la frecuencia de
muestreo seleccionada; esto se logra haciendo pasar la señal de entrada por
129

un filtro pasabajos, que garantice que las frecuencias existentes en la señal de


entrada, no son superiores a la mitad de la frecuencia de muestreo. Por
ejemplo, si se muestrea a 20.000 Hz, se debe filtrar la señal original,
eliminando todas sus componentes, por encima de 10.000 Hz.

Un ejemplo muy claro se encuentra aplicado en la telefonía: la voz humana


produce sonidos comprendidos entre 100 y 10.000 Hz. Haciendo pruebas y
medidas se llegó a la conclusión de que al filtrar la gama de frecuencias de la
voz humana, hasta dejarla entre 300 y 3.400 Hz, se obtiene una buena
inteligibilidad (se entiende con claridad suficiente el 99% de las palabras) y se
reconoce al interlocutor; posteriormente, se muestrea a una frecuencia de
8.000 Hz, que es mayor al doble de la nueva frecuencia máxima.

En el caso de seleccionar una frecuencia de muestreo de 40.000 Hz, o


superior, no es necesario implementar el filtro pasabajos, pues fi y fs no son
percibidas por el oído humano, como se muestra a continuación:

fa: 20.000 Hz. Cota superior máxima aproximada de las frecuencias


perceptibles por el oído humano.

fm: 44.100 Hz. Frecuencia de muestreo correcta, según el teorema de Nyquist.

fs = 44.100 Hz + 20.000 Hz = 64.100 Hz (frecuencia no perceptible por el oído


humano)

fi = 44.100 Hz – 20.000 Hz = 24.100 Hz (frecuencia no perceptible por el oído


humano)
130

4.2.2. Cuantización. Discretizar la amplitud, o cuantizar, significa asignar


un código para diferentes valores de la amplitud de la señal analógica en
idénticos intervalos de tiempo. Consiste en la subdivisión de las amplitudes de
las señales en un predeterminado número de niveles discretos de amplitud.
Las señales que resultan se denominan cuantizadas. Contrario del proceso de
muestreo, este resultado produce una pérdida irreparable de información,
debido a que es imposible reconstruir la señal analógica original a partir de su
versión cuantizada, pues, al mismo tiempo que se realiza la cuantización, cada
una de las muestras es atribuida al nivel de cuantización más aproximado
logrando que ésta sólo tome valores discretos que pueden ser representados
por códigos binarios digitales, mediante su codificación. Sin embargo, en el
análisis del concepto de información no es necesario transmitir todas las
posibles amplitudes de las señales. Por causa del ruido que se introduce
durante la transmisión y en el receptor, el circuito demodulador o detector no
es capaz de distinguir entre las variaciones muy finas de la amplitud de una
señal. Además, el último receptor de la información, el oído humano, cuando
se trata de sonidos o música, presenta limitaciones en cuanto al más pequeño
nivel de señal que puede distinguir. La imposibilidad de distinguir entre las
amplitudes, hace que el proceso de cuantización sea aplicable.

4.2.3. Codificación. Consiste en la asignación de códigos a los diferentes


niveles de discretización de la señal analógica en una secuencia ordenada de
números. El procedimiento más utilizado en la actualidad se denomina
Modulación por Codificación de Pulsos (PCM) y consiste en reemplazar una
señal por una secuencia de bits que representan su forma de onda. Una de las
ventajas de esta modulación es que la señal codificada sólo tiene dos valores
posibles: 0 y 1 en conjuntos de 2 hasta 24 bits, que dependen de la longitud
del código. Para reconstruir una señal es necesario tener un mecanismo
decodificador capaz de reconocer la diferencia entre dos valores definidos, lo
cual hace que el proceso sea menos sensible a errores.
131

4.2.3.1. Digitalización. Existen diferentes métodos para convertir una señal


analógica en una secuencia de bits. En el proceso de muestreo se realiza una
modulación de pulsos, donde se utiliza un tren de pulsos, cuyas características
se hacen variar de acuerdo con la señal modulada o de entrada. En nuestro
caso, la señal de audio analógico. Entre los sistemas de modulación de pulsos
PAM (Modulación por Amplitud de Pulsos), PPM (Modulación por Posición de
Pulso), PDM o PWM (Modulación por Duración de Pulso) y PCM. Sólo PCM tiene
importancia práctica, los demás sistemas rara vez se utilizan. El proceso de
conversión analógica a PAM es el primer paso en la conversión de una señal
analógica en una señal PCM. En PAM la amplitud de un tren de pulsos de ancho
constante varía en proporción con los valores muestreados de la señal
analógica de audio, es decir, la información es denotada en la amplitud de los
pulsos (la elección de la frecuencia de muestreo es determinada por el teorema
de Nyquist). En la figura 42 se observa la modulación por amplitud de pulsos
de una señal senoidal. Cuando la altura de estos pulsos es cuantizada en
niveles, y expresada mediante un código numérico, el resultado es conocido
como PCM. En la figura 43 se ilustra el diagrama para la generación de PCM.

Existe además, un proceso conocido como DPCM (Modulación Diferencial por


Código de Pulso), en el que el parámetro que se cuantifica es la diferencia
entre los valores absolutos de la muestra anterior y la actual.
132

0.8

0.6

0.4
Amplitud

0.2

-0.2

-0.4

-0.6

-0.8

-1
0 0.2 0.4 0.6 0.8 1

Tiempo (seg)

Figura 42. PAM de una onda senoidal.

Señal PAM
Señal analógica Señal PAM cuantizada Señal PCM
Muestreo y Cuantizador Codificador
Retención

Figura 43. Generación de PCM.

La pérdida de exactitud de información es conocida como ruido de


cuantización y es disminuido aumentando el número de niveles de
cuantización.

K = log 2 N (4.1)
133

Donde:
K es la longitud del código en bits.
N es el número de niveles.

En la tabla 4 se muestra la relación entre la longitud de código y el número de


niveles de cuantización comerciales de ADC y DAC.

Tabla 4. Relación longitud de código y niveles de cuantización.

Bits (K) Niveles (N)


8 265
16 65536
20 1048576
24 16777216

Se puede concluir que a mayor número de niveles de cuantización para definir


la amplitud de una señal analógica, se requiere una longitud de código mayor y
más exacta será la señal digital resultante.

4.3. REPRODUCCIÓN DE LA SEÑAL DE AUDIO DIGITAL

La reproducción de la señal define el momento culminante de un proceso de


tratamiento digital de audio y en especial el de restauración de audio, pues es
aquí donde se escucha el resultado definitivo de varios días de trabajo y se
extraen las conclusiones pertinentes. Por esta razón se dedica esta muy corta
sección a los conversores digital–analógicos, que son los responsables de llevar
la señal de audio del mundo digital al mundo analógico.
134

Todos los dispositivos reproductores de medios digitales y amplificadores de


audio poseen este tipo de conversor, puesto que el sonido, para que sea
percibido por el ser humano, debe ser sometido a este proceso. Esta tarea
también puede hacerse mediante DAC’s externos como el que se aprecia en la
figura 44, conectados a una salida digital de los reproductores. Con ello,
según sus fabricantes, se logra obtener sonido de mejor calidad. Esta
afirmación está soportada en teorías que aún no han sido probadas y
confirmadas definitivamente.

Figura 44. DAC externo.


Fuente: Conversores de audio. Products: progression DAC model 4705. [en linea].
Jefferson: Sakura Systems, 2005.
<http://www.sakurasystems.com/products/47dac.html> [consulta: 28 May. 2005]

4.3.1. Conversor digital-analógico. Conocido abreviadamente como DAC o


D/A. Se trata de un dispositivo que convierte un código o señal digital en una
señal analógica que puede ser voltaje, corriente, entre otras. Los DACs son la
interface entre el abstracto mundo digital y el analógico mundo real.
135

Lo que hace fundamentalmente el proceso de conversión digital–analógica es


tomar las miles de muestras de la señal digital y reagruparlas para obtener
una silueta que pareciera estar delineada de forma continua, creando la ilusión
de una señal con forma de onda analógica. Para hacerse una mejor idea de
este proceso se pueden tomar las pirámides. Cada pirámide está hecha de
miles de bloques que forman a sus lados un patrón escalonado que va hasta la
parte más alta de la estructura. Pero al observar desde lejos pareciera que los
bloques se combinaran entre sí dando la impresión de formar una línea recta
continua. En otras palabras, digitalizar es guardar una señal como una serie de
bloques de diferente altura. Cuando se ven estos bloques en el mundo
analógico se tiene la ilusión de ver una línea que va desde el tope de un bloque
al tope del siguiente, recreando la forma original de la señal.

4.3.2. Tipos de conversores digital-analógico. De acuerdo con la forma


en que se aplica la información digital a la entrada de un DAC, éstos se pueden
clasificar en:

4.3.2.1. Conversores serie. Son aquellos en los que la señal o el código


digital para convertir se aplica a través de un único terminal en el que
aparecen, en secuencia, los diferentes bits que la constituyen.

4.3.2.2. Conversores paralelos. Son aquellos en los que la señal para


convertir se aplica, en paralelo, a su entrada. Éstos, a su vez, según la forma
en que realiza la conversión, pueden clasificarse en:

Conversores de conversión simultánea o directa. La señal digital se


convierte de manera directa a analógica sin realizar ningún paso intermedio.
136

Conversores de conversión secuencial o indirecta. En este tipo de


conversores, la señal digital se convierte en una secuencia de impulsos que, a
su vez, se transforma en una señal analógica. Algunos de los procedimientos
de conversión secuencial son:

• Conversión por sobremuestreo. Consiste en utilizar, durante la


etapa de conversión, frecuencias de dos o más veces la frecuencia de
muestreo de la señal digital. Esto se logra mediante un mecanismo de
interpolación que agrega 2 o más muestras por cada muestra en la señal
original. Por ejemplo, una señal a 44.100 Hz entrega 44.100 muestras
por segundo, con un mecanismo de interpolación que agregue tres
muestras más, se obtendrían 176.400 muestras para entregar al DAC y
de esta manera el requerimiento del filtro de reconstrucción análogo
sería cortar en 88.200 Hz, lo cual es un proceso más fácil de efectuar
para la mayoría de los filtros. Un proceso similar se puede aplicar
tomando otro parámetro de la señal digital: la resolución. Si se tiene
una señal de 16 bits y se hace la conversión a 18 ó 20 bits, se obtendría
una señal con un mayor rango dinámico y, por lo tanto un
funcionamiento del conversor más holgado y una conversión digital
analógica más efectiva.

• Conversión PWM. Está basado en la generación de una secuencia de


impulsos cuya frecuencia es constante y la relación entre el tiempo en
que estos se encuentran en cero y en uno es variable y depende de la
información digital para convertir. Posteriormente, la señal analógica es
llevada a un filtro pasabajos que elimina todas las frecuencias por
encima del umbral de percepción del ser humano aproximadamente
20.000 Hz.

• Conversión MASH o Multistage Noise Shaping. En este caso se


genera una señal intermedia que se forma por el valor de varios bits,
gracias a que todos estos bits tienen el mismo nivel, la amplitud de esta
137

señal será constante. Para distinguir el valor de cada bit se usa un


proceso de PDM, donde el valor de cada bit está dado por su ancho y no
por su amplitud. Como la presencia del ruido implica una diferencia de
amplitud, que en este caso no existe, la componente de ruido en la
señal obtenida será muy reducida.

• Conversión híbrida. Cuando se aplica una combinación de las técnicas


mencionadas anteriormente.

4.4. CRITERIOS PARA LA SELECCIÓN DE EQUIPOS

Estos criterios que se pondrán a consideración deben ser muy sólidos para
permitir que esa selección no se haga de manera casual. El objetivo de cada
procedimiento en el tratamiento digital para la restauración de audio, es
obtener la mejor calidad de sonido en el momento de la captura y
digitalización. La nitidez y calidad se pueden garantizar, si la atención se
centra en tres aspectos fundamentales:

• El tratamiento previo de formatos de audio analógicos

• La selección de los equipos de reproducción

• La selección de equipos de captura digital

En el tratamiento de los formatos de audio analógico, analizado en el capítulo


3, es claro que el objetivo era reducir la mayor cantidad de ruidos espurios
causados por el mal estado de los formatos aplicando técnicas de limpieza y
reparación. Logrado esto, el segundo paso será la correcta elección de los
equipos encargados de la reproducción (playback) de los formatos analógicos.
138

El tercer aspecto está determinado por la adecuada y coherente selección de


los equipos de captura y digitalización.

4.4.1. Equipos de reproducción de audio analógico. Cada formato de


audio analógico tiene su reproductor y su calidad de reproducción será
directamente proporcional con las condiciones en las que se encuentre el
equipo reproductor, además de la calidad de sus dispositivos. Estos dos
aspectos son trascendentales en el momento de pensar en la restauración de
audio, pues un equipo reproductor descalibrado, que presente desgaste en sus
piezas mecánicas y eléctricas, o con un bajo perfil de calidad, perjudicará
notablemente el proceso, aumentará el número de degradaciones y tornará
poco efectivo el proceso de restauración digital.

Actualmente, existen modernos equipos diseñados para una óptima


reproducción de audio analógico con fines de restauración, los cuales abarcan
varios tipos de equipos que, usualmente, utilizan técnicas ópticas para el
proceso de restauración. En la figura 45 se observan dos tipos de
reproductores de discos. Algunos de estos modernos equipos, al igual que los
tradicionales equipos de reproducción de audio analógico, pueden ser
consultados en el anexo A, en el que se indican sus características y
especificaciones técnicas.
139

Reproductor óptico Reproductor tradicional


de discos analógicos de discos analógicos

Figura 45. Reproductores de discos analógicos.


Fuente: ELP Laser Turntable [en línea]. s.l.: WAUGH, Max, 2005.
<http://www.elpj.com> [consulta: 1 Jun. 2005]
Fuente: Amazon. Electronics. Turntables & Accessories: Sony PSLX350H Stereo
Turntable System [en línea]. s.l.: Amazon, 2005.
<http://www.amazon.com> [consulta: 15 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.

4.4.2. Conversores análogo-digital y digital–análogo. Estos equipos,


citados con antelación varias veces, son los que brindan la posibilidad de
cambiar del mundo analógico al digital y viceversa; por ello se convierten en
factores definitivos en los procesos de digitalización y restauración de las
señales de audio. Los seres humanos no generan ni reciben directamente la
información digital, pues los procesos naturales son analógicos, los ADC y DAC
son equipos electrónicos encargados de traducir el lenguaje analógico a digital
y viceversa.

Las señales de audio analógico no son las únicas señales que pueden ser
digitalizadas para realizar un tratamiento digital: las señales de video y medida
de parámetros, por métodos de instrumentación, (voltaje, fuerza, velocidad,
etc.) son aplicaciones en las que las señales analógicas son capturadas y
tratadas digitalmente. Por ejemplo, un electrocardiógrafo es un equipo
140

electrónico que captura las señales del corazón (señales analógicas) y las
digitaliza (hace conversión análoga–digital), procesa la señal digitalizada
(hace tratamiento digital) e imprime las gráficas (hace conversión digital-
análoga) del comportamiento del corazón (señal analógica). Puede observarse
que la señal analógica de entrada (señal cardiaca) no es de la misma
naturaleza que la señal analógica de salida (impresión de la señal cardiaca),
pero esta última describe perfectamente la señal de entrada.

En el caso que nos compete, el audio (como señal analógica) es digitalizado


(conversión análoga–digital), para realizar luego un proceso sobre la señal
digitalizada (restauración de audio) y reproducir, posteriormente, la señal de
audio restaurada (conversión digital-análoga). Se observa cómo la señal
analógica de entrada es de la misma naturaleza que la señal analógica de
salida (señales de audio), pero esta última con características que le ofrece un
tratamiento digital de restauración. En la figura 46 se observa, mediante un
diagrama de bloques, el proceso de restauración digital de audio.

Señal analógica Señal Señal analógica


de audio con Señal digital de audio sin
degradaciones digital tratada degradaciones
Tratamiento DAC
ADC
digital

Figura 46. Procedimiento de restauración digital para fonogramas.

En las figuras 47 y 48 se aprecia el proceso de restauración de audio en dos


etapas, captura de la señal analógica para su restauración digital y
reproducción de la señal digital restaurada.
141

Señal de audio Señal de audio


Señal analógica
digital digital modificada
de audio con
degradaciones 1010110 1 1 1010 0
0101001 0101 101
0011110 00 0 110 0
1100001 0 100 101

Medio de
ADC
almacenamiento
Computador digital

Figura 47. Proceso de captura y almacenamiento digital de audio.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/index.php?do=products.family>
Fuente: Computers. Products: store [en línea]. s.l.: MAC, 2005.
<http://www.m-audio.com/index.php?do=products.family>
[consulta: 3 Abr. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

Señal de audio
Señal analógica
digital modificada
de audio sin
degradaciones
11 10100
0101 101
00 01100
0100 101

Convensor D/A Amplificador Parlantes

Figura 48. Proceso de reproducción de la señal digital restaurada.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://store.apple.com/1-800-MY-APPLE/WebObjects/AppleStore.woa>
[consulta: 3 Abr. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

Entendidos los procesos fundamentales de muestreo, cuantización y


codificación para la captura de señales de audio analógico, es necesario definir
los criterios para la correcta selección del conversor.
142

Se trata, básicamente, de cuatro aspectos:

• Resolución de los ADC/DAC

• Frecuencia de Muestreo de los ADC/DAC

• Interfaz de comunicación de los ADC/DAC

• Tipos de ADC/DAC

4.4.2.1. Resolución de los ADC/DAC. La resolución de un conversor de audio


digital es definida como el número de bits que utiliza para representar las
muestras de audio, es decir, la cantidad de bits que conforma cada palabra
digital. Retomando la ecuación 4.1 en la que se relacionan la cantidad de
niveles con la longitud de códigos en bits, inferimos que la longitud del código
es sinónimo de resolución digital. Cuanto mayor sea la resolución, más precisa
será la representación. Por ejemplo, con una resolución de 8 bits, el rango de
variación de la señal se divide en 256 niveles, mientras que con una resolución
de 16 bits lo hace en 65.536 niveles. Esta relación se advierte en la tabla 4. El
audio digital para el consumo masivo (por ejemplo como el CD) tiene una
resolución de 16 bits. En sistemas de audio profesional se utilizan conversores
de 20 bits, aun, 24 bits.

4.4.2.2. Frecuencia de muestreo de los ADC/DAC. Como se señaló


anteriormente, la frecuencia mínima de muestreo para audio, sin pérdidas de
componentes ni aparición de frecuencias fantasmas, es de 40.000 Hz. A una
mayor frecuencia de muestreo, más precisa será la representación de la señal
de audio analógica digitalizada. En audio digital, para consumo masivo (por
ejemplo como el CD) tienen una frecuencia de 44.100 Hz. En sistemas de
audio profesional se utilizan ADC/DAC de 48.000, 96.000 y aún de 192.000 Hz.
143

En la figura 49 se observan el muestreo y cuantización de una onda senoidal


con variaciones en la frecuencia de muestreo y longitud del código.

1 1

0.8 0.8

0.6 0.6

0.4 0.4
Amplitud

Amplitud
0.2 0.2

0 0

-0.2 -0.2

-0.4 -0.4

-0.6 -0.6

-0.8 -0.8

-1 -1
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

Tiempo (seg) Aa) Tiempo (seg) Ab)


1 1

0.8 0.8

0.6 0.6

0.4 0.4
Amplitud

Amplitud

0.2 0.2

0 0

-0.2 -0.2

-0.4 -0.4

-0.6 -0.6

-0.8 -0.8

-1 -1
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1

Tiempo (seg) Ac) Tiempo (seg) Ad)

Figura 49. Señal senoidal de 1 Hz muestreadas a diferentes resoluciones (k) y


frecuencias de muestreo (fm). a) K= 16 bits, fm= 50 Hz , b) K= 16 bits, fm= 1000 Hz,
c) K= 4 bits, fm= 50 Hz y d) K= 4bits, fm= 1000 Hz.

4.4.2.3. Interfaz de comunicación de los ADC/ DAC. Cada formato de


audio analógico tiene su respectivo reproductor. En su gran mayoría los
equipos reproductores poseen interfaces de audio eléctricas de tipo
salida/entrada (in/out); estas interfaces son ideadas para diferentes
propósitos, entre los que se pueden mencionar: amplificación, ecualización,
grabación y tratamiento digital. En el caso de los equipos reproductores que
144

no poseen este tipo de interfaces eléctricas, el procedimiento de captura se


realiza a través de micrófonos que convierten las ondas de presión sonora en
variaciones eléctricas. Los equipos de reproducción poseen diferentes
interfaces de conexión, algunas con perfil bajo (en equipos para el hogar) y
otros con perfil profesional (en equipos de estudio de audio). En el anexo A se
muestran los equipos de reproducción de formatos analógicos y se indican sus
características y especificaciones técnicas, así como las interfaces de
comunicación.

De acuerdo con el tipo de interfaz eléctrica del equipo reproductor, se


selecciona el ADC/DAC que posea esta misma interfaz para hacer posible la
captura. Existen dos maneras para llevar señales eléctricas de audio analógico:

• No balanceado

• Balanceado

Interfaz de audio no balanceado. La primera forma de transportar señales


eléctricas de audio es la no balanceada. La señal viaja a través de un cable de
dos conductores. Los conectores de señal no balanceada tienen dos contactos,
como el tipo RCA (Radio Corporation of America), también llamado Phono,
utilizado habitualmente por los equipos domésticos y el 1/4" no balanceado (a
menudo llamado Jack, usado en los instrumentos musicales y de audio
semiprofesional). Los conectores de más pines, utilizados para audio
balanceado, también pueden llevar señal no balanceada, eliminando algunos
de sus pines. Por ejemplo, un XLR (Cannon) de tres pines, podría transportar
señales no balanceadas, dejando un pin sin usar.
145

Las conexiones no balanceadas son simples y se usan, normalmente, para la


conexión de instrumentos musicales. Este tipo de conexiones no son
consideradas profesionales, pues son susceptibles a contaminación por
interferencia electromagnética, específicamente, cuando las distancias de cable
son largas. En la figura 50 se ilustra un conector típico RCA.

Positivo
Tierra

Figura 50. Conector RCA.

Interfaz de audio balanceado. La señal se envía dos veces, una de ellas con
la polaridad invertida. A este procedimiento se le conoce comúnmente como
balanceado de una señal.

Para transportar una señal balanceada se necesitan conectores de tres pines y


cable de tres conductores, uno de los cuales trabaja como apantallador para
las interferencias electromagnéticas. La entrada del dispositivo al que se lleva
la señal, realiza lo que se conoce como desbalanceado, que consiste en sumar
las dos señales que le llegan, después de invertir una de ellas. El balanceado
consiste en reforzar la señal original y anular las interferencias que se
generaron en el cable. El transporte balanceado de señal es el más adecuado
para aplicaciones profesionales. En la figura 51 se explica de forma gráfica el
balanceado. El dispositivo de salida genera dos copias de la misma señal, una
de la cuales está con polaridad invertida. Si existe interferencia
electromagnética se produce de igual manera para las dos señales que se
146

envían por el cable. En el dispositivo de destino la señal, inicialmente invertida,


nuevamente se invierte para ser sumada con la señal no invertida, con el
objeto de cancelar la interferencia.

S(t) S(t) + n(t) S(t) + n(t) 2S(t)

+ =

-S(t) -S(t) + n(t) S(t) - n(t)

Figura 51. Forma grafica del balanceo de señales de audio.


Fuente: Forms de transporte de señal. [en línea]. s.l.: Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas/balanceado.htm>
[consulta: 7 Abr. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

Habitualmente se nombran los terminales de los conectores como positivo,


negativo y tierra. En la figura 52 se ilustra un conector típico de ¼” TRS (Tip
ring-sleeve).

La asignación de los terminales en el conector XLR se realiza de acuerdo con


las normas de la AES (Audio Engineering Society), de forma que se conecta el
pin 2 al positivo, el 3 al negativo y el 1 a la tierra. En la figura 53 se ilustra un
conector conocido como XLR.
147

Positivo
Negativo
Tierra

Figura 52. Conector ¼”.


Fuente: Forms de transporte de señal. [en línea]. s.l.: Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas/balanceado.htm>
[consulta: 7 Abr. 2005]

Positivo
Negativo
Tierra

Figura 53. Conector XLR (Cannon).


Fuente: Forms de transporte de señal. [en línea]. s.l.: Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas/balanceado.htm>
[consulta: 7 Abr. 2005]
148

En la figura 54 se observan los tres tipos de conectores.

Aa) Ab) Ac)

Figura 54. Conectores de audio. a) RCA, b) ¼” y c) XLR macho hembra.


Fuente: Connectors and accessories. [en línea]. s.l.: Van Den Hul, 2005.
<http://www.vandenhul.com/other/c-connec.htm#BNC-RCA>
[consulta: 4 May. 2005]

Mezcla de sistemas balanceados y no balanceados. Es habitual que se


utilicen fuentes de sonido no balanceadas en conjunto con fuentes de sonido
balanceado, pero es necesario seguir unos procedimientos que minimicen la
aparición de ruidos originados en el uso de dichas aplicaciones. Existen
dispositivos en el mercado que convierten las salidas no balanceadas de alta
impedancia y -10 dBV (equipos domésticos) a salidas balanceadas de +4 dBV y
baja impedancia (equipos profesionales). También, están disponibles
dispositivos adaptadores que convierten entradas no balanceadas en
balanceadas. Estos adaptadores se deberán poner lo más cerca posible de los
dispositivos no balanceados para evitar el ruido por falta de apantallamiento.

• Conexiones balanceado a Balanceado. Es una conexión pin a pin.


En caso de zumbidos en las conexiones de salida a entrada balanceada,
basta desconectar la tierra del conector de entrada. En la figura 55 se
ilustran los tipos de cables balanceados.
149

• Conexiones No Balanceado a Balanceado. En general, para conectar


una fuente no balanceada a un dispositivo balanceado, se unen dos de
los conductores del cable (tierra y negativo). Es claro que al llevar una
señal no balanceada a un dispositivo balanceado se pierden las
propiedades y beneficios de la interfaz balanceada. En la figura 56 se
muestran los tipos de cables no balanceados.

XLR a XLR

1/4” a 1/4”

XLR a 1/4”

Figura 55. Cables balanceados a balanceados.


Fuente: Conexiones a entradas balanceadas: balanceado a balanceado. [en línea]. s.l.:
Doctor ProAudio, 2001.
<http://www.doctorproaudio.com/doctor/temas/ref_con.htm>
[consulta: 5 May. 2005]
150

XLR a XLR

XLR a 1/4”

1/4” a XLR

1/4” a 1/4”

RCA a XLR

RCA a 1/4”

Figura 56. Cables No balanceados a balanceados.


Fuente: Conexiones a entradas balanceadas: no balanceado a balanceado.
[en línea]. s.l.: Doctor ProAudio, 2001.
<http://www.doctorproaudio.com/doctor/temas/ref_con.htm>
[consulta: 5 May. 2005]

4.4.2.4. Tipos de ADC/DAC para audio. Generalmente, sólo son dos tipos de
conversores de audio los que se pueden encontrar en el mercado; el primero,
llamado conversor de audio estático (tarjeta interna) y el segundo, llamado
conversor de audio móvil (tarjeta externa). Dentro de estos dos tipos de
conversores encontramos de alto y bajo perfil, diseñados para diferentes
aplicaciones. En los conversores del tipo móvil se encuentra un mayor número
de modelos diseñados para el procesamiento de señales de audio y
aplicaciones profesionales. En la figura 57 se observan los tipos de ADC/DAC
de audio.
151

Conversor Móvil Conversor Estático

Figura 57. Tipos de conversores de audio.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/index.php?do=products.family>
[consulta: 15 Abr. 2005]

Un conversor de audio profesional, además de una buena calidad de


audio, posee un chip DSP (Procesador Digital de Señales) que acelera la
gestión y transmisión del audio liberando al computador de esta tarea.
Estos conversores suelen incluir un tipo de drivers (controladores por
software del hardware) llamados Firmware o programas de firma muy
especiales con tiempos de latencia (tiempo de respuesta de las órdenes
de audio) muy bajos. Existen drivers tipo ASIO (Audio Streaming Input
Output de Steinberg) de código abierto, EASI (Enhanced Audio Streaming
Interface) de Emagic, muy similar a ASIO, DAE (Digidesing Audio Engine)
de Digidesign, un "super-driver" que incluye todo el manejo del motor
DSP de Pro Tools (programa profesional de sonido y edición de sonido
digital) y E-WDM (Enhanced Audio MIDI Driver) de Ego-Sys, un formato
que mejora el WDM (Windows Model Driver) de Microsoft. Estos drivers
deben ser proporcionados por los fabricantes de los conversores de audio
profesionales. Dentro de éstos, el más común, sin duda alguna, es el
formato ASIO.
152

Los drivers multimedia normales, insuficientes en el mundo del audio


profesional, son los llamados MME (Microsoft Multimedia Extensions) y
Direct X3.

Es habitual que en los estudios profesionales de audio se trabaje con los dos
tipos de conversores de audio. El conversor estático o tarjeta interna será de
alto perfil, con chips DSP para el tratamiento digital de audio (Software de
edición, restauración y creación de audio), y el conversor móvil o tarjeta
externa, igualmente con un perfil alto y con chips DSP. Por otra parte, se
utiliza para la correcta importación de audio de las diferentes fuentes (equipos
reproductores de audio analógico y digital) y exportación a receptores de audio
(para la grabación y monitoreo).

Un procesador DSP está diseñado inicialmente para aplicaciones con


computadores, conocidos como “Sistemas Embebidos”, en los que el
procesador es parte integral del producto. En otras palabras, un procesador
DSP ayuda al producto a ejecutar su función, pero el propósito del producto va
más allá de la computación. Los usuarios finales de los “Sistemas Embebidos”,
generalmente, no saben que el producto utiliza un procesador, pues estos
productos son tan comunes y prácticos como los reproductores de video, CD
player, hornos microondas o videograbadoras.

Los procesadores usados para DSP son rápidos y tienen una precisión media (8
a 24 bits) en los cálculos. A diferencia de los computadores personales o
estaciones de trabajo de una red, estos procesadores no soportan periféricos.
El procesamiento digital de señales también es útil para ayudar a cualquier

3
Software de edición y manipulación de audio digital: multipistas de audio digital. [en
linea]. s.l. La oreja digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Frevista%2Ftutorial%2Fesdi
_audio3%2Fdocu.php3%3F> [consulta: 30 Mar. 2005]
153

computador en el procesamiento de imágenes de alta velocidad, cálculos


científicos, procesamiento de audio u otras aplicaciones de cálculos intensivos.
Los dispositivos de captura de señales (ADC/DAC) que poseen los
procesadores DSP se conectan a los computadores personales o a las
estaciones de trabajo. Estos dispositivos ejecutan los cálculos pesados,
mientras que el computador al que se conectó proporciona otros servicios al
usuario. En la figura 58 se ilustran chips DSP típicos para aplicaciones de
audio.

El auge del uso de los DSP se debe a que éstos mejoran los productos
existentes, son de bajo costo y abren puertas a nuevos productos. Los avances
en los procesadores DSP ofrecen grandes capacidades de computación a un
costo mucho menor que el tradicional procesamiento analógico de señales.

Los DSP están diseñados para el desarrollo de las tareas de los programas
multipistas, edición gráfica de audio y secuenciadores MIDI (Musical
Instruments Digital Interface) o interfaces digital para instrumentos musicales,
que son todas aquellas aplicaciones que permitan grabar, capturar, manipular,
crear, restaurar y mezclar audio digital. El proceso de los efectos o algoritmos
implementados en cada aplicación puede ser de dos tipos y pueden combinarse
entre sí.

• Proceso por DSP físico

• Proceso nativo
154

Figura 58. Chips DSP de audio.


Fuente: Software de edición y manipulación de audio digital: multipistas de audio
digital. [en linea]. s.l. La oreja digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Frevista%2Ftutorial%2Fesdi
_audio3%2Fdocu.php3%3F> [consulta: 30 Mar. 2005]

• Proceso por DSP físico: Las tareas son procesadas por chips DSP,
ubicados en conversores móviles o tarjetas PCI (Peripheral Component
Interconnect) o conector de componentes periféricos. El ejemplo clásico
es Pro Tools, un programa de edición gráfica de audio acompañado de
un potente conversor que posee hasta 18 chips DSP y con posibilidad de
ampliar su capacidad. En este caso, el computador solamente gestiona
tareas secundarias como generar los gráficos del programa y realizar un
control sobre los procesos, pero en ningún caso requiere enormes
cantidades de recursos. Los efectos DSP (Proceso digital de señales)
existen porque un mismo fabricante desarrolla el hardware (la tarjeta
DSP) y el software, lo cual supone una gran dependencia de tal
fabricante. En la actualidad hay varios formatos de drivers por DSP, de
los que se muestran algunos en la tabla 5.
155

• Proceso nativo: Las tareas nativas son las más comunes y no


requieren un conversor móvil o una tarjeta PCI con chips DSP. Utilizan la
CPU (Unidad Central de Proceso) del computador, (Intel Pentium 4,
Motorota G5, AMD Athlon XP, entre otros) para calcular los efectos en
tiempo real. En este caso, el computador debe realizar ambas tareas,
generar los gráficos del programa y realizar un control sobre los
procesos y todos los cálculos del audio (mezcla, efectos, etc.) lo cual
requiere de una gran cantidad de recursos, pero evita la dependencia de
un único fabricante. Existen varios formatos de drivers nativos.

Tabla 5. Formatos de Plug-ins por DSP

Proceso Nativo Por PC MAC Comentario


DSP
VST (Virtual Studio Si No Si Si De Steinberg, el
Technology) estándar nativo actual
EASI (Enhanced Si No Si Si De Emagic, sólo incluido
Audio Streaming en Logic Audio
Interface)
DirectX (DX) Si No Si No Estándar de Microsoft
MAS (MOTU Audio Si No No Si De MOTU y utilizado por
System) Digital Performer
RTAS (Real Time Si No Si Si De Digidesign y sólo
Audio Suite) funciona con hardware y
software Digidesign
HTDM (Host Time No Si Si Si Nuevo formato, híbrido
Division entre TDA y RTAS
Multiplexing)
TDM (Time Division No Si Si Si Primer estándar por DSP
Multiplexing) físico. Sólo funciona con
156

hardware Digidesign
SoundScape No Si Si De Soundscape y sólo
funciona con hardware y
software Soundscape
Pulsar/ SCOPE No Si Si Si De Creamware,
funciona con todos los
programas

Fuente: Software de edición y manipulación de audio digital: multipistas de audio


digital. [en linea]. s.l. La oreja digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Frevista%2Ftutorial%2Fesdi
_audio3%2Fdocu.php3%3F> [consulta: 30 Mar. 2005]

Existen programas que soportan los formatos principales de drivers (VST, DX,
RTAS, HTDM, etc.) minimizando el problema de compatibilidad de software y
hardware.

Conversores de audio estáticos. En el mercado es muy común encontrarlos con


el nombre de tarjetas de sonido. Varían en precio y calidad. Las tarjetas
convencionales que posee un computador personal son de muy bajo perfil, y
no están dotados de procesadores DSP, lo que dificulta enormemente las
posibilidades de procesamiento de señales de audio. Menos precisa será
también la representación de la señal de audio analógica digitalizada y poco
efectiva con los programas profesionales de edición, restauración y creación de
audio. Los conversores estáticos poseen una conexión PCI para su
compatibilidad con los computadores de hoy en día. Las posibilidades de estas
tarjetas varían de acuerdo con la marca y el modelo: existen modelos con
procesos nativos, reducidas entradas y salidas de audio analógico no
balanceado, resolución baja y modesta frecuencia de muestreo que
empobrecen el correcto tratamiento digital de audio. Otros modelos con
procesos por DSP físicos, numerosas entradas y salidas de audio analógico
157

balanceado y no balanceado, resolución y frecuencia de muestreo altas,


interfaz MIDI e interfaces digitales para formatos S/PDIF (Sony/Philips Digital
Interface), Dolby Digital AC3 (Sistema de sonido envolvente digital) y DTS
(Digital Theater Surround), son ampliamente utilizadas. En el anexo B se
muestran diferentes marcas y modelos de conversores estáticos con sus
características y especificaciones técnicas.

Conversores de audio móviles. En el mercado es muy común encontrarlos con


diferentes nombres: Interfaces móviles (M-Audio), Interfaces Audio/MIDI
(Tascam) e Interfaces de Audio (MOTU), entre otros. Generalmente, los
conversores de audio móviles guardan un perfil profesional con procesos DSP
físicos, aunque existen modelos muy discretos para aplicaciones no
profesionales. Este tipo de conversor tiene dos valores agregados sobre los
conversores estáticos (tarjetas de audio PCI). El primero es, como su nombre
lo indica, un dispositivo móvil con posibilidad de ser trasladado y conectado en
cualquier computador, con las interfaces digitales de datos necesarias para la
correcta comunicación con el conversor. En la actualidad son FIREWIRE (IEEE
1394) y USB 2.0 (Universal Serial Bus) las interfaces de conexión de datos
digitales para estos equipos. La segunda ventaja de los conversores móviles es
que poseen diferentes dispositivos que proporcionan un pretratamiento de la
señal de audio analógico; entre los que se destacan:

• Entradas para micrófono (XLR) control de ganancia, indicadores de


saturación, atenuador, etc.

• Entradas para instrumentos musicales (1/4”) con controlador de


ganancia, indicador de saturación, etc.

• Canales preamplificados
158

Al igual que en las tarjetas de audio PCI, los conversores móviles poseen
numerosas entradas y salidas de audio analógico balanceado y no balanceado,
resolución y frecuencia de muestreo altas, interfaz MIDI e interfaces digitales
para formatos S/PDIF, Dolby Digital AC3 y DTS. En el anexo B se muestran
diferentes marcas y modelos de conversores móviles con sus características y
especificaciones técnicas.
159

5. TRATAMIENTO DIGITAL DE SEÑALES DE AUDIO PARA SU


RESTAURACIÓN

5.1. PROGRAMA PARA EDICIÓN Y MANIPULACIÓN DEL AUDIO


DIGITAL

Cuando se habla de edición y manipulación de audio digital, se está haciendo


referencia, indudablemente, a todas aquellas aplicaciones en programas
(software), y, en cierta medida, hardware, que permiten alterar las secuencias
de bits de las señales de audio codificadas.

Actualmente existen muchas aplicaciones orientadas al audio digital que no se


relacionan con la edición, transformación y manipulación con fines de
restauración y creación musical. Sin embargo, se centrará únicamente en
aquellas aplicaciones orientadas a la restauración de audio digital. El audio
digital se aplica en tecnología de telefonía móvil, sonares, radares, reducción
de ruido en maquinaria, exploración del espacio, aplicaciones médicas,
arquitectónicas y psicología, entre muchas otras.

Inicialmente, se debe capturar el audio digital por medio de los ADC y


almacenarlo en el computador. Para ello se necesita un programa que realice
la comunicación con el ADC y almacene el audio digital para luego restaurarlo
(tratamiento digital) y reproducirlo posteriormente, enviándolo a través de un
DAC. El primer y el último pasos son procesos básicos, precisos y muy sencillos
para manejar (capturar y reproducir). El tratamiento digital es muy distinto
porque incluye toda una gama de procesos más densos y complejos.
160

El tratamiento digital de audio puede ser de dos tipos: destructivo (la


secuencia de bits es alterada) o a tiempo real (se calcula el resultado a medida
que se reproduce sin cambios en la secuencia de bits).

Un programa de tratamiento digital de audio deberá gozar de la posibilidad de


captura del audio a través de las interfaces digitales del computador con la
ayuda de los ADC móviles o estáticos. Existen variadas aplicaciones shareware
(programas pagos que pueden ser utilizados durante un periodo de prueba) o
freeware (programas gratuitos que pueden ser utilizados sin restricciones) que
permiten dicha captura.

En el contexto profesional se definen tres tipos de aplicaciones:

• Editor gráfico de audio digital

• Multipistas de audio digital

• Secuenciador MIDI

5.1.1. Editor gráfico de audio digital. Estos programas permiten grabar,


exportar, importar y manipular audio digital, sin incluir funciones de mezcla y
producción musical. Esto significa que no tiene la capacidad de reproducir
múltiples pistas de forma simultánea ni realizar la mezcla y ecualización de
dichas pistas.

Anteriormente se han descrito los mecanismos para digitalizar señales de audio


procedente de diversas fuentes analógicas, y en el capítulo 7 se analiza el
161

almacenamiento de audio digital, pero el potencial que ofrece comienza a


intuirse en el momento de interactuar con un editor gráfico de audio digital.
Este tipo de aplicaciones son de un manejo relativamente sencillo y varía muy
poco de un fabricante a otro. Básicamente consiste en aplicar utilidades de
edición a un audio por medio de procesos matemáticos DSP (Proceso Digital
de Señales) con la ayuda de un entorno gráfico que permita seleccionar
cómodamente los fragmentos para tratar y que muestre los resultados
auditivos y visuales. Mediante estos procesos se consigue modificar el audio o
algunos de sus fragmentos con diferentes propósitos: corregir defectos en los
sonidos originales, en el caso de elementos espurios y ruidos, ensalzar o
modificar ligeramente fragmentos o generar otros totalmente irreconocibles.
Los editores gráficos de audio son las aplicaciones más utilizadas para la
restauración de audio.

Un buen editor de audio deberá almacenar cualquier audio digitalizado en


diferentes formatos de archivo e, igualmente, importarlo. Algunos de los
formatos de archivos o ficheros más utilizados son: WAV y AIFF, aunque
existen muchos otros formatos dedicados a la multimedia y entretenimiento en
general (audio para Internet, juegos, codificación, compresión, cine, etc.) y
sobre todo formatos de audio propios de hardware externo como grabadores
de audio digital autónomos (conversores móviles). En el capítulo 6 se
describen diferentes formatos de archivo de audio digital, empleados,
generalmente, para fines de restauración.

Las utilidades de un programa de edición gráfica de audio son, en su mayoría,


de tipo destructivo, es decir, alteran en alto porcentaje los datos originalmente
grabados, y ofrece, entre sus posibilidades, un historial de los procesos, que
permite recuperar las distintas versiones del audio tratado. Gran parte del
trabajo de los editores gráficos de audio se basa en procesos de masterización,
es decir, la creación del archivo final. Los efectos con retardos (delay),
162

procesadores de rango dinámico, procesos de filtrado y dithering, son algunas


de las herramientas que ofrecen los editores gráficos de audio. Los algoritmos
DSP de un editor gráfico con procesos destructivos deben tener mayor calidad
que los procesos de tiempo real, pues no se requiere de una rapidez del
proceso ya que el resultado no debe entregarse en tiempo real. Entre las
utilidades de un editor gráfico se destacan los procesos por paquetes, en los
que se programan acciones de edición para ser aplicadas a un número
determinado de pistas, es decir, listar "n" archivos de audio, seleccionar los
procesos para aplicar y que el programa se encargue del resto sin necesidad
de la participación del operador o editor. Otro aspecto importante son las
herramientas de medición, estadísticas y análisis del audio.

En la figura 59 se observa el espectro de una pista de audio en el programa


Sound Forge, de Sony, donde se ofrece un análisis gráfico-espectral que
permite identificar diferentes componentes, como degradaciones y efectuar el
procedimiento requerido para la restauración.

En la figura 60 se observa el espectro tridimensional de una pista de audio en


el programa Wavelab de Steinberg, que ofrece un análisis gráfico-espectral
para efectuar correctamente el procedimiento de restauración.
163

Figura 59. Análisis espectral de una pista de audio en Sound Forge.


164

Figura 60. Análisis tridimensional espectral de una pista de audio en Wavelab.

Además de las más comunes herramientas de edición, estos programas


ofrecen otras funciones extras, aplicadas al video. Por ejemplo, extraer el
audio de un video digital, procesarlo (tratamiento digital) e insertar el nuevo
audio al video. Otra función extra son las listas de reproducción, en las que se
efectúa un orden de reproducción de “n” pistas de audio en una lista virtual. La
última herramienta de este tipo de aplicaciones es el proceso de
almacenamiento del audio digital llevado a un medio como el CD o DVD
(Digital Versatile Disc). Vale la pena citar que existen varias aplicaciones de
tipo shareware y freeware que permiten el almacenamiento de audio en un
medio digital, como por ejemplo “Get it On CD” de Steinberg, que ofrece la
posibilidad de crear CD en todos los formatos disponibles.
165

Existe otro grupo de editores de audio especializados en procesos muy


concretos, como programas de restauración de audio. Un ejemplo es Clean,
también de Steinberg o NoNOISE, de SONIC Solutions. Resaltan algunos
programas que reúnen edición, almacenamiento digital y restauración, como
es el ejemplo de Sound Forge, de Sony y Wavelab, de Steinberg.

5.1.1.1. Elección de un editor gráfico de audio. Generalmente, los


conversores de audio (tarjetas de audio) incorporan un programa de edición
gráfica de audio que, en muchos casos, son excesivamente sencillos, limitando
las posibilidades de tratamiento digital de audio. Para una correcta elección de
un editor gráfico de audio, se deben tener en cuenta las necesidades del
usuario y definir prioridades. Como se mencionó, existen dos grupos de
editores de audio, los primeros de propósito general, con numerosas
herramientas de edición de audio y los segundos dedicados a procesos muy
concretos. La gran mayoría de programas de propósito general poseen
herramientas aceptables para la restauración de audio, pero son débiles si se
comparan con las herramientas que ofrece un programa especializado en
restauración de audio.

Posibilidades de un editor gráfico de audio digital. Cada programa de


edición gráfica de audio digital posee calidad, versatilidad y soporte técnico
diferentes a los demás, por ello resulta muy complejo describir las diferentes
herramientas, funciones y procesos representativos en una forma general.

El proceso se inicia cargando un archivo de sonido digital (frecuentemente tipo


WAV, AIFF u otro formato digital compatible con el programa de edición) o se
digitaliza desde el mismo programa, a través de un ADC teniendo en cuenta
todas las consideraciones mencionadas en el capítulo 4. Inmediatamente la
onda podrá ser representada gráficamente en una ventana. Con el mouse del
166

computador se seleccionan los fragmentos o el fichero en su totalidad para que


mediante opciones de menú se le apliquen los procesos de edición y
modificación digital. Un criterio para juzgar la calidad de estos programas es el
número, calidad y versatilidad de los efectos disponibles. A continuación se
enuncian algunos aspectos representativos y herramientas mínimas que debe
poseer un programa de edición gráfica de audio.

Multiventana. Posibilita tener varios ficheros de audio abiertos y visibles, es


fundamental para realizar composiciones con fragmentos de diferentes
ficheros.

Deshacer y rehacer. Es una opción configurable por el usuario y permite


deshacer y rehacer las acciones efectuadas sobre el fichero de audio.

Edición independiente de canales. Los ficheros estéreo se muestran en dos


ventanas superpuestas, una por canal para facilitar la modificación de uno o
ambos canales.

Zoom. Para lograr un mayor detalle o definición de la onda observada. Con el


zoom es posible modificar la escala de visualización. El zoom puede aplicarse a
dos parámetros: el tiempo (eje horizontal) y la amplitud (eje vertical).

Unidades temporales. Normalmente son tres las unidades empleadas para


medir las coordenadas temporales, éstas son: tiempo, muestras o frames y
compases. Esta última es útil para la edición de fragmentos musicales con un
tiempo preciso y exigencias de composición profesional.
167

Puntos de marca. Cuando un archivo es largo (pesado), es común perderse


mientras se navega hacia delante y hacia atrás en el eje del tiempo. Con el
punto de marca es posible poner marcas en algunos puntos de la onda
observada.

Importación y exportación de formatos. Aunque los formatos más


empleados son WAV y AIFF, en ocasiones es necesario importar o exportar
formatos diferentes. El número de formatos soportados varía de un programa
a otro. En el capítulo 7 se describen los formatos de archivo más
representativos para audio digital.

Salvar configuraciones. Muchas de las herramientas orientadas para efectos


incorporan parámetros configurables. Al salvar (guardar) las diferentes
configuraciones, se simplifica el trabajo.

Programación de nuevos efectos. Esta herramienta es compleja, pues


requiere de las nociones básicas de programación por parte del editor, además
de un profundo conocimiento del proceso digital de señal (DSP). Por ejemplo,
Gold Wave dispone de un editor de fórmulas, con el que se crean efectos
sorprendentes. Otro ejemplo es la arquitectura abierta que se aplica en Sound
Forge y Wave Lab, que permiten crear plug-ins, en lenguaje C.

Proceso por lotes. Esta herramienta permite repetir acciones sobre un cierto
número de ficheros. La cantidad depende de cada programa.

Síntesis de sonidos. Existen opciones que permiten crear sonidos sintéticos,


nuevos, es decir, partiendo de cero.
168

Control de dispositivo de audio. La mayoría de los programas de edición


posibilitan el manejo de la unidad de CD de audio del computador.

Extracción digital. Esta opción es útil cuando se desea extraer pistas


directamente de un CD de audio.

Herramientas de procesado digital de audio. Las posibilidades de


modificar el audio digital, mediante los programas de edición, son
interminables. A continuación se describen puntualmente algunas de estas
posibilidades, en lugar de seguir los menús de opciones de un determinado
programa, que varía de acuerdo con cada fabricante.

Los efectos más frecuentes se pueden dividir en tres grandes grupos:

Efectos básicos en el dominio temporal. Suelen estar en la opción de


menú editar. Algunos son:

• Copiar, Cortar, Pegar

• Reverse (Darle la vuelta a un sonido)

• Eliminar silencios (borrar los fragmentos silenciosos)

• Insertar silencios
169

Efectos básicos en el dominio de la amplitud. Los efectos descritos a


continuación realizan multiplicaciones para cada muestra de un fragmento.
Algunos son:

• Modificar ganancia (multiplicar las muestras por un valor real)

• Silenciar (multiplicar por cero la zona seleccionada)

• Normalizar (lograr la máxima amplitud de una muestra sin distorsión)

• Aplicar envolventes (la envolvente determina la variación temporal de la


amplitud)

• Modulación de amplitud (multiplicar un fragmento por una señal


periódica)

• Invertir (diferente a reverse. Hay un cambio de fase)

• Mezclar (suma de dos fragmentos)

• DC offset (elimina componentes indeseables de directa)

Efectos básicos en el dominio de la frecuencia. Son operaciones sencillas


en el dominio de la frecuencia. Algunos son:

• Modificación de la frecuencia de muestreo

• Resample (modifica la frecuencia de muestreo sin alterar la frecuencia


del audio)
170

• Transpositor (modificar la altura manteniendo la frecuencia de


muestreo)

En este apartado se abordarán conceptos más avanzados relacionados con la


teoría del proceso digital de señales (DSP) y la restauración de audio.

5.1.1.2. Efectos que utilizan retardos. Un gran número de efectos se


consiguen sumando varias copias con retardos y modificaciones a la señal
original. Los ejemplos más típicos son los de eco y reverberación, aunque,
como se mostrará a continuación, no son los únicos que manejan este tipo de
técnicas. De acuerdo con el tipo de efecto deseado, los tiempos de estos
retardos pueden ser de milisegundos o segundos y, en algunos casos,
benéficos en un proceso de restauración digital de audio.

Eco y reverberación

Naturaleza. La reverberación se produce de forma natural en una sala o


recinto porque los sonidos no proceden de un único punto emisor; los sonidos
captados por el oído humano son copias reflejadas por el techo, las paredes, el
suelo, y otros objetos. Cuanto más grande es la distancia de los reflectores al
oído, más retardadas y atenuadas serán las copias.

El tiempo de reverberación es una cualidad de las salas, y se define como el


tiempo que debe transcurrir para que el sonido inicial se atenúe en 60 dB. El
tiempo de reverberación cambia de acuerdo con el tamaño de la sala
171

Cuando se aborda el tema de la reverberación, es preciso tener en cuenta un


factor determinante como lo es la absorción de energía de los materiales
reflectantes, puesto que las superficies poco absorbentes, incrementarán el
tiempo de reverberación. Se puede citar un ejemplo: el cristal. Las superficies
como telones, madera o el propio público, hacen que el tiempo de
reverberación disminuya. La absorción no sólo varía con el tipo de material de
las superficies reflectantes, pues también es función de la frecuencia (los
agudos se absorben más que los graves).

Cuando la duración de los retardos es suficientemente amplia como para oírse


de forma aislada se denominan ecos y sólo se producen en grandes espacios y
con pocos obstáculos.

Reverberación y eco digitales. Un gran porcentaje del audio es escuchado


en salas pequeñas y con tiempos de reverberación mínimos. Precisamente es
en estos lugares en los que se usan métodos de reverberación para enriquecer
el audio y hacer la experiencia sonora más grata al oído. Los programas de
edición gráfica de audio digital posibilitan la configuración de este tipo de
efectos, realizando cambios en el tiempo, en la amplitud y en la frecuencia.

Con retardos menores de 30 milisegundos y una realimentación se altera la


tímbrica, lo que le da al sonido un carácter metálico, hasta el punto de adquirir
resonancias muy definidas en determinadas frecuencias. Con retardos entre 20
y 80 milisegundos se afecta principalmente la presencia de los instrumentos
musicales, ya que gracias al efecto Haas que explica la capacidad para ubicar
una fuente sonora que se confunde por las reflexiones y ecos, se pueden
"sumar" dos sonidos iguales y físicamente separados en el tiempo, de manera
que se genera la sensación de un sonido más "grueso", o un conjunto de
instrumentos sonando al unísono. Este tipo de retardos se implementan
172

comúnmente en procesos de restauración de audio, para el que su objetivo


principal no es eliminar ruidos sino resaltar algún instrumento musical que
presenta una frágil presencia en la grabación, ya sea por el deterioro del medio
de almacenamiento analógico o por las limitadas técnicas de grabación
implementadas en su creación.

Flanger y phaser. Los efectos de flanger o flanging, consisten en mezclar la


señal original con una copia con retardo corto, pero variable de forma
periódica.

Normalmente los parámetros para configurar, son: el mínimo porcentaje de


señal retardada; el margen de variación del retardo (regularmente en
milisegundos), la frecuencia de variación de este retardo (habitualmente entre
algunas décimas y varios hertzios), y el porcentaje de realimentación. De
acuerdo con los valores asignados, el efecto conseguido puede ser variado.
Este efecto se evidencia en los sonidos del pop sicodélico de los años 70, que
se lograba de una forma analógica, mezclando la señal de dos magnetófonos
retardando o acelerando uno de ellos.

Cuando no hay realimentación, el efecto es más discreto y suele llamarse


phaser o phasing, que es común encontrar en pedales para guitarras
eléctricas. Pero cuando la realimentación es completa se denomina chorus, que
tiene beneficios en procesos de restauración de audio.

Retroalimentación o feedback. La retroalimentación (feedback) no es un


efecto propiamente dicho, sino una manera de procesar el audio. Se produce
cuando parte del sonido generado por los parlantes es captado por el
micrófono y esta señal es reenviada al sistema, llegando, poco a poco, a un
173

punto crítico tal que el nivel captado por el micrófono, tanto de la fuente como
de los parlantes, tienen la misma intensidad. Este proceso de retroalimentación
genera un molesto zumbido cuando un micrófono capta el sonido proveniente
de los parlantes y lo reingresa al sistema, y causa una amplificación
permanente, es decir, un lazo cerrado de amplificación. El feedback se expresa
mediante un porcentaje que indica la cantidad de sonido procesado que se
vuelve a procesar. Cuando este valor es del 0%, no se genera
retroalimentación, pero cuando es superior al 100%, la intensidad del sonido
resultante aumentará paulatinamente hasta llegar a la saturación. En el caso
de la restauración de audio, es sumamente perjudicial en aquellos procesos en
los que la digitalización es del tipo sucio, donde la señal analógica para
restaurar es capturada a través de micrófonos. Es importante, en
consecuencia, manejar criterios para evitar este molesto efecto. Algunos de
estos criterios se pueden enumerar de la siguiente manera:

• La correcta ubicación y orientación de los parlantes y micrófonos. Los


micrófonos deben estar muy cerca del reproductor analógico y muy lejos
de los parlantes

• Pocas reflexiones acústicas locales. Es importante eliminar las


reflexiones acústicas cercanas a los micrófonos

• Mínima reverberación del lugar

• Implementar ecualizadores para controlar la retroalimentación que se


presente

• El lugar de trabajo (estudio de audio o auditorio), debe cumplir con


parámetros establecidos4. La construcción de estos espacios es

4
Handbook for sound engineers. Boston. BALLOU M, Glen, 2002.
174

fundamental para asegurar una correcta captura, grabación y


reproducción de audio.

Chorus. Es un efecto muy sutil y ampliamente utilizado, en el que un solo


instrumento o una sola voz, suena como si se tratara de varios instrumentos o
un coro al unísono. Se consigue retardando sutilmente la copia del sonido
original.

En la actualidad es muy aplicado a los cantantes, para dar más realce a la voz.
Muchos sintetizadores, y algunos conversores de audio con procesadores DSP,
incorporan este efecto en tiempo real. Este tipo de retardos se implementan
comúnmente en procesos de restauración de audio, en el que el objetivo es
resaltar la voz o algún instrumento que presenta una débil participación en la
grabación, ya sea por el deterioro del medio de almacenamiento analógico o
por las limitadas técnicas de grabación implementadas en su creación.

Excitador o enhancer. Genera armónicos pares de la señal de entrada, de


forma que ayuda con la mayor presencia o mejor brillo de esa señal. También
se emplea para generar subarmónicos con el propósito de realzar instrumentos
con tendencia grave. Suele utilizarse satisfactoriamente en restauración digital
de grabaciones analógicas en vinilos u otros formatos con degradaciones, y en
los que algunos instrumentos son resaltados notoriamente en la pista sonora.

Transpositor. Originalmente, se empleaban transposiciones mecánicas que


alteraban la velocidad de reproducción de una cinta o disco respecto de su
velocidad original de grabación, pero también se alteraba el timbre, ya que
este tipo de transformación no conserva las estructuras propias de muchos
instrumentos y la voz humana. Los efectos sonoros sobre la voz, llamados
175

“Pitufo” y “Ogro”, son el resultado de transposiciones, en las que el primer


efecto se relaciona con un aumento en la velocidad de reproducción y el
segundo con una disminución. Existen transpositores digitales que se
fundamentan en esta base para alterar la velocidad de reproducción, aunque
algunos equipos y programas modernos brindan la posibilidad de transponer,
incluso en tiempo real, sin alterar significativamente las características del
instrumento. Es común cambiar el aspecto sonoro de un instrumento musical
aumentando su sonido y, agregando pequeños retardos, se construyen señales
de audio estéreo a partir de señales monofónicas, incluso se pueden deformar
sonidos para generar nuevos arreglos. También se aplican transposiciones
digitales con el propósito de restaurar audio, en los que se da solución a los
problemas relacionados con la alteración de la velocidad de reproducción que
se genera por el mal estado del medio de almacenamiento analógico o por
problemas en el equipo reproductor analógico. Resulta, además, benéfico
aplicar transposiciones en viejas grabaciones, pues se da un aire más moderno
al nuevo audio.

5.1.1.3. Procesadores de rango dinámico. La diferencia (en dBs) entre la


intensidad más fuerte y la más débil es conocida como rango dinámico de un
fragmento de una señal de audio. Los efectos de rango dinámico manipulan
directamente la amplitud de las muestras, modificando, de múltiples maneras,
el rango dinámico de un determinado fragmento de audio. Los más
representativos son los compresores, expansores, limitadores y las puertas de
ruido. Una correcta forma de representar estos procesos es mediante su
función de transferencia, que establece la relación entre las amplitudes de
entrada y las amplitudes de salida.

En la figura 61 se muestran varias funciones de transferencia de este tipo, al


igual que su efecto en un fragmento sonoro. La función de transferencia, de la
figura 61 a), es una recta con una inclinación de 45º, lo que significa que, en
176

este caso, no se produce ninguna modificación del rango dinámico, es decir, a


cualquier valor de amplitud de entrada le corresponde el mismo valor en la
amplitud de salida.

Compresores y limitadores. Los compresores son empleados para disminuir


el rango dinámico de una señal de audio. Se emplea ampliamente en
grabaciones vocales, pues, la señal emitida por la voz y transducida por un
micrófono, presenta armónicos muy débiles que se suelen confundir con el
ruido de fondo. Con una compresión más alta se consigue un efecto
comúnmente utilizado en las guitarras eléctricas, creando el típico sonido de
heavy, como se ilustra en la figura 61 b). Parecido al comportamiento realizado
por los efectos que emplean retardos, donde se realzan instrumentos
musicales o la voz humana, los compresores tienen como finalidad reducir el
nivel de las señales con demasiado volumen, para el realce de aquellas
señales con un nivel bajo. Cuando algún sonido de interés, la voz o un
instrumento musical, es opacado por el ruido de piso u otra degradación
global, es útil la implementación de compresores.

Los limitadores son un caso particular de compresores, que limitan la amplitud


máxima posible a un valor límite. Suelen utilizarse en grabaciones al aire libre
como conciertos, para evitar que se produzca saturación. Su función de
transferencia presenta pendientes horizontales en los extremos, como se
muestra en la figura 61 c).

Expansores. Tienen el efecto opuesto de un compresor. Minimiza los


cambios, disminuye los niveles débiles y aumenta los fuertes, como se ilustra
en la figura 61 d). Se emplean normalmente en combinación con puertas de
ruido y para mejorar grabaciones antiguas que presentan un rango dinámico
estrecho con fines de restauración. Produce realce del sonido y restaura la
177

fuerza o emotividad que le imprime algún instrumento o ejecutante, incluido el


cantante.

Distorsión. Este término tiene connotaciones peyorativas, pues,


normalmente, significa la pérdida o degradación inevitable de una señal,
factores ocasionados por los diferentes dispositivos o procesos (micrófono,
grabación, amplificador, parlantes) a los que se ve sometida. Sin embargo, los
efectos descritos anteriormente son, en realidad, casos particulares de
distorsión, que, por su uso frecuente, reciben un nombre propio.

Puertas de ruido. Silencian las muestras por debajo de determinado valor


límite, introducido como parámetro de porcentajes sobre la amplitud máxima
de las muestras, y silencia las muestras por debajo de dicho porcentaje. Las
puertas de ruido se emplean, regularmente, para conferencias donde hay
varios micrófonos y se desea que sólo un micrófono, el del interlocutor, capte
las señales sonoras. Este efecto es muy común en la reducción de hiss o ruido
de fondo, comúnmente llamado ruido de piso, aunque existen formas más
sofisticadas y efectivas de reducción de este tipo de ruido a través de
algoritmos DSP (Procesamiento Digital de Señales).

La combinación de compresores y puertas de ruido en procesos de grabación,


junto con expansores, se utiliza ampliamente como técnica de reducción de
ruido, un ejemplo es el sistema Dolby, implementado en muchos equipos de
reproducción y grabación de audio.
178

Señal original
0
+1

Amplitud
Aa) 0

-1
-1 +1 Tiempo

Compresor

Amplitud
Ab)

Tiempo

Limitador
Amplitud

Ac)

Tiempo
Expansor
Amplitud

Ad)

Tiempo

Figura 61. Funciones de transferencia de procesadores de rango dinámico.


Fuente: JORDÀ PUIG, Sergi. Conceptos avanzados de procesado digital de audio:
procesadores de rango dinámico. [en linea]. s.l.: JORDÀ PUIG, Sergi, 2003.
<http://www.ccapitalia.net/reso/articulos/audiodigital/pdf/06-ProcesadoSonido.pdf>
[consulta: 25 Mar. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás
179

5.1.1.4. Filtros. La teoría de filtros digitales es un tema importante y


extenso, y puede ocupar todo un curso en una carrera de ingeniería. Por ello,
no se tratará aquí la forma de implementación de estos filtros digitales ni las
teorías matemáticas sobre los que se apoyan, pues no es el propósito central
de este trabajo que ha asumido como eje temático central la restauración de
audio. A continuación, se describirán superficialmente los filtros digitales como
complemento del tema de editores gráficos de audio digital. Dejando aclarado
que los filtros digitales son la herramienta fundamental para lograr alterar la
estructura tímbrica de un sonido para posibilitar aquellos procesos como
efectos con retardo, procesadores de rango dinámico y algoritmos DSP
(Procesamiento digital de señales) orientados a la restauración de audio.

La implementación de filtros en procesamiento digital de señales es una etapa


necesaria y amplia, ya que son muchas las situaciones, entre ellas la
restauración de audio, en las que se pretende acentuar o atenuar
determinadas frecuencias. Un ejemplo para graficar lo antes argumentado
puede ser la aparición de filtros en la entrada de los equipos digitales como
ADC, consolas digitales u otro dispositivo que procese señales analógicas de
audio, para evitar la presencia de señales de muy baja o muy alta frecuencia
que, sin ser útiles, implican la adición de ruido a la señal procesada.

En un contexto más riguroso, cualquier algoritmo, o proceso digital sobre una


señal de audio que, a partir de una entrada (una secuencia de bits) genere una
salida (otra secuencia de bits), se considera un filtro digital. Todos los procesos
comentados hasta el momento se constituyen en casos particulares de filtros
digitales, pero en la práctica este término se reserva para aquellos dispositivos
que modifican el espectro de una señal de audio.
180

Espectro de una señal. En el primer capítulo se argumentó que la mayoría


de sonidos están compuestos por diferentes frecuencias. En el estudio de los
sistemas y señales se exhibe el teorema de Fourier, quien afirma que cualquier
señal periódica compleja puede descomponerse en una suma de señales
senoidales de frecuencias y amplitudes diferentes. Dicha descomposición es
denominada como espectro de frecuencias, y se representa mediante un
gráfico con frecuencias en el eje horizontal y amplitudes en el eje vertical, en
el que se observan diferentes amplitudes de todas las frecuencias que
componen un sonido.

Esta teoría data desde hace más de un siglo y se aplicaba rigurosamente a las
señales totalmente periódicas, pero los sonidos nunca lo son plenamente, pues
siempre varían con el paso del tiempo. Afortunadamente, desde hace varias
décadas, y mediante elaborados y complejos procesos matemáticos, es posible
el análisis por Fourier de señales variables en el tiempo. La representación
espectral de un sonido no es una única distribución bidimensional de
frecuencias, sino una superficie tridimensional, compuesta por una sucesión de
cortes temporales, en la que cada una muestra la forma del espectro en un
instante de tiempo determinado.

Ya se mostró cómo algunos programas de edición gráfica de audio son capaces


de realizar este análisis para un fragmento seleccionado de un archivo y de
mostrar gráficamente el resultado. Estos gráficos permiten estudiar el cambio
temporal de los diferentes componentes frecuenciales que conforman un
sonido para realizar una correcta ecualización sobre éste, además de identificar
componentes no deseados como ruidos o elementos espurios para estudiar con
mayor profundidad sus comportamientos en frecuencia y amplitud.
181

Filtros básicos. Un filtro se define por su respuesta en frecuencia


(atenuación o amplificación) mediante la función de transferencia, que
establece la relación entre las frecuencias de entrada y las frecuencias de
salida.

Los filtros más usuales pueden clasificarse en cuatro grupos:

• Pasa-bajo

• Pasa-alto

• Pasa-banda

• Rechazo de banda (Elimina-banda).

Filtro pasa-bajo. Permite pasar las señales cuyas frecuencias están por
debajo de un determinado umbral, denominado frecuencia de corte. En un
filtro ideal estas frecuencias suponen una discontinuidad en la curva de
respuesta, de forma que se atenúan las frecuencias mayores al umbral y
todas aquellas frecuencias por debajo del umbral pasaran sin atenuación. En la
práctica esto no es viable y los filtros reales presentan una pendiente en la
región próxima a la frecuencia de corte. Mientras mayor sea la inclinación de la
pendiente de atenuación, más preciso será el filtro.

Filtro pasa-alto. Es el filtro que se caracteriza por ser el opuesto al pasa-


bajo, ya que únicamente deja pasar las señales cuyas frecuencias sean
superiores a la frecuencia de corte y atenúa las señales cuyas frecuencias
están por debajo del punto de corte.
182

Filtro pasa-banda. Permite pasar señales dentro de una banda de


frecuencias. Se determina por una frecuencia central y un ancho de banda.

Filtro de rechazo de banda. Es el opuesto al filtro pasa-banda, ya que


permite pasar las señales de frecuencias, excepto las de frecuencias de una
banda restringida, que se determina por una frecuencia central y un ancho de
banda.

En la figura 62 se muestran las curvas de respuesta de frecuencia de estos


cuatro filtros básicos.

Ecualizadores. Un ecualizador gráfico es un arreglo de filtros pasa-banda en


paralelo, que permite seleccionar las bandas deseadas en baja, media o alta
frecuencia para filtrar una señal de audio. En la figura 63 se aprecia la
respuesta de un ecualizador compuesto de 6 filtros pasa-banda. Es el
dispositivo más empleado para transformar el timbre de un sonido, de manera
que permite modificar la señal de entrada en forma tal que determinados
componentes de su estructura o espectro resultan aumentadas o amplificadas.
Las transformaciones logradas con un ecualizador no son radicales, aunque
ayudan atenuando determinadas frecuencias molestas como es el caso del
ruido de piso, muy común en registros sonoros analógicos o realzando
determinadas características tímbricas de registro sonoro antiguo que presenta
degradaciones en su calidad sonora.
183

Pasa-bajo Pasa- alto

Frecuencia Frecuencia
de corte de corte
Aa) Ab)
Amplitud

Amplitud
Frecuencia Frecuencia

Pasa-banda Elimina-banda

Frecuencia Frecuencia
central central
Ac) Ad)
Amplitud

Amplitud

Frecuencia Frecuencia

Figura 62. Curvas de respuestas de filtros.


Fuente: JORDÀ PUIG, Sergi. Conceptos avanzados de procesado digital de audio: los
filtros. [en linea]. s.l.: JORDÀ PUIG, Sergi, 2003.
<http://www.ccapitalia.net/reso/articulos/audiodigital/pdf/06-ProcesadoSonido.pdf>
[consulta: 25 Mar. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás
184

Respuesta del
ecualizador

Amplitud

Frecuencia

Filtros pasa-banda

Figura 63. Respuesta de ecualizador con 6 bandas de filtrado.


Fuente: PENA GIMÉNEZ, Antonio. Sistemas de audio y video: procesos sobre la señal
de audio. [en linea]. Vigo: Universidad de Vigo, 2005.
<http://www.gpi.tsc.uvigo.es/%7Ecbarcena/Web-SAV/sav0405_tema3_procesos.pdf>
[consulta: 11 Abr. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

Un ecualizador permite, como máximo, manipular 3 parámetros:

• Frecuencia central: Determina sobre qué zona del espectro de desea


ecualizar

• Anchura de banda o factor Q: Define la región alrededor de la frecuencia


central

• Nivel de atenuación y amplificación: Señala la magnitud en dBs,


necesaria para realzar o acentuar la región o banda elegida.
185

Los tipos de ecualizadores son:

• Paramétricos: Son los que permiten manipular los 3 parámetros

• Semiparamétricos: En ellos Q está predefinida y sólo es posible cambiar


los otros dos parámetros

• Gráfico o de bandas: Posee un número fijo de frecuencias de


atenuación, con Q fija, de forma que sólo es posible modificar el nivel de
atenuación o amplificación

En las figuras 64 y 65 se observan dos ecualizadores, el primero un ecualizador


grafico del programa Audition y el segundo un ecualizador paramétrico del
programa Sound Forge. En la figura 66 se ilustra un hardware de ecualización
gráfica de audio.

5.1.1.5. Dither. Es un método de reducción del ruido de aliasing y


distorsión, producido por el truncamiento de bits (al pasar de 24 a 16 bits). El
dither agrega un tipo de ruido que elimina el ruido por efecto de "aliasing" o
espectro plegadizo.
186

Figura 64. Ecualizador gráfico de Audition.

Figura 65. Ecualizador paramétrico de Sound Forge.


187

Figura 66. Hardware de ecualizador grafico de audio.


Fuente:Equalizer. Products: equalizer & accessories. [en linea]. s.l.: Behringer, 2005.
<http://www.behringer.com/DEQ2496/index.cfm?lang=ENG>
[consulta: 22 Abr. 2005]

5.1.2. Multipistas de audio digital. Son programas que permiten grabar,


manipular y mezclar audio digital. La característica primordial de estas
aplicaciones es que pueden reproducir varios archivos de audio
simultáneamente.

El estudio de los programas multipista es un tema interesante y profundo, y


puede ocupar todo un curso en el manejo de este tipo programas de audio.
Por ello, no se tratará aquí sus procesos ni características ya que no es el
objetivo alejarse de los temas centrales relacionados con la restauración de
audio.

Un multipistas de audio requiere un conversor de audio (tarjeta de audio)


profesional que, además de una buena calidad de audio, posea uno o varios
chips DSP que aceleren los procesos de transmisión del audio liberando al
computador de esta tarea (para mayor información y claridad remítase al
capítulo 4). La mayoría de los multipistas de audio incluyen sencillas
herramientas de edición pero insuficientes para la restauración de audio.
Tampoco poseen funciones de importación y exportación de registros vía MIDI
o SCSI (Small Computer System Interface) o sistema de interfaz para
computadora pequeña, ni herramientas de análisis de señales o listas de
188

reproducción. Los procesos implementados se calculan de forma independiente


por cada pista y puede ser por DSP físico o nativo.

Los siguientes son algunos programas multipistas reconocidos en el mercado:

Proceso Nativo. (No requieren chip DSP, aunque mejorarían su rendimiento)

• Nuendo (PC/MAC)

• Audition (PC/MAC)

• Vegas Audio (PC)

• Cool Edit Pro (PC/MAC)

Proceso DSP. (Requieren chip DSP)

• Proo Tools (PC/MAC)

• SoundScape (PC)

• P.A.R.I.S (PC/MAC)

5.1.3. Secuenciador MIDI. Es la aplicación más exigente relacionada con


la potencia del computador y los procesos DSP. Requiere conversores con
múltiples chips DSP para un correcto funcionamiento, en parte, porque un
secuenciador MIDI debe poseer las funciones de un multipistas de audio más la
funcionalidad propia de todo un secuenciador MIDI.
189

El estudio de los secuenciadores MIDI es un tema innovador y extenso, y


puede ocupar todo un curso en el manejo de este tipo programas de audio.
Por ello, no se tratará aquí sus procesos ni características ya que no es el
objetivo alejarse de los temas centrales de la restauración de audio.

Generalmente, los datos MIDI son mucho más pequeños que los datos de
audio digitalizados, lo que hace más exigente el cálculo de los efectos
aplicados, como reverberaciones en tiempo real. Un secuenciador requiere de
un buen conversor de audio (tarjeta de audio), al igual que el multipista de
audio digital, pero, además, requiere de una excelente interfaz MIDI que ayude
al computador en la gestión y transmisión de datos MIDI. Se emplean los
mismos tipos de drivers que en los multipistas de audio ya que la exigencia de
procesamiento es la misma o superior.

Los secuenciadores, igualmente, incluyen sencillas herramientas de edición de


audio, aunque no ofrecen un alto grado de profundidad.

Los siguientes son algunos programas secuenciadores MIDI, reconocidos en el


mercado:

Proceso Nativo. (No requieren chip DSP, aunque mejorarían su rendimiento)

• Cubases VST (PC/MAC)

• Logia Audio (PC/MAC)

• Cakewalk / SONAR (PC)

• Digital Performer (MAC)


190

Proceso DSP. (Requieren chip DSP)

• Logic Audio Platinum (MAC)


191

6. TECNOLOGÍAS DE RESTAURACIÓN DIGITAL DE AUDIO

Como se esbozó inicialmente en los primeros capítulos, y luego se argumentó


profundamente en el trabajo, las señales de audio contienen una mezcla de
señales musicales y de voz, además de otros elementos de información,
incluyendo ruidos, cuya composición y origen son de naturaleza diversa. Por
tales razones, se consideró pertinente hacer un análisis sobre las tecnologías
de restauración. Asunto que no ha sido reflexionado profundamente en nuestro
contexto, de acuerdo con las indagaciones hechas para los propósitos descritos
en este trabajo de grado.

Las tecnologías de restauración que se exponen están basadas en Procesos


Digitales de Señales (DSP). Se dispone de dos áreas metodológicas que
agrupan tecnologías con orientaciones diferentes. La primera se fundamenta
en modificaciones locales o globales de la señal de audio; la segunda se basa
en la sustitución de la señal de audio por una combinación lineal de vectores
extraídos de un diccionario apropiado, que se elige de acuerdo con la
naturaleza de la señal.

Algunas de las empresas más sobresalientes en el campo de la restauración


digital son:

• CEDAR. (Computer Enhanced Digital Audio Restoration), Cambridge. Es


una de las empresas pioneras en la creación y distribución de productos
para restauración de señal de audio con ruidos, basados en software y
en hardware. El producto DC1 elimina ruidos impulsivos y pulsos
192

transitorios. El producto CR1 ataca los zumbidos y distorsiones no


lineales. La interfaz gráfica de este producto se observa en la figura 67.

Diseñado para sistemas operativos MAC y Windows. En caso de requerir


mayor información sobre este aspecto, por favor visite la página Web:
http://www.cedar-audio.com

Figura 67. Programa de restauración de audio de CEDAR.


Fuente: Restauración de audio. Proceso de señales y aplicaciones en la restauración de
registros sonoros: tecnologías de restauración. [en linea]. Oviedo: Universidad de
Oviedo, s.f. <http://coco.ccu.uniovi.es/brahms/tecnolgiasresta/tecnologiasresta.htm>
[consulta: 28 Feb. 2005]

• SONIC Solutions. Creadora de NoNOISE, paquete de aplicaciones para


la restauración de señales de audio con ruidos, que incluye herramientas
para eliminar ruidos impulsivos, de banda ancha y un filtrado complejo
193

para el tratamiento de los ruidos de baja frecuencia. La interfaz gráfica


de este producto se observa en la figura 68.

Diseñado para sistemas operativos MAC y Windows. Para ampliar esta


información puede visitar la página Web: http://www.digidesign.com

Figura 68. Programa de restauración de audio de SONIC Solutions.


Fuente: Restauración de audio. SONIC: Sonic NoNOISE. [en linea]. Novato: Sonic
Solution, 2005. <http://www.digidesign.com/products/details.cfm?product_id=3180>
[consulta: 26 Abr. 2005]

• Pinnacle. Ofrece gran variedad de programas relacionados con el


tratamiento de audio, en edición, multipista y secuenciadores MIDI; pero
es el programa Steimberg Clean el más especializado en la limpieza de
194

todo tipo de audio y en restaurar discos y cintas magnéticas. La interfaz


gráfica de este producto se observa en la figura 69.

Diseñado para sistemas operativos Windows. Sobre este tema en


particular se halla mayor información en la página Web:
http://www.pinnaclesys.com

Figura 69. Programa de restauración de audio de Steimberg Clean.


Fuente: Restauración de audio. PINNACLE SYSTEMS: audio. [en linea]. s.l.: Pinnacle
systems, 2005.
<http://www.pinnaclesys.com/ProductPage_n.asp?Product_ID=1477&Langue_ID=6>
[consulta: 25 Abr. 2005]

• Waves. Ofrece un programa para la reducción de ruidos y restauración


de audio. Apoyado en investigaciones psicoacústicas y de algoritmos de
195

restauración de varios niveles. Sus aplicaciones X-Hum, X-Click, X-


Crackle y X-Noise ofrecen una excelente alternativa en la restauración y
remoción de ruidos que se presentan en los medios de almacenamiento
analógico. La interfaz gráfica de este producto se observa en la figura
70.

Diseñado para sistemas operativos MAC y Windows. Si se desea ampliar


esta información, indague en la página Web: http://www.waves.com

Figura 70. Programa de restauración de audio de Waves.


Fuente: Restauración de audio. WAVES: restoration bundle. [en linea]. s.l.: Waves
Audio, 2005. <http://www.waves.com/content.asp?id=59> [consulta: 25 Abr. 2005]

• Bias, inc. Ofrece SoundSoap Pro, constituye un conjunto de


herramientas de restauración de audio, diseñado para profesionales del
audio: ingenieros, músicos e incluso científicos. Su característica
primordial es que no divide el proceso de restauración en plug-ins
196

individuales, sino que ofrece una interfaz integrada que permite ejecutar
la herramienta deseada rápidamente. Algunas de sus aplicaciones son:
Hum, Click & Cracke, Broadband y Noise Gate. La interfaz gráfica de
este producto se observa en la figura 71.

Diseñado para sistemas operativos MAC y Windows. Para ampliar esta


información puede remitirse a la página Web: http://www.bias-inc.com

Figura 71. Programa de restauración de audio de Bias, inc.


Fuente: Restauración de audio. SoundSoap Pro de Bias. [en linea]. s.l.: La oreja
digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Fnoticia.php3%3Fidnoticia
%3D1225> [consulta: 26 Abr. 2005]
197

Existe gran variedad de programas de edición gráfica de audio, con amplios


paquetes de herramientas que incluyen opciones de restauración de registros
de audio. Algunos ya citados anteriormente, son:

• Sound Forge (PC/MAC)

• Audition (PC/MAC)

• Wavelab (PC)

• Proo Tools (PC/MAC)

• Cool Edit Pro (PC/MAC)

• SoundTrack (MAC)

• Gold Wave (PC)


198

6.1. TECNOLOGÍAS DE MODIFICACIÓN

Las tecnologías de modificaciones diseñan modelos matemáticos de la señal,


que representan de manera precisa la parte no degradada. Una vez detectado
el segmento degradado de la señal, es posible eliminarlo y sustituirlo por otro
que se cimentará en el modelo matemático. Aquella parte de señal que no se
identifica como degradación o ruido, se conserva en su estado original. En la
figura 72 se ilustra la detección de un segmento degradado de una señal. En la
figura 73 se grafica la eliminación del ruido; y en la figura 74 se muestra la
sustitución.
Amplitud

Tiempo (seg)
Figura 72. Detección de segmento con ruido.
199

Amplitud

Tiempo (seg)
Figura 73. Eliminación del ruido.
Amplitud

Tiempo (seg)
Figura 74. Sustitución del ruido.
200

De acuerdo con el modelo matemático elegido para representar la señal de


audio, se usan las diferentes tecnologías para detectar las degradaciones
localizables y globales que luego serán eliminadas.

El proceso de restauración digital se compone de tres etapas:

• La detección de los fragmentos degradados

• La eliminación del contenido de dichos fragmentos

• La sustitución de los fragmentos eliminados, por técnicas de


interpolación que, generalmente, relacionan valores de muestras que
anteceden al fragmento eliminado, valores de las muestras que le
siguen y probablemente los valores de algunas muestras del fragmento
degradado eliminado previamente.
201

A continuación se describen algunos ruidos identificados en pistas de audio y


restaurados por técnicas de interpolación.

En la figura 75 se observa una señal de audio degradada con abundantes clicks


y su equivalente restaurada pero sin presencia de clicks.

Señal de audio
con clicks

Señal de audio
restaurada

Figura 75. Señal de audio con clicks y señal restaurada.


202

En la figura 76 se advierte muy detalladamente la forma de un click en el


tiempo, además de su representación espectral en tercera dimensión.

Click
Amplitud

Tiempo

Click
Amplitud

23 m s
20.5
00 HZ
Fr ec u
e n ci a 640 H
Z po
Ti e m
0 ms

20 HZ

Figura 76. Representación de un click en el tiempo y el espectro.


203

En la figura 77 se muestra una señal de audio degradada con abundantes


thumps y su equivalente restaurada, sin presencia de thumps.

Señal de audio
con thumps

Señal de audio
restaurada

Figura 77. Señal de audio con thumps y señal restaurada.


204

En la figura 78 se detalla la forma de dos thumps en el tiempo, además de su


representación espectral en tercera dimensión.

Amplitud Thump Thump

Tiempo

Thump

Thump
Amplitud

23 m s
20.5
00 HZ
Fr ec u
e n ci a 640 H

o
Z

Ti e m p
0 ms

20 HZ

Figura 78. Representación de thumps el tiempo y el espectro.


205

La teoría de los modelos matemáticos para describir señales de audio,


detección de degradaciones y generación de algoritmos de restauración, es un
tema importante y extenso y puede ocupar todo un curso en una carrera de
ingeniería o un trabajo de grado. Por ello, se ha decidido no profundizar
teóricamente sobre dichos modelos, ni sobre sus teorías matemáticas en las
que se apoyan. En su lugar, y para efectos de mantener los propósitos
centrales del trabajo, se enuncian los modelos matemáticos para representar
señales de audio y detección de degradaciones como también los algoritmos
utilizados para la restauración. En el anexo E se encuentran algunos de los
modelos matemáticos más representativos. Se describen, en consecuencia, los
modelos matemáticos existentes para la restauración de audio,
posteriormente, en los procesos de modificación se señalarán cuáles son los
más empleados en los programas de edición gráfica de audio.

Modelos matemáticos para describir señales de audio:

• Modelos AR (auto-Regressive)

• Modelos de espacio de estado y filtros de Kalman

• Modelos sinusoidales

• Marcos bayesianos

• Transformada Wavelet continua

• Transformada Wavelet discontinua


206

Modelos matemáticos para detectar clicks:

• Modelos AR por bloques

• Filtros adaptados (matched filter)

• Transformada Wavelet continua

• Técnicas bayesianas

• Técnicas Subbanda

• Empaquetado de muestras

Algoritmos para restaurar señales con clicks:

• Interpolación AR

• Técnicas bayesianas

• Técnicas espectrales

Modelos matemáticos para detectar scratches:

• Utilización de pulsos patrón

• Técnicas bayesianas: separación de señales

• Filtro adaptativo y sustracción


207

• Métodos espectrales de localización

Algoritmos para restaurar señales con scratches:

• Modelos AR por bloques

• Filtros adaptivos (matched filter)

• Transformada Wavelet continua

• Técnicas bayesianas

• Técnicas Subbanda

• Empaquetado de muestras

Modelos matemáticos para degradaciones globales:

• Modificación espectral

• Métodos basados en la transformada Wavelet de la señal

• Métodos basados en la transformada Wavelet continua

• Modelos AR por bloques


208

Algoritmos para restaurar señales con degradaciones globales:

• Atenuación espectral

• Modelos AR por bloques

6.1.1. Procesos de modificación. Estos procesos tienen lugar después de


pasar la señal de audio analógica a digital, y elegir los procedimientos de
restauración para realizar en el programa de edición gráfico de audio digital. Es
importante recordar que cada programa define diferentes criterios y
parámetros para la evaluación de la señal de audio digital: identificación de
elementos espurios y reparación. En muchas aplicaciones el usuario es quien
define los parámetros, modelos y aproximaciones matemáticas para esta labor.

6.1.1.1. De-thumping. Como se señaló en el primer capítulo, los Thumps o


golpes, surgen por la aparición de largos pulsos contenidos en bajas
frecuencias que auditivamente alteran la señal de audio. Estos pulsos se
relacionan con la respuesta mecánica del sistema o mecanismo de playback a
una excitación anormal.

Además de las técnicas simples, como filtros pasa-altos, existen unos pocos
métodos con altos grados de complejidad para tratar este tipo de pulsos de
bajas frecuencias. Se denomina De-thumping al proceso de remoción de
thumps de un registro sonoro digital. El modelo que se observa en la figura 79,
ocupa las primeras posiciones en popularidad y corresponde al método
introducido por Vaseghi5. El argumento básico en el que se apoya este método

5
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: VASEGHI S, V. Algorithms of Restoration of Archived
Gramophone Recordings. Cambridge: Cambridge University, 1988.
209

es que todos los pulsos largos de baja frecuencia son idénticos y que sólo
varían en amplitud. Así, dado un modelo de un pulso corrupto, se logra
localizar otras ocurrencias de pulsos a través de altos valores del coeficiente de
cross-correlation, medido entre el modelo y la señal degradada.
Posteriormente, la eliminación del ruido se lleva a cabo sustrayendo un modelo
de amplitud escalado de la porción degradada de la señal, después de una
sincronización adecuada de tiempo.

Señal Restaurada
Señal + Pulso

- Interpolador

Ganancia
Filtro
detector + Detector
clicks

Pulso de
referencia
Retardo

Figura 79. Diagrama de bloques de-thumping.


Fuente: VASEGHI S, V. and FRAYLING-CORK, R. En: J. Audio Eng. Soc. Cambridge.
Vol. 40, No. 10 (Oct. – Sep. 1992); p. 791-801.
[consulta: 11 May. 2005]
* Diseñada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás

El click de alta amplitud que usualmente aparece en el inicio de un thump será


removido por el algoritmo de-clicking. En el modelo de la figura 79, se muestra
el diagrama de bloques que ilustra las fases del modelo que corresponden al
método De-thumping. Su principal limitante es la falta de potencia detectando
210

y suprimiendo pulsos cuyas formas varían con el tiempo o pulsos que se


superponen6.

Otro acercamiento a un modelo basado en la eliminación de thumps, plantea


que la señal de audio degradada es modelada como una mezcla de dos
procesos AR (Auto-Regressive) diferentes. Así, la restauración de la señal se
logra separando estos dos procesos. Los modelos AR de alto orden son usados
para adaptar la señal fundamental de audio y los modelos AR de bajo orden
para los pulsos y el click inicial es incorporado como parte del pulso. La
principal desventaja de la separación AR es su alta exigencia computacional.
Este método se ha desarrollado hasta el punto de permitir el surgimiento de
aplicaciones más eficientes que utilizan técnicas basadas en filtros de Kalman.

6.1.1.2. De-clicking. Los clicks son cortos estallidos al azar en el tiempo y


la amplitud. Se pueden percibir de manera aleatoria, como pequeños ticks de
ruido que pueden ocurrir en cualquier medio de grabación analógica. Las
perturbaciones son causadas, regularmente, por las imperfecciones en
pequeña escala en las ranuras de la pared de un disco. Otras causas de estas
imperfecciones pueden ser la inherente porosidad del material del medio,
sólidos que se adhieren a las ranuras de las paredes, o la presencia de rayones
superficiales. Se denomina De-clicking al proceso de remoción de clicks de un
registro sonoro digital.

En los modelos basados para la detección de clicks, pequeñas muestras de la


señal de audio fundamental son modeladas con un orden N de un proceso AR

6
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: GODSILL. S. J. and RAYNER. P, W. Digital Audio Restoration
A Statistical Model Based Approach. London: Springer Verlag, 1988.
211

modelo. Además, el mecanismo de degradación asume la forma de la ecuación


6.1.

Y(n)= x(n) + i(n)d(n) (6.1)

Donde:
x(n): muestras de la señal de audio
i(n)d(n):componente de ruido
i(n): sucesión binaria de la presencia de ruido

El objetivo del algoritmo de detección de clicks es estimar la secuencia i(n) que


minimiza el porcentaje de error de detección y falsa alarma de clicks. La
magnitud de excitación del modelo AR es obtenida por vía de filtrado inverso y
comparada con un umbral adaptable. Las muestras de la excitación con valores
que exceden el umbral reflejan las muestras degradadas en la señal de audio.
El mejoramiento del desempeño del detector de clicks puede lograrse usando
un filtrado por comparación (match filter)7, alternativas de predicción lineal8 y
esquemas más elaborados de umbrales9. La supresión de ruido se logra
reemplazando las muestras corrompidas con otras que simulan la señal
fundamental. Esta tarea puede lograrse satisfactoriamente a través de los
métodos de interpolación AR. El de-clicking también puede llevarse a cabo por

7
ESQUEL A, Paulo, Op. Cit., p. 8.
8
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: VASEGHI S, V. and RAYNER. J, W. Detection and
Suppression of Impulsive Noise in Speech Communication Systems. Proc. IEEE Int.
Conf. Acoustics, Speech, and Signal Processing. Vol. 137, No. 1 (Feb. – Mar. 1990); p.
38-46.
9
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: ESQUEL A, Paulo and BISCAINHO. L, W. A Double-Threshold-
Based Approach to Impulsive Noise Detection in Audio Signals. in Proc. X European
Signal Processing Conf., Tampere. Vol. 4 (Sep. – Oct. 2000) p. 2041-2044.
212

técnicas bayesinanas y técnicas espectrales. En las aproximaciones


bayesianas, los modelos son utilizados para la señal fundamental y en los
procesos de ruido. Además, la detección y eliminación del clicks se lleva a cabo
dentro de una misma fase del proceso. Otros métodos para el proceso de De-
clicking incluyen los algoritmos de red neural10 (neural –network) y modelos
basados en técnicas de filtros adaptivos11. En el anexo E se exponen algunos
de estos diferentes métodos. En la figura 80 se puede observar el diagrama de
bloques con las fases del modelo basado en De-clicking por algoritmos AR.

6.1.1.3. De-hissing. El ruido de banda ancha o hiss es un ruido aleatorio


de fondo, es una forma de degradación común a todo sistema de medida
analógica, almacenamiento y sistemas magnetofónicos. En el caso de audio las
señales de ruido, que generalmente percibe el oyente como hiss, están
compuestas de ruidos en circuitos eléctricos, irregularidades en el medio de
almacenamiento y ruido ambiental de las condiciones externas de grabación.

10
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: CZYZEWSKI, A. Learning Algorithms for Audio Signal
Enhancement, Part I: Neural Network Implementation for the Removal of Impulsive
Distortions. J. Audio Eng. Soc. Vol. 45, No. 10 (Oct. – Sep. 1997); p. 815–831.
11
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: NIEDZWIECKI, M and CISOWSKI, K. Adaptive Scheme for
Elimination of Broadband Noise and Impulsive Disturbances from AR and ARMA
Signals. IEEE Trans. Signal Processing. Vol. 44, No. 3, ( Mar. – Apr. 1996) p. 528–537.
213

Señal + Ruido impulsivo Señal Restaurada


Interpolador

Modelo AR Indice de
muestras
corruptas

Filtrado Filtro Detector


inverso detector clicks

Figura 80. Diagrama de bloques de de-clicking por algoritmos AR.


Fuente: VASEGHI S, V. and FRAYLING-CORK, R. En: J. Audio Eng.
Soc. Cambridge. Vol. 40, No. 10 (Oct. – Sep. 1992); p. 791-801.
[consulta: 11 May. 2005]
* Diseñada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás

Es común a todas las formas de registro, usualmente aditivo e independiente


de la señal. Los estudios del De-hissing se han abordado a través de diferentes
connotaciones conceptuales. Quizás el método más común es la atenuación
espectral de corto tiempo STSA (Short-Time Spectral Attenuation) que tienen
origen en la exposición de-noising12. En la práctica, debido en general al
comportamiento no estacionario de las señales de audio, el método STSA
emplea un bloque de traslapo y adición esquemático del proceso. Además, las
transformaciones de tiempo en frecuencia y viceversa se llevan a cabo
mediante la transformada discreta de Fourier. En los métodos STSA, la
reducción del hiss se cumple sustrayendo un estimado del espectro de potencia

12
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: BOLL. S, F. Suppression of Acoustic Noise in Speech Using
Spectral Subtraction. En: IEEE Trans. Acoustics, Speech, and Signal Processing. Vol.
ASSP- 27, No. 2 (Apr. – May. 1979) p. 113–120.
214

del ruido realizado de la observación del espectro de potencia de la señal


degradada. Esta estrategia es conocida con el nombre de Regla de supresión
por sustracción de espectro de potencia. Otras reglas de supresión
relacionadas incluyen la sustracción espectral de la magnitud y filtrado de
Wiener13. A continuación se ilustran las fases del proceso tradicional de
métodos STSA de-hissing en la figura 81.

Continuando con las clases de técnicas no paramétricas, el modelo de Wavelet


recibe mucha atención en la literatura atinente con la restauración de audio14.
En este método la señal de ruido es proyectado (mapeado) dentro de una
representación multi-resolución tiempo-frecuencia por vía de la transformada
discreta de Wavelet.

Además de las técnicas no paramétricas, existen sofisticados modelos


propuestos para el proceso de De-hissing en señales de audio. Por ejemplo, el
esquema del modelo AR para señales de audio que se ha mencionado, modelos
estáticos basados con técnicas que emplean modelos AR y ARMA (Auto
Regressive Moving-Average) que también han sido desarrollados para el
tratamiento del ruido de banda ancha y ruidos impulsivos15, esquemas de
filtros adaptivos para el tratamiento del ruido de banda ancha16 y modelos

13
ESQUEL A, Paulo, Op. Cit., p. 16.

14
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: BERGER, J, COIFMAN, R and GOLDBERG. M, J. Removing
Noise from Music Using Local Trigonometric Bases and Wavelet Packets. J. Audio Eng.
Soc. Vol. 42, No. 10 (Oct. – Sep. 1994) p. 808–818.

15
ESQUEL A, Paulo, Op. Cit., p. 18.
16
Ibid, p. 18
215

híbridos que combinan diferentes esquemas no paramétricos17 o mezcla de no


paramétricos y paramétricos. Algunos de estos modelos pueden ser
consultados en el anexo E.

Estimación
de ruido

Reglas de
Análisis supresión
Señal + Ruido STFT

Síntesis
STFT
Señal Restaurada

Figura 81. Diagrama de bloques de de-hissing por STSA.


Fuente: P.J WOLFE. P, J and y GODSILL. S, J. Efficient Alternatives to the Ephraim and
Malah Suppression Rule for Audio Signal Enhancement. En: EURASIP Journal on
Applied Signal Processing – Special Issue on Digital Audio for Multimedia
Communications. Vol. 2003, No. 10 (Sept. – Oct. 2003) p. 1043–1051.
[consulta: 11 May. 2005]
* Diseñada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás

17
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: S. B. JEBARA. S, B, BENAZZA-BENYAHIA, A and KHELIFA. A,
B. Reduction of Musical Noise Generated by Spectral Subtraction by CombiningWavelet
Packet Transform and Wiener Filtering. Proc. X European Signal Processing Conf.,
Tampere. Vol. 2 (Sept. – Oct. 2000).
216

6.1.1.4. De-scratching. Los scratches son producidos por arañazos o


roturas en la superficie de un disco. Son pulsos discontinuos de gran amplitud
en tiempo y en frecuencia, seguidos de una etapa transitoria de bajas
frecuencias que está asociada con la respuesta impulsiva del medio de
reproducción. Los scratches son pulsos transitorios de duración mayor que la
correspondiente a los clicks, aproximadamente de 20 ms. y con una proporción
relativamente alta de contenido de energía de baja frecuencia, pero exhibiendo
contenido frecuencial a lo largo de todo el espectro. Por otra parte, esta clase
de defectos es menos frecuente que los clicks. Mientras que puede haber
varias decenas de clicks por segundo, apenas se presenta un scratch en el
mismo intervalo de tiempo. En general, la señal que representa esta clase de
defectos puede dividirse en dos partes:

• Una parte inicial que consiste en una discontinuidad semejante a la que


se presenta en un ruido impulsivo de gran amplitud

• Una segunda parte está constituida por oscilaciones amortiguadas de


bajas frecuencias, de larga duración, asociadas con la respuesta
impulsiva del dispositivo reproductor

Los métodos para la detección de estos pulsos transitorios están basados en la


utilización de conjuntos de patrones de pulsos previamente organizados,
teniendo en cuenta las semejanzas que presentan los clicks y los scratches
entre sí: las técnicas bayesianas para la separación de señales (señal
fundamental y pulso transitorio), técnicas que combinan un filtro adaptivo con
un proceso de sustracción en el dominio temporal y técnicas espectrales18 son
los métodos para la detección. En el contexto de las técnicas bayesianas, se
puede formular el problema de supresión de los pulsos transitorios como un

18
ESQUEL A, Paulo, Op. Cit., p. 16.
217

asunto de separación de señales, adoptando la hipótesis general de que se


conoce la localización de los citados pulsos, es decir se supone que se sabe
distinguir entre bloques de señal que contienen un pulso de aquellos que no
están degradados por el defecto. Algunos de estos modelos y algoritmos para
la restaurar señales con scratches pueden ser consultados en el anexo E.

6.2. TECNOLOGÍAS DE SUSTITUCIÓN

Estas técnicas consisten en sustituir la señal de audio por una combinación


lineal, de señales elementales extraídas de un diccionario adaptado a cada tipo
de ruido. En el proceso se fijan límites de tolerancia para la calidad de la
representación, y el residuo (fragmentos de la señal) que no es posible incluir
en ella es precisamente el ruido que debe ser eliminado. En la figura 82 se
muestra un diagrama de bloques de esta tecnología.

Las sustituciones por combinaciones lineales intervienen generalmente en los


procesos no lineales, de los que se destacarán tres métodos:

• Selección de la mejor base ortogonal, "Best Orthogonal Basis", de R.


Coifman, Y. Meyer y V. Wickerhauser

• Búsqueda de bases, "Basis Pursuit", de S. Chen y D. Donoho

• " Matching Pursuit", de S. Mallat y Z. Zhang


218

Diccionario
de señales
elementales

Ruido

Señal + Ruido Selección de los


mejores elementos
del diccionario

Señal Restaurada

Figura 82. Diagrama de bloques de tecnología de sustitución.


Fuente: Restauración de audio. Proceso de señales y aplicaciones en la restauración de
registros sonoros: tecnologías de sustitución. [en linea]. Oviedo: Universidad de
Oviedo, s.f. <http://coco.ccu.uniovi.es/brahms/sustitucion/sustitucion.htm>
[consulta: 28 Feb. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

En el anexo E se muestran los algoritmos de restauración por técnicas de


sustitución.
219

7. FORMATOS Y MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL

7.1. FORMATOS DE ARCHIVO DE AUDIO DIGITAL

Un formato de archivo de audio es el mecanismo mediante el cual se


almacenan datos de audio en un computador. Se distingue por el grupo de tres
letras, llamado Extensión, que aparecen después del punto posterior del
nombre del archivo. La información contenida en un archivo de audio digital no
es más que un arreglo de bytes. Se define un byte como la unidad básica de
almacenamiento de información (1 byte corresponde a 8 bits). De acuerdo con
la longitud del código ésta puede ser de 8, 16, 20 ó 24 bits, como se
argumentó en el capítulo 4. La cantidad de formatos de este tipo es muy
numerosa porque cada sistema operativo y, a veces cada programa, tiene
preferencia sobre algunos tipos de formatos, es decir, este tipo de formatos se
ha privilegiado más que otros. Las diferencias de tales formatos radican
principalmente en el tipo de compresión utilizado, en sus características
multicanal y en la forma de ordenar las muestras. Por ejemplo, para sonido
estéreo, algunos formatos prefieren guardar cada canal de forma
independiente, mientras que otros optan por almacenar muestras alternas de
cada una de las pistas. Todos los formatos poseen unos bits de encabezado
que indican la resolución, la frecuencia de muestreo y el número de canales. Lo
que sí se puede predeterminar es que las características como el tamaño, el
contenido y la ordenación, varían sustancialmente de un formato a otro.

También hay archivos que no poseen estos bits, como ejemplo se puede citar
el caso de las extensiones PCM, en los que el usuario es quien define la
220

resolución, la frecuencia de muestreo y el número de canales. Los programas


de edición y manipulación de audio digital, que se abordan en el capítulo 5,
ofrecen normalmente opciones para cargar y salvar formatos diferentes. En
este caso conviene tener en cuenta que dos archivos no comprimidos, que
presenten el mismo fonograma y tengan la misma resolución y frecuencia de
muestreo, contendrán la misma información (aunque organizada de diversas
formas) y el sonido será exactamente igual, independiente del formato. Para
propósitos de restauración de audio los archivos maestros no deberán tener
ningún tipo de compresión y, a partir de ellos, se efectuarán los procesos de
edición y compresión. Hay dos grupos especializados de formatos de archivos
de audio, aunque existen otros formatos de archivos que no hacen parte de
estos grupos.

• Formatos sin pérdidas (Lossless), como WAV, PCM, FLAC, AU, entre
otros

• Formatos de compresión con pérdidas (Lossy), como MP3, Ogg Vorbis,


WMA, AAC, entre otros

Los archivos con formato de compresión lossy se basan en modelos


psicoacústicos, que excluyen sonidos que los humanos no alcanzan oír. Un
formato de audio lossless como TTA (True Audio) proporciona una compresión
aproximadamente de 1:2; pero la relación de datos-calidad no se pierde con la
compresión. Cuando el archivo es descomprimido, los datos serán idénticos al
original. Los codecs de audio lossless son una excelente alternativa para
almacenar la música con la mejor calidad.

Si se quiere rigurosidad conceptual en el tema de la restauración de audio, se


debe concluir que ninguno de los formatos de compresión lossy ofrece las
garantías y la calidad de reproducción, por lo que resulta vano e infructuoso
221

cualquier intento por llevar a cabo una excelente restauración digital sobre
estos archivos comprimidos. Para una correcta restauración digital de audio,
los archivos sometidos a los algoritmos de restauración deben estar libres de
compresión con pérdidas. En el anexo D se describirán los formatos de
compresión con pérdida o lossy.

Como se expuso en el capítulo 4, el sistema PCM empezó utilizando 14 bits


para codificar cada muestra, pero se estandarizó finalmente en 16 bits; sin
embargo, es posible la codificación con un número mayor de bits 20 y 24 bits,
con lo que se consigue mayor calidad del sonido (Audio profesional). También
es posible incrementar la cantidad de muestras, aumentando la frecuencia de
muestreo desde 44.100, 48.000, 96.000 y 192.000 Hz. Después de obtener el
archivo PCM, una vez completado el proceso de captura de la señal de audio
analógico, se almacena en el computador como archivo maestro que contiene
la información más fiel del audio original. Este archivo maestro es procesado
con diferentes algoritmos de compresión para la implementación en Internet,
multimedia o video, entre otros.

7.1.1. Tamaños en el audio digital. Como se concluyó anteriormente: a


mayores longitudes de código y mayores frecuencias de muestreo, se obtendrá
una representación más fiel de la señal de audio analógica capturada, pero
esto tiene varios costos. El primero, es contar con un excelente conversor de
audio y el segundo es que se debe contar con un potente computador que
administre la gestión de captura y almacenamiento. El computador debe
poseer suficiente espacio en disco duro para almacenar los archivos PCM.

Para saber cuánto espacio en disco duro ocuparía un segundo de audio


estéreo, con una longitud de código de 16 bits y una frecuencia de muestreo
de 44.100 Hz, se recurre al siguiente cálculo:
222

En un audio digital 16 bits, cada muestra ocupa dos bytes (recuérdese que un
byte equivale a 8 bits). Si la frecuencia de muestreo es 44.100 Hz, significa
que cada segundo requiere de 44.100 muestras. Además, si el audio es
estéreo, utiliza dos canales, lo que significa que dichas muestras se ven
duplicadas.

Así que:
2 bytes/muestra x 44.100 muestras/segundo x 2 (canales) = 176.400
bytes/segundo o 172,2 Kb/s.

En conclusión, un segundo de audio, bajo estos parámetros, ocuparía en disco


duro 172.2 Kb. Si para el mismo segundo de audio en estéreo se cambia la
longitud del código por 24 bits y la frecuencia de muestreo por 192.000 Hz, el
espacio que ocuparía en disco sería:

En un audio digital de 24 bits, cada muestra ocupa tres bytes. Si la frecuencia


de muestreo es 192.000 Hz, significa que cada segundo requiere de 192.000
muestras. Pero si el audio es estéreo, utiliza dos canales, y dichas muestras se
ven duplicadas.

Así que:
3 bytes/muestra x 192.000 muestras/segundo x 2 (canales) = 1’152.000
bytes/segundo o 1125 Kb/s o 1.098 Mb/s.

En conclusión, un segundo de audio, bajo los anteriores parámetros, ocuparía


en disco duro 1.098 Mb.
223

De ahí, entonces, que si se desea trabajar con un audio profesional, se


requiere un computador de gran capacidad en disco duro, además de las
condiciones mínimas inherentes al proceso.

7.1.2. Compresión de archivos de audio. Por lo evidenciado en el


apartado anterior, cuando se vio que el audio profesional alcanza grandes
tamaños en Mb (megabytes), se hizo necesario buscar formas de compresión
con la capacidad de reducir el tamaño de la información, con el fin de ahorrar
espacio en el medio de almacenamiento. Esto se hace bajo el supuesto de que
tienen la capacidad de comprimirse y descomprimirse en tiempo real.
Inmediatamente debe aclararse que no pueden confundirse con la compresión
de archivos en diferido, como el popular ZIP (Zone Information Protocol) que
son de codificación entrópica, independiente del tipo de información, que
también puede aplicarse en archivos de audio, aunque no son formatos de
compresión de audio. La codificación de fuente es la aplicada para audio, en la
que se aprovechan las características de la fuente para producir una
representación comprimida adecuada

La teoría de sistemas de algoritmos matemáticos involucrados en cualquier


sistema de compresión es muy significativa y extensa y puede abordarse, sin
ser agotado, un curso completo en una Facultad de Ingeniería, lo que implica
que no está dentro de los propósitos de este trabajo. Sin embargo, se
mencionarán algunas ideas relacionadas con el tema. Muchos de estos
sistemas son independientes de los dos grupos mencionados anteriormente:
lossless y lossy, de forma que un mismo formato de archivo puede soportar
varios métodos de compresión.
224

Otras codificaciones de fuente para audio, además de PCM, son:

• DPCM. (PCM Diferencial). Se codifican las diferencias de una


muestra con la anterior, su deficiencia está representada en el
hecho de que cada muestra contiene un error, que se acumula y
sólo se va corrigiendo a través de técnicas de predicción.

• ADPCM. (PCM Diferencial Adaptativo). Se usan menos bits para


codificar las muestras que son poco diferentes. Se reduce el
número de bits de la señal (por ejemplo a 4 bits) tratando
únicamente las diferencias entre una muestra y la siguiente. Se
intuye que este proceso provoca una inevitable degradación de la
señal ya que el sistema es incapaz de representar saltos grandes
de amplitud entre dos muestras.

• APC. (Codificación Predictiva Adaptativa). Las predicciones de los


valores anteriores se hacen de forma adaptativa, en función de
las características de la señal.

• LPC. (Codificación Predictiva Lineal). En lugar de tomar muestras


de la señal, se analizan las características de la forma de onda y
se envían para que la señal pueda ser “recreada” en el destino.
Normalmente para voz.

• Perceptual Coding. (Codificación basada en la percepción):


como en LPC y derivados, pero transmitiendo sólo las
características perceptibles al oído humano. Se tiene en cuenta la
sensitividad del oído y el enmascaramiento de frecuencias.
225

Las codificaciones Ley-µ y Ley-A (utilizados en telefonía), usan un sistema de


codificación no lineal que permite una resolución de 8 bits, pero ofrece una
calidad sonora y un rango dinámico próximos a los obtenidos con 14 bits.

Algunos de estos sistemas de codificación se ven favorecidos por la presencia


de hardware especializado, como puede ser la inclusión de chips DSP en los
conversores (tarjeta de audio), mientras que otros funcionan perfectamente
por software.

7.1.2.1. Compresión y descompresion de Datos. Se adquieren usando


un tipo de algoritmo que permite comprimir y reconstruir exactamente los
datos originales a partir de los datos comprimidos. Estos algoritmos son
utilizados en programas con herramientas de compresión como el popular
archivo de formato ZIP y otros formatos como Stuffit (algoritmo de compresión
estándar de archivos para MAC), RAR (extensión de archivos comprimidos) y
7z (formato con niveles elevados de compresión).

Comparada con la compresión de imágenes lossless, la compresión de audio


lossless no es ampliamente usada. Aunque esto ha ido cambiando con el uso
frecuente de formatos lossless como FLAC (Free Lossless Audio Codec). Los
usuarios primarios de la compresión lossless son ingenieros de audio,
audiophiles (individuos que tienen un alto interés en el audio de alta calidad) y
aquellos consumidores que desean preservar la máxima calidad de sus
archivos de audio y que, además, desprecian las técnicas de compresión lossy
como Ogg Vorbis y MP3, por la pérdida de calidad.

Una primera razón para implementar la compresión lossless, es que la inmensa


mayoría de grabaciones está fundada en sonidos naturales, grabados en el
226

mundo real, de tal manera que los datos no son fácilmente comprimibles.
Hasta el peor sonido generado por un computador puede contener formas de
ondas que presentan un desafío a muchos algoritmos de compresión, puesto
que los valores de las muestras de audio cambian muy rápido, de esta manera
los algoritmos genéricos de compresión no alcanzan la calidad requerida para
audio. Estos factores se deben, fundamentalmente, a la naturaleza del audio
en su forma de onda que, generalmente, resulta difícil de simplificar sin la
conversión de la información de frecuencia y amplitud, como el realizado por el
oído humano. Este aspecto fue analizado en los capítulos 1 y 4, en los que se
indican las propiedades de una onda de audio y los procedimientos de captura
de una señal de audio analógico.

A continuación se describen los formatos de audio lossless más representativos


y válidos antes de iniciar un proceso de restauración digital.

IFF. (Interchange File Format) Es un formato de archivo genérico,


originalmente introducido por la compañía Electronics Arts, en 1985, para
facilitar la transferencia de datos entre programas de diferentes compañías.

RIFF. (Resourse Interchange File Format) RIFF o Recursos de Intercambio de


Formatos de Archivos, es un formato genérico que está muy extendido en
plataformas Apple. Se fundamenta en el formato IFF, que permite almacenar la
información en segmentos. Este fue introducido en 1991 por Microsoft e IBM.

Las aplicaciones principales de formatos de audio de Microsoft son AVI (Audio


Video Interleave) y WAV, que utilizan formatos de base RIFF.
227

El formato WAV se almacena dentro de un archivo con formato RIFF,


definiendo unos segmentos concretos que puede contener. Por lo tanto, es
adecuado analizar el formato general de un archivo RIFF y qué segmentos se
definen para los archivos WAV.

WAV. (Waveform Audio File Format), Es un formato estándar para el


almacenamiento de audio en el computador, y fue desarrollado por Microsoft e
IBM. Apareció por primera vez para el ambiente Windows en el año 1995. Con
el paso del tiempo, se convirtió en un estándar de grabación para música de
CDs. Su soporte de reproducción es uno de los más importantes, pues funciona
en cualquier aplicación Windows y en equipos domésticos comunes que
incorporan reproductor de CDs.

El WAV es una variante del formato RIFF que emplea un método de


almacenamiento de datos en trozos, parecido a los formatos IFF y AIFF, usados
en los ordenadores Macintosh. No obstante, un archivo WAV puede tener audio
comprimido con cualquier codec, lo que hace que el formato de datos de audio
más común sea el PCM. Desde entonces PCM usa una compresión sin pérdidas
(método de almacenamiento lossless) y conserva todas las muestras de un
audio. Los profesionales o expertos en audio pueden y suelen utilizar el
formato WAV para una máxima calidad de audio.

El formato WAV también puede ser editado y manipulado con relativa facilidad
usando programas especializados. Frente al file sharing (actividad que consiste
en permitir la viabilidad de los archivos para que los usuarios puedan
descargarlos a través de Internet). El WAV ha declinado en popularidad,
principalmente por causa de su naturaleza no comprimida. Hoy en día es más
frecuente la implementación de formatos lossy, como el MP3, Ogg Vorbis y
AAC (Advanced Audio Coding) para el almacenamiento y transferencia de
228

audio, ya que los archivos son de muy pequeño tamaño, lo que facilita una
rápida transferencia sobre Internet y porque las grandes colecciones de
archivos ocupan muy poco espacio en un disco duro.

Existen también otros codecs más eficientes: como Monkey’s Audio, FLAC, TTA
o Apple Lossless.

PCM. (Modulación por Código de Pulsos) El método más común para la


creación de audio digital es PCM. El audio digital PCM es tradicionalmente
muestreado a 44.100 Hz para las grabaciones en CD, o superiores para
aplicaciones de audio profesional. Las más altas frecuencias de muestreo para
grabación profesional son 88.200, 96.000 y 192.000 Hz. La amplitud de cada
muestra es un valor numérico que representa un arreglo de bits. Refiérase al
capítulo 4.

TTA. (True Audio) Es un codec gratuito de audio de tiempo real, basado en el


pronóstico de filtros adaptivos, los que demuestran resultados satisfactorios si
se comparan con la mayoría de filtros analógicos modernos. Sus características
más relevantes son:

• Una compresión de datos lossleess, mínimo del 30%

• Algoritmos de codificación y decodificación en tiempo real

• Velocidad de operación rápida con mínimos requerimientos de


sistema

• Puede ser compilado y ejecutable en varias plataformas diferentes


229

• Es gratuito, con código abierto y documentación

TTA realiza la compresión lossless en multicanal de 8, 16 y 24 bits de datos de


archivos de entrada WAV no comprimidos. La proporción de compresión de TTA
depende del tipo de archivo musical para comprimir. Luego del proceso de
compresión el tamaño será, generalmente, entre un 30 y un 70% del original.
El formato TTA soporta dos etiquetas de información ID3v1 e ID3v2.

ID3 es un formato de etiqueta para MP3. Contiene metadata (información en


datos de datos) como el título, nombre del artista, álbum, número de pista,
entre otros, para adicionar a los archivos MP3. ID3 posee varias versiones.

FLAC. (Free Lossless Audio Codec). Es un codec de audio popular. A diferencia


de los codecs lossy, como MP3 y AAC, éste no quita ninguna información del
audio y es conveniente para realizar playbacks continuos y para archivar
colecciones de audio. El formato FLAC es común y bien soportado por muchos
software y hardware de audio.

FLAC se diferencia de los algoritmos generales de codificación entrópica como,


ZIP y RAR, en que está especialmente diseñado para un empaquetado eficiente
de datos de audio. Mientras ZIP, por ejemplo, puede comprimir la calidad de
un archivo CD de audio en un 20 al 40%, FlAC realiza una compresión del 30 al
70%.

FLAC se ha convertido en el formato lossless preferido para intercambiar


música en línea. Este es un archivo de pequeño tamaño y diferente al MP3,
que ofrece asegurar la fidelidad más alta de la fuente del material, lo que
230

permite la comercialización de música en vivo. Igualmente, es popular en


formatos de archivo para usuarios de CD’s y otros medios, que desean
preservar sus invaluables colecciones de audio. Si el medio original se pierde,
daña o cae en desuso, una copia FLAC de las pistas de audio original asegura
que un duplicado exacto de los datos sea recuperado en cualquier momento.

AU. (Audio para Unix). El formato AU se utiliza para archivos de sonido con
sistema Unix de Sun Microsystems & NeXT. La extensión AU también funciona
como estándar acústico para el lenguaje de programación JAVA. Su estructura
es muy sencilla. Las razones de compresión que ofrece son pequeñas y destaca
por su soporte de longitudes de muestras muy altas comparadas con otros
formatos (32 y 64 bits).

Se compone de tres secciones:

• Una cabecera, en la que se describe la codificación de audio


utilizada

• Un campo de longitud variable para almacenar otro tipo de


información como texto en formato ASCII

• El conjunto de datos de audio

Monkey’s. Es un codec de compresión diferente de los métodos que, como


MP3, Ogg Vorbis, o AAC, permanentemente descartan datos para salvar
espacio. Monkey’s Audio comprime de una manera matemática perfecta,
creando copias bit a bit. Por consiguiente, un archivo comprimido por Monkey’s
Audio siempre sonará de la misma manera que el archivo fuente. La extensión
de un archivo Monkey’s Audio es APE.
231

7.2. MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL

Se presentan, a continuación, los formatos de almacenamiento de audio digital


más utilizados, además de sus características técnicas más relevantes.

7.2.1. ADAT. (Alesis Digital Audio Tape) Este medio fue introducido en
1991. Graba simultáneamente ocho pistas de audio en una, sobre una cinta
magnética de Super VHS, cinta similar a la utilizada por los usuarios de VCR’s
(Video Cassette Record).

Se han producido muchas versiones de reproductores. La primera generación


de máquinas ADAT usó 16 bits de longitud de código. Una versión más
moderna soportaba 20 bits de longitud de código. Ambas máquinas tenían la
capacidad de muestrear a unas frecuencias de 44.100 y 48.000 Hz. El ADAT es
considerado como un formato de audio profesional y, mientras es reemplazado
por el computer-based DAW, aún es ampliamente utilizado en la industria de
grabación. En la figura 83 a) se ilustra un casete ADAT.
232

Aa) Ab) Ac)

Figura 83. Medios de almacenamiento a) ADAT, b) DAT y c) DDS.


Fuente. Audio formats. ADAT Audio Tape. [en linea]. s.l.: tapeonline, 2005
<http://www.tapeonline.com/store/product.asp?dept%5Fid=2010&pf%5Fid=AHP%2D
ADAT45> [consulta: 25 May. 2005]
Fuente. SCHOENHERR. E, Steven. Audio formats. The Digital Revolution. [en linea].
s.l.: SCHOENHERR. E, Steven, 2004
<http://history.acusd.edu/gen/recording/images2/dat01.GIF> [consulta: 25 May.
2005]
Fuente. Audio formats. Electronics: DDS [en linea]. s.l.: Amazon, 2005
<http://www.amazon.com> [consulta: 25 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás

7.2.2. DAT. (Digital Audio Tape) La cinta de audio digital (DAT o R-DAT) es
un medio de grabación y reproducción de audio introducido por Sony en 1987.
En apariencia, es muy similar al casete de audio compacto y, como su nombre
sugiere, la grabación es digital. Este sistema digitaliza el sonido con muy alta
calidad de 32.000, 44.000 ó 48.000 Hz, y lo almacena sin compresión de datos
en una cinta magnética. Esto significa que la señal de entrada es
completamente retenida. Si una fuente de audio digital es copiada en un DAT,
su reproducción será una copia exacta de la fuente original, diferente de lo que
ocurre en otros formatos digitales, como DCC o MiniDisc, que utilizan
compresión con pérdida lossy. En la figura 83 b) se ilustra un casete DAT.

La tecnología de DAT está basada en un porcentaje muy alto en grabadores de


video, usando cabezas giratorias y escaneo helicoidal para grabar los datos.
233

Esto evita que el DAT pueda ser editado físicamente, como sí ocurre con el
ProDigi, DASH, o cintas de grabación analógicas.

Los estándares del DAT permiten cuatro posibilidades que se observan en la


tabla 6.

Tabla 6. Estándares de grabación de DAT.

Frecuencia Longitud del


Opciones de Muestreo (Hz) Código (Bits)
1 32.000 12
2 32.000 16
3 44.100 16
4 48.000 16

Fuente: Audio storage. Digital audio tape. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Digital_Audio_Tape> [consulta: 30 May. 2005]

Algunos grabadores trabajan fuera de las especificaciones, con frecuencias de


muestreo de 96.000 Hz y longitud de código de 24 bits. Los DAT soportan dos
canales estéreos en todas las posibilidades de grabación, pero el estándar R-
DAT soporta cuatro canales de grabación a 32.000 Hz.
234

7.2.3. DDS. (Digital Data Storage) El almacenamiento de datos digitales


DDS representa un formato para guardar y hacer copias de seguridad de datos
procedentes de un computador a un DAT, el cual fue originalmente creado por
CD-quality audio recording. En 1989, Sony y Hewlett Packard definieron el
formato DDS para el almacenamiento usando cartuchos de DAT. Las cintas que
conforman un DDS pueden ser reproducidas por cualquier máquina DAT o
DDS. Sin embargo, una máquina DDS no puede reproducir el audio
almacenado en un cartucho DAT. En la figura 83 c) se ilustra un casete DDS.

DDS usa cintas de 4 milímetros de ancho e inicialmente las cintas eran de 60 a


90 m. de largo. En versiones posteriores los avances tecnológicos de los
materiales han permitido aumentar significativamente la longitud. Una cinta
DDS implementa un escaneo helicoidal para grabar como si se tratara del
mismo proceso usado para un grabador de video casete (VCR). Son dos
cabezas de lectura y dos de escritura. Las cabezas lectoras verifican los datos
que han sido grabados y, si hay errores, las cabezas de escrituras vuelven a
escribir los datos. Un cartucho DDS debe ser remplazado después de 2.000
reproducciones o 100 grabaciones. Existen 5 categorías del formato DDS, que
se presentan en la tabla 7.

7.2.4. DASH. (Digital Audio Stationary Head) Fue un formato de cinta digital
de audio usando open reels (carretes de video o audio abiertos) con capacidad
de grabar 8, 16, 24 o más canales de audio en 1” ó ½” de cinta. Los datos son
grabados linealmente en una cinta, con una cabeza grabadora estacionaria,
proceso opuesto al del formato DAT, en el que los datos son grabados
helicoidalmente con una cabeza giratoria.

Los datos de audio se ponen como PCM lineal, con fuertes interrupciones de
corrección de error, permitiendo que la cinta sea físicamente editada, como por
235

ejemplo para cortar, empalmar y reproducir sin ningún tipo de pérdida en la


señal. En la figura 84 se ilustra una cinta DASH.

Tabla 7. Categorías de formatos DDS.

Formato Fecha Capacidad (GB) Capacidad (GB) Longitud Velocidad


sin con (m) (MB/s)
compresión compresión
DDS-1 1989 2.0 2.6 60 0.6
DDS-2 1993 4.0 8 120 0.6
DDS-3 1996 12.0 24 125 1.1
DDS-4 1999 20.0 40 150 2.4
DAT 72 2003 36.0 72 170 3.6

Fuente: Audio storage. Digital data storage. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Digital_Data_Storage> [consulta: 30 May. 2005]

Figura 84. Formato DASH.


Fuente. Audio formats. All blank media. [en linea]. s.l.: P Dogra & Sons, 2005
<http://www.pdograandsons.sonydealer.co.uk/default.asp?qsid=8122>
[consulta: 25 May. 2005]
236

7.2.5. DCC. (Digital Compact Cassette) El casete digital compacto fue un


formato de audio de corta vida, creado por Phillips en los años 90’s. Concebido
para competir con el formato MD (MiniDisc). A diferencia del DAT o el CD
Audio, el DCC utiliza un sistema llamado PASC (Precision Adaptative Sub
Coding) o Subcodificación de Precisión Adaptativa que, por no grabar la
información de las frecuencias que no es capaz de percibir el oído humano
normal, permite almacenar más minutos de música en menos espacio. Este
tipo de compresión tiene una relación de 4:1 y con un esquema muy similar al
MPEG-1.

El DCC tiene la misma forma de los casetes estándar de audio compacto


analógico, de manera que sus reproductores puedan aceptar ambos tipos de
cintas. El objetivo de la creación del DCC era proporcionar compatibilidad, para
que los usuarios pudieran adoptar el formato digital y no hacer obsoletas las
colecciones de cintas analógicas.

Un DCC es un multi-track stationary-head recorder (una cabeza de grabación


estacionaria multi-pista). A diferencia de una cabeza rotatoria o un grabador
de escaneo helicoidal, como un DAT o VCR, donde la cabeza tiene un
movimiento relativo a la cinta, las cabezas son fijas (así, sólo la cinta está en
movimiento). La capacidad de información de un DCC es mucho menor que la
de un DAT. DCC salió del mercado en 1996.

7.2.6. MD. (MiniDisc) Es un disco que sirve para almacenar cualquier dato,
usualmente audio. Fue introducido al mercado por Sony en 1992. Junto con el
sistema DCC, el MD tuvo como objetivo central sustituir los casetes de audio
compacto analógico. Su tamaño físico es de 3.5”, y en él se pueden almacenar
70 minutos de música. Del mismo modo que el DCC, utiliza un sistema de
compresión de datos, llamado ATRAC (Adaptative Transform Acoustic Coding)
237

o Codificación Acústica de Transformación Adaptativa, que le permite ahorrar


espacio sacrificando una pequeña pérdida de calidad. En la figura 85 se ilustra
un disco MD.

Figura 85. Disco MD.


Fuente. Audio formats. Audio Recordable Media. [en linea]. s.l.: Cunnings recording
associates, 2005 <http://www.cunnings.co.uk/product/audiorecmedia/index.html>
[consulta: 25 May. 2005]

7.2.7. CD. (Compact Disc) Es un disco óptico usado para almacenar datos,
originalmente desarrollado para audio digital. Un disco compacto estándar,
nombrado a menudo como un CD de audio, para diferenciarlo de las otras
variantes que se mencionan a continuación, almacena datos de audio en un
formato que cumple con los estándares del libro rojo (red book). Un CD de
audio consiste en varias pistas de audio estéreo almacenadas, usando una
codificación PCM con longitud de código de 16 bits y una frecuencia de
muestreo de 44.100 Hz. La mayoría de los discos compactos tiene un diámetro
de 120 mm. o 80 mm. diseñado para soportar 74 minutos de audio, pero en la
práctica almacenan un poco más. En la figura 86 se ilustra un CD.
238

Figura 86. Formato CD.


Fuente. Audio formats. Compact disc. [en linea]. s.l.: FreeFoto, 2005
<http://www.freefoto.co.uk/preview.jsp?id=11-12-9> [consulta: 25 May. 2005]

La tecnología del compact disc fue adoptada posteriormente para ser utilizada
como dispositivo de almacenamiento de datos, comúnmente conocida como
CD-ROM.

7.2.8. CD-ROM. (Compact Disc Real-Only Memory) Es un medio óptico de


almacenamiento de datos que emplea el mismo formato y dimensiones físicas
de un CD de audio, la cual es legible por un computador que posee una unidad
de CD-ROM. Un CD-ROM es un disco plano de plástico con información digital
puesta en algún código en éste, en una espiral desde el centro al límite del
borde externo. El CD-ROM fue establecido en 1985 por Sony y Philips, aunque
Microsoft y Apple, son los máximos exponentes de la promoción de CD-ROMs.
En general, los CDs de audio son diferentes de los CD-ROMs, pues un
reproductor de CDs (CD player) no puede leer y reproducir un CD-ROM de
datos, aunque las unidades de CD-ROM, generalmente, pueden leer y
reproducir los CDs de audio. Es posible producir CDs compuestos que
contengan datos y audio con la posibilidad de escuchar el último en un
239

reproductor de CDs, mientras que los datos (posiblemente videos y audio)


pueden ser vistos y escuchados en un computador. Un CD-ROM estándar
puede almacenar aproximadamente 650-700 Megabytes de datos.

Los CD-ROMs son leídos usando unidades lectoras de CD-ROM, equipo


periférico común en los computadores de hoy en día. En caso de requerir
grabación (burning), son empleados los CD-Burners, conocidos como
quemadores de CD.

7.2.9. CD-R. (Compact Disc-Recordable) Es un disco óptico, construido de


policarbonato, al igual que el CD y el CD-ROM, y que emplea el mismo
formato y dimensiones físicas de un CD de audio, que es principalmente usado
para el almacenamiento de datos o música. Sin embargo, a diferencia de un
CD convencional, en un CD-R el núcleo es de fibra sintética en lugar de metal.

Un CD-R estándar tiene la capacidad de almacenar 74 minutos de audio o 650


MB de datos. Los CD-Rs no convencionales tienen capacidades de 80 minutos
o 703 Mb, los cuales exceden las tolerancias especificadas por el libro naranja
de estándares para CD-R (Orange Book). La gran mayoría de CD-Rs en el
mercado posee esta última capacidad. Existen también capacidades de 90
minutos o 790 Mb y 99 minutos o 870 MB.

7.2.10. CD-RW. (Compact Disc Rewritable) Es una versión regrabable del


CD-ROM en la que se puede grabar y regrabar datos varias veces. Un CD-ROM
tiene la información almacenada de una manera permanente en su capa
reflejante de aluminio, pero un CD-RW posee una capa reflejante de aluminio
adicional llamada Recubrimiento de cambio de fase, que permite una sobre-
escritura de información. Su capacidad estándar es de 650 MB, aunque en el
240

mercado es más común encontrarlos de 700 MB. Un CD-RW tiene una


capacidad de sobre escritura cercana a las 1.000 veces. Este factor depende,
en última instancia, de cada fabricante, lo que explica sus múltiples
variaciones.

7.2.11. CD+G. (Compact Disc Graphics) Es un CD de audio que contiene


datos gráficos adicionales a los de audio. Este disco puede ser reproducido en
un CD player convencional. Cuando es reproducido en un CD+G player, puede
observarse señales gráficas como las proporcionadas por un video-juego o
ambientación musical. Es necesario conectar el CD+G player a un receptor de
video, como un TV, para lograr el propósito señalado.

El CD+G es utilizado, regularmente, para consolas de video-juegos, como por


ejemplo Sega CD, Sega Saturn y la Atari Jaguar CD.

7.2.12. CD-i. (Compact Disc Interactive) Regido por los estándares del
libro verde (Green Book), fue un formato multimedia comercializado en 1991.
Fue creado por Philips y en menor grado por Sony, aunque sólo Philips lo
comercializó. El CD-I es capaz de almacenar 19 horas de audio, 7.500
imágenes o 72 minutos de video. Fue implementado para video-juegos con la
exclusividad de Nintendo. Su venta se extendió hasta 1998 y luego perdió
mucha popularidad.
241

7.2.13. UMD. (Universal Media Disc) Es un disco óptico desarrollado por


Sony para usar en consolas de PlayStation portátiles. Este puede almacenar
1.8 GB de datos, los cuales incluyen juegos, películas o música. Sony no
comercializó los UMD vírgenes para evitar la copia ilegal. En la figura 87 se
ilustra un UMD.

Figura 87. Formato UMD.


Fuente: Audio storage. Universal media disc. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Universal_Media_Disc> [consulta: 30 May. 2005]

7.2.14. DD-CD. (Double Density Compact Disc) Es un CD basado en


tecnología óptica desarrollado por Sony. Su capacidad de almacenamiento es
de 1.3 GB. En a figura 88 se ilustra un DD-CD.
242

Figura 88. Formato DD-CD.


Fuente: Audio storage. Sony CD-R Double Density. [en linea]. s.l. Bulldog, 2005.
<http://www.bdog.fi/cgi-bin/netstore/tuote.pl?tuote=067140754897>
[consulta: 30 May. 2005]

7.2.15. MultiLevel. Es un CD basado en tecnología óptica, desarrollado por


Calimetrics. Este triplica la capacidad de 650 MB de un CD y la velocidad nativa
de transferencia de datos de las unidades ópticas (drives) estándar.

7.2.16. MO. (Magneto Optical Disc) Es un formato de almacenamiento que


combina tecnología óptica y magnética. Su tamaño es de 3.5” ó 5.25”, con
capacidades de almacenamiento de 128/230/540/640 MB o
1.3/2.6/4.1/4.8/5.2 GB. Para su reproducción es necesario un Magneto-optical
drive (reproductor magnético –óptico). En la figura 89 se ilustra un disco MO.

El disco regrabable MD usa tecnología magneto óptica para la grabación de


datos.
243

Figura 89. Formato MO.


Fuente: Audio storage. Magneto-optical drive. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Magneto-optical> [consulta: 30 May. 2005]

7.2.17. SA. (Silicon Audio) Formato desarrollado por NEC, que consta de
circuitos integrados (chips de silicio) donde es posible almacenar audio digital
con la calidad de un CD audio y tiene una capacidad hasta 192 minutos. Su
forma física es similar a la de una tarjeta de crédito.

Existen dos tipos de SA: la primera, RAM (Random Access Memory) en la que
se puede escuchar y grabar audio; la segunda, ROM (Read Only Memory) que
sólo permite escuchar audio. En la figura 90 se ilustra un SA.
244

Figura 90. Formato SA.


Fuente: Audio storage. Silicon Audio. [en linea]. s.l. Minidisc.org, 2005.
<http://www.minidisc.org/main_chip_music.html> [consulta: 30 May. 2005]

7.2.18. DVD. (Digital Versatile Disc) Es un disco óptico para el


almacenamiento de datos, generalmente empleado para películas con una alta
calidad de video y sonido. Posee las mismas dimensiones de un CD de audio,
aunque con pistas más finas, lo que proporciona una mayor densidad y
capacidad de almacenamiento en su superficie.

En los inicios de los 90’s había dos estándares de almacenamiento de alta


densidad óptica en desarrollo; uno, el MMCD (Disco Compacto Multimedia),
respaldado por Philips y Sony, y el otro, el SD (Super Disco) respaldado por
Toshiba, Time-Warner, Matsushita Electric, Hitachi, Mitsubishi Electric, Pioneer,
Thomson y JVC. IBM realizó esfuerzos para unir todas estas compañías para el
desarrollo de un solo estándar, que arrojó como resultado el formato DVD,
comercializado en 1996.
245

Los tipos de formato existentes son: DVD-ROM (datos), DVD-Video (video y


audio), y DVD-Audio (alta calidad de audio).

• DVD-ROM: (DVD Real-Only Memory) permite almacenar todo tipo


de dato, similar que en el CD-ROM, pero con una mayor
capacidad.

• DVD-Video: básicamente es un DVD-ROM con un nivel de


aplicación definido que limita sus funciones a la reproducción de
películas. Las especificaciones de un DVD-video simula las pistas
de audio Dolby AC-3, PCM o DTS, entre otras.

• DVD-Audio: es un formato que entrega alta fidelidad en audio, es


multicanal (desde audio monofónico hasta 5.1 de audio surround)
a diferentes frecuencias de muestreo.

Dentro de estas categorías existen 5 tipos de discos:

• DVD-5 contiene sólo una cara grabada en una capa de


información y su capacidad es de 4.7 GB

• DVD-9 contiene sólo una cara en dos capas de información y su


capacidad es de 8.5 GB

• DVD-10 contiene dos caras y una sola capa por cara, su capacidad
es de 9.5 GB

• DVD-14 contiene dos caras, una de dos capas y la otra de capa


simple, su capacidad es de 13.2 GB

• DVD-18 contiene dos caras y dos capas por cara, su capacidad es


de 17 GB
246

En la figura 91 a) se ilustra un DVD-5 y en la 91 b) un DVD-10.

Existen 7 formatos de grabación:

• DVD-R

• DVD-R DL (doble cara)

• DVD-RW

• DVD+R

• DVD+R DL (doble cara)

• DVD+RW

• DVD-RAM

Aa) Ab)

Figura 91. Formatos DVD.


Fuente: Audio storage. DVD. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/DVD> [consulta: 30 May. 2005]
247

7.2.19. DVD-R. (DVD Dash Recordable) Igual que un CD-R, es utilizado


para almacenar datos o música, pero con una mayor capacidad de
almacenamiento. Este formato fue desarrollado por Pioneer, en 1997, y sólo
puede ser grabado una sola vez. La grabación de un DVD-R necesita un
proceso de inicialización y de finalización. Para grabar información, es
indispensable formatear el disco en su totalidad. Una vez finalizada la
grabación, el DVD-R debe cerrarse para que sea leído por un reproductor de
DVD.

7.2.20. DVD-RW. (DVD Dash Rewritable) Es una versión regrabable del


DVD-R en la que se pueden grabar y regrabar datos, varias veces.

7.2.21. DVD+R. (DVD Plus Recordable) Tiene el mismo propósito que un


DVD-R. Este formato fue desarrollado en el año 2002 por una asociación
llamada DVD+RW Alliance. La grabación de un DVD+R no requiere los
procesos de inicialización y de finalización. Una vez terminada la grabación se
visualiza la información de forma inmediata; por esta razón el tiempo de
grabación es más corto que en un DVD-R.

7.2.22. DVD+RW. (DVD Plus Rewritable) Es una versión regrabable del


DVD+R en la que se pueden grabar y regrabar datos, varias veces.

7.2.23. DVD-RAM. (DVD – Random Access Memory) Es un disco óptico


regrabable con tecnología de cambio de fase para grabación. Fue desarrollado
por Panasonic, Hitachi y Toshiba. En la figura 92 se ilustra un DVD-RAM.
248

Figura 92. Formato DVD-RAM.

Dentro de estas categorías existen 2 tipos de discos:

DVD-RAM 1.0

• Un sola cara en una capa de información y su capacidad es de


2.58 GB

• Dos caras y una sola capa por cara, su capacidad es de 5.16 GB

DVD-RAM 2.0

• Un sola cara en una capa de información y su capacidad es de


4.7 GB

• Dos caras y una sola capa por cara, su capacidad es de 9.4 GB


249

Están diseñados para aplicaciones que contengan grandes cantidades de datos


con exigencia de alto rendimiento. En un DVD-RAM se maneja la información
de la misma manera que en un disco duro, es decir, no requiere de un Burning
software (programa de grabación de datos) para manipular datos.

Tiene una vida útil aproximada de 30 años y capacidad de sobre escritura


mayor a las 100.000 veces, aunque esto varía de acuerdo con el fabricante.

7.2.24. SACD. (Super Audio CD) Es un nuevo formato de grabación de


audio con la finalidad de brindar una alta fidelidad en la reproducción
superando al CD de audio. Este formato fue desarrollado por Sony y Philips y
comercializado en 1999. Emplea el mismo formato y dimensiones físicas de un
CD de audio, pero las señales no son almacenadas en PCM sino en un formato
de compresión lossless DSD (Direct Stream Digital) de 1 bit o bitstream y una
frecuencia de muestreo aproximada de 2.822.000 Hz. Tiene la posibilidad
multicanal de 2, 3, 4 y hasta 5.1 canales de audio sin distorsiones y sin
pérdida de calidad. Existe un formato de SACD llamado Híbrido, que cuenta
con dos capas en las que se almacenan dos versiones de audio, una, estéreo
con codificación PCM; otra, multicanal con codificación DSD. Estos discos
tienen una capacidad de almacenamiento de 8.5 GB y son compatibles con
reproductores de CD de audio. Los formatos de SACD de una sola capa sólo
pueden ser leídos en reproductores SACD y su capacidad es de 4.7 GB. En la
figura 93 se ilustra un SACD.
250

Figura 93. Formato SACD híbrido.

7.2.25. DD. (Dual Disc) Es un formato digital de almacenamiento óptico


producido por RIAA (Recording Industry Association of America) y considerado
como la competencia de SACD. Esencialmente, el DD es una combinación de
un CD con un DVD, ofreciendo audio en el formato de CD y video, juegos y
multimedia en el formato DVD en la otra cara.

7.2.26. BD. (Blu-ray Disc) Es la próxima generación del formato de disco


óptico desarrollado por BDA (Blu-ray Disc Association), conformada por 75
compañías, entre las que se destacan: Apple, Dell, Hitachi, HP, JVC, LG,
Matsushita, Mitsubishi, Panasonic, Pioneer, Philips, Samsung, Sharp, Sony,
TDK y Thomson. El formato fue estructurado para posibilitar la grabación, la
sobre escritura y la reproducción de video HD (High Definition), como también
para almacenar gran cantidad de datos. Mientras las tecnologías actuales del
disco óptico, como el DVD, emplean un láser rojo para leer y escribir datos,
este nuevo formato usa un láser azul-violeta que hace referencia a su nombre:
Blu-ray. El beneficio de un láser azul-violeta está representado en su longitud
de onda de 405 nm más corta que un láser rojo que es de 650 nm, lo que hace
posible enfocar el haz de luz con mayor precisión, lo que, a su vez, permite
251

almacenar los datos más herméticamente y que sean guardados en menos


espacio. Blu-ray fue diseñado para soportar grabación directa MPEG-2 TS
(Transport Stream) usada para transmisión compatible con los estándares de
HDTV (High Definition TV) y TV estándar. Sus capacidades de almacenamiento
son de 25 Gb que permite almacenar dos horas de video HD o 13 horas de
video estándar. En el caso doble cara, su capacidad es de 54 GB, hasta 100
GB. En la figura 94 se ilustra un Blu-ray disc.

El Blu-Ray será lanzado oficialmente al mercado en el año de 2006.

Figura 94. Formato Blu-ray.


Fuente: Audio storage. Blue-ray Media. [en linea]. s.l. Blu-ray, 2005.
<http://www.blu-ray.com/media/> [consulta: 30 May. 2005]

7.2.27. HD-DVD. (High Definition/Density DVD) Es un formato de


almacenamiento de video y datos, creado por Toshiba y NEC con el apoyo de
Sanyo y Memory Tech, a partir de la tecnología del láser azul-violeta,
implementada igualmente por Blu-ray. En compañía del Blue-ray es otro
candidato para suceder al actual DVD. Además, cuenta con el apoyo de Warner
Bros, Universal, Columbia, Eisner & Co. y Paramount que, aunque no darán
252

exclusividad a ningún formato, apoyan con recursos y publicidad al HD-DVD.


También es posible que Microsoft lo adopte en su nueva generación de
videojuegos para Xbox en contrapartida del próximo lanzamiento de SONY con
su consola de juegos PlayStation 3, que implementará tecnología Blu-ray.

Proporciona una capacidad de almacenamiento de 15 a 30 GB con discos de


triple capa e incluso se realizan híbridos de DVD y HD-DVD. Sin embargo, Bue-
ray, lo supera en capacidad de almacenamiento. En la figura 95 se ilustra un
HD DVD disc.

Figura 95. Formato HD DVD.


Fuente: Audio storage. Les Numeriques: Disque HD-DVD. [en linea]. s.l. Les
Numeriques, 2005.
<http://www.lesnumeriques.com/article-66-380-92.html>
[consulta: 4 Jun. 2005]
253

8. EQUIPOS DE ALMACENAMIENTO

Antes de comenzar a presentar algunas recomendaciones sobre los aspectos


más relevantes que deben tenerse en cuenta para la selección del equipo
(computador) que se ha de usar en el almacenamiento temporal, es pertinente
hacer un breve recorrido por las formas, el tratamiento de la señal que se va a
restaurar y su posterior grabación en un medio digital. Este capítulo,
entonces, se dedicará exclusivamente a la parte práctica de lo que hay que
tener en cuenta a la hora de seleccionar el equipo, la grabación y la
reproducción de audio.

En el ámbito del audio profesional se les conoce a estos equipos como Digital
Audio Workstations (DAW) o Estaciones de Trabajo de Audio Digital.

Las DAWs se pueden encontrar de dos tipos:

• DAWs integradas. Están conformadas por una serie de dispositivos


electrónicos integrados en una consola conocida como consola de mezcla
o mezclador de audio en el que todo el proceso de tratamiento de las
señales de audio se hace mediante circuitos electrónicos discretos y
convencionales.

Estos equipos eran la única opción hasta que los computadores se


hicieron lo suficientemente potentes y económicos para ejecutar estas
tareas mediante el uso de los poderosos programas de edición grafica de
audio con los que se cuenta hoy en día. Sin embargo, este tipo de DAWs
siguen siendo la primera opción en los estudios profesionales de
254

grabación que cuentan con presupuestos ilimitados, además de que sus


niveles de procesamiento aun superan los de un computador.

Actualmente se usan y se fabrican DAWs convencionales pero su costo


comparativo hace inclinar la balanza hacia el lado de los DAWs basados
en computador.

• DAW´s basados en computador. Son DAWs construidos por un


computador, una tarjeta de sonido y un programa de edición grafica de
audio.
El computador, además de ser el soporte del software y la tarjeta de
sonido, tiene la misión de proveer el procesamiento y almacenamiento
de la información del registro de audio.
Los DAWs de este tipo son los que se analizan en este capítulo porque
en éstos se puede lograr un excelente trabajo y con precios
relativamente bajos.

A diferencia de lo que se suele pensar, una DAW basada en computador no


necesita estar equipada con lo más moderno en tecnología informática. La
Sony, por ejemplo, para su última versión del Sound Forge recomienda un
procesador de 500 MHz, 128 MB de RAM y una capacidad en disco de 150 MB.
Sin embargo, estas características son muy básicas, y los 150 MB sirven para
alojar el programa y no el audio que se ha de procesar.

Indudablemente, mientras más capacidad, mayor será el rendimiento y los


procesos podrán ejecutarse con mayor rapidez. En última instancia, se
requiere una máquina estable y que funcione adecuadamente cuando se
procese el audio.
255

8.1. PERFIL DE UN DAW BASADO EN COMPUTADOR

Las siguientes son las consideraciones para tener en cuenta antes de hacer
una selección de un DAW basado en computador:

8.1.1. Estabilidad. La estabilidad de un computador es función de su


versatilidad, esto quiere decir que mientras más utilidades o usos se pretendan
obtener de él, más inestable será.

A partir de esta consideración surge la primera recomendación:

Exclusividad Para trabajar con audio se recomienda contar con un


computador para uso único y exclusivo, con el propósito de garantizar la
máxima estabilidad del sistema. Obviamente, esto no es más que una
recomendación para obtener máximo desempeño, así que si se pretende
utilizar una máquina multifuncional puede hacerse perfectamente, pero
haciendo conciencia de que puede perderse eficiencia en el proceso de
restauración.

8.1.2. El sistema operativo. Para beneplácito de los antagonistas de


Microsoft, la producción de audio es un caso en el que su popular sistema
operativo no es la única opción; lo que no equivale a decir que Windows sea
malo para este efecto, sino que puede considerarse la opción Mac, que, en este
campo, supera en experiencia a Windows en 10 años, aproximadamente.

A pesar de esta diferencia, la recomendación es la opción Microsoft Windows


XP Home Edition.
256

La popularidad de Windows hace que se prefiera este sistema porque para la


mayoría de las personas que habitan un ambiente “no tan profesional” puede
ser más mencionado y, por lo tanto, más amigable que Mac. Además, se debe
tener en cuenta que fue la nada despreciable y elogiable compañía Steinberg,
con sus drivers ASIO (Audio Streaming Input/Output), la que introdujo a la PC
en el medio de la producción profesional de audio, pues la MME, de Windows,
no era suficiente para un trabajo profesional que exige tanta calidad. Un buen
antecedente para Windows. Adicionalmente, hoy en día, la gran mayoría de
empresas que desarrollan software y hardware profesional, orientados a la
producción de audio en DAWs basadas en computador, proveen las
herramientas necesarias para convertir un PC en un poderoso DAW.

Equipado con cualquiera de los drivers profesionales de audio mencionados en


el capitulo 5, Windows XP puede considerarse como una plataforma apta y
poderosa para producción de audio.

Se recomienda Windows XP Home Edition ya que su precio es más bajo y se


espera que no se necesiten las aplicaciones de la edición profesional. Sin
embargo, si se desea, se puede recurrir a esta versión.

8.1.3. Procesador. En cuanto al procesador no hay mucho qué decir ya que


tanto AMD e Intel cuentan con procesadores lo suficientemente potentes para
trabajar la producción de audio. No se hace ninguna recomendación en cuanto
a la marca.

En relación con el tipo de procesador y la velocidad de procesamiento, la


recomendación es AMD Athlon XP o Intel Pentium IV.
257

El procesador no tiene que ser el más rápido en el mercado. Lo importante es


lograr un buen rendimiento en el proceso, trabajar a un ritmo adecuado y
obtener una buena relación precio–beneficio. Además, si la tarjeta de sonido
cuenta con chips DSP, se libera al procesador de las tareas relacionadas al
procesamiento del audio como tal. De todas formas, se recomienda un
procesador de características sobresalientes en cuanto a su velocidad de
procesamiento y de comunicación con otros dispositivos (Front Side Bus) y su
actualización a medida que las necesidades y los procesos lo vayan exigiendo.

Vale la pena mencionar que algunos de los fabricantes de programas de


manipulación de audio realizan convenios con los fabricantes de procesadores
con el fin de optimizar procesos cuando se ejecuta el programa en una PC
equipada con este procesador.

8.1.4. Mainboard o tarjeta madre. Este componente no es un punto


crítico en producción de audio, basta con ser confiable y de reputación
conocida. Aquí no hay una recomendación específica.

Algunas de las marcas de mainboards más reconocidas son ASUS, MSI,


Supermicro e Intel y todas, complementadas con una buena plataforma para
producción profesional de audio, como las mencionadas en el capitulo 5,
cuentan con chipsets aceptables para producción de audio.

8.1.5. Memoria RAM. La memoria RAM en un computador es importante


para cualquier proceso que se quiera efectuar, ya que con una buena cantidad
de ella se optimizan los procesos y se incrementa el rendimiento.
258

Por esta razón la recomendación es de 1 GB de Memoria RAM. Esta cantidad


es lo mínimo para trabajar con audio, puesto que se trata de un proceso que
puede requerir ejecución de varias tareas simultáneas o trabajo en tiempo
real.

8.1.6. Capacidad de almacenamiento. Luego de analizar, en capítulos


anteriores, el proceso de digitalización de una señal y describir los formatos
digitales en los que se puede almacenar al audio digitalizado, se puede intuir
que la capacidad de almacenamiento de un DAW basado en computador debe
ser bastante amplia, pues lo ideal es almacenar el audio lo más parecido (fiel)
al original. Esto implica niveles de digitalización muy altos y almacenamiento
en formatos lossless. Fidelidad de sonido es un objetivo principal para todo
trabajo de carácter profesional.

Repasando un poco el proceso de digitalización de audio, la frecuencia de


muestreo debe ser tal que no se pierda ninguna componente de la frecuencia
audible por un ser humano, esto es, mínimo una frecuencia de 40.000Hz, La
cuantización, para obtener calidades aceptables de audio, debe hacerse
mínimo a 16 bits y, por último, para que no haya pérdida de información, no
se deben utilizar formatos comprimidos o lossy. Todo esto implica una gran
capacidad de almacenamiento.

De acuerdo con estos argumentos expuestos, se puede inferir que la mejor


recomendación es: Dos discos duros: 1 x 400 GB + 1 x 80 GB.

Un total de 480 GB es la mínima capacidad recomendada para producción de


audio profesional, ya que el audio digitalizado a niveles profesionales
aceptables y en formatos lossless, ocupan bastante espacio (Ej. 1 minuto de
259

audio en formato WAV a 44.100Hz y 16 bits, ocupan aprox. 10 MB. Es decir:


un LP o un casete de 60 minutos necesitan de 600 MB en disco para
almacenarse).

Además, con el Internet, los virus, los espías informáticos o hackers y la


misma inestabilidad que pueden presentar los sistemas operativos, los
computadores son vulnerables a fallas que pueden ocasionar pérdida de
información. Por esta razón, utilizar dos discos duros brinda seguridad y
confiabilidad. El disco de 80 GB para el sistema operativo y el software, y el
disco de 400 GB únicamente para almacenar el audio para procesar,
garantizan que las pérdidas, en caso de presentarse un problema grave, serán
mínimas, pues sólo se vería afectado el disco del sistema y no el disco de
almacenamiento.

Adicionalmente a la capacidad, se recomiendan discos con un buffer mínimo de


8 MB y que giren a un mínimo de 7200 RPM para acceder más rápidamente a
la información y agilizar la grabación de información de un lugar a otro.

La interface de estos discos puede ser tanto SATA como SCSI pero estos
últimos presentan capacidades de grabación menores, lo que originaría que se
necesitara más de dos discos duros, además de que son más costosos.

8.1.7. Tarjeta de video. Para producción de audio el video es un factor


poco relevante, a menos que se contemple la opción de trabajar a la vez con
producción de video e imagen. No obstante, aun trabajando sólo con el audio,
puede verse la necesidad de un ambiente de trabajo en dos monitores para
supervisar un proceso o llevar a cabo dos tareas simultáneas en pantallas
260

completas. Por esta razón práctica es que se recomienda una tarjeta de video
que tenga soporte para dos monitores.

8.1.8. Monitor. El monitor, como un componente activo en la producción de


audio, es secundario, pero como dispositivo productivo puede jugar un papel
importante, pues es lógico que un monitor amplio permite visualizar más
detalladamente un proceso y, más aun, si se necesitan realizar dos tareas
simultáneamente y sólo se cuenta con un monitor. El trabajo con audio es un
proceso que requiere que las personas le dediquen horas continuas sentadas
frente a una pantalla, por esta razón, un monitor de baja radiación es
imprescindible para evitar cansancio excesivo en los ojos. Cumpliendo con
estas condiciones, se recomienda un monitor de 17” de panel plano de TFT
(Thin Film Transistor) LCD (Liquid Cristal Display).

8.1.9. Dispositivos de grabación de medios externos. Luego del


tratamiento digital es necesario llevar el audio a un medio externo,
preferiblemente digital y óptico, para que se conserve sin los problemas
señalados en capítulo 2. Éste puede ser un CD, un DVD o uno de los tantos
que fueron mencionados en el capítulo 7. Se requiere de un equipo grabador
del medio seleccionado que bien puede ser interno o externo, el cual iría
conectado a la tarjeta de sonido del DAW por medio de un cable óptico, coaxial
digital o uno que sea de transmisión digital. Para esta consideración no hay
una recomendación específica, ya que cualquier grabador interno o externo
confiable realiza esta tarea de forma adecuada. En el anexo C se presentan las
características y especificaciones técnicas más relevantes de algunos
grabadores internos y externos digitales.

8.1.10. Tarjeta de sonido. Una de las partes más importantes de un DAW,


ya que, entre sus principales tareas se encuentra la conversión analógica–
261

digital de la señal de audio: contribuir poder de procesamiento al proceso de


tratamiento de la señal de audio y proporcionar entradas y salidas para
transmisión de señales. Estas características ya fueron analizadas en el
capítulo 4.

Vale la pena mencionar que la conversión analógica-digital puede hacerse


mediante un dispositivo externo, pero es absolutamente necesario que el PC
cuente con la interfaz para comunicarse con éste.

8.1.11. Ruido acústico. Este aspecto sólo es importante si se harán


grabaciones en vivo por medio de dispositivos externos como micrófonos. Un
ejemplo: si se quiere restaurar audio proveniente de un medio cuyo
reproductor no tenga salidas eléctricas como es el caso de un fonógrafo o un
gramófono. En este proceso es importante que la señal captada por el
micrófono sea únicamente lo que se desea grabar, libre de ruido externo.

Además de un ambiente completamente aislado acústicamente, se debe


utilizar un computador que produzca un mínimo de ruido, para esto se
recomienda un chasis que aísle los ruidos internos provenientes de
ventiladores, discos y demás componentes o simplemente tener el computador
en una sala diferente, cerca de la sala de grabación.

Para este tipo de grabaciones se deben tener en cuenta las consideraciones


mencionadas en el capítulo 5 referidas al efecto feedback.
262

9. TRABAJO CON LA EMISORA DE LA UNIVERSIDAD PONTIFICIA


BOLIVARIANA

Sería inconcebible que se hubiera abordado un tema como el del presente


trabajo y no se hiciera alusión a un lugar que ocupa un espacio preponderante
dentro del ámbito del sonido: la emisora de la Universidad Pontificia
Bolivariana. En este capítulo se integran varios aspectos que tienen que ver
con la digitalización de audio, la historia de la emisora de la Universidad y los
formatos en los que se almacena la información que emite cotidianamente
tanto en la frecuencia AM como en la de FM.

La emisora de la Universidad Pontificia Bolivariana, Radio Bolivariana, lleva 57


años divulgando cultura y haciendo pedagogía a través del medio de
comunicación con mayor cobertura en nuestro medio, como la radio. Esta
experiencia la ha adquirido porque con el paso del tiempo ha tenido la
oportunidad de vivir parte del periodo en el que reinaba el audio analógico y la
tecnología de la computación apenas estaba apareciendo con pasos
agigantados, pero su presencia era tenue. Estas vivencias le dieron el estatuto
para apoderarse de una gran cantidad de música en formatos analógicos, como
discos y cintas magnéticas. Algunos de ellos son hoy valorados como tesoros
invaluables en cuanto a su contenido musical. Otros, se consideran artículos
valiosos como piezas de colección, pero, lo más relevante, todos son pedazos
invaluables de su historia, la historia de la emisora de la Universidad Pontificia
Bolivariana. Y, entonces, antes de seguir adelante, recordemos algunos
aspectos que marcaron sus orígenes y su quehacer actual.
263

9.1. HISTORIA.

1948 El 11 de Agosto se inaugura RADIO BOLIVARIANA A.M., gracias a


la gestión de Monseñor FELIX HENAO BOTERO y al entusiasmo de un
grupo de estudiantes amantes de la radio, entre los cuales se destaca el
primer Director de la Emisora JAIME SALAZAR MONTOYA. Nota Especial:
Desde la inauguración de la Emisora A.M., se empieza a editar un Boletín
de Programación.

1955 Se estructura la Programación con nuevas ideas y nuevos


programas. Los estudiantes de la Facultad de Derecho son los encargados
de la Programación Cultural y los de la Facultad de Ingeniería Eléctrica, de
los equipos y de la parte técnica.

1962 Radio Bolivariana A.M. empieza a dar frutos: Se vinculan a


importantes medios de comunicación y a grandes empresas, los que
antes, como estudiantes conducían los destinos de la Emisora. Estos son
algunos de ellos: BERNARDO HOYOS, IVO MEJÍA, MIGUEL RESTREPO,
DAIRO CÁRDENAS, RAÚL AGUILAR, JAIME SALAZAR, ALBERTO UPEGUI,
JOSÉ LUIS RESTREPO, etc.

1969 Se vincula a Radio Bolivariana, siendo estudiante de segundo año


de la Facultad de Derecho, su actual Director HUMBERTO MESA R., quien
primero fue locutor, luego programador y finalmente Director en 1972.

1973 La emisora, en sus Bodas de Plata, amplía sus emisiones de 7


horas a 18 horas diarias.
264

1980 La Universidad dispone una renovación total de los equipos. Se


adquiere un transmisor de 10 Kilovatios de Potencia que asegura un
mayor cubrimiento sobre casi toda la región antioqueño.

1990 La Universidad participa y gana la Licitación para el


establecimiento de una nueva emisora educativa en Frecuencia Modulada
en los 92,4 Mhz. para la ciudad de Medellín.

1992 El 1° de Diciembre la Universidad Pontificia Bolivariana le entrega


a la ciudad de Medellín y Municipios vecinos, la nueva estación RADIO
BOLIVARIANA F.M. 92.4 Mhz. "La Máxima Nota".

1993 Se establecen estrategias de programación para las dos emisoras


A.M. y F.M: RADIO BOLIVARIANA A.M. 1110 Khz. "SOCIAL
PARTICIPATIVA", informa y forma sobre los aspectos generales de la
Salud, la Comunidad, la Religión, la Familia, la Educación, etc. RADIO
BOLIVARIANA F.M. 92.4 Mhz. "CULTURAL RECREATIVA", dirigida a un
público empresarial, ejecutivo, universitario adulto, amante de la "música
culta" y especializada.

Se adquieren equipos de Video Audio Digital y de esta manera, Radio


Bolivariana se convierte en pionera de nuevos esquemas de producción
radial con el VIDEO CONCIERTO DIGITAL, espacio emitido los domingos y
festivos a través del canal regional de TV. TELEANTIOQUIA, con su
explicación respectiva en el periódico EL COLOMBIANO y la transmisión
simultánea por Radio Bolivariana F.M.
265

1995 Reinstalación locativa de la emisora. Se gestionan las


retransmisiones vía satélite con la BBC de Londres, Radio Neederland, La
Voz de América y Radio Vaticano. La CNC (Centro Nacional de
Consultoría), muestran que Radio Bolivariana F.M. ocupa el primer puesto
de sintonía en el Estrato Medio-Alto entre las emisoras de Medellín. Por
primera vez en Colombia una emisora cultural ocupa el primer puesto en
el "Rating", compitiendo con casi 40 emisoras comerciales

1998 Con éxito, el 11 de agosto se celebran los 50 años de Radio


Bolivariana. En el mes de diciembre, se instalan nuevos equipos
transmisores del sistema A.M. mientras se diseña una programación aún
más específica en los temas sociales y cristianos.

1999 Se elabora una Página en Internet, la cual apoya y complementa la


información de Radio Bolivariana para todos los navegantes en el
ciberespacio. La página es bien acogida por el público y junto con el
Boletín Bimestral de Programación, se convierte en otro medio alternativo
de la emisora.

2000 El 12 de enero, el sistema F.M. de Radio Bolivariana es el "audio


ambiente" de las veinticinco estaciones del Metro de Medellín. Gracias a
esta gestión, la emisora es escuchada por un gran público cautivo, "para
que ese 'santuario' en el que viajan los antioqueños, además de ser
limpio y tranquilo, sea también una experiencia auditiva grata y deliciosa
con un alto nivel de contenido cultural."

2001 Se realizan las siguientes estrategias comerciales: arrendamiento


de espacios radiales, patrocinios y pauta publicitaria, contactos y alianzas
266

estratégicas con diferentes empresas públicas y privadas, esquemas de


programación comercial, incursión en la pedagogía hacia el medio radial
como proyecto alternativo de educación no formal.

2004 Alianza estratégica con EDATEL, lo cual permite que Bolivariana


F.M. entre en el sistema Real Audio (sistema de enlace virtual para
escuchar la emisora desde cualquier país del mundo). Esta estrategia
impulsa a Radio Bolivariana hacia la conquista de una nueva audiencia y
hacia otros campos de tecnología y de proyección.

2005 Con éxito, Radio Bolivariana ingresa a la tecnología digital,


mediante la adquisición de cinco computadores para sus estudios y dos
"software" especiales para la edición y transmisión de audio19.

En cifras, la emisora tiene aproximadamente 12.000 discos de vinilo y 5.000


cintas de carrete abierto, de los cuales, afortunadamente, muchos se
encuentran en condiciones aceptables, gracias al cuidado que han tenido los
empleados, los directores y, en general, las personas que han estado dentro de
la organización. Afortunadamente se han preocupado por almacenarlos de
forma adecuada y su manipulación se corresponde con las condiciones
mínimas. Sin embargo, y a pesar de los cuidados, los formatos analógicos, aun
en condiciones de almacenamiento adecuadas, no son eternos y tienden a
degradarse con el tiempo, como se vio en el desarrollo de este trabajo.
Adicionalmente, su uso continuado implica manipulación, contacto directo con
el polvo, el calor, la humedad, etc. Además de estas degradaciones
generadoras de ruidos, también se encuentra el ruido de fondo, que es

19
Radio Bolivariana. Historia de radio bolivariana. [en linea]. Medellín. Universidad
Pontificia Bolivariana, 2005.
<http://www.bolivarianafm.com/historia_de_radio_bolivariana.htm>
[consulta: 15 Jun. 2005]
267

inherente en todos los medios de almacenamiento analógicos; factores que


inciden directamente para que la música no se escuche con plenitud.

17.000 medios de almacenamiento de audio analógico, en proceso de


deterioro, no era una cifra despreciable como para ignorar sin más. Por ello, la
emisora avistó la necesidad de comenzar un proceso de renovación que fue
definitivamente ejecutado en el momento que en este trabajo se expresó el
deseo de confirmar y apoyar tal renovación.

Fue así como comenzó este trabajo conjunto, en el que ambas partes se verían
beneficiadas. La emisora rescataría sus viejas memorias musicales, y nosotros
enriqueceríamos nuestra experiencia, nuestro conocimiento y, en
consecuencia, nuestro trabajo de grado.

En las figuras 96 y 97 se muestra, la fonoteca de la emisora de la Universidad


Pontificia Bolivariana.

En la figura 98 se aprecian los diferentes formatos de discos de audio analógico


pertenecientes a la emisora de la Universidad Pontificia Bolivariana, de
izquierda a derecha se ilustran los formatos de 45, 33 1/3 y 78 RMP.
268

Figura 96. Fonoteca de la emisora de la Universidad Pontificia Bolivariana. Colección de


cintas magnéticas.

Figura 97. Fonoteca de la emisora de la Universidad Pontificia Bolivariana. Colección de


discos.
269

Figura 98. Discos analógicos de audio de la emisora radio Bolivariana.

En la figura 99 se aprecian los diferentes formatos de carrete abierto de audio


analógico pertenecientes a la emisora de la Universidad Pontificia Bolivariana.

Figura 99. Carretes abiertos de audio analógico de la emisora radio Bolivariana.


270

Precisamente este trabajo de grado brindará apoyo permanente a la Emisora


una vez terminada la labor académica, pues, se considera que el trabajo de
grado es un texto rico en información teórica y práctica que tendrá gran
importancia para la emisora, pues, si se usa adecuadamente, será un manual
de restauración de audio que, además, presenta abundante información
técnica. En este aspecto se debe hacer énfasis porque, según el personal de la
emisora, hacía falta en la biblioteca de la misma emisora. Así pues, este libro
tendrá el honor de ser el primer texto de contenido técnico e ingenieril, de
obligada consulta, que reposará en los estantes de la biblioteca de la emisora
de la Universidad Pontificia Bolivariana.

Con lo expuesto en este trabajo y por las continuas asesorías en el campo de


la restauración de audio analógico por medios digitales y otros temas
relacionados con el audio y el video digital, la emisora de la Universidad
complementó los saberes relacionados con estas artes y brindó avances en el
proceso de transición del mundo analógico al digital, en el que se encuentra en
este momento.

Todas aquellas experiencias vividas en la emisora relacionadas con el mundo


del audio digital y, en particular, con la restauración de audio, motivó la
elaboración de este apartado, en el que, además de cosechar los frutos de
largos meses de investigación teórico-práctica, es un verdadero orgullo que
este trabajo, y el conocimiento desplegado sobre el tema, hayan servido como
orientación en tan importante proceso que es el de la recuperación de
invaluables fonogramas para beneficio de la universidad, comunidad
universitaria y todos aquellos radioescuchas de la emisora de la Universidad
Pontificia Bolivariana.
271

9.2. EXPERIENCIAS EN LA EMISORA DE LA UNIVERSIDAD PONTIFICIA


BOLIVARIANA.

Ubicados, como estamos, en la llamada era digital, la emisora comenzó a


adquirir música en formatos digitales. Estos formatos se pueden graficar,
aproximadamente, de la siguiente manera: 10.000 CDs, 5.000 MDs y 500
Laser Discs. Este último medio fue el encargado de crear la inquietud para
consultar por parte de la Emisora Radio Bolivariana, que expresó su interés por
trasladar la información tradicional en un formato más moderno y versátil
como es el DVD. Planteada esta necesidad, la labor académica de los
integrantes del trabajo de grado fue orientar, aclarar conceptos y compartir
criterios. La solución de esta necesidad radicó fundamentalmente en la
adquisición de un conversor análogo-digital de audio y video, dispositivo, hasta
el momento, desconocido por la emisora. Estudiando las características
técnicas de los llamados video láser y la disposición de equipos de
computación de alta gama, se sugirió la compra de un conversor externo
marca Datavideo, modelo DAC-100 que se ilustra a continuación. La compra
fue inmediata y efectiva. Hasta ahora, su uso ha sido muy frecuente, ya que
sus características técnicas cumplen las necesidades de audio y video
profesional. Su particularidad de ser externo lo hace portátil y puede ser
conectado a cualquier computador de la emisora, a diferencia de un modelo en
particular de tarjeta estática capturadora de audio y video.
272

Figura 100. Conversor de audio y video DAC-100


Fuente: vides Converters. Professional video: post production. [en linea]. s.l.: H&B
Photo-Video, 2005.
<http://www.bhphotovideo.com/bnh/controller/home?A=details&kw=DADAC100&is=R
EG&Q=&O=productlist&sku=259093>
[consulta: 5 Mar. 2005]

Antes de comenzar con este proyecto la emisora había iniciado el proceso de


adquisición de programas de audio, programas que, consideraban, serían más
modernos y solucionaban las necesidades de la emisora. Por lo adelantado del
proceso, no se ingresó la experiencia ni los antecedentes de este trabajo
investigativo sobre los programas de audio especializados. Lo anterior no se
expone para inferir que la adquisición de estos programas haya sido incorrecta.
Lo que se pretende concluir es que la autoridad científica debe recaer en los
hombres que se han especializado en un campo del saber específico.

Como se mencionó anteriormente, la emisora cuenta con gran cantidad de


material analógico en condiciones de deterioro y otro en buen estado, lo que
hace del proceso de restauración digital una tarea de suma importancia para
sus intereses. Uno de los programas adquiridos por la emisora Radio
Bolivariana es un excelente editor gráfico de audio con herramientas básicas
273

de restauración, aunque, como lo expresamos anteriormente, existen otros


programas especializados para obtener óptimos resultados.

Además de la restauración, la emisora también estaba interesada en adquirir


un conocimiento más profundo sobre algunos temas técnicos del audio como
principios, formatos y aplicaciones, por eso adquiere mayor trascendencia el
presente trabajo.

Otro de los factores que se destaca es el hecho de que se hubieran


programado algunas conferencias sobre el contenido de este trabajo de grado,
en las que se desplegaron temas como: la historia del audio, los medios de
almacenamiento analógicos y sus degradaciones y la captura de señales de
audio analógico.

En las siguientes imágenes se evidencia el proceso desarrollado junto a la


emisora y su gran aceptación e interés por parte de esta.
274

Figura 101. Exposición introductoria a la restauración de audio.

Figura 102. Exposición de restauración de audio digital.


275

Figura 103. Exposición de tecnologías de audio digital.

Retornando al tema principal de la tesis, la restauración de audio, se encontró


que en la emisora hay muchas cintas magnéticas en perfectas condiciones,
otras presentan problemas menores como polvo y suciedad y unas cuantas
presentan pérdida de aglomerante o síndrome de Sticky Shed. Lo que permitió
asesorar a la emisora en el proceso de reparación de este tipo de degradación
con las indicaciones y aclaraciones sobre el procedimiento de horneado de
cintas magnéticas. Muchas de las cintas magnéticas están en buenas
condiciones, pero aun así, el objetivo de la emisora es llevar toda su fonoteca
analógica a medios digitales, con un previo tratamiento digital, pues las
directivas de la emisora conocen las consecuencias de un prolongado
almacenamiento de formatos analógicos, además de su conocimiento y
conciencia de las ventajas de los medios digitales.
276

En la figura 104 se evidencia el efecto de sticky shed en una cinta magnética


de audio analógico de carrete abierto perteneciente a la emisora Radio
Bolivariana.

Figura 104. Cinta magnética de audio con síndrome de sticky shed perteneciente a la
emisora radio Bolivariana.

Además de las cintas magnéticas en carrete abierto, la emisora también


cuenta con gran cantidad de discos de vinilo susceptibles de tratamientos de
restauración digital. Muchos de ellos en buenas condiciones, pero el
sentimiento y tendencia por la digitalización es generalizada para toda su
fonoteca.
277

Algunos de los discos, como es apenas lógico, tienen bastante polvo y algunas
suciedades superficiales; otros, presentan algunos rayones. Algunos discos
están en franco proceso de deformación por causa del almacenamiento
prolongado.

Para estas degradaciones menores, se brindaron orientaciones de limpieza,


pero lo que más llamó la atención fueron los sistemas limpiadores de discos
que incrementan la productividad del proceso de restauración, con unos
resultados óptimos. Igualmente, los reproductores ópticos de discos analógicos
también fueron considerados para la reproducción de los discos a digitalizar y,
así, optimizar los resultados de la restauración digital y obtener un sonido de
excepcional calidad.
278

10. CONCLUSIONES

• La restauración de audio no es una disciplina que se limita única y


exclusivamente a estudiar conceptos relacionados con la restauración de
los soportes físicos de almacenamiento y señal de audio, mediante el
tratamiento digital, pues, además, estudia detalladamente las
características de las ondas y el análisis de algunos conceptos referidos
al audio analógico y digital, con el fin de ilustrar más claramente la
naturaleza y los parámetros que definen una onda de audio y su
comportamiento, los que, a su vez, permiten identificar y percibir con
precisión las consecuencias de las degradaciones o ruidos en la música.
De esta manera se puede evaluar, con poco margen de error, las
acciones correctivas que deben tomarse durante el tratamiento digital,
en lo que se refiere a la aplicación de algoritmos matemáticos, efectos o
filtros para resaltar o corregir un sonido en particular.

• Restaurar audio no se reduce únicamente a eliminar los ruidos presentes


en una grabación, pues precisa de una serie de consideraciones
prácticas y técnicas de carácter ingenieril que no pueden asumirse
superficialmente, ya que de ellas dependen, en gran medida, los
resultados que se esperan porque determinan la viabilidad y
necesidades del proyecto de acuerdo con la magnitud de la restauración
que se ha de ejecutar.

• La aplicación del Procesamiento Digital de Señales (DSP) en problemas


relacionados con la restauración de audio, ha sido una área de
considerable crecimiento desde las primeras investigaciones en este
279

tema, a principios de 1970. Para 1980, los chips DSP ya eran


suficientemente poderosos como para ejecutar las complejas
operaciones requeridas por la restauración digital de audio en tiempo
real. Todo esto dio origen a los primeros sistemas comerciales de
restauración digital por parte de CEDAR Audio, en el Reino Unido y Sonic
Solutions, en Estados Unidos.

• Hasta hace algunos años, la producción digital de audio requería


poderosos motores computacionales que solamente estaban al alcance
de grandes empresas dedicadas a esta labor. No obstante, con el
advenimiento del CD y otros formatos digitales, el crecimiento de la
computación y la consecuente accesibilidad de esta tecnología por parte
del público en general, puso este proceso digital de audio al alcance de
todas las personas que cuenten con un computador equipado con un
conversor de sonido.

• Es importante establecer la diferencia entre edición digital de audio y


restauración digital de audio. El primero de estos términos consiste en
tomar una señal de audio y realizar un proceso cuyo objetivo es la
alteración total o parcial de la señal, en el que el resultado será un
sonido modificado pero no necesariamente restaurado. La restauración
digital de audio es un caso particular de la edición digital de audio, pero
con la connotación que le da su nombre. Restaurar es volver a poner en
el estado que antes tenía una obra de arte, es llevar a su estado original
una señal de audio. Esto quiere decir que restaurar implica obtener un
sonido exactamente igual o lo más parecido posible al que escuchó la
persona que estuvo presente en el momento de la grabación. Así, pues,
la restauración de audio no es un proceso que consiste en aplicar al
azar una cantidad desmesurada de filtros y efectos en la señal de audio.
280

• Una de las ventajas que proporciona el audio digital sobre el audio


analógico es que permite la experimentación y el ensayo, es decir,
manipular información digital es más fácil y más seguro ya que hace
posible la reversibilidad del proceso. Reversibilidad en el sentido de que
se pueden hacer copias con mayor facilidad y sin perder calidad de
audio en el proceso de duplicación. El audio analógico no posee esta
flexibilidad ya que el tratamiento físico puede ocasionar destrucción
permanente, lo que quiere decir que duplicar no es una solución, ya que
con cada copia la calidad del sonido va decayendo.

• El surgimiento de los programas de restauración digital de audio se dio,


en primera instancia, por causa de la implementación de los modelos
matemáticos para representar señales de audio, desarrollados por
ingenieros estudiosos de las matemáticas, pues fue con base en el
estudio de estos modelos como se generaron los diferentes algoritmos
de restauración de audio, presentes en estos programas que, por
métodos de predicciones probabilísticas aplicados a la representación
matemática de la señal de audio, son capaces de distinguir entre ruido y
la señal original. En algunos casos, aplicando tecnología de sustitución,
se logran reconstruir fragmentos perdidos de la señal. En segunda
instancia, y gracias al desarrollo de los computadores, se hicieron lo
suficientemente poderosos para solucionar, en tiempo real, las
ecuaciones y matrices que arrojan estos algoritmos durante el análisis y
reparación de la señal degradada.

• Más allá del conocimiento adquirido en este trabajo por la investigación


y búsqueda de información relacionada con la restauración de audio, es
evidente que los frutos más apreciados son los beneficios recibidos por
la comunidad universitaria, la naciente línea de formación en audio de la
Escuela de Ingeniería y, particularmente, por la emisora de la
Universidad Pontificia Bolivariana, con la que compartimos el
beneplácito de los logros obtenidos con este trabajo, un texto rico en
281

información técnica con reales soluciones a la problemática referida a la


degradación de medios de almacenamiento de audio analógico,
digitalización de audio analógico y posterior tratamiento digital para la
restauración.

• Quedan como resultados múltiples aspectos técnicos compartidos con la


emisora que, gracias a nuestra profunda afición a los temas referidos al
audio y por nuestra experiencia laboral en el medio del audio y video de
alta calidad, consideramos que son y serán de gran valor. También
manifestamos nuestro profundo agradecimiento a la emisora Radio
Bolivariana y a todo su personal, por la calidad humana y por compartir
con nosotros sus experiencias y conocimientos relacionados con el
maravilloso mundo de la radio.

• Así pues, esperamos que este aporte personal y nuestro trabajo de


grado hagan perdurar el camino que, conjuntamente con la emisora,
comenzamos a trazar por el mundo de la restauración del audio ya que
seguramente le traerá grandes beneficios en el en el futuro que se
avizora exitosamente.
282

BIBLIOGRAFIA

ADOBE. AUDITION [CD]. Ver. 1,5. s.l.: Adobe, 2005. 1 CD. Programa
informático

AES: Audio Engineering Society. [en línea]. New York: AES, 2005
<http://www.aes.org/> [consulta: 1 May. 2005]

AUDIO CODECS. Wikipedia: audio codecs. [en línea]. s.l.: Wikipedia, 2005
<http://en.wikipedia.org/wiki/Audio_codecs> [consulta: 19 Mar. 2005]

AUDIO DECKS. Audio converters: ADI-2. [en línea]. s.l.: RME, 2005.
<http://www.rme-audio.com/english/adi/adi2.htm>
[consulta: 26 May. 2005]

AUDIO DECKS. DVD players: DVD-1910. [en linea]. s.l.: DENON, 2005.
<http://www.usa.denon.com/catalog/photo.asp?s=home&p=DVD-
1910&f=DVD1910%20Front.jpg&c=4> [consulta: 4 Jun. 2005]

AUDIO DECKS. DV-RA1000. [en línea]. s.l.: TASCAM, 2005.


<http://www.tascam.com/Products/dvra1000.html>
[consulta: 4 Jun. 2005]

AUDIO DECKS. Performance audio: alesis [en línea]. s.l.: Performance audio,
2005. <http://www.performanceaudio.com/cgi/pages.cgi?buildPage=
item&ProductID=004017> [consulta: 11 May. 2005]
283

AUDIO DECKS. Products: DVD.618. [en línea]. s.l.: RCA, 2005.


<http://www.rcaaudiovideo.com/Cultures/en-US/ModelDetail.html?PCI=
Portable+DVD&ProductID=DRC618N> [consulta: 6 Jun. 2005]

AUDIO DECKS. Products: PCI audio. [en línea]. s.l.: MOTU, 2005.
<http://www.motu.com/products/motuaudio/896/body.html/en>
[consulta: 26 May. 2005]

AUDIO DECKS. Professional audio: recorders & players. [en línea]. s.l.: Vann’s,
2005. <http://www.vanns.com/shop/servlet/item/features/523149324>
[consulta: 26 May. 2005]

AUDIO DECKS. Sony: sony mastering. [en línea]. s.l.: Zzounds, 2005.
<http://www.zzounds.com/item--SNYPCMM1> [consulta: 16 May. 2005]

AUDIO FILES. Wikipedia: audio file format. [en línea]. s.l.: Wikipedia, 2005
<http://en.wikipedia.org/wiki/Audio_file_format> [consulta: 19 Mar. 2005]

AUDIO FORMATS. Wikipedia: list of audio formats [en línea]. s.l.: Wikipedia,
2005 <http://en.wikipedia.org/wiki/List_of_audio_formats>
[consulta: 17 Mar. 2005]

AUDIO PRODUCTS. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
http://www.m-audio.com/index.php?do=products.family
[consulta: 3 Abr. 2005]

AUDIO PRODUCTS. Terratec producer: phase 26. [en línea]. s.l.: Terratec,
2005. <http://audioen.terratec.net/modules.php?op=modload&name
=News&file=article&sid=6> [consulta: 13 May. 2005]
284

AUDIO RESTORATION. [en línea]. s.p.i.


<http://www.lnlrecording.com/FAQ/audio_restoration.htm>
[consulta: 6 Mar. 2005]

AUDIO RESTORATION. PINNACLE SYSTEMS: audio. [en línea]. s.l.: Pinnacle


systems, 2005. <http://www.pinnaclesys.com/ProductPage_n.asp?Product
_ID=1477&Langue_ID=6> [consulta: 8 Mar. 2005]

AUDIO RESTORATION. WAVES: restoration bundle. [en línea]. s.l.: Waves


Audio, 2005. <http://www.waves.com/content.asp?id=59>
[consulta: 5 Mar. 2005]

BERGER, J, COIFMAN, R and GOLDBERG. M, J. Removing Noise from Music


Using Local Trigonometric Bases and Wavelet Packets. J. Audio Eng. Soc. Vol.
42, No. 10 (Oct. – Sep. 1994) p. 808–818.

BOLL. S, F. Suppression of Acoustic Noise in Speech Using Spectral


Subtraction. En: IEEE Trans. Acoustics, Speech, and Signal Processing. Vol.
ASSP- 27, No. 2 (Apr. – May. 1979) p. 113–120.

BROTHERS, Peter. Specbros: Video & Audio tape restoring since 1983. [en
línea]. s.l. BROTHERS, Peter, 2003 <http://www.specsbros.com/index.html>
[consulta: 2 Abr. 2005]

BLU-RAY DISC. Blu-ray. [en línea]. s.l.: Blu-ray DiscAssociation, 2005


<http://www.blu-ray.com> [consulta: 25 May. 2005]

CARRETERO MONTERO, Alfonso. Sistemas de sonido: definiciones de sonido y


campos que lo estudian. [en línea]. s.l. ALFOCAMO WEB, 1999, actualizada 9
Sep. 2004 <http://www.terra.es/personal/alfocamo/Sonido.htm>
[consulta: 12 Mar. 2005]
285

CILETTI, Eddie. If I Knew You Were Coming I’d Have Baked A Tape!: (A Recipe
for Tape Restoration). [en línea]. s.l. CILETTI, Eddie, 1998.
<http://www.tangible-technology.com/tape/baking1.html>
[consulta: 4 Abr. 2005]

CONVERSORES DE AUDIO. Products: progression DAC model 4705. [en línea].


Jefferson: Sakura Systems, 2005.
<http://www.sakurasystems.com/products/47dac.html>
[consulta: 28 May. 2005]

DAVIS, Don and DAVIS, Carolyn. Sound System Engineering. 2 ed. Portland:
Focal Press, 1997. 665p
Digital Audio Basics: historical background. [en linea]. s.p.i.
<http://www.cyberbee.com/audio.pdf> [consulta: 6 Mar. 2005]

DIGITAL AUDIO STORAGE. Wikipedia: digital audio. [en linea]. s.l.: Wikipedia,
2005 <http://en.wikipedia.org/wiki/Digital_audio>
[consulta: 17 Mar. 2005]

DIGITAL DOMAIN. ARTICLES. [en línea] s.p.i.


<http://www.digido.com/portal/pmodule_id=11/pmdmode=fullscreen/pagead
der_page_id=18/> [consulta: Ene. 19 2005]

DOCTOR PROAUDIO. Conexiones a entradas balanceadas. [en línea]. s.l.:


Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas.htm>
[consulta: 7 Abr. 2005]

DOCTOR PROAUDIO. Transporte de señal: balanceado y no balanceado. [en


línea]. s.l.: Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas.htm>
[consulta: 7 Abr. 2005]
286

EL SONIDO. Velocidad de propagación del sonido en un gas. [en línea]. s.l. s.n,
2004.
<http://www.sc.ehu.es/sbweb/fisica/ondas/acustica/sonido/sonido.htm>
[consulta: 8 Mar. 2005]

ELECTROACÚSTICA: digitalización de señales de audio. [en línea]. s.l.:


Wanadoo 2005. s.l.: Wanadoo, 2005.
<http://html.rincondelvago.com/electroacustica_digitalizacion-de-senales-de-
audio.html> [consulta: 23 Mar. 2005]

ELP Laser Turntable [en línea]. s.l.: WAUGH, Max, 2005.


<http://www.elpj.com> [consulta: 1 Jun. 2005]

ENHANCEDAUDIO: Audio restoration and enhancement software. [en línea].


York, EnhancedAudio, s.f. <http://www.enhancedaudio.com/index.htm>
[consulta: 5 Abr. 2005]

EQUALIZER. Products: equalizer & accessories. [en línea]. s.l.: Behringer,


2005. <http://www.behringer.com/DEQ2496/index.cfm?lang=ENG> [consulta:
22 Abr. 2005]

ESQUEF A. A, Paulo. Model-Based Analysis of Noisy Musical Recordings with


Application to Audio Restoration. [en linea]. Helsinki: Helsinki University of
Technology, 2004. <http://lib.tkk.fi/Diss/2004/isbn9512269503/> [consulta: 6
Mar. 2005]

ESQUEL A, Paulo and BISCAINHO. L, W. A Double-Threshold-Based Approach


to Impulsive Noise Detection in Audio Signals. in Proc. X European Signal
Processing Conf., Tampere. Vol. 4 (Sep. – Oct. 2000) p. 2041-2044.
287

EVANS, Mick and EVANS, Dave. Audio decks. Mick’s audioworld [en línea]. s.l.:
EVANS, Mick and EVANS, Dave, 2004.
<http://www.arcticcorsair.f9.co.uk/audio/kit/dcc730.html> [consulta: 26 May.
2005]

FISICANET. El sonido. Ondas sonoras: el sonido y las ondas. [en línea]. s.p.i.
http://www.fisicanet.com.ar/fisica/f3ap04/apf3_25b_Ondas_Sonoras.
html> [consulta: 8 Mar. 2005]

FONOTRON. Restauración digital de sonido. [en línea]. Sevilla: s.n., s.f.


http://www.arrakis.es/~fonotron/dsr.html [consulta: Ene. 19 2005]

GARG, Hari Krishna. Digital signal processing algorithms. 1 ed. Bogota: CRC
Press, 1998. 672p

GODSILL, Simon and RAYNER, J.W. Digital Audio Restoration: A Statistical


Model Based approach. [en linea], Cambridge: University of Cambridge, 1998.
<http://www-sigproc.eng.cam.ac.uk/~sjg/springer>
[consulta: Ene. 20]

GODSILL, Simon and RAYNER, Peter. Digital Audio Restoration [en línea].
Cambridge: CAPPE,Olivier, 1997
<http://citeseer.ist.psu.edu/cachedpage/105169/1>
[consulta: Feb. 19 2005]

HANDBOOK FOR SOUND ENGINEERS. 3 ed. Portland: BALLOU, Glen, 2005.


1553p

HESS, Richard. Vignettes Media Audio Tape Restoration & Mastering. [en
línea]. Aurora: HESS, Richard, 2001
<http://www.richardhess.com/tape/contact.htm> [consulta: 7 Abr. 2005]
288

HINTZE, Mike. Consumer Audio Equipment. [en línea]. s.l. HINTZE, Mike,
2005. <http://mhintze.tripod.com/audio/default.htm>
[consulta: 17 Mar. 2005]

IASA (International Association of sound and Audiovisual Archives). Technical


Committee Papers.The Safeguarding of the Audio Heritage: Ethics, Principles
and Preservation Strategy [en línea]. s.p.i. <http://www.iasa-
web.org/index.htm> [consulta: 20 Abr. 2005]

IEEE Virtual Museum. The beats goes on: How sounds are recorded and
played. [en línea]. s.l.: IEEE, 2005. <http://www.ieee-virtual-
museum.org/index.php> [consulta: 12 Abr. 2005]

INTRODUCCTION TO AUDIO RESTORATION. [en línea]. s.l.: CEDAR, 2005.


<http://www.cedar-audio.com/> [consulta: 3 Mar. 2005]

JORDÀ PUIG, Sergi. Conceptos avanzados de procesador digital de audio. [en


línea]. s.l.: Resonancias, 1997.
<http://www.ccapitalia.net/reso/articulos/index.htm?frame=http%3A//www.cc
apitalia.net/reso/articulos/articulos.htm> [consulta: 12 Mar. 2005]

JORDÀ PUIG, Sergi. Conceptos avanzados de procesador digital de audio. [en


línea]. s.l.: Resonancias, 1997.
<http://www.ccapitalia.net/reso/articulos/index.htm?frame=http%3A//www.cc
apitalia.net/reso/articulos/articulos.htm> [consulta: 12 Mar. 2005]

JORDÀ PUIG, Sergi. El audio digital en el ordenador personal. [en línea]. s.l.:
Resonancias, 1997.
<http://www.ccapitalia.net/reso/articulos/index.htm?frame=http%3A//www.cc
apitalia.net/reso/articulos/articulos.htm> [consulta: 12 Mar. 2005]
289

JORDÀ PUIG, Sergi. Principios del sonido digital. [en línea]. s.l.: Resonancias,
1997. <http://www.ccapitalia.net/reso/articulos/index.
htm?frame=http%3A//www.ccapitalia.net/reso/articulos/articulos.htm>
[consulta: 12 Mar. 2005]

"KING, Gretchen.Magnetic Wire Recordings: A Manual Including Historical


Background, Approaches to Transfer and Storage, and Solutions
to Common Problems. [en línea]. Washington: University of Washington, 2003.
<http://depts.washington.edu/ethmusic/wire1.html>
[consulta: 10 Mar. 2005]"

KONOPKA, Mike. ThunderTone Audio: High Quality Audio Engineering Services.


[en linea]. Mount Prospect: KONOPKA, Mike, 2005
<http://www.mikekonopka.com/page1.html> [consulta: 29 Mar. 2005]
La clinica del disco. [en línea]. s.p.i. <http://jaye76.tripod.com/index.htm>
[consulta: 3 Abr. 2005]

MANDANO, Enrique. Sistemas electrónicos digitales. 6 ed. Barcelona:


Marcombo, 1987. 704p

MATHWORKS. Matlab [CD]. Ver. 6. s.l.: Mathworks, 2000. 1 CD. Programa


informático

MICROGRAPHIA: The microscopy of vinyl records. [en línea]. s.p.i.


<http://www.micrographia.com/index.htm> [consulta: 10 Abr. 2005]

MILIÁN, Marc. Bu-ray Disc Vs HD-DVD. Blu-ray. [en línea]. s.l.: MILIÁN, Marc,
2005 <http://lam.e-gim.net/gimmaster/jcl/lam/Documentos/
contenido1.asp?id=201&ide=030&cod=030> [consulta: 25 May. 2005]

MIYARA, Federico. Acústica y Sistemas de Sonido. 4 ed. Bogota: deciBel, 2004.


319p
290

MORTON, David. The history of sound recording technology. [en línea].


s.l.:MORTON, David, 1998. <http://www.recording-history.org/> [consulta:
12 Mar. 2005]

NEWTON, Graham. Graham Newton's Audio-Restoration Web Site. [en línea].


s.l.: Newton, Graham, s.f. <http://audio-restoration.com/
index.php> [consulta: 20 Mar. 2005]

P.J WOLFE. P, J and y GODSILL. S, J. Efficient Alternatives to the Ephraim and


Malah Suppression Rule for Audio Signal Enhancement. En: EURASIP Journal
on Applied Signal Processing – Special Issue on Digital Audio for Multimedia
Communications. Vol. 2003, No. 10 (Sept. – Oct. 2003) p. 1043–1051.
[consulta: 11 May. 2005]

PANASONIC. Blue-ray. [en línea]. s.l.: AV LAND LTD, 2005.


<http://www.avland.co.uk/panasonic/dmre700/dmre700lrg.jpg>
[consulta: 6 Jun. 2005]

PENA GIMÉNEZ, Antonio. Sistemas de audio y video: procesos sobre la señal


de audio. [en línea]. Vigo: Universidad de Vigo, 2005.
<http://www.gpi.tsc.uvigo.es/%7Ecbarcena/Web-
SAV/sav0405_tema3_procesos.pdf> [consulta: 11 Abr. 2005]

PLASTIC REVOLVER. Vinyl audio restoration, transfer, archival. [en línea].


s.p.i. <http://www.plasticrevolver.com/index.html> [consulta: 6 Abr. 2005]

POOLER, Bob. Video Interchange: Vintage Audio - Video Transfer Conversion


Services [en línea]. Waldoboro: POOLER, Bob, 2005
<http://www.videointerchange.com/index.html> [consulta: 18 Mar. 2005]

PRESS RELASE: Nec HD DVD. [en línea]. s.l.: HD DVD Promotion Group, 2005.
<http://www.hddvdprg.com/press/nec.html> [consulta: 6 Jun. 2005]
291

PROAKIS, John and MANOLAKIS, Dimitris. 3 ed. Portland: Prentice Hall, 1995.
1016p

RESTAURACIÓN DE AUDIO. Proceso de señales y aplicaciones en la


restauración de registros sonoros. [en línea]. Oviedo: Universidad de Oviedo,
s.f. <http://coco.ccu.uniovi.es/brahms/sumario.htm> [consulta: 28 Feb. 2005]

RESTAURACIÓN DE AUDIO. SONIC: Sonic NoNOISE. [en línea]. Novato: Sonic


Solution, 2005.
<http://www.digidesign.com/products/details.cfm?product_id=3180>
[consulta: 3 Mar. 2005]

RESTAURACIÓN DE AUDIO. SoundSoap Pro de Bias. [en línea]. s.l.: La oreja


digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Fnoticia.php3%3Fid
noticia%3D1225> [consulta: 26 Abr. 2005]

RIFE. D, Douglas. Theory of Upsampled Digital Audio. [en línea]. s.l.: RIFE. D,
Douglas, 2002. <http://www.mlssa.com/pdf/Upsampling-theory-rev-2.pdf>
[consulta: 8 Mar. 2005]

S. B. JEBARA. S, B, BENAZZA-BENYAHIA, A and KHELIFA. A, B. Reduction of


Musical Noise Generated by Spectral Subtraction by CombiningWavelet Packet
Transform and Wiener Filtering. Proc. X European Signal Processing Conf.,
Tampere. Vol. 2 (Sept. – Oct. 2000)

SAGE, Glenn. Dedicated to the preservation of early recorded sound. [en


línea]. Portland: SAGE, Glenn, 1996, updated June 2 2005.
<http://www.tinfoil.com/> [consulta: 2 Abr. Mar. 2005]
292

SCHOENHERR, Steve. Recoding Technology History. [en línea] s.p.i., revised in


27 January 2005. <http://history.acusd.edu/gen/recording/notes.html>
[consulta: 20 Mar. 2005]

SCREENSOUND AUSTRALIA. National screen and sound archive: Preservation.


[en línea]. Canberra: ScreenSound Australia, 2000
<http://www.screensound.gov.au/ScreenSound/Screenso.nsf> [consulta: 16
Mar. 2005]

SONY. Sound Forge [CD]. Ver. 7. s.l.: Sony, 2004. 1 CD. Programa informático
Steinberg. Wavelab [CD]. Ver. lite. s.l.: Steinberg, 2005. 1 CD. Programa
informático

ST-LAURENT, Gilles. The Care and Handling of Recorded Sound Materials. [en
línea]. s.l.: National Library of Canada, 1996
<http://palimpsest.stanford.edu/byauth/st-laurent/care.html>
[consulta: 22 Mar. 2005]

THE LIBRARY OF CONGRESS PRESERVATION: Cylinder, Disc and Tape Care in


a Nutshell. [en línea]. Washington: Library of congress, 2002.
<http://www.loc.gov/preserv/care/record.html> [consulta: 2 Abr. 2005]

THE VINYL ENGINE: The home of the turntable. [en línea]. s.l.: JaS, 2002
<http://www.vinylengine.com/> [consulta: 20 Mar. 2005]

TRANSFORMACIONES TIMBRICAS. [en línea]. s.p.i.


<http://www.euskalnet.net/manzano/apuntes/cuerpos/cuerpo_procesamiento.
htm> [consulta: 25 Abr. 2005]

TYPES OF NOISES SUCCESSFULLY REMOVED OR DIMINISHED. [en línea]. s.l.:


s.n, 1999. <http://lp2cd.com/restoration_types.htm> [consulta: 25 May.
2005]
293

UNESCO: United Nations Educational, Scientific and Cultural Organization.


Audiovisual archives: A practical reader. [en línea]. s.l.: UNESCO, 1997.
<http://www.unesco.org/webworld/ramp/html/r9704e/r9704e00.htm#Content
s> [consulta: 20 Mar. 2005]

VAN BOGART, John. Magnetic Tape Storage and Handling: A Guide for Libraries
and Archives. [en línea]. Washington: National Media Laboratory, 1995.
<http://www.clir.org/pubs/reports/pub54> [consulta: 1 Abr. 2005]

VAN DEN HUL. Connectors and Accessories. [en línea]. s.l.: A.J, van den Hul
B.V, 1997. <http://www.vandenhul.com/other/c-connec.htm>
[consulta: 14 May. 2005]

VASEGHI S, V. and FRAYLING-CORK, R. En: J. Audio Eng. Soc. Cambridge.


Vol. 40, No. 10 (Oct. – Sep. 1992); p. 791-801. [consulta: 11 May. 2005]

VASEGHI S, V. and RAYNER. J, W. Detection and Suppression of Impulsive


Noise in Speech Communication Systems. Proc. IEEE Int. Conf. Acoustics,
Speech, and Signal Processing. Vol. 137, No. 1 (Feb. – Mar. 1990); p. 38-46.

VIDEOGAMES. Hardware: PlayStation2. [en línea]. s.l.: SONY, 2005.


<http://www.us.playstation.com/consoles.aspx?id=2/info/PlayStation2/default
.html#> [consulta: 6 Jun. 2005]

VIDEOGAMES. PS3: oficial PS3 pictures. [en línea]. s.l.: SONY, 2005.
<http://www.ps3land.com/ps3-pictures/picture53.php>
[consulta: 6 Jun. 2005]

VIDEOGAMES. SEGA: saturn 2 [en línea]. s.l.: Vidgame, 2005.


<http://www.vidgame.net/SEGA/SATURN.html> [consulta: 31 May. 2005]
294

VIDEOGAMES. SONY: playstation [en línea]. s.l.: SONY, 2005.


<http://www.us.playstation.com/psp.aspx?id=overview>
[consulta: 31 May. 2005]
431

ANEXO F

ANTEPROYECTO
432

Proyecto de trabajo de grado


La Restauración de Audio

Estudiante Gustavo Adolfo Valencia Zapata


Cédula 3.396.765 de envigado
e-mail tavobat@hotmail.com
Teléfono 265 70 17
Programa Ingeniería Electrónica
Universidad Universidad Pontificia Bolivariana

Estudiante Nicolás Ramírez Echeverri


Cédula 98.670.385 de Envigado
e-mail nicramec@netscape.net
Teléfono 266 76 13
Programa Ingeniería Eléctrica
Universidad Universidad Pontificia Bolivariana

Director José Ricardo Zapata


Cédula 71.375.690 de Medellín
e-mail jrzapata@upb.edu.co
Teléfono 2658798
Empresa UPB
Universidad Universidad Pontificia Bolivariana

Asesor Hernán Valencia


Cédula 8.281.231 de Medellín
e-mail hernanvalencia@hotmail.com
Teléfono 2356224
Empresa UPB
Universidad Universidad Pontificia Bolivariana

31/01/05
Ingeniería Eléctrica - Electrónica / Escuela de ingenierías
Universidad Pontificia Bolivariana
433

Memo de trabajo para el Comité: La Restauración de Audio

Primera revisión

Recibió: _____________________________________ Fecha: ______________


Lectura y asignación de evaluador en comité #__________ Fecha: ______________
Evaluación preliminar asignada a: ______________________________
Recomendación:
Reprobado: • Aplazado: • Aprobado: •
Comité #______ Firma Responsable________________________ Fecha: _____________

Comentarios:

Segunda revisión:
434

(1) INVOLUCRADOS

Gustavo Adolfo Valencia Zapata, estudiante de Ingeniería Electrónica


Nivel Académico: Actualmente cursando el 10º semestre.

Nicolás Ramírez Echeverri, estudiante de Ingeniería Eléctrica


Nivel Académico: Curso y aprobó todas las materias del Pensum.

Director: José Ricardo Zapata, Ingeniero de la Universidad Pontificia Bolivariana


Profesión: Ingeniero Electrónico
Lugar de Trabajo: Universidad Pontificia Bolivariana

Asesor: Hernán Valencia Gallón, Ingeniero de la Universidad Pontificia Bolivariana


Profesión: Ingeniero Eléctrico
Lugar de Trabajo: Universidad Pontificia Bolivariana

(2) MODALIDAD

“Monografía”

(3) TEMA DEL PROYECTO

Con las herramientas que ofrecen la electrónica y la informática en la actualidad y de


acuerdo a las posibilidades de nuestro medio, se pretende ofrecer un apoyo en el
planteamiento de soluciones y alternativas para la restauración del audio analógico con
daños y deterioro mediante un tratamiento digital. Con la búsqueda teórica y un desarrollo
de campo amplio, el proyecto pretende abarcar los aspectos necesarios para lograr un
proceso de restauración digital; siendo base fundamental la experimentación y
posteriormente análisis de los resultados para una concreta y real solución de los
problemas del audio analógico deteriorado en el medio de las telecomunicaciones y los
sistemas de sonido.

Teórico Aplicado Gestión


Tipo de Experimental De campo
Trabajo Búsq/Estudio Desarrollo (laboratorio)

% 35 20 10 35 10

Comunicacion Sistemas Circuitos Instrumentac Microprocesador Animaci


Áreas es y Señales Electrónico ión es ón
s y
multimed
ia

% 30 20 20 10 10 10
435

(4) ANTECEDENTES

Desde los inicios de las grabaciones de audio se han empleado los formatos analógicos de
almacenamiento. Ejemplos típicos de estos serian el disco de acetato, casetes, cintas de ½,
¾, ¼, etc. Aunque en la actualidad aun se debate si los medios de almacenamiento digital
permiten más fidelidad del sonido que los formatos analógicos, el audio analógico presenta
una gran desventaja que se encuentra en el deterioro de los medios de almacenamiento.
Muchos medios analógicos van perdiendo calidad con el pasar de los años debido a daños
en las cintas magnéticas causados por la temperatura, estiramiento o en el caso de vinilos el
polvo y otras suciedades que causan rayones y distorsión. En cintas magnéticas se
evidencia esto al ver como con el paso del tiempo, la humedad y la suciedad hacen perder
su calidad. La respuesta a estos inconvenientes se encuentra en la restauración de audio
mediante la digitalización y posterior tratamiento digital. Cualquier fuente de audio se
puede ver beneficiada por la aplicación de la reducción digital de ruido.

Por los acelerados cambios que han sufrido la televisión, radio, cine y demás medios
relacionados con el Audio y video, las técnicas, equipos y formatos de almacenamiento
han evolucionado en el campo de los medios audiovisuales; siendo un punto fundamental
la migración de materiales con formato analógico a formato de reproducción digital.
Con la aparición de las técnicas digitales y el procesamiento de señales, la restauración de
audio adoptó un tratamiento fuertemente digital dejando a un lado los pobres resultados de
técnicas simples de restauración análoga y enfocándose hacia el desarrollo de hardware y
software para una optimización y mejoramiento de este proceso.

En la actualidad es muy abundante el material de audio en formato analógico que se


encuentra en emisoras, universidades y hogares que aun no está en formato digital; un
adecuado tratamiento digital a este material permitiría recuperar mucha de esta
información.

Algunas empresas, relacionadas con el medio audiovisual, ofrecen diferentes alternativas


en software y hardware que contienen poderosas herramientas para procesos de audio y
video en los que se incluye la restauración de audio. A nivel nacional son diversas las
empresas que ofrecen servicios y productos audiovisuales en el área de Posproducción
siendo la digitalización y restauración de audio algunas de sus prestaciones.

En la Universidad Pontificia Bolivariana, tanto a nivel de pregrado como de postgrado el


tema del audio ha tenido un tratamiento muy general enfocándose principalmente en los
modelos matemáticos que describen el fenómeno del sonido y los conceptos y temas
asociados a este. En ningún caso se ha profundizado en un concepto en particular o se ha
trabajado un tema especializado que seria ir más allá de repetir una teoría a aplicarla.
Las siguientes son algunas tesis relacionadas con el tema del audio, que pueden servir de
soporte a este proyecto, trabajadas en la Universidad Pontificia Bolivariana:
436

• Audio digital. Carlos Eduardo Castañeda R. Juan José Rodríguez L.


• Conversión análogo-digital y digital-análoga. Luis Fernando Cadavid Marín.
Alberto León Hernández Cardona.
• Electrónica Musical. Juan Diego Correo Blair.
• Plataforma para procesamiento digital de señales de audio. Ricardo Antonio
García Ortega.

En la búsqueda bibliografía a nivel nacional no se han logrado identificar trabajos


relacionados con la restauración de audio analógico; concentrando nuestra búsqueda en las
diferentes Universidades del país.

Las siguientes son algunas de las empresas Colombianas más representativas en el tema de
posproducción y producción de audio y video; contando con equipos y software de edición
de gama profesional que brindan múltiples técnicas de tratamiento de audio y video
incluyendo la restauración de los mismos.

Empresa Area Website


RCN Audiovisual www.canalrcn.com
Caracol Audiovisual www.canalcaracol.com
Telemedellín Audiovisual www.telemedellin.com
VideoBase Posproducción www.videobase.net

Las siguientes son algunas de las empresas más representativas en el tema de la


restauración de audio.

Empresa Producto Descripción


Software Hardware
Sony Sound Forge Edición de Audio
Adobe Audition Edición de Audio
Steinberg Wavelab Recuperación de la calidad de Audio
Pinnacle Steinberg Clean Recuperación de la calidad de Audio
CEDAR Cedar para Tarjetas/conversores Restauración de Audio
Windows
SONIC NoNoise NoNoise Restauración de Audio
solutions
Canopus Utilidades Edición de video
Pinnacle Tarjetas de video Edición de Video
IberAlp Cube Tec Sistema Informático de Audio
IberAlp Conversores Convertidor AD y DA para audio
DataVideo Conversores Línea DAC
Promax Conversores Línea DA-MAX+
Canopus Tarjetas/conversores Edición de Video
437

(5) OBJETIVOS

Objetivo general:

Redactar un documento que permita conocer mediante bases teóricas y ejemplos los
procesos, métodos y elementos más significativos relacionados con el tratamiento digital
orientado a la restauración de audio.

Objetivos específicos:

• Describir el proceso de la restauración de audio desde su digitalización hasta su


tratamiento digital.
• Orientar al personal de la emisora de la Universidad Pontificia Bolivariana en el
proceso de restauración de audio.
• Describir el proceso de eliminación de las degradaciones presentes en las señales de
audio. (Ej: Declicking, etc…..)
• Explicar los fenómenos físicos que ocurren en los medios de almacenamiento de
audio analógico que hacen necesaria su restauración.
• Generar material de apoyo pedagógico a la nueva línea optativa en audio de
ingeniería.
• Llevar a la práctica con ejemplos el proceso de la restauración de audio.

(6) JUSTIFICACIÓN Y BENEFICIOS

Las motivaciones personales nacen de nuestra profunda afición a los temas referidos con el
Audio y sus avances tecnológicos y la posibilidad de contar con equipos de audio de alto
perfil profesional para desarrollar un beneficioso trabajo de campo. La restauración de
Audio por medios digitales es un tema que aun no se abordado en Trabajo de Grados en el
medio local.
El trabajo de grado servirá como material pedagógico a la línea optativa en audio de la
facultad de ingeniería; no siendo solo un beneficio educativo sino un apoyo tecnológico
social al contribuir con asesoramiento en la adquisición de nuevas tecnologías para la
restauración de audio, proceso que se encuentra activo actualmente en la emisora de la
Universidad Pontificia Bolivariana, además con el desarrollo del trabajo de grado se
apoyará la capacitación del personal de la emisora, elevando el nivel de calidad de esta y
proporcionando un mejor servicio de radiodifusión a la radioescucha.

Nuestro asesoramiento a la emisora de la Universidad Pontificia Bolivariana será de gran


utilidad debido a que en el proceso de adquisición de los materiales de hardware y software
no se ha hecho la investigación debida.

Cabe anotar que cuando la emisora se familiarice con dichos procesos no vera necesario
contratar los servicios de Tranfer a terceros.
438

(7) ALCANCES

Describir claramente el proceso necesario para la correcta restauración de audio Analógico,


así como mostrar los elementos (software y hardware) que participan en este proceso.
Un alcance fundamental será contribuir con la modernización de la emisora de la
Universidad Pontificia Bolivariana.

(8) TABLA DE CONTENIDOS

Capítulos Enfoque Materia Comentario


1. Introducción Teórico Introducción al trabajo de
grado
2. Conceptos de Teórico Física de Ondas Definiciones e introducción a
Sonido y Sistemas y Señales la restauración de Audio
Restauración
de Audio
3. Material de Teórico Investigación Medios de audio análogos
Audio Análogo Daños y deterioro de medios
analógicos de Audio.
4. Tratamiento al Teórico Investigación Descripción de los
medio físico de tratamientos “reconstructivos”
almacenamiento de de los medios físicos de
audio análogo. almacenamiento de audio
análogo previos a la
digitalización.
5. Captura de audio Teórico Microprocesadores Proceso de digitalización de la
analógico Práctico Sistemas y señales señal de audio analógica.
Instrumentación Conversores A/D. Criterios de
selección de los equipos
conversores.
6. Tratamiento digital de Teórico Sistemas y señales Procedimiento de restauración
la señal de audio para digital de Audio y ejemplos.
su restauración Mención de algoritmos de
restauración (DSP)
7. Material de audio Teórico Investigación Medios de almacenamiento
digital. digitales de audio
8. Grabación y Teórico Sistemas y señales Medios de reproducción digital
reproducción de la Microprocesadores de audio.
señal restaurada Investigación Conversión D/A
9. Conclusiones Teórico Resultados obtenidos
10. Bibliografía
Anexos Teórico Investigación Anexos relacionados con el
trabajo de grado
Experiencias del Teórico Relato de lo aprendido,
trabajo con la emisora Practico problemas encontrados y
de la Universidad soluciones planteadas en el
439

Pontificia Bolivariana trabajo con la emisora.

(9) PRESUPUESTO Y RECURSOS NECESARIOS

Tabla de recursos Participación (miles de pesos) Implica desembolso


Recursos Estudiant Servicio Préstamo Donación SI NO
presupuestados e s UPB (Nuevo) (Existente
)
Fotocopias y 300 300
Bibliografía.

Internet, llamadas y 180 180


fax larga distancia.

Transporte y estadía
en otras ciudades.

Servicios de 2000 200 1800


Cómputo

Materiales y 200 15000 200 15000


componentes
Hardware

Licencias Software 6500 6500

Alquiler de espacios 2000 2000


físicos

Trabajo Director (40 1400 1400


h @ 35k$/h
Especialista)

Trabajo Asesor (15 h 525 525


@ 35k$/h
Especialista)

Imprevisibles (10%) 100 50 150

SUBTOTALES (Por 2780 50 23500 1925 1030 27225


columna)

TOTALES 28255 28255


440

(10) FINANCIACIÓN

Gran parte de los recursos requeridos corren por cuenta de los estudiantes que hacen parte
de este proyecto. Durante el proceso de trabajo de grado se recibirá la ayuda de la Emisora
de la Universidad Pontificia Bolivariana y la empresa VideoBase en el préstamo de equipos
de Audio y video profesionales. Se contara con dos estudios de audio profesional con líneas
de radiodifusión y posproducción a disposición del proyecto.

(11) CRONOGRAMA Y OCUPACIÓN

Actividades MES Ocupació


n
Ener Febrero Marzo Abri Mayo Juni Julio Horas
o l o
1. Búsqueda de 250
Bibliografía
2. Formulación del 50
Proyecto
3. Familiarización de 150
equipos Análogos
y
Digitales de Audio
4. Digitalización de 80
Señales de Audio
5. Tratamiento de 300
Señales Digitales
de
Audio
6. Restauración de 100
Audio
7. Apoyo a la 125
Emisora
de la Universidad
8. Redacción del 300
Informe
9. Revisión del -
informe por
Jurados
Horas Totales 1355
Numero de 2 Horas promedio Integrante 677.5
graduados
441

(12) BIBLIOGRAFÍA

Libros

[1] Tratamiento Digital de Señales


Jhon G. Proakis
Prentice Hall
Biblioteca Universidad Pontificia Bolivariana

[2] Procesamiento de señales analógicas y digital


Ashok Albardar
Thomson 2002
Biblioteca Universidad de Antioquia

[3] Digital Audio Restoration: A Statistical Model Based approach


Simon J. Godsill.
http://www-sigproc.eng.cam.ac.uk/~sjg/springer/

[4] Digital signal Processing Algorithms


Hari Krishna Garg
CRC Press 1998
Biblioteca Universidad de Antioquia

[5] Tesis
Audio Digital
Carlos Eduardo Castañeda
Juan Jose Rodriguez 1985
Biblioteca Universidad Pontificia Bolivariana

[6] Tesis
Electrónica Musical
Juan Diego Correa 1999
Biblioteca Universidad Pontificia Bolivariana

[7] Digital Signal Processing Principles algorithms and applications


Jhon G. Proakis, Dimitris Manolakis
Prentice may 1996
Biblioteca Universidad de Antioquia

[8] Noise and other interfering signals


Ralph Morrison
Biblioteca Universidad de Antioquia
442

[9] Handbook for Sound Engineers


Ballu Glen
Sams, 1991
Biblioteca Universidad Nacional de Colombia Seccional Medellín

[10] Sistemas de Comunicaciones


Haykin
Editorial Limusa
Colección Personal

[11] Sound System Engineering


Don Davis, Carolyn Davis
Sams, 1987
Biblioteca Universidad Nacional de Colombia Seccional Medellín

Sitios en Internet

[12] Introduction to Audio Restoration – The Concepts


www.cedar-audio.com

[13] Restauración Digital de Sonido.


http://www.arrakis.es/~fonotron/dsr.html

[14] Back to Analog


http://www.digido.com/portal/pmodule_id=11/pmdmode=fullscreen/pageadder_
page_id=37/

[15] Preparing tapes and files for mastering


http://www.digido.com/portal/pmodule_id=11/pmdmode
=fullscreen/pageadder_page_id=38

[16] Model-Bases Analysis of Noisy Musical Recordings with Applications to Audio


Restoration
http://lib.hut.fi/Diss/2004/isbn9512269503/isbn9512269503.pdf

[17] Audio Signal Processing


http://www.lectrosonics.com/wg/wgaud.pdf

[18] Audio tutorial


http://www.obsoleteelectronics.com/21065L_Audio_Tutorial.PDF

[19] Audio Terms


http://www.peavey.com/support/technotes/
443

[20] Software de edición y manipulación del audio digital


http://www.laorejadigital.com/default.php?echohtml
=%2Frevista%2Ftutorial%2Fesdi_
audio3%2Fdocu.php3%3F

[21] Cube Tec, Procesado de Señal


http://www.iberalp.es/Descripciones/cubetec/vpis.htm

[22] Transferring LPs to CDR: Some Advice


http://www.delback.co.uk/lp-cdr.htm#clean

[23] Audio Restoration


http://perso.wanadoo.fr/jlf/restoration.htm

[24] LEARN Datavideo Secrets


http://www.datavideo.us/

[25] Sistema informático de audio, multicanal, 24 bits y 192 kHz


http://www.iberalp.es/Productos/gama_de_productos.htm

[26] Convertidor AD y DA para audio


http://www.iberalp.es/Productos/gama_de_productos.htm

[27] Convertidores AD/DA


http://www.promax.com/products/
444

ACTA DE PROPIEDAD INTELECTUAL del Proyecto: La Restauración de Audio

1. Los derechos morales de autor corresponden al autor principal y a toda persona que, a
criterio de éste, haga aportes originales intelectuales en los avances y en el resultado final
del proyecto. Al director le asiste el derecho de mención.
El director y el graduando serán autor y coautor de todas las publicaciones nacionales e
internacionales que genere el proyecto. Estos a su vez determinarán cuales de los
colaboradores deben ser mencionados según sus aportes en el proyecto. Adicionalmente, en
cualquier tipo de divulgación que se haga del trabajo se dará crédito a La Universidad
Pontificia Bolivariana, Ingenierías Eléctrica y Electrónica, Grupo de investigación, etc...

2. Derechos patrimoniales:
Los derechos patrimoniales podrán pertenecer conjunta o separadamente a los creadores, a
la Universidad o a otras personas y organismos, dependiendo de la modalidad bajo la cual
el realizador ejecute la producción intelectual. Debe describirse claramente en que manera
o proporción se hará la repartición de los derechos industriales o de explotación en caso de
generarse estos.
En caso de obtener financiación por parte de alguna entidad, antes de iniciar cualquier
explotación comercial de la investigación se deberá suscribir un acuerdo entre las partes, a
saber: Universidad Pontificia Bolivariana, Entidad Financiadora, autor(es), en el cual se
determinan los derechos y obligaciones de las partes.

3. Causales de retiro. El retiro podrá ser voluntario o ser motivado por el incumplimiento de
las obligaciones de una de las partes, a criterio del director.

4. Costos: Se declara el costo estimado total, y cuánto de estos requiere desembolsos, y se


hace referencia a la “Tabla de recursos necesarios” para explicar la participación relativa de
los involucrados.

5. Constancias: Todos los partícipes han estudiado y aceptan el “Estatuto de propiedad


intelectual” de la Universidad Pontificia Bolivariana, el reglamento de elaboración de
trabajos de grado IEE y el proyecto del trabajo de grado; y se comprometen a cumplir los
deberes que estipulan en estos.

____________________________ ____________________________
Gustavo Adolfo Valencia Zapata Nicolás Ramírez Echeverri
Estudiante Estudiante
CC. 3.396.765 de Envigado CC. 98.670.385 de Envigado

____________________________ ____________________________
José Ricardo Zapata Hernán Valencia Gallón
Director Asesor
CC. 71.375.690 de Medellín CC. 8.281.231 de Medellín
295

ANEXO A

DISPOSITIVOS REPRODUCTORES Y/O GRABADORES DE AUDIO


ANALÓGICO
296

FONÓGRAFO

El fonógrafo fue creado por Thomas Alva Edison en 1877 y, entre sus inventos,
fue el que más orgullo le produjo. El sonido se grababa en un cilindro que
luego se hacía girar contra una aguja. Ésta subía y bajaba en los surcos del
cilindro, produciendo vibraciones que se amplificaban en una bocina cónica.
Debido al movimiento vertical de la aguja, este método de grabación se
denominó proceso de "Registro en profundidad".

El fonógrafo de Edison fue la primera máquina capaz de grabar y reproducir


sonidos. Se fabricaron diversos modelos pero todas sus características técnicas
eran iguales, sus variaciones estaban en el tipo de madera utilizada para la
construcción de su base, su forma física y la del embudo amplificador.

Figura 105. Fonógrafos.


Fuente: Phonophan. Antique Phonographs for Sale [en línea]. s.l.: Phonophan, 2005.
<http://www.phonophan.com/sales.html> [consulta: 20 May. 2005]
297

AMBEROLA

El principio de funcionamiento de la amberola era básicamente el mismo del


fonógrafo. La diferencia entre uno y otro radicaba en el tipo de cilindro que
reproducían. El cilindro de la amberola, que se caracterizaba por su color azul,
estaba construido con un plástico llamado amberol, que debía rotar a mayor
velocidad y tenía mejor calidad de sonido. Desde el punto de vista
constructivo, este cilindro implicó dos variantes para a la amberola. La primera
de ellas estaba en el sistema de engranajes que debía tener una configuración
diferente para lograr que el cilindro girara a la velocidad adecuada. La otra era
que la aguja de la amberola debía ser más delgada para desplazarse por los
finos canales del nuevo cilindro.

La Edison Company fabricó un tipo de amberola que poseía diferentes tipos de


agujas y una pequeña palanca que, al desplazarla, cambiaba la relación de
engranajes del mecanismo de rotación. De esta manera se obtuvo una
máquina con capacidad para reproducir ambos tipos de cilindro. Esta máquina
siguió llamándose fonógrafo, la amberola sólo reproducía cilindros de amberol.
298

Figura 106. Amberola.


Fuente: The oficial homepage for Lisa and Mike. Antiques: Edison Amberola [en línea].
s.l.: Lisa and Mike, 2005
http://www.lisaandmike.com/PhonographEdisonAmberola.htm
[consulta: 26 May. 2005]
Fuente: Phonophan. Antique Phonographs for Sale: The ghosts of phonograph past…
[en línea]. s.l.: Phonophan, 2005.
<http://www.phonophan.com/sold.html> [consulta: 26 May. 2005]
299

GRAMÓFONO

La creación del gramófono se le otorgó al inventor de origen alemán Emile


Berliner, en 1888. Su principal diferencia con el fonógrafo era que, en lugar de
utilizar cilindros como medio de grabación, usaba discos planos. Al igual que el
fonógrafo, reproducía sonido con una aguja cuyas vibraciones mecánicas se
amplificaban mediante una bocina cónica. El movimiento de la aguja sobre la
superficie del disco era lateral (de un lado a otro) y de afuera hacia adentro.
Inicialmente, la rotación del disco debía hacerse en forma manual, a través de
una manivela. Posteriormente, se dotaron con motores de muelle a los que
había que dar cuerda.

La popularidad del gramófono hizo que se fabricaran con distintas tipologías.


En Francia se construyó un modelo en el que la aguja se desplazaba por el
disco desde adentro hacia afuera, en sentido inverso al usual y con el disco
girando a 90 RPM. Esta máquina era capaz de producir un sonido de
excepcional calidad para la época. Los fabricantes suizos de cajas de música se
especializaron en la producción de pequeños gramófonos portátiles.
300

Figura 107. Gramófonos


Fuente: Phonophan. Antique Phonographs for Sale [en línea]. s.l.: Phonophan, 2005.
<http://www.phonophan.com/sales.html> [consulta: 27 May. 2005]
Fuente: HOWE, Tom. CED Magic: CED in the History of Media Technology
[en línea]. Portland. HOWE, Tom, 2005.
<http://www.cedmagic.com/history/berliner-gramophone.html>
[consulta: 27 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
301

ALAMBRE

El grabador y reproductor de alambre fue el primer dispositivo dotado con las


condiciones mínimas para utilizar adecuadamente el principio de la grabación
magnética en el almacenamiento de sonidos. Sin embargo, su pobre respuesta
en frecuencia (70 a 6.000 Hz.) lo redujo a grabaciones de voz en dictáfonos y
telégrafos.

El aparato contaba con una perilla para el volumen, controles para seleccionar
entre modo de grabación o reproducción, botones de encendido y apagado,
una entrada para micrófono y un altavoz interno. Algunos modelos tenían
indicadores del nivel de volumen y de grabación, pero no eran muy exactos.

Figura 108. Grabadores y reproductores de alambre


Fuente: MORTON, David. The history of sound recording technology: Wire recorders
[en linea]. s.l.: MORTON, David, 2003.
<http://www.recording-history.org/HTML/morewire.htm>
[consulta: 27 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
302

CARRETE ABIERTO

Durante la era analógica, los grabadores de carrete abierto eran considerados


los sistemas de audio profesional por las características de su cinta, expuestas
anteriormente. Estas características permitieron, al equipo grabador y
reproductor de carrete abierto, contar con unas especificaciones técnicas que
sobrepasaban ampliamente todas las de sus homólogos de otros formatos.
Entre estas características sobresalen:

• Respuestas en frecuencia que podían ir desde 20 hasta 30.000 Hz, de


acuerdo con la velocidad de grabación y la calidad de la cinta.
• Diversidad de entradas y salidas: RCA, ¼” TRS, micrófonos y en
algunos modelos más recientes entradas y salidas XLR balanceadas.
• Capacidad de selección entre diversas velocidades de grabación:
desde 1 7/8 pps hasta 30 pps
• Algunos modelos poseían hasta 4 indicadores del nivel de grabación
independientes para cada una de las pistas de la cinta
• Capacidad para soportar carretes hasta de 10.5” de diámetro
• Supresores de ruido
• Bajos niveles de wow y flutter < a 0.05%, grabando a altas
velocidades.
• Conector para controles remoto alámbricos
• Posibilidad de operación a 50 ó 60 Hz. y a diferentes niveles de
voltaje.
303

Figura 109. Grabadores y reproductores de carrete abierto


Fuente: MIDI Classics. Open Reel Recorder: BR-20 Open Reel Recorder – B Stock [en
linea]. Weatogue. MIDI Classics, 2005.
<http://www.midi-classics.com/h/h22423.htm>
[consulta: 23 May. 2005]
Fuente: ebaY Store. Vintage Electronics: Reel-to-reel tape recorders
[en línea]. s.l.: ebaY, 2005.
<http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&category=67814&item=578176534
5&rd=1> [consulta: 23 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
304

TOCADISCOS

El disco fue la manera más popular de almacenar sonido en la era del audio
analógico, lo que produjo que el desarrollo y el mercado de los tocadiscos sean
tan amplios, incluso hoy en día se comercializan. Desde el punto de vista de su
construcción, todos los tocadiscos están diseñados de la misma manera: una
bandeja giratoria, un brazo con una aguja en un extremo, controles de
velocidad y salidas para los canales izq. y der. de audio que, por lo general,
deben ir a un amplificador. Las diferencias entre modelos están en los
materiales utilizados para construir el equipo, que pueden variar en calidad, la
capacidad para reproducir discos de diferentes tamaños y velocidades y en el
hecho de que algunos tienen sistemas antivibratorios y antideslizantes para
evitar que la aguja se mueva bruscamente por la superficie del disco.

Por lo general, las velocidades de reproducción de los tocadiscos pueden variar


entre 33 1/3 RPM o 45 RPM y los tamaños entre 7” ó 10”, ya que es lo más
corriente. Sin embargo, existen aún tocadiscos que, incluso, pueden reproducir
discos de 78 RPM y 33 1/3 RPM de 12”.

En esta categoría, pero en otro nivel, también están los tocadiscos ópticos o
láser, cuya fotografía se presenta a continuación. La diferencia de éste con el
tocadiscos convencional es que utiliza un rayo láser en lugar de una aguja para
leer los surcos del disco, que logra eliminar el contacto físico con el disco y, por
lo tanto, incrementa la calidad del sonido. Puede reproducir discos desde 30 a
50 RPM y de diámetros hasta 12”, posee una respuesta en frecuencia de 20 a
25.000 Hz.

(Para adquirir mayor información sobre este equipo, se sugiere la visita de la


página Web de ELP Laser Turntable, http://www.elpj.com/.)
305

Figura 110. Tocadiscos.


Fuente: ebaY Store. Vintage Electronics R-US: All Categories
[en línea]. s.l.: ebaY, 2005.
<http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&category=48649&item=578065070
7&tc=photo> [consulta: 15 May. 2005]
Fuente: Amazon. Electronics. Turntables & Accessories: Sony PSLX350H Stereo
Turntable System [en línea]. s.l.: Amazon, 2005.
<http://www.amazon.com> [consulta: 15 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.

Figura 111 Tocadiscos óptico o láser.


Fuente: ELP Laser Turntable [en línea]. s.l.: WAUGH, Max, 2005.
<http://www.elpj.com> [consulta: 1 Jun. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
306

CARTUCHOS RCA

Este tipo cartucho no alcanzó la popularidad suficiente como para generar un


desarrollo pleno de sus equipos reproductores y grabadores. Por esta razón es
claro que existen muy pocos modelos y con características muy básicas de uso,
diseño y sonido. Además de los controles básicos de volumen, play, stop y
rewind (no tenía forward), el equipo estaba dotado de un altavoz, una entrada
para micrófono externo y una pequeña palanca que cambiaba la velocidad de
grabación del cartucho entre 3.75 pps o 1 7/8 pps. Utilizaba tecnología de
tubos de vacío y su cuerpo tenía la notable característica de estar construido
casi enteramente de plástico.

Figura 112. Grabador y reproductor de cartuchos RCA.


Fuente: ebaY Store. Vintage Electronics. Rell-to-reel tape recorders: other brands [en
línea]. s.l.: ebaY, 2005.
<http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&category=15000&item=578157880
3&rd=1&ssPageName=WDVW> [consulta: 1 Jun. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
307

SANYO MICRO PACK 35

Esta pequeña grabadora fue la primera forma de grabación portátil que tenía
como función esencial la grabación de voz o de periodista. Debido a esto, sus
características eran muy básicas y sus controles muy limitados, apenas
contaba con un control de volumen, un botón de grabación, un botón de
reproducción, un altavoz y un micrófono incorporado. Su tamaño compacto y
portátil la limitaba únicamente a fuentes de energía portátiles o baterías.

Figura 113. Sanyo Micro Pack 35.


Fuente: TEDESCHI, Enrico. Old radio digital world: Items for Sale, Miscellaneous items
for sale [en línea]. Brighton. TEDESCHI, Enrico, 2002.
<http://www.etedeschi.ndirect.co.uk/sale/miscellanea.htm>
[consulta: 28 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
308

CARTUCHO DE 4 PISTAS

El cartucho de 4 pistas fue un formato de poca duración y su aplicación se dio


de manera amplia en reproductores de automóviles. Se fabricaron algunos
modelos portátiles y de mesa, pero estos últimos no eran muy comunes.

Sus características eran aceptables, pero su escaso mercado no le permitió un


gran despliegue. Sus controles eran los básicos, su respuesta en frecuencia
podía ir desde 30 a 20.000 Hz. y apenas tenían salidas para sus canales
izquierdo y derecho o altavoces. Algunos modelos de mesa tenían control de
tono y entradas para micrófonos.

Figura 114. Grabadores y reproductores de cartuchos de 4 pistas.


Fuente: 8-track heaven. 4 track stuff: muntz porta four [en línea].
s.l.: 8-track heaven, 2005 <http://www.8trackheaven.com/4-track-pics.html>
[consulta: 28 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
309

CARTUCHO DE 8 PISTAS

El cartucho de 8 pistas fue una evolución del cartucho de 4 pistas, tanto en su


formato como en el equipo reproductor y grabador. Fue más popular que el
cartucho de 4 pistas, lo que propició un mayor desarrollo y más variedad de
equipos. Se encontraban equipos para automóviles, portátiles y de mesa,
incluso había modelos que también tenían tocadiscos. Entre sus características
se destacan:

• Circuitos supresores de ruido como el Dobly NR


• Indicadores de nivel de reproducción y grabación
• Control de nivel de reproducción y grabación independiente para
cada canal (izquierdo o derecho). En algunos modelos también
automático.
• Función de repetición de cinta un vez o indefinidamente.
• Entradas de ¼” TRS para micrófonos.
• Salidas de ¼” TRS para audífonos.
• Auto detención de la reproducción al terminar la cinta.
• Salidas y entradas RCA no balanceadas.
310

Aa) Ab) Ac)

Figura 115. Grabadores y reproductores de cartuchos de 8 pistas. a) Portátil, b) De


mesa, c) De automóvil.
Fuente: ebaY Store. Vintage Electronics R-US: All Categories
[en línea]. s.l.: ebaY, 2005.
<http://stores.ebay.com/Vintage-Electronics-R-
US_W0QQcolZ4QQdirZ1QQdptZ0QQftidZ2QQpZ2QQtZkm>
[consulta: 25 May. 2005]
Fuente: Dad's 8-Track Attack!. Dad's 8-Track Car Players! [en línea]. s.p.i.
<http://www.hooked.net/~danasam/car.html>
[consulta: 25 May. 2005]
Fuente: Dad's 8-Track Attack!. Dad's 8-Track Portable Players! [en línea]. s.p.i.
<http://www.hooked.net/~danasam/port.html> [consulta: 25 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
311

AUDIO CASETE COMPACTO

El casete de audio compacto fue el formato de cinta magnética más popular de


la historia, incluso hoy en día se fabrican modelos con características muy
aceptables. Existen grabadores/reproductores de todos los tipos posibles con
diversidad de características, de acuerdo con su aplicación y funcionalidad.
Entre las características de estos reproductores se pueden destacar:

• Respuesta en frecuencia de 30 a 13.000 Hz. para modelos de antaño, de


30 a 14.000 Hz. para modelos domésticos y de 20 a 18.000 Hz. para
modelos profesionales, según el tipo de cinta
• Niveles de wow y flutter de 0.15% en modelos de antaño y domésticos y
de 0.06% para profesionales.
• Sistemas supresores de ruido
• Selector del tipo de cinta: normal, cromo o metal.
• Entradas y salidas RCA no balanceadas (todos los modelos)
• Entradas y salidas para micrófonos y audífonos, respectivamente.
• Los modelos profesionales cuentan, además, con sistemas de búsqueda
de pistas, interfaces de comunicación con computadores y consolas de
audio profesional, entradas y salidas para conexión de varios equipos en
cascada y selector automático del tipo de cinta.
312

Figura 116. Grabadores y reproductores de casete de audio compacto.


Fuente: Peformance Audio. Products: Denon profesional DN-780R [en línea].
s.l.: Performance Audio, 2005.
<http://www.performanceaudio.com/cgi/pages.cgi?buildPage=item&ProductID=00511
9> [consulta: 15 May. 2005]
Fuente: ebaY Store. Consumer Electronics. Vintage Electronics: Cassette Decks.
[en línea]. s.l.: ebaY, 2005.
<http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&category=71574&item=578031347
4&rd=1&ssPageName=WDVW> [consulta: 15 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
313

PLAYTAPE

El playtape 1200, como el de la figura que se presenta a continuación, fue uno


de los diversos modelos de playtape portátiles que se fabricaron. Tenían
básicamente las mismas características técnicas, sólo diferían en su forma.

Dada su característica de portátil, por lo general, la alimentación era de con


base en baterías, aunque algunos modelos tenían entradas para fuentes de
alimentación externas. Sus altavoces eran internos y tenían perillas para
control de volumen, selección de canales (1, 2 o estéreo). Algunos modelos
poseían control de tono. Únicamente contaban con una salida de ¼” TRS para
conectar un altavoz externo o unos audífonos. También se fabricaron playtapes
de mesa pero los modelos portátiles eran los que más se utilizaban en la
época.
314

Figura 117. Playtape.


Fuente: 8-track heaven. Playtape - the 2-track alternative [en línea].
s.l.: 8-track heaven, 2005 <http://www.8trackheaven.com/playtape.html>
[consulta: 30 May. 2005]
Fuente: Dad's 8-Track Attack!. Dad's 8-Track Collectibles & Unique! [en línea]. s.p.i.
<http://www.hooked.net/~danasam/collect.html>
[consulta: 30 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
315

MICROCASETE

Por tratarse de un formato limitado para grabaciones de voz, sus


reproductores son muy simples en cuanto a sus controles, especificaciones
técnicas y sus interfaces de comunicación. La mayoría de estos dispositivos,
además de los botones corrientes de control, posee un pequeño altavoz, un
micrófono interno y una salida de ¼” TRS para audífonos. Algunos modelos
tienen un selector para variar la velocidad de grabación.

Su característica de portátil implica una alimentación con base en baterías,


aunque existen modelos con entradas para conexión a fuentes de alimentación
externas.

Figura 118. Grabadores y reproductroes de microcasete.


Fuente: Amazon. Electronics. Audio & Video. Portable Audio & Video: Sony M-670V
Microcassette Voice Recorder [en línea]. s.l.: Amazon, 2005.
<http://www.amazon.com> [consulta: 12 May. 2005]
Fuente: ebaY Store. Consumer Electronics. Portable Audio: Voice Recorders [en línea].
s.l.: ebaY, 2005.
<http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&item=5781062514>
[consulta: 12 May. 2005]
316

ELCASET

Grabador y reproductor desarrollado específicamente para el cartucho elcaset.


Todos los modelos eran de características técnicas similares y una de sus
principales innovaciones es que tenía tres cabezas de reproducción. Además de
los controles convencionales con los que cuenta cualquier reproductor de
cintas, en este equipo se pueden destacar:

• Botón de reducción de ruido Dolby NR


• Selector de tipo de cinta: TYPE I: Normal TYPE II: Metal TYPE III: Cromo
• Perilla de nivel de grabación para controlar la intensidad de la señal
proveniente del micrófono
• Medidores de nivel de grabación y reproducción

Entre sus especificaciones técnicas se puede destacar su respetable respuesta


en frecuencia de 25 a 22.000 Hz, su bajo nivel de wow y flutter en 0.04%, y su
distorsión armónica total de 0.8%. En cuanto a sus interfaces de conexión, el
dispositivo contaba con las siguientes entradas y salidas:

• 2 entradas para micrófonos


• 1 entrada RCA estéreo no balanceada
• 2 entradas ¼” TRS estéreo no balanceadas
• 2 salidas ¼” TRS estéreo no balanceadas
• 1 salida para audífonos
317

Figura 119. Grabador y reproductor Elcaset


Fuente: M, Hintze. Consumer Audio Equipment. The Elcaset. Elcaset Tape Decks
[en línea]. s.l.: M. Hintze, 2005.
<http://mhintze.tripod.com/audio/elcaset/decks.htm>
[consulta: 28 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
318

ANEXO B

CONVERSORES ANÁLOGO-DIGITAL Y DIGITAL-ANÁLOGO DE AUDIO


319

CONVERSORES MÓVILES

Audiophile USB

Figura 120. ADC/DAC móvil Audiophile USB.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/products/en_us/AudiophileUSB-main.html>
[consulta: 11 May. 2005]

Marca: M-AUDIO

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 96.000 HZ
• Salida analógica de audio: no balanceada RCA
• Entrada analógica de audio: balanceada ¼” TRS y no balanceada RCA
• Entrada y salida digital de audio: S/PDIF coaxial y MIDI
• Rango dinámico: 109 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
• Interfaz digital: USB
• Plataforma: MAC - Windows
320

FireWire Audiophile

Figura 121. ADC/DAC móvil FireWire Audiophile.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/products/en_us/FirewireAudiophile-main.html>
[consulta: 11 May. 2005]

Marca: M-AUDIO

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima : 96.000 HZ
• Entrada y salida analógica de audio: no balanceada RCA
• Entrada y salida digital de audio: S/PDIF coaxial y MIDI
• Rango dinámico: 108 dB
• Respuesta en frecuencia: 20 – 40.000 Hz
• Interfaz digital: FireWire
• Plataforma: MAC - Windows
321

FireWire Solo

Figura 122. ADC/DAC móvil FireWire Solo.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/products/en_us/FireWireSolo-main.html>
[consulta: 11 May. 2005]

Marca: M-AUDIO

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 96.000 HZ
• Entrada analógica de audio: no balanceada ¼” TRS
• Salida analógica de audio: balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial y MIDI
• Rango dinámico: 102 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
• Interfaz digital: FireWire
• Plataforma: MAC - Windows
322

Waveterminal U24

Figura 123. ADC/DAC móvil Waveterminal U24.


Fuente: Audio products. Guia de productos: tarjetas. [en línea]. s.l.: ESI, 2005.
<http://www.thomann.de/thoiw2_esi_waveterminal_u24_prodinfo.html?sn=43d0a519
0c077250eab81b97b514bff5>
[consulta: 12 May. 2005]

Marca: ESI

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo: 32.000/44.100/48.000 HZ
• Entrada analógica de audio: no balanceada ¼” TRS
• Salida analógica de audio: balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial y óptica
• Rango dinámico: 100 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
• Interfaz digital: USB
• Plataforma: MAC - Windows
323

PHASE 26 USB

Figura 124. ADC/DAC móvil PHASE 26 USB.


Fuente: Audio products. Terratec producer: phase 26. [en línea]. s.l.: Terratec, 2005.
<http://audioen.terratec.net/modules.php?op=modload&name=News&file=article&sid
=6> [consulta: 13 May. 2005]

Marca: Terratec

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 96.000 HZ
• Entrada y salida de analógica de audio: no balanceada RCA
• Salida analógica de audio: balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial, óptica y MIDI
• Rango dinámico: 106 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
• Interfaz digital: USB
• Plataforma: MAC - Windows
324

PHASE 88 rack FireWire 751

Figura 125. ADC/DAC móvil PHASE 88 rack FireWire 751.


Fuente: Audio products. Terratec producer: phase 88 rack. [en línea]. s.l.: ESI, 2005.
<http://audioen.terratec.net/modules.php?op=modload&name=Sections&file=index&r
eq=viewarticle&artid=32>
[consulta: 12 May. 2005]

Marca: Terratec

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 96.000 HZ
• Entrada y salida de analógica de audio: balanceada ¼” TRS y XLR
• Entrada y salida digital de audio: S/PDIF coaxial, óptica y MIDI
• Interfaz digital: tarjeta PCI o USB
• Plataforma: MAC - Windows
325

MOTU 896HD

Figura 126. ADC/DAC móvil tipo rack MOTU 896HD.


Fuente: Audio decks. Products: PCI audio. [en linea]. s.l.: MOTU, 2005.
<http://www.motu.com/products/motuaudio/896/body.html/en>
[consulta: 26 May. 2005]

Marca: MOTU

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 192.000 HZ
• Entrada y salida de analógica de audio: balanceada ¼” TRS y XLR
• Salida analógica de audio: balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial, óptica y MIDI
• Interfaz digital: FireWire
• Plataforma: MAC - Windows
326

MOTU HD192

Figura 127. ADC/DAC móvil tipo rack MOTU HD192.


Fuente: Audio decks. Products: PCI audio. [en linea]. s.l.: MOTU, 2005.
<http://www.motu.com/products/pciaudio>
[consulta: 26 May. 2005]

Marca: MOTU

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 192.000 HZ
• Entrada y salida de analógica de audio: balanceada XLR
• Salida analógica de audio: balanceada ¼” TRS
• Rango dinámico: 120 dB
• Interfaz digital: tarjeta PCI
• Plataforma: MAC - Windows
327

ADI-2

Figura 128. ADC/DAC móvil ADI-2.


Fuente: Audio decks. Audio converters: ADI-2. [en linea]. s.l.: RME, 2005.
<http://www.rme-audio.com/english/adi/adi2.htm>
[consulta: 26 May. 2005]

Marca: RME

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 192.000 HZ
• Entrada y salida de analógica de audio: balanceada ¼” TRS y XLR
• Salida analógica de audio: balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial y óptica
• Rango dinámico: 119 dB
• Interfaz digital: tarjeta PCI
• Plataforma: MAC - Windows
328

CONVERSORES ESTÁTICOS

Delta 1010LT

Figura 129. ADC/DAC estático Delta 1010LT.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/products/en_us/Delta1010LT-main.html>
[consulta: 11 May. 2005]

Marca: M-AUDIO

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 96.000 HZ
• Entrada y salida de analógica de audio: no balanceadas RCA y
balanceada XLR
• Entrada y salida digital de audio: S/PDIF coaxial y MIDI
• Rango dinámico: 101.5 dB
• Respuesta en frecuencia: 22.000 – 40.000 Hz
• Interfaz digital: PCI
• Plataforma: MAC - Windows
329

Delta 44

Figura 130. ADC/DAC estático Delta 44.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/products/en_us/Delta44-main.html>
[consulta: 11 May. 2005]

Marca: M-AUDIO

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 96.000 HZ
• Entrada y salida de analógica de audio: no balanceadas RCA y
balanceada ¼” TRS
• Rango dinámico: 103 dB
• Respuesta en frecuencia: 22.000 – 40.000 Hz
• Interfaz digital: PCI
• Plataforma: MAC - Windows
330

Audiophile 192

Figura 131. ADC/DAC estático Terratec phase 28.


Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/products/en_us/Audiophile192-main.html>
[consulta: 11 May. 2005]

Marca: M-AUDIO

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 192.000 HZ
• Entrada y salida de analógica de audio: balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial y MIDI
• Rango dinámico: 113 dB
• Respuesta en frecuencia: 22.000 – 48.000 Hz
• Interfaz digital: PCI
• Plataforma: MAC - Windows
331

Terratec Phase 28

Figura 132. ADC/DAC estático PHASE 28.


Fuente: Audio products. Terratec producer: phase 28. [en línea]. s.l.: Terratec, 2005.
<http://audioen.terratec.net/modules.php?op=modload&name=News&file=article&sid
=7>
[consulta: 12 May. 2005]

Marca: Terratec

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo máxima: 192.000 HZ
• Entrada y salida de analógica de audio: balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial y MIDI
• Interfaz digital: PCI
• Plataforma: MAC - Windows
332

ANEXO C

DISPOSITIVOS REPRODUCTORES Y/O GRABADORES DE AUDIO


DIGITAL
333

ADAT. Grabador y reproductor

Figura 133. Grabador y reproductor ADAT.


Fuente: Audio decks. Performance audio: alesis [en linea]. s.l.: Performance audio,
2005.
<http://www.performanceaudio.com/cgi/pages.cgi?buildPage=item&ProductID=00401
7> [consulta: 11 May. 2005]

Marca: ALESIS
Modelo: ADAT HD24XR

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo: 48.000/96.000 HZ
• Entrada y salida analógica de audio: balanceada de ¼” TRS
• Entrada y salida digital de audio: ADAT óptica y MIDI
• Compatibilidad: cintas ADAT
• Rango dinámico: ADC 130 dB y DAC 103 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
• Interfaz de comunicación 10 Base-T Ethernet (RJ-45)
• 24 pistas a 24 bits/48.000 Hz ó 12 pistas a 24 bits/96.000 Hz
334

DAT. Grabador y reproductor

Figura 134. Grabador y reproductor DAT.


Fuente: MEROD, Jim. Audio decks. The stereo times: [en linea]. s.l.: The stereo times,
2000. <http://www.stereotimes.com/trans110600.shtm>
[consulta: 11 May. 2005]

Marca: TASCAM
Modelo: DA-45HR "Powerhouse" 24-bit Digital Recorder

Características técnicas básicas:

• Resolución digital: ADC 24 bits y DAC 20 bits


• Frecuencia de muestreo: 44.100/48.000 Hz
• Entrada y salida analógica de audio: balanceadas XLR y no balanceadas
RCA
• Entrada y salida digital de audio: S/PDIF
• Compatibilidad: cintas DAT
• Rango dinámico: ADC 130 dB y DAC 103 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
335

DAT. Grabador y reproductor móvil

Figura 135. Grabador y reproductor móvil DAT.


Fuente: MEROD, Jim. Audio decks. The stereo times: [en linea]. s.l.: The stereo times,
2000. <http://www.stereotimes.com/trans110600.shtm>
[consulta: 11 May. 2005]

Marca: TASCAM
Modelo: DAP1 Digital Audio Tape Recorder

Características técnicas básicas:

• Resolución digital:16 bits lineal


• Frecuencia de muestreo: 32.000/44.100/48.000 HZ
• Entrada y salida analógica de audio: balanceadas XLR y no balanceadas
RCA
• Entrada y salida digital de audio: S/PDIF
• Compatibilidad: cintas DAT
• Respuesta en frecuencia: 20 – 22.000 Hz
336

DAT. Grabador y reproductor portátil

Figura 136. Grabador y reproductor portátil DAT.


Fuente: Audio decks. Sony: sony mastering. [en linea]. s.l.: Zzounds, 2005.
<http://www.zzounds.com/item--SNYPCMM1>
[consulta: 16 May. 2005]

Marca: SONY
Modelo: PCMM1 Professional Portable DAT Player and Recorder

Características técnicas básicas:

• Resolución digital:16 bits lineal , 12 bits no-lineal


• Frecuencia de muestreo: 32.000/44.100/48.000 HZ
• Entrada y salida digital de audio: 7-pin conector ¼” TRS
• Compatibilidad: cintas DAT
• Respuesta en frecuencia: 20 – 22.000 Hz
337

DDS. Grabador y reproductor interno

Figura 137. Grabador y reproductor interno DDS.


Fuente: Audio decks. Electronics: DDS decks. [en linea]. s.l.: Amazon, 2005.
<http://www.amazon.com>
[consulta: 17 May. 2005]

Marca: SONY
Modelo: Sony SDT-11000/BM 20/40 GB Capacity DDS-4 Internal Tape Drive

Características técnicas básicas:

• Capacidad 20 GB sin compresión y 40 GB con compresión.


• Transferencia de datos: soporta 4.8 MB/s (comprimido) y 2.4 MB/s
(nativo)
• Compatibilidad: cintas DDS-4, DDS-3, DDS-2 y DDS-1
338

DDS. Grabador y reproductor externo

Figura 138. Grabador y reproductor externo DDS.


Fuente: Audio decks. Electronics: DDS decks. [en linea]. s.l.: Amazon, 2005.
<http://www.amazon.com>
[consulta: 17 May. 2005]

Marca: SONY
Modelo: Sony Sony TSL-S11000/TB 320 GB 8 Cartridge DDS-4 External
Autoloader Tape

Características técnicas básicas:

• Capacidad: 320 GB sin compresión y 160 GB con compresión.


• Transferencia de datos: soporta 4.8 MB/s (comprimido) y 2.4 MB/s
(nativo)
• Compatibilidad: cintas DDS-4, DDS-3, DDS-2 y DDS-1
339

DCC. Grabador y reproductor

Figura 139. Grabador y reproductor DCC.


Fuente: EVANS, Mick and EVANS, Dave. Audio decks. Mick’s audioworld [en linea]. s.l.:
EVANS, Mick and EVANS, Dave, 2004.
<http://www.arcticcorsair.f9.co.uk/audio/kit/dcc730.html>
[consulta: 26 May. 2005]

Marca: PHILIPS
Modelo: DCC730 Didital Compact Cassette recorder

Características técnicas básicas:

• Receptor de AM y FM
• Frecuencia de muestreo: 44.100/48.000 HZ
• Entrada y salida analógica de audio: no balanceadas RCA
• Entrada y salida digital de audio: coaxial acc. A IEC 958
• Compatibilidad: Casetes DCC
• Rango dinámico: 100 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
340

DCC. Reproductor portátil

Figura 140. Reproductor portátil DCC.


Fuente: GOUDSMIT, Jac. Audio decks. Philips [en linea]. s.l.: GOUDSMIT, Jac, 1998.
<http://home.swipnet.se/~w-59099/dcc/Dcc-mode.htm#DCC%20134>
[consulta: 26 May. 2005]

Marca: PHILIPS
Modelo: DCC 134 - Portable Digital Compact Cassette player

Características técnicas básicas:

• Resolución digital:18 y 16 bits DAC


• Salida analógica de audio: Audífono 1/8” Mini TRS
341

MD. Grabador y reproductor

Figura 141. Grabador y reproductor MD.


Fuente: Audio decks. Recorders: stereo master players and records. [en linea]. s.l.:
Zzounds, 2005. <http://www.zzounds.com/item--SNYMDSJE480>
[consulta: 26 May. 2005]

Marca: SONY
Modelo: MDSJE480 MiniDisc Recorder Deck

Características técnicas básicas:

• Resolución digital: 24 bits


• Entrada y salida analógica de audio: no balanceadas RCA
• Entrada y salida digital de audio: S/PDIF óptica
• Compatibilidad: MD
• Respuesta en frecuencia: 5 – 20.000 Hz
342

MD. Grabador y reproductor portátil

Figura 142. Grabador y reproductor móvil MD.


Fuente: Audio decks. Professional audio: recorders & players. [en linea]. s.l.: H&B
Photo-Video, 2005.
<http://www.bhphotovideo.com/bnh/controller/home?O=productlist&A=details&Q=&s
ku=200797&is=REG>
[consulta: 26 May. 2005]

Marca: HHB
Modelo: MDP-500 Portadisc Portable MD Field

Características técnicas básicas:

• Resolución digital:16 bits


• Frecuencia de muestreo: 44.100HZ
• Frecuencia conversor: 32.000/48.000 Hz
• Entrada analógica de audio: balanceadas XLR MIC/LINE
• Salida de analógica de audio: Audífono ¼” TRS y no balanceadas RCA
• Compatibilidad: MD
• Rango dinámico: 96 dB
• Respuesta en frecuencia: 10 – 20.000 Hz
343

MD. Grabador y reproductor portátil

Figura 143. Grabador y reproductor portátil MD.


Fuente: Audio decks. Professional audio: recorders & players. [en linea]. s.l.: Vann’s,
2005. <http://www.vanns.com/shop/servlet/item/features/523149324>
[consulta: 26 May. 2005]

Marca: SONY
Modelo: MZNF520D

Características técnicas básicas:

• Receptor de AM y FM
• Frecuencia de muestreo: 44.100HZ
• Entrada y salida digital de audio: USB
• Salida analógica de audio: Audífonos 1/8” Mini TRS
• Compatibilidad: MD
• Respuesta en frecuencia: 20 – 20.000 Hz
344

CD. Reproductor

Figura 144. Reproductor de CD.


Fuente: Audio decks. Performance audio: denon [en linea]. s.l.: Performance audio,
2005.
<http://www.performanceaudio.com/cgi/pages.cgi?buildPage=item&ProductID=00085
3> [consulta: 30 May. 2005]

Marca: DENON
Modelo: Professional CD Player D-C680

Características técnicas básicas:

• Frecuencia de muestreo del ADC: 32.000/44.100/48.000 HZ


• Resolución DAC: dual 18 bits lineal
• Entrada y salida analógica de audio: balanceadas XLR y no balanceadas
RCA
• Salida digital de audio: S/PDIF Coaxial
• Compatibilidad: CD de audio
• Respuesta en frecuencia: 5 – 20.000 Hz
345

CD. Grabador y reproductor

Figura 145. Grabador y reproductor de CD.


Fuente: Audio decks. Performance audio: denon [en linea]. s.l.: Performance audio,
2005.
<http://www.performanceaudio.com/cgi/pages.cgi?buildPage=item&ProductID=00083
5> [consulta: 30 May. 2005]

Marca: DENON
Modelo: Professional Dual CD Player and CD-R/RW Recorder DN-C550R

Características técnicas básicas:

• Frecuencia de muestreo del ADC: 32.000/44.100/48.000 HZ


• Resolución DAC (CD drive): 24 bits
• Entrada y salida analógica de audio: balanceadas XLR y no balanceadas
RCA
• Salida digital de audio: S/PDIF Coaxial y óptica
• Compatibilidad lectura y escritura: CD de audio, CD-R y CD-RW
• Rango dinámico: 98/88 dB (CD drive/CD-R drive)
• Respuesta en frecuencia: 20 – 20.000 Hz
346

CD+G. Reproductor

Figura 146. Sega Saturn.


Fuente: Videogames. SEGA: saturn 2 [en linea]. s.l.: Vidgame, 2005.
<http://www.vidgame.net/SEGA/SATURN.html>
[consulta: 31 May. 2005]

Marca: SEGA
Modelo: Sega Saturn (MK-80000A)

Características técnicas básicas:

• CPU: 2 x Hitachi SH2 @ 28.6 MHz


• RAM: 2 MB principal, 1.5 MB video
• Resolución: 352x224 a 704x480
• Colores: 16.7 millones (24 bit)
• Sonido: 32 PCM
• Salida de audio analógico: no balanceado RCA
• Salida de video analógico: compuesto/S-Video/RGB
• Compatibilidad lectura: CD+G
347

CD-i. Reproductor

Figura 147. CD-I.


Fuente: Videogames. Infoconsolas.com: philips CDI [en linea]. s.p.i.
<http://personal.telefonica.terra.es/web/mallorcadisco/infoconsolas/paginas/Philips/C
DI/CDI.htm>
[consulta: 31 May. 2005]

Marca: PHILIPS
Modelo: CDI 450

Características técnicas básicas:

• CPU: 68070 Philips 15 MHz


• RAM: 1 MB (aumentable a 2,5 MB con MPEG Cartridge, +1 MB RAM
+512 KB MPEG decodificador RAM)
• Resolución: 768x560
• Colores: 16.7 millones (24 bit)
• Sonido: 44.100 Hz
• Compatibilidad lectura: CD-i y CD+G
348

UMD. Reproductor

Figura 148. PlayStation portátil.


Fuente: Videogames. SONY: playstation [en linea]. s.l.: SONY, 2005.
<http://www.us.playstation.com/psp.aspx?id=overview>
[consulta: 31 May. 2005]

Marca: SONY
Modelo: PSP-1001K

Características técnicas básicas:

• Resolución: Pantalla LCD


• Colores: 16.7 millones
• Interfaz digital: USB 2.0
• Compatibilidad lectura: UMD
• Red inalámbrica: IEEE 802.b
• Compatibilidad de formatos de audio: ATRAC3, MP3
• Compatibilidad de formatos de video: MPEG-4
• Compatibilidad de formatos de imagen: JPEG
349

DD-CD. Grabador y reproductor

Figura 149. DD-CD RW.


Fuente: Audio decks. Suche: ergebnis [en linea]. s.l.: ZDNet, 2005.
<http://www.zdnet.de/enterprise/storage/0,39027626,10000406,00.htm>
[consulta: 3 Jun. 2005]

Marca: SONY
Modelo: Internal ATAPI CRX200E

Características técnicas básicas:

• Grabación sobre DD-CC 1.3GB


• Velocidad de grabación CD-R: 12x
• Velocidad de grabación CD-RW: 8x
• Velocidad de lectura CD-ROM: 32x
• Compatibilidad lectura y escritura: DD-CD, CD de audio, CD-R y CD-RW
350

MO. Grabador y reproductor externo

Figura 150. Grabador y reproductor externo MO.


Fuente: Audio decks. Storage: M/O [en linea]. s.l.: Promarktech, 2005.
<http://www.promarktech.com/storage/mo/sony/smo_s551.htm>
[consulta: 3 Jun. 2005]

Marca: SONY
Modelo: SMO-S551 Magneto optical drive

Características técnicas básicas:

• Velocidad de transferencia de datos: 5 MB/s


• Interfaz digital: SCSI 2
• Compatibilidad lectura y escritura: MO disc 1.3/2.6/4.1/4.8/5.2
351

SA. Grabador y reproductor portátil

Figura 151. Grabador y reproductor portátil SA.


Fuente: Audio decks. 1GB memory audio player from NHJ. [en linea]. s.l.: Dottocomu,
2004. <http://www.dottocomu.com/b/archives/000713.html>
[consulta: 5 Jun. 2005]

Marca: NH Japan
Modelo: iOPS-F300 series

Características técnicas básicas:

• Receptor de FM
• Grabador de MP3
• Capacidad: 128/256/512/1.024 MB
• Salida analógica de audio: Audífonos 1/8” Mini TRS
• Compatibilidad lectura y escritura: SA card
• Compatibilidad de formatos: MP3, WMA y Ogg Vorbis
• Compatibilidad de sistemas operativos: Windows 98SE/Me/2000/XP y
Mac OS 9.2 ó OSX.
352

SA. Reproductor portátil

Figura 152. Reproductor portátil SA.


Fuente: Audio decks. Sharp MP-A100/A200 MP3 player. [en linea]. s.l. s.n, 2005.
<http://breakingnewsblog.com/mp3players/index.php?category_name=news/&paged
=2>
[consulta: 5 Jun. 2005]

Marca: SHARP
Modelo: MP-A 100/A200 MP3 player

Características técnicas básicas:

• Receptor de FM
• Capacidad: 256/512 MB
• Salida analógica de audio: Audífonos 1/8” Mini TRS
• Compatibilidad lectura: SA card
• Compatibilidad de formatos: MP3, WMA
• Compatibilidad de sistemas operativos: Windows XP
353

DVD. Grabador y Reproductor

Figura 153. Grabador y reproductor de DVD.


Fuente: Audio decks. DV-RA1000. [en linea]. s.l.: TASCAM, 2005.
<http://www.tascam.com/Products/dvra1000.html>
[consulta: 4 Jun. 2005]

Marca: TASCAM
Modelo: DV-RA1000 recorder

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo: 192.000 Hz
• Entrada y salida analógica de audio: balanceadas XLR, ¼” TRS y no
balanceadas RCA
• Interfaz digital: USB
• Compatibilidad lectura y escritura: CD de audio, CD-R, CD-RW, DVD-R,
DVD-RW, DVD+R y DVD+RW
• Rango dinámico: 103 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
354

DVD. Reproductor

Figura 154. Reproductor de DVD.


Fuente: Audio decks. DVD players: DVD-1910. [en linea]. s.l.: DENON, 2005.
<http://www.usa.denon.com/catalog/photo.asp?s=home&p=DVD-
1910&f=DVD1910%20Front.jpg&c=4>
[consulta: 4 Jun. 2005]

Marca: DENON
Modelo: DVD-1910

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo: 192.000 Hz
• Entrada y salida analógica de audio: no balanceadas RCA
• Entrada y salida digital de audio: S/PDIF óptico y coaxial
• Compatibilidad lectura: CD de audio, CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R y DVD+RW
• Compatibilidad de formatos: MP3, WMA
• Compatibilidad de formatos de imagen: JPEG
• Rango dinámico: 100 dB
• Respuesta en frecuencia: 2 – 88.000 Hz
355

DVD. Reproductor portátil

Figura 155. Reproductor portátil DVD.


Fuente: Audio decks. Products: DVD.618. [en linea]. s.l.: RCA, 2005.
<http://www.rcaaudiovideo.com/Cultures/en-
US/ModelDetail.html?PCI=Portable+DVD&ProductID=DRC618N>
[consulta: 6 Jun. 2005]

Marca: RCA
Modelo: DVD.618

Características técnicas básicas:

• A/V entrada/salida
• MultiSpeed Scan
• Compatibilidad lectura: CD de audio, CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R y DVD+RW
• Compatibilidad de formatos: MP3, WMA
356

DVD. Reproductor

Figura 156. PlayStation2.


Fuente: Videogames. Hardware: PlayStation2. [en linea]. s.l.: SONY, 2005.
<http://www.us.playstation.com/consoles.aspx?id=2/info/PlayStation2/
default.html#>
[consulta: 6 Jun. 2005]

Marca: SONY
Modelo: PlayStation2

Características técnicas básicas:

• CPU: 128-bit 294.912 MHz


• Ancho de banda bus memoria: 3.2 GB por segundo
• Sonido: ADPCM
• Interfaz digital: USB
• Salidas de audio analógico: no balanceada RCA
• Salidas de audio digital: S/PDIF óptica
• Salida analógica de video: compuesto/S-video
• Compatibilidad lectura: CD de audio, CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R y DVD+RW
357

DVD. Grabador y reproductor externo

Figura 157. Grabador y reproductor externo.


Fuente: DVD drives. CD/DVD drivers: DVD burners. [en linea]. s.l.: SONY, 2005.
<http://www.tigerdirect.com/applications/SearchTools/item-
details.asp?EdpNo=1446930&Sku=S167-3470>
[consulta: 26 May. 2005]

Marca: SONY
Modelo: DRX-710UPL External DVD Writer

Características técnicas básicas:

• Velocidad de grabación DVD+R/DVD-R: 16x/8x


• Velocidad de grabación DVD+RW/DVD-RW: 4x/4x
• Velocidad de lectura DVD-ROM: 16x
• Compatibilidad lectura y escritura: CD de audio, CD-R, CD-RW, DVD-R,
DVD-RW, DVD+R y DVD+RW
358

SACD. Reproductor

Figura 158. Reproductor SACD.


Fuente: DVD drives. CD/DVD drivers: DVD burners. [en linea]. s.l.: DENON, 2005.
<http://www.usa.denon.com/catalog/photo.asp?s=home&p=DVD-
5910&f=DVD5910%20Front.jpg&c=4>
[consulta: 26 May. 2005]

Marca: DENON
Modelo: DVD-5910

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo: 192.000 Hz
• Entrada y salida analógica de audio: no balanceadas RCA
• Entrada y salida digital de audio: S/PDIF óptico y coaxial
• Entrada y salida analógica de video:
compuesta/S-video/RGB/HDMI/DVI-D
• Interfaz digital: IEEE 1394
• Compatibilidad lectura: CD de audio, CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R, DVD+RW y SACD
• Compatibilidad de formatos: MP3, WMA
359

• Compatibilidad de formatos de imagen: JPEG


• Rango dinámico: 112 dB
• Respuesta en frecuencia: DVD (2 – 88.000 Hz)/SACD (2 – 100.000
Hz)/CD (2 – 20.000 Hz)
360

BD. Reproductor

Figura 159. PlayStation3.


Fuente: Videogames. PS3: oficial PS3 pictures. [en linea]. s.l.: SONY, 2005.
<http://www.ps3land.com/ps3-pictures/picture53.php>
[consulta: 6 Jun. 2005]

Marca: SONY
Modelo: PlayStation3

Características técnicas básicas:

• CPU: PowerPC-base Core 3.2 GHz


• Ancho de banda bus memoria: 22.4 GB por Segundo
• Resolución: 480i, 480p, 720p, 1080i,1080p
• Sonido: Dolby 5.1ch, DTS, LPCM
• Interfaz digital: USB, Bluetooth, Ethernet
• Salidas de audio digital: S/PDIF óptica
• Salida analógica de video: HDMI
• Compatibilidad lectura: CD de audio, CD-R, DVD-R, CD-RW, DVD+R,
DVD+RW, BD-ROM, BD-R, BD-RE
361

BD. Grabador y reproductor

Figura 160. Grabador y reproductor Blu-ray.


Fuente: Panasnic. Blue-ray. [en linea]. s.l.: AV LAND LTD, 2005.
<http://www.avland.co.uk/panasonic/dmre700/dmre700lrg.jpg>
[consulta: 6 Jun. 2005]

Marca: Panasonic
Modelo: DMR-E700BD Blu-Ray Disc / DVD-R/RAM Recorder

Características técnicas básicas:

• Resolución digital: 24 bits


• Frecuencia de muestreo: 192.000 Hz
• Entrada y salida analógica de audio: no balanceadas RCA
• Entrada y salida digital de audio: S/PDIF óptico y coaxial
• Entrada y salida analógica de video: compuesta/S-video/RGB
• Compatibilidad lectura: CD de audio, CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R, DVD+RW, DVD-RAM y Blu-ray Disc
• Compatibilidad de grabacion: CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R, DVD+RW, DVD-RAM y Blu-ray Disc.
362

HD DVD. Reproductor

Figura 161. Grabador y reproductor HD DVD.


Fuente: Press relase: Nec HD DVD. [en linea]. s.l.: HD DVD Promotion Group, 2005.
<http://www.hddvdprg.com/press/nec.html> [consulta: 6 Jun. 2005]

Marca: NEC
Modelo: HD DVD Drive

Características técnicas básicas:

• Compatibilidad lectura: CD de audio, CD-R, CD-RW, DVD-R, DVD-RW,


DVD+R, DVD+RW, DVD-RAM y HD DVD
363

ANEXO D

FORMATOS DE COMPRESIÓN DE AUDIO CON PÉRDIDAS “LOSSY” Y


AUDIO MULTICANAL
364

COMPRESIÓN DE DATOS LOSSY

El método de compresión de datos lossy consiste en el hecho de que al


comprimir un archivo y luego descomprimir, se recupera el archivo pero no es,
necesariamente, fiel al original, aunque es suficientemente aproximado para
ser utilizado en algunas aplicaciones. Este tipo de compresión es usada
frecuentemente en Internet y en medios de comunicación y en aplicaciones de
telefonía. En este contexto estos métodos son llamados tradicionalmente como
codecs. Básicamente se tienen dos esquemas de compresión: codecs de
transformación y codecs predictivos.

En los codecs lossy de transformación, se toman muestras de imagen o sonido


cortados en pequeños segmentos, los cuales son cuantizados y transformados
en una nueva base de espacio. Los valores de cuantización son llamados
Entropía de código.

En los codecs lossy predictivos, datos de secuencias previas o subsecuencias


decodificadas, son usadas para predecir la muestra de sonido o frame de la
imagen actual. El error entre el dato predicho y el dato real, junto con
cualquier información extra necesaria para reproducir la predicción, son luego
cuantizados y codificados. En algunos sistemas las dos técnicas son
combinadas. Los codecs de transformación se usan para comprimir las señales
de error, generadas por la fase de predicción.

MP3. (MPEG-1 Audio Layer 3). Es un formato lossy de audio digital


comprimido con pérdidas, desarrollado por el Moving Picture Experts Group
(MPEG) para formar parte de la versión 1 (posteriormente ampliado en la
365

versión 2) del formato de video MPEG. Su nombre es el acrónimo de MPEG-1


Audio Layer 3.

Su característica principal es su relacion de compresión es aproximadamente,


11:1, lo que quiere decir, por ejemplo, que si un CD de música normal
contiene unas 13 canciones, en un CD con MP3, se tendrían 143. Tal reducción
de tamaño se realiza por eliminación de sonidos que el oído humano no puede
escuchar. Cuando se eliminan escalas de sonidos no audibles, se reduce la
cantidad de bytes necesarios en el archivo final. El MP3 tiene unas técnicas de
compresión digital diferentes al CD. Por ejemplo, en los archivos digitales de
CD, si dos sonidos simultáneos tienen la misma frecuencia de onda, se elimina
una de ellas. En cambio, en los MP3, hay otros parámetros que influyen, por
ejemplo, si hay un ruido fuerte, se eliminan los datos de los débiles, pues el
oído humano sólo escuchará el fuerte. Existen muchas versiones del codec
MP3. Cada una de ellas dictamina qué sonidos se han de eliminar y cuáles no.
Por este motivo, todas las versiones y configuraciones son distintas. El formato
MP3 se convirtió en el estándar utilizado para streaming (estrategia sobre
demanda para la distribución de contenido de multimedia a través de Internet)
de audio y compresión de audio de alta calidad, gracias a su capacidad para
ajustar la calidad de la compresión, que es proporcional al tamaño por segundo
(frecuencia de muestreo) y, por tanto, al tamaño final del archivo, que podría
llegar a ocupar 11 e incluso 15 veces menos que el archivo original sin
comprimir.

Ogg Vorbis. El funcionamiento de este formato de compresión es similar al


de los otros y también se utiliza para guardar y reproducir música digital. Lo
que diferencia a Ogg Vorbis del resto es que es gratuito, abierto y no está
patentado. Su principal atractivo es la reducción significativa que hace de un
archivo de audio sin restarle calidad. Así mismo, se distingue por su
366

versatilidad y por ocupar muy poco espacio. Su calidad es superior a la de los


codecs comerciales de última generación, como AAC y MP3.

WMA. (Windows Media Audio). Es la versión de Windows para comprimir


audio, es muy parecido al MP3, pero técnicamente inferior. No sólo reduce el
tamaño de archivos grandes sino que también se adapta a diferentes
velocidades de conexión, en caso de que se necesite reproducir en Internet en
tiempo real. Como estrategia comercial utiliza la inclusión de soporte en el
reproductor Windows Media Player, insertado en el sistema operativo Windows.
A diferencia del MP3, el formato posee una infraestructura para proteger el
Copyright (derechos de copia) y hacer más difícil el tráfico ilegal de música.

AAC. (Codificación Avanzada de Audio). Diseñado con el fin de reemplazar el


MP3, almacena más información en menos espacio y con mayor calidad. Se
trata de un formato de propiedad, pero es utilizado para múltiples aplicaciones
como el itunes (reproductor y organizador de música creado por Apple),
Winamp (reproductor y organizador de música para diferentes plataformas) y
es el formato de audio que utiliza Apple para los archivos de audio que
reproduce el IPOD.

VQF. (Transform-domain Weighted Interleave Vector Quantization). Es un


formato de compresión desarrollado por Yamaha con características muy
similares al MP3, pero con mayor compresión y mejor calidad del sonido.
Ofrece una relación de compresión de 18:1. Un archivo VQF es un 30%
aproximadamente más pequeño que un MP3.
367

OTROS FORMATOS

AIFF. (Audio Interchange File Format). Es un archivo de música para


computadora. Los datos de audio no son comprimidos, lo que los hace de un
gran tamaño, comparado con los formatos lossless y lossy. El formato fue
desarrollado por Apple Computer y Electronic Arts, y es principalmente usado
en computadores Macintosh y estaciones de trabajo Silicon Graphics. Es
medianamente conocido fuera de estos dos ambientes, pero más que el
formato AU. Es el archivo por excelencia con el propósito de restaurar audio en
ambiente Macintosh.

RA. (Real Audio). Es un formato ampliamente distribuido y usado, capaz de


reproducir sonido con fidelidad graduada, es decir, el usuario decide la calidad
del sonido para encontrar el equilibrio entre un archivo muy grande con alta
fidelidad y uno muy pequeño de baja fidelidad. Este formato es usado
habitualmente en medios de aplicación en Internet. Se usa con el RealOne
player.

RMF. (Rich Music Format). El Formato Musical Enriquecido, soportado por


Beatnik, es de muy alta calidad, fundamentalmente para descarga y
reproducción. Cada vez se hace más popular.

MIDI. El formato MIDI no se considera de audio digital, pues no almacena


muestras de un determinado sonido, lo que hace es una descripción musical
del mismo a través de un código de instrucciones del reproductor. Sólo
representa sonidos musicales, pero no los describe completamente, ya que
indica el instrumento en el que se tocan, la forma de tocarlo, pero el sonido
368

final que se reproduce depende, en gran parte, del dispositivo reproductor


MIDI.

AUDIO MULTICANAL

Es una manera de procesar audio, en la que el sonido se divide en canales que


se distribuyen a través de una serie de parlantes ubicados estratégicamente,
con el fin de percibir el sonido desde diferentes direcciones. Este fenómeno
produce la sensación de un sonido envolvente, mucho más profundo y, por lo
tanto, más real.

El audio multicanal está muy asociado al video y su principal aplicación se


presenta en las salas de cine y los teatros caseros (Home Theater). No
obstante, una nueva aplicación se está comenzando a desarrollar en el Super
Audio Compact Disk o SACD y el Audio DVD.

Algunos de estos sistemas de sonido multicanal, son: Dolby Digital, Dolby


Digital EX, DTS, DTS ES, SDDS, este último no tiene equivalente para sistemas
caseros.

Dolby Stereo. Desarrollada por laboratorios Dolby, fue la primera forma de


audio multicanal que, además de utilizar los canales, izquierdo y derecho, del
audio estéreo estándar, agrega dos canales adicionales: central y de
envolvente (surround) o de efectos, mediante procesos externos de
codificación sobre la señal. Este último, en combinación con el canal izquierdo
y con el derecho.
369

Dolby Digital. (Dolby 5.1 o AC-3). Este sistema de audio multicanal, también
creado por laboratorios Dolby, es una evolución del Dolby estéreo y se
presentó al público por primera vez en la exhibición de la película Batman
Returns, en el año 1992.

El sistema posee un sonido digital a 48.000 Hz y 16 bits, con 6 canales de audio


comprimidos a una relación 14:1:5 de rango completo (20 a 20.000 Hz) y otro
adicional para señales de baja frecuencia (3 a 120 Hz) conocido como 0.1, de ahí el 5.1.

Dolby EX. (Dolby Extended Sound). Es una variación evolutiva del sistema
Dolby Digital, que incorpora un canal de efectos adicional, mediante
codificación de la señal de audio, para un total de 6 canales reales y un canal
codificado.

DTS. (Digital Theater System). El sistema multicanal DTS es, en términos


generales, equivalente al sistema Dolby Digital, ya que también tiene 5.1
canales de audio y están distribuidos de la misma forma.

La diferencia fundamental entre estos sistemas radica en las características


que presenta la señal digital de audio. La del sistema DTS es a 48.000 Hz y 20
bits (contra los 16 bits de Dolby) y la relación de compresión 4:1 contra 14:1,
dando como resultado un sonido de mayor calidad

DTS ES. (DTS Extended Sound). Sistema idéntico a Dolby Digital EX, pero con
las características propias de DTS.

La primera película que utilizó esta norma fue Stars Wars Episode I.
370

SDDS. (Sony Dynamic Digital Sound). Este sistema ofrece 8 canales de rango
completo (20 a 20.000 Hz) y, como los otros sistemas, utiliza los canales
principales derecho e izquierdo y los de efectos. Su singularidad se encuentra
en la distribución de los altavoces ya que 6 de éstos se ubican detrás de la
pantalla, lo que permite un sonido más integrado con la imagen.

Para este sistema, Sony no proporciona información sobre el tipo y el nivel de


compresión, ni las características del sonido digital.

THX. (Tomlinson Holman Experiment). Etimológicamente este nombre se


desprende del nombre de la primera película de George Lúcas, llamada THX
1138.

THX no es un sistema de audio digital multicanal sino una serie de estándares


técnicos que establece y normaliza las características mínimas que debe poseer
una película o una sala de cine para garantizar una calidad excepcional, entre
ellas la calidad del audio.

En general, THX tiene en cuenta principalmente los aspectos relacionados con


el sonido y la acústica, además pauta ciertos aspectos sobre la imagen y la
comodidad de las salas.

Las características que tiene en cuenta la norma THX para certificar son:

• Calidad, color y ángulo de incidencia del proyector sobre la


pantalla
371

• Ruido generado dentro de la sala (aire acondicionado,


proyector, etc.) y ruido generado fuera de la sala (ruido
ambiental)
• Ángulos de visión y escucha de los espectadores
• Propiedades acústicas de la sala
• Sistema de sonido

Existe la norma THX para equipos de uso doméstico, para que un usuario
pueda comprar un conjunto de reproductor de DVD, decodificador
multicanal, amplificadores y altavoces homologados por THX.
372

ANEXO E

ALGORITMOS DE MODELACIÓN MATEMÁTICA DE SEÑALES DE AUDIO,


DETECCIÓN DE RUIDOS Y RESTAURACIÓN

Fuente: Restauración de audio. Proceso de señales y aplicaciones en la restauración de


registros sonoros. [en linea]. Oviedo: Universidad de Oviedo, s.f.
<http://coco.ccu.uniovi.es/brahms/sumario.htm> [consulta: 28 Feb. 2005]
373

MODELOS MATEMÁTICOS PARA DESCRIBIR SEÑALES DE AUDIO

Modelos AR

CONCEPTO

Los modelos AR (autoregresivos) para describir señales se incluyen en un


contexto más amplio de procesos aleatorios discretos, una de cuyas
realizaciones sería la señal discreta o serie temporal que se desea describir.
Sin embargo, para no complicar la notación, se hará uso de un abuso de
lenguaje, denominando con el mismo símbolo a un proceso aleatorio y a
cualquiera de sus realizaciones. Se dice que el proceso s(n) obedece a un
modelo auto-regresivo discreto de orden P si s(n) es la única solución
estacionaria de la ecuación de recurrencia siguiente:

donde P es el orden del modelo, a(k) sus coeficientes, e(n) un proceso


aleatorio centrado, estacionario de segundo orden, blanco y con varianza
constante σe2, que suele denominarse señal de excitación y N el tamaño del
bloque de señal cuyo modelo se desea establecer.

EL FILTRO AP Y MODELO DE PRODUCCIÓN DE HABLA

Una señal que puede ser razonablemente predecible en función de los valores
muestrales pasados, muestra un espectro de banda estrecha. Inversamente,
una señal no predecible, como un ruido blanco, exhibe un espectro de
frecuencias de banda ancha. Si se escribe
374

la señal s(n) se puede interpretar como la respuesta del filtro todo polos cuya
función de transferencia es:

a la señal de excitación e:

Se demuestra que la ecuación de recurrencia admite como solución una señal


única s(n) estacionaria de segundo orden si y solo si los polos de la función de
transferencia H(z) son de módulo estrictamente inferior a 1, es decir si

Se puede demostrar que la densidad espectral de potencia de un proceso AR


de orden P es de la forma:

Se puede ilustrar la utilidad de este modelo aplicándolo al establecimiento de


un modelo matemático básico para la producción de habla. Este proceso es un
ejemplo de un proceso que sirve para convertir una señal aleatoria, no
correlacionada, en otra señal fuertemente correlacionada que es el habla. El
habla se genera por inhalación de aire en los pulmones y exhalándolo
375

seguidamente a través de las cuerdas vocales y del tracto vocal. Para el


modelo, los pulmones se sustituyen por un generador de ruido aleatorio, las
cuerdas vocales por un generador de impulsos y el tracto vocal por un sistema
basado en un filtro lineal.

Dada la señal de habla, el problema básico de predicción lineal consiste en


determinar los coeficientes del filtro para deducir las propiedades espectrales.

PRIMERA FORMULACIÓN MATRICIAL

La ecuación de recurrencia fundamental se puede escribir en forma matricial


de formas diversas. Si se designa:

y
376

la señal bajo estudio s es la suma s0+s1, de la parte que se supone conocida


s0, las P primeras muestras mas la parte que se deduce a partir del modelo s1,
desde la muestra P+1 hasta finalizar el bloque de tamaño N y la recurrencia se
expresa como:

s = Ga + e

El problema de construir el modelo para una señal dada se traduce en estimar


los coeficientes a(k) de la ecuación de recurrencia una vez adoptado un valor
de P conveniente.

ESTIMACIÓN DEL VECTOR DE PARÁMETROS a

Suponiendo conocida la densidad de probabilidad pe de la sucesión de


excitación, también de nombre pe y teniendo en cuenta que dicha sucesión es
i.i.d., se puede determinar la probabilidad de obtener el vector s1 condicionada
a los valores conocidos de s0:

y en el caso de una excitación gaussiana con media 0,

donde se añade la necesidad de disponer de una hipótesis sobre el vector de


parámetros a. Para valores N>>P se puede admitir la aproximación

Teniendo en cuenta esta relación se puede estimar el vector a maximizando


P(s|a) respecto de a, obteniendo
377

proceso que equivale a la estimación de a mediante minimización de una


función de coste:

Se puede así describir la señal mediante la expresión

ILUSTRACIONES

Para ilustrar el algoritmo se considera una señal AR generada haciendo uso de


los coeficientes

Tomando una muestra de tamaño N=1000, se realiza la estimación de los


coeficientes mediante el algoritmo precedente (covarianza modificada). Resulta

que generan señales respectivamente cuyas 100 primeras muestras se


representan a continuación:
378

Figura 162. Señal AR.

Un procedimiento alternativo se basa en la estimación de las covarianzas R(k)


del proceso para establecer las denominadas ecuaciones normales o
ecuaciones de Yule-Walker.

Multiplicando ambos miembros de la ecuación de recurrencia por s*(n-k),


posteriormente la ecuación conjugada por e(n), usando el operador esperanza
matemática y teniendo en cuenta que

se obtienen las relaciones

y para n>P,
379

La matriz de la primera expresión es la matriz de covarianza de orden P+1 del


proceso s(n) que hermítica en el caso general y simétrica si el proceso s es
real, positiva y de Toeplitz.

Las ecuaciones de Yule-Walker suministran un procedimiento para estimar los


coeficientes del proceso AR conocida una muestra del mismo. En efecto, se
sustituyen las covarianzas por sus valores estimados,

y se resuelve el sistema lineal resultante para obtener las estimaciones a^.


Tomando la ilustración anterior, se obtiene la estimación

y la señal cuyas 100 primeras muestras se exhiben a continuación.

Figura 163. Estimación de la señal AR por la ecuación de Yule-Walker.


380

Finalmente, conviene resaltar que es necesario ponderar dos parámetros


fundamentales en estas formulaciones de los modelos AR. En primer lugar se
necesita para la señal en estudio una hipótesis de estacionariedad, que se
puede establecer si se consideran bloques de señal de longitudes entre 500 y
2000 muestras, con una tasa de muestreo de 44100 Hz. Para evitar los
consiguientes efectos de borde se hace uso de ventanas adecuadas como las
Hanning o Hamming.

Por otra parte se debe adoptar un valor para P. Para señales musicales de alta
complejidad se requiere un valor P>100, mientras que para señales más
simples puede ser suficiente tomar P=30.
381

Modelos Sinusodiales

Un modelo matemático adecuado para representar música, palabra o una


combinación de ambas señales está basado en el desarrollo de la señal en dos
componentes:

donde s(t) se denomina parte sinusoidal y r(t) parte residual.

La parte sinusoidal se escribe como la suma de un número finito I de parciales


sinusoidales cuyos parámetros de configuración son variables con el tiempo:

donde los factores ak son señales que cambian lentamente con el tiempo, es
decir, señales con un ancho de banda Ba de pequeña magnitud. Por su parte,
las señales Φk son localmente lineales, es decir, alrededor de t=t0,

con Φk (t0;t0)=0. Y de otra forma

La estimación de los parámetros del modelo sinusoidal se realiza en dos


etapas.

1. Se calcula el espectro para una ventana temporal y se realiza la estimación


de la posición de los puntos cuspidales de frecuencia correspondientes. Cada
382

punto cuspidal se considera un elemento de sinusoidal parcial cuyos


parámetros deben estimarse. El espectrograma puede ser un elemento auxiliar
relevante. Simultáneamente se determina la fase asociada con los diferentes
valores frecuenciales y en particular con los puntos cuspidales.

2. Los puntos cuspidales de las sucesivas ventanas de análisis se agrupan en


segmentos que representan las sinusoidales parciales que se buscan. Los
valores de frecuencia, magnitud y fase de los puntos cuspidales pueden
facilitar la agrupación mencionada.

Figura 164. Fase asociado a valores de frecuencia del modelo senosoidal.

El modelo discreto asociado se puede expresar en la forma siguiente:


383

Finalmente la parte residual debe recoger aquellos aspectos de la señal que no


pueden ser representados mediante sinusoidales parciales. Para esta
componente se puede adoptar un modelo estocástico que se describe como la
salida del un filtro dependiente del tiempo y configuración frecuencial
determinada como respuesta a un ruido blanco.

siendo w el ruido blanco y h la respuesta de impulso del filtro.


384

Marcos Bayesianos

La teoría de Bayes en el ámbito de la estimación de parámetros o de la


predicción del estado de un proceso hace uso de la información contenida en
las observaciones de la señal y de las probabilidades a priori asociadas con el
proceso.

Se considera un proceso aleatorio que depende de un parámetro θ que es un


vector aleatorio y se supone que está disponible y, un vector de observaciones
del proceso. De acuerdo con la regla de Bayes, la función de densidad de
probabilidad a posteriori del parámetro θ dadas las observaciones se puede
expresar como:

La estimación bayesiana del parámetro q se basa en la minimización de una


función de riesgo bayesiana.

donde C es una función de coste y θ^ designa la variable estimación de θ. Para


una observación dada y, fy(y) es constante por lo que la función de riesgo se
puede escribir como:

En particular, la estimación maximum a posteriori (MAP) se obtiene como el


vector que maximiza la función de densidad posterior fθ|y(θ|y). La
correspondiente función de coste es la denominada uniforme:
385

Figura 165. Función de coste para marcos bayesianos.

Efectuando la sustitución en la función de riesgo queda:

Es decir: El valor del parámetro que minimiza la función de riesgo maximiza la


función de densidad posterior:
386

MODELOS MATEMÁTICOS PARA DETECTAR CLICKS

Modelos AR por Bloques

Una señal de audio es generalmente una señal de larga duración, que no se


procesa habitualmente de una forma global. Por otra parte, estas señales
exhiben una elevada no estacionariedad. Por estas razones siempre se practica
una segmentación de la señal en bloques casi estacionarios, con auxilio de
ventanas de Hamming o de Haaning, de una longitud conveniente y con un
nivel de solapamiento adecuado.

El primer mecanismo para la detección de clicks que será objeto de examen


está basado la adopción de un modelo AR para los bloques de la señal no
degradada. Los clicks o ruidos impulsivos se consideran señales aditivas y su
modelo matemático debe reflejar esta consideración. Si se designa con x(k) a
la señal no degradada y con y(k) a la señal con ruido, se escribe:

donde i(k) es un índice cuyo valor es, para cada valor de k, 1 o 0, dependiendo
de que el ruido afecte o no a la muestra k, respectivamente. La señal v está
relacionada con la magnitud del defecto.

Teniendo en cuenta la hipótesis de estacionariedad de la parte de señal en


estudio, se supone para los segmentos no degradadados un modelo AR de
orden P:
387

siendo e(n) un ruido blanco de varianza σe2, que se denomina señal de


excitación o error de predicción.

La señal corrupta se procesa mediante el filtro de error o filtro inverso cuya


función de transferencia es:

proporcionando una señal de detección:

Sustituyendo el modelo adoptado para los ruidos impulsivos y el modelo AR


para la señal limpia x, queda:

La señal de detección eD(n) es débil para las muestras no degradadas, ya que


en este caso el modelo AR tiene buen ajuste y es de mayor magnitud cuando
encuentra defectos impulsivos, ya que en este caso el modelo AR no es el
adecuado. Para señales de audio con correlación alta, la varianza de eD(n) es el
orden de 100 veces mayor para una señal degradada comparándola con la
correspondiente a una señal limpia.

Así, la detección se efectúa comparando la magnitud de eD(n) con un umbral


dado por:

λ = Kσ 2 ( e D )

siendo σ2(eD) una estimación de la varianza de la señal de detección que


corresponde a la señal no corrupta y K un parámetro que se puede seleccionar
388

perceptualmente, cuya magnitud establece un compromiso entre la no


detección y la falsa detección. En general se consigna un valor de K idéntico
para todos los bloques de señal.

Desde el punto de vista metedológico, es posible detectar todas las muestras


degradadas de un bloque conjuntamente, considerando clicks todas las
muestras k para las que |eD(k)|>λ. Puesto que las degradaciones impulsivas
no afectan a muestras aisladas, se especifica una duración determinada para
aquellas y se atribuye la condición de muestras corruptas a un número fijo a la
izquierda y a la derecha de cada click encontrado.

Figura 166. Señal con ruidos impulsivos.

Figura 167. Señal de detección eD.


389

Figura 168. Localización de 37 clikcs con umbral λ=66.81.

Alternativamente, se puede detectar el impulso de mayor amplitud buscando el


valor de k para el que |eD(k)| sea máximo, con |eD(k)|>λ, consignando como
antes una duración fija en número de muestras para el defecto impulsivo
encontrado. Seguidamente, se suprime la señal en el tramo completo
degradado y se reitera el cálculo con otra muestra hasta alcanzar la condición
|eD(k)|< λ para todos los puntos del bloque de señal considerado.

La detección de un umbral eficiente presenta a priori dos problemas:

1. En primer lugar, es necesario obtener estimaciones de la varianza de la


señal de excitación que corresponde a la señal no degradada y para ello la
forma más sencilla es acudir a la señal degradada, lo que produce
estimaciones sesgadas evidentes en presencia de ruidos impulsivos.

2. Otra dificultad consiste en establecer de una forma conveniente la duración


de las degradaciones impulsivas, es decir, determinar el instante en el que
comienzan y el instante en el que finalizan. El procedimiento más simple
consiste en atribuir una duración fija a todas las degradaciones.

Respecto del primer problema, una opción consiste en adoptar como umbral la
cantidad:
390

que surge de la consideración de la señal de excitación como un ruido blanco


gaussiano estacionario. En efecto, para l variables aleatorias gaussianas
independientes X1, X2, ..., Xl centradas y con varianza σ2 se tiene:

Por otra parte, para estimar de una manera más sistemática la duración de las
degradaciones impulsivas, se puede hacer uso de dos umbrales: Un umbral de
detección λD, que puede especificarse tal como se ha especificado antes y un
umbral de localización λL, λL<λD que permite consignar como degradadas
algunas muestras contiguas a la detectada en primer lugar.

La sucesión de operaciones puede ser como sigue:

• En una primera etapa se detecta el impulso de mayor amplitud de


excitación entre todos los que integran el bloque:

• En la segunda etapa se consignan como degradadas todas las muestras


contiguas a k1 cuya amplitud de excitación sea superior a λL,
continuando la agregación de nuevas muestras hasta que se alcance a la
izquierda y a la derecha del paquete corrompido un número n prefijado
de muestras para las que |eD(k)|< λL.

• En una tercera etapa se atribuye valor cero a las muestras encontradas


como degradadas y se prosigue con la búsqueda de la muestra k2 que
391

exhiba la mayor amplitud de excitación. Así, hasta que |eD(k)|< λD para


todas las muestras del bloque.

Figura 169. Localización del defecto a partir de la muestra k=419, entre las muestras
417 y 428. Las líneas roja y verde identifican los umbrales de detección y localización,
respectivamente.

Una vez identificado este primer conjunto de paquetes de muestras con ruido
impulsivo, se realizan iteraciones sucesivas para determinar otros paquetes
con menor amplitud de excitación estimando de nuevo los umbrales λL y λD que
serán cada vez de magnitudes menores en cada iteración.
392

Técnicas Bayesianas

Es posible hacer uso de técnicas bayesianas que aprovecha informaciones a


priori acerca de la señal. Teniendo en cuenta el modelo y(k)=x(k)+i(k)v(k), el
planteamiento del problema de detección de clicks en un contexto bayesiano
consiste en estimar el vector i(k) que minimice alguna función de riesgo de
Bayes.

Para una estimación MAP, el problema equivale a buscar el vector i(k) que
maximiza la función de densidad posterior fy|i(y|i). Si se considera un bloque
de señal con N muestras, el modelo se puede describir en forma vectorial:

Aplicando el teorema de Bayes, la probabilidad de i condicionada al vector de


observaciones y se escribe como:

El denominador fy(y) es un coeficiente de escala que no interviene en el


proceso de maximización y P(i) debe reflejar informaciones previamente
conocidas acerca de la señal; por ejemplo, el porcentaje estimado de muestras
degradadas por ruido impulsivo. El problema se reduce así a calcular la función
de verosimilitud fy|i(y|i) y a maximizar la probabilidad a posteriori Pi|y(i|y).

Se supone que la señal no degradada está bien representada por un proceso


AR de orden P y el conjunto está modelado por el sistema
393

donde r(n)=i(n)v(n) agrupa los ruidos impulsivos.

Los elementos del vector y se reorganizan en dos segmentos: yc, que contiene
a los elementos de i para los que i(k)=0, luego elementos conocidos; yd, que
contiene a los elementos de y para los que i(k)=1, desconocidos. Se tiene:

donde xd contiene a las muestras de la señal que deben ser estimadas y rd es


un proceso gaussiano con media 0 y matriz de correlación R. La función de
verosimilitud se puede escribir de la siguiente forma:

siendo,

donde Ad y Ac son particiones de A acomodadas a los segmentos yd e yc,


respectivamente. La estimación del vector i consiste en determinar Pi|y(i|y)
para todas las 2N combinaciones posibles de aquél y seleccionar la combinación
que maximice la probabilidad a posteriori.

El esfuerzo computacional es considerable y es posible mejorar la situación


haciendo uso de un algoritmo secuencial que determina la función de
verosimilitud fy|i(y|i) de forma recursiva cada vez que se incorpora una
muestra nueva de y.
394

ALGORITMOS PARA RESTAURACIÓN DE SEÑALES CON CLICKS

Interpolación AR (Tecnología de modificación)

Se plantea el problema de estimar mediante interpolación los puntos de señal


colocados a 0 teniendo en cuenta los valores muestrales de los puntos de la
señal contenidos en el bloque de estacionariedad considerado que preceden y
también los que siguen al paquete eliminado. Una técnica eficiente consiste en
suponer que los diferentes bloques siguen el modelo AR de orden P, donde P
puede ser diferente en cada bloque. El algoritmo de interpolación basado en
esta suposición, se conoce con el nombre de LSAR (Least Squares
Autoregressive).

Se considera una señal con N muestras s(k) que admite un modelo AR de


orden P:

y se supone que parte de dichas muestras, un total de M comenzando en la


muestra m,

tienen valores desconocidos. Se propone estimar los valores de dichas


muestras haciendo uso de los valores de las restantes N-m y del modelo AR,
que se puede desarrollar matricialmente en la forma siguiente:
395

En forma compacta se puede escribir

Utilizando la función de coste F=eTe para minimizar el error en la forma


habitual, se observa que intervienen los valores muestrales desconocidos en
términos no lineales de le ecuación de minimización. Una solución sub-óptima
consiste en linealizar la ecuación asignando un valor 0 a las muestras perdidas
o indeterminadas. Esta operación elimina los términos de la ecuación
comprendidos entre las líneas de puntos, de manera que para resolver el
sistema que estima los coeficientes a se escribe

donde sc agrupa en un vector a todas las muestras conocidas.

Seguidamente es necesario proceder a la estimación de los valores que


corresponden a las muestras desconocidas. Para ello se extraen de la ecuación
matricial anterior las filas situadas entre las líneas de puntos:
396

Si se introduce la estimación del vector a, únicamente permanecen como


incógnitas los valores de las muestras desconocidas. El sistema se puede
componer separando las muestras conocidas y desconocidas:

siendo sd y sc vectores que contienen las muestras desconocidas y conocidas,


respectivamente y Ad y Ac matrices cuadradas extraídas de la matriz
fundamental de acuerdo con sus papeles respectivos. Estableciendo de nuevo
la condición de mínimo del funcional F=eTe, resulta finalmente

que es una estimación para los valores de las muestras perdidas.

Figura 170. Resultado de la interpolación (línea roja) de las muestras perdidas por un
defecto impulsivo entre las muestras 417 y 428.
397

Este método de interpolación tiene algunas limitaciones que se pueden resumir


como sigue:

1. Las señales de audio no son exactamente AR. En primer lugar es necesario


admitir la hipótesis de estacionariedad, al menos cuando se consideran bloques
de señal de tamaño 1024 o 2048. En segundo lugar, para señales de habla, la
excitación de la señal no es en general un ruido blanco, sino una sucesión de
impulsos casi periódicos. Finalmente, la parte casi estacionaria que
corresponde a los sonidos musicales posee generalmente un gran número de
componentes espectrales, y únicamente los segmentos que tienen frecuencia
fundamental muy elevada dan una excitación de la señal relativamente exenta
de estructuras periódicas.

2. El modelo AR de la señal necesita ser estimado a partir de datos con ruido,


de manera que la eventual presencia de ruidos impulsivos puede sesgar
significativamente el proceso de estimación.

Sin embargo, el método se revela eficaz y robusto en la práctica. La razón


esencial es la ganancia considerable obtenida en la señal después del filtrado
inverso practicado para la detección. Esta ganancia está motivada por la
precisión de los picos de la densidad espectral de la señal que se elabora con
ocasión de la detección y combinación de los paquetes de clicks.
398

Técnicas Bayesianas (Tecnología de modificación)

Si se hace uso de técnicas bayesianas para estimas las muestras afectadas por
ruidos impulsivos en la forma indicada anteriormente, es conocido que no es
necesario un proceso separado de interpolación, ya que en el transcurso del
proceso se combinan detección de los defectos (vector i) y estimación de la
señal limpia (vector xdMAP).

Sin embargo, es posible hacer uso de técnicas bayesianas con la única


finalidad de restaurar muestras perdidas en el curso de un proceso previo de
detección/anulación como el explicado en la sección modelos AR por bloques

Con el fin de establecer un modelo para un bloque de señal de tamaño N, se


considera un proceso aleatorio x, que se reorganiza en los segmentos xc, que
modela las muestras conocidas y xd, que modela las desconocidas. Haciendo
uso de matrices adecuadas se puede escribir

La función de densidad de probabilidad a posteriori del segmento desconocido


xd dado el segmento conocido xc se puede expresar como

siendo f la función de densidad de probabilidad asociada con el proceso


aleatorio x. Así,
399

La estimación maximum a posteriori (MAP) se obtiene como el vector que


maximiza la función de densidad posterior. Puesto que el denominador f(xc) es
un factor de escala que no interviene en el proceso,

Si x es un proceso aleatorio gaussiano con media 0 y covarianza Qxx,

y la función de densidad de probabilidad a posteriori del segmento desconocido


xd dado el segmento conocido xc se escribe

La estimación MAP se deduce igualando a cero la derivada respecto de xd de la


función de verosimilitud lnf(x|xc). Resulta
400

MODELOS MATEMÁTICOS PARA DETECTAR SCRATCHES

Técnicas Bayesianas: separación de señales

En el contexto de las técnicas bayesianas, se puede formular el problema de


supresión de los pulsos transitorios como un problema de separación de
señales, adoptando la hipótesis general de que se conoce la localización de los
citados pulsos, es decir se supone que se sabe distinguir entre bloques de
señal que contienen un pulso de aquellos que no están degradados por el
defecto citado.

Se considera en primer lugar el siguiente problema general: sean y1, y2


procesos AR, independientes y gaussianos, con parámetros A2, P2, σ2e1, A1, P1,
σ2e2, conocidos. Se suponen conocidas además las observaciones

sobre un bloque de muestras de tamaño N. Se plantea el problema de obtener


una estimación de y1, de forma que los dos procesos AR considerados queden
identificados individualmente. Las funciones de densidad de probabilidad
respectivas de los procesos y1, y2 son, respectivamente,

para j=1,2, limitadas a las Pj primeras muestras, j=1,2.

Para obtener una estimación y1MAP se recurre a la maximización de fy1|y(y1|y)


que, de acuerdo con el teorema de Bayes se puede escribir:
401

Además,

e ignorando el factor de escala fy(y),

Así la estimación MAP de y1 queda

Para realizar la supresión del pulso transitorio se adopta un modelo AR para la


señal y1 con P=40 (hasta 80) y otro para el pulso y2 con P=2 o 3, aplicando a
continuación el mecanismo de separación que se acaba de describir.

Sin embargo, los pulsos transitorios no obedecen a la hipótesis de


comportamiento gaussiano. Alternativamente, se puede suponer que la señal
de excitación tiene una varianza que es muy elevada en los momentos iniciales
del pulso, en correspondencia con la gran discontinuidad del defecto y una
varianza reducida el resto del tiempo. Si se designa con i a un vector binario
de longitud N cuyos valores 1 se aplican a las muestras de elevada varianza y
0 para las demás, la varianza de excitación en la muestra m está dada por:
402

donde se designa con subíndice 0 a la varianza de magnitud reducida y con 1 a


la varianza elevada. La matriz de covarianza para la excitación del pulso
transitorio es una matriz diagonal:

y la función de densidad de probabilidad para el pulso transitorio y2 resulta:

Siguiendo etapas análogas al caso directo de separación AR se tiene ahora la


estimación siguiente:

La estimación MAP de y1 de acuerdo con el algoritmo modificado implica


algunas consideraciones de orden práctico.

1. Los parámetros del modelo AR de la señal sin ruido se pueden obtener


haciendo uso del segmento no degradado inmediatamente anterior al pulso.
Para un bloque de 2000 muestras con arranque del pulso en la muestra M, se
hace uso de 1000 puntos precediendo al comienzo de la degradación. El orden
del proceso AR puede ser P=80.

2. Los parámetros correspondientes al modelo AR del pulso se pueden obtener


del segmento inmediatamente posterior a la discontinuidad de arranque del
pulso, partiendo de una versión limpia del mismo. Incluso, si es posible, se
403

obtienen a partir de un segmento de grabación en el que no exista sonido. Si


no se dispone de estimaciones adecuadas se utilizan los parámetros a2=[2,-1]
que conducen generalmente a magnitudes pequeñas de las diferencias

3. La estimación del vector i se realiza mediante un filtro inverso, de manera


semejante al procedimiento empleado para detectar ruidos impulsivos. Así, los
pulsos transitorios adquieren la consideración de clicks de gran amplitud. Para
distinguir entre clicks y pulsos, se requiere hacer uso de un umbral de mayor
magnitud para los defectos del segundo tipo. Para el bloque de 2000 puntos,
se deben seleccionar como de alta varianza un total de 50 a 100 puntos
muestrales desde el comienzo M del pulso.

4. La magnitud de la varianza σn02 se selecciona por el usuario, teniendo en


cuenta que si se utilizan valores muy grandes se puede interferir con el
contenido de baja frecuencia de la señal subyacente, mientras que si se
utilizan valores muy pequeños puede quedar una parte del pulso sin extraer.
Por otra parte para la varianza σn12>>σn02se adopta una cantidad
arbitrariamente grande. En el límite, los elementos de Λ-1, que se identifican
con 1/σn12 tienden a 0. Puesto que σn12 es muy grande y difícil de estimar, en la
práctica es conveniente optar por el caso límite.

5. Para el bloque antes considerado, el proceso de separación se realiza sobre


un total de 400 a 600 muestras comenzando 10 puntos antes de la muestra M,
fijando P muestras "correctas" precediendo a la muestra M-10.

6. El algoritmo directo para la estimación MAP de y1 implica el cálculo de la


inversa de una matriz de grandes dimensiones y posiblemente mal
condicionada. Un método más eficiente utiliza la técnica de filtros Kalman.
Adoptando las notaciones
404

las ecuaciones de estado se pueden escribir, respectivamente,

para i=1,2. El modelo se puede establecer en una forma más compacta


agrupando las dos señales:

siendo,

El algoritmo basado en el filtro de Kalman se resume así:


405

Tabla 8. Resumen del algoritmo de Kalman.

Inicialización

Cálculo Para n=1,2,...


Actualización
temporal:
Predicción

Actualización
de las
medidas:
corrección

donde Ci=E[xi(0)xi(0)T] son las matrices de covarianza para Pi muestras de los


procesos AR i=1,2.

Teniendo en cuenta que y=x1+x2, existe una redundancia en esta formulación


que puede ser aprovechada para simplificar el algoritmo.
406

Métodos espectrales de localización

Una tarea central en el proceso de eliminación de pulsos transitorios consiste


en la identificación de los bloques de señal que están contaminados por la
clase de degradación citada.

Teniendo en cuenta que los pulsos poseen una energía espectral significativa
en una banda espectral amplia, se puede calcular la transformada de Fourier
discreta en cada bloque y seleccionar los términos de dicha transformada que
quedan incluidos en la banda de frecuencias adoptada. El valor medio de los
valores absolutos de las componentes con frecuencia en la banda, para un
bloque con pulso transitorio, será superior a un umbral que deberá fijarse con
antelación.

Sea y la señal, Y su TFD, p y q los índices de las componentes de la


transformada que limitan la banda. Para un bloque determinado con N
muestras, el valor medio se escribe:

Los índices p y q se pueden adscribir a las frecuencias de 3 y 10 kHz,


respectivamente, que limitan una banda en la que evolucionan las frecuencias
de los pulsos. Realizando una normalización de la magnitud de los coeficientes
de Fourier, se contrasta µ con el umbral λ de valor 0.5.
Cuando el contenido espectral de altas frecuencias de la señal es importante,
se modifica el esquema anterior calculando la resultante µm de aplicar a µ un
filtro de mediana con una ventana de tamaño impar, por ejemplo v=5. Se
determina la diferencia
407

que se contrasta con un nuevo umbral λ. Se declaran corrompidos los bloques


de señal para los que
408

ALGORITMOS PARA LA RESTAURACIÓN DE SEÑALES CON SCRATCHES

Las muestras irrevocablemente distorsionadas por la parte inicial de cada pulso


deber ser eliminadas y reemplazadas por estimaciones determinadas por un
interpolador tipo LSAR, análogamente al proceso que se aplica cuando se
eliminan clicks.

Por otra parte, cuando se aplican técnicas bayesianas para suprimir pulsos
transitorios, es necesario en primer lugar realizar una tarea de localización de
los mismos a lo largo de la señal o, lo que es equivalente, identificar los
bloques degradados por pulsos de aquellos que no presentan la degradación
citada. Para ello, una vez aceptadas las hipótesis que permiten modelar los
bloques de señal como AR, se puede hacer uso de métodos análogos a los
utilizados para detectar la presencia de clicks. El coste computacional suele ser
elevado porque las matrices que es necesario invertir alcanzan un tamaño muy
grande pero es posible considerar un modelo estado-espacio para implementar
un filtro de Kalman que permita un algoritmo numérico de separación viable.
409

MODELOS MATEMÁTICOS PARA DEGRADACIONES GLOBALES

Método basado en la transformada wavelet continua

El problema de eliminación de ruido de fondo se puede abordar considerando


el modelo clásico

donde x es la señal subyacente cuyo modelo es determinista y w un ruido


blanco independiente de x y con varianza σ2. Los mecanismos de atenuación
espectral resuelven el problema de restauración pero tienen el problema de
que, al mismo tiempo, eliminan o atenúan singuaridades de la señal que
muchas veces representan rasgos de la misma no prescindibles.

La transformada wavelet continua genera coeficientes cuya magnitud está


determinada por la mezcla del ruido con la señal subyacente. El grado de
influencia de cada componente de la señal depende de la escala de
representación. En particular, los máximos locales de los coeficientes de la
transformada reciben aportaciones diferenciadas desde la señal x y el ruido w.

En general, siendo w un proceso aleatorio estacionario con media 0 se puede


definir su función de covarianza:

y su espectro de potencia:
410

Puesto que las wavelets poseen media 0, se cumple

y además,

de donde se deduce:

Así, desde el punto de vista estadístico, el ruido blanco exhibe una aportación
a la magnitud de los coeficientes CWT que crece de una forma explosiva
cuando a tiende a 0.

Por otra parte, si w es un ruido blanco gaussiano, a una escala determinada a


la función:

es también un proceso aleatorio gaussiano para el que se demuestra que la


densidad de máximos locales de la transformada wavelet continua es:
411

(n)
donde ψ es la derivada n-sima de ψ y λ una constante tal que 0.5<λ<1. La
densidad da es inversamente proporcional a la escala, de manera que cuando
se pasa de la escala a=2j a la escala a=2j+1, la cantidad de máximos locales
que corresponden a la transformada wavelet del ruido w pierde la mitad de sus
efectivos.

Para la señal subyacente x, en los puntos singulares cuya regularidad de


Lipschitz es positiva, las magnitudes de los máximos locales de la
transformada wavelet crecen o permanecen constantes cuando la escala crece.
Por otra parte, para el ruido blanco w, que presenta puntos con exponente de
Holder negativo, la magnitud de los máximos locales decrece en promedio
cuando la escala crece.

Tomando en consideración los comportamientos diferenciados de las líneas de


máximos locales que caracterizan las señales x y w, un mecanismo para
eliminar el ruido de fondo podría ser el siguiente:

1. Trazar las líneas de máximos locales de la transformada;


2. Clasificar las líneas como generadas por la señal subyacente x o por el ruido
w.
3. Eliminar las líneas de máximo asociadas con el ruido.
4. Recuperar la señal a partir de las líneas de máximo restantes.
412

Figura 171. Suma de señales senosoidales una exponencial que decae exhibiendo una
discontinuidad de ruido blanco.

La señal es una suma de una sinusoide, una exponencial que decae rápidamente y empieza en la
muestra 1501 (abscisa 46.97) exhibiendo una discontinuidad y un ruido blanco. La sinusoide deja
de existir en la muestra 3001 (abscisa 92.06) de un total de 4096, que corresponde a la abscisa 40π.
413

Figura 172. Máximos locales de la CWT.

La gráfica de líneas de máximo exhibe su diferente comportamiento de


acuerdo con los puntos de la señal que las generan. La situada más a la
derecha, se debe al efecto de borde; hacia la izquierda sigue un paquete de
líneas debido al ruido exento de señal; las líneas que terminan hacia la
ordenada 9, proceden del ruido de fondo; las que terminan en torno a 5, se
deben a la señal sinusoidal; la línea que desborda la gráfica por la parte
superior, está generada por la discontinuidad, en el punto 1531. Por último la
que apunta a la muestra 3001, se debe a la desaparición repentina de la señal
sinusoidal.

Más generalmente, cualquier método que facilite la determinación numérica del


escalograma modificado

conduce a una solución para la eliminación del ruido de fondo de la señal.


414

Matching Pursuit de S. Mallat y Z. Zhang

Sea H un espacio de Hilbert y:

un diccionario redundante de elementos de H tales que ||φγ||=1. Se designa


por V el subespacio vectorial engendrado por los vectores del diccionario, que
es un diccionario completo si V=H. Se plantea de nuevo el problema de
construir representaciones de señales s∈H mediante combinaciones lineales de
los elementos de Φ mediante operadores de la forma

no necesariamente lineales. Para introducir y motivar el mecanismo Matching


Pursuit, se considera un elemento Φ0 de H y se formula la proyección ortogonal
de la señal s sobre el mismo:

siendo el residuo R(s), ortogonal a Φ0.


415

Figura 173. Proyección ortogonal para Matching Pursuit.

Se cumple:

o bien

Para minimizar la norma del residuo, es necesario seleccionar Φ 0 de forma que


|<s, Φ 0>| sea máximo.

Generalmente, para espacios de dimensión infinita solo es posible seleccionar


φ0 de forma que |<s, Φ 0>| se acerca al máximo en el sentido siguiente:

donde α es una coeficiente de optimalidad tal que 0< α ≤1 y Γα⊆Γ. La


construcción de Γα depende del diccionario F, pero si está indexado por un
conjunto continuo Γ, habitualmente Γα es una malla que permite la
discretización de Γ.
416

El mecanismo Matching Pursuit prosigue con la búsqueda del elemento del


diccionario Φ para el que la proyección de R(s) minimiza R2(s)

El algoritmo Matching Pursuit

El algoritmo Matching Pursuit se desarrolla a partir de R0(s)=s. Si se supone


conocido el residuo Rk(s), se elige φγ∈Φ de forma que

y se calcula Rk+1(s) de forma que

siendo Rk+1(s) ortogonal a φk. Así,

En estas condiciones, se puede obtener una descomposición de la señal s como


combinación lineal de n elementos del diccionario sumando miembro a
miembro las n versiones de las ecuaciones precedentes obtenidas para
k=0,1,...,n-1:

Se tiene:
417

de donde,

y se puede probar que la convergencia es exponencial cuando H es de


dimensión finita. Por el contrario, cuando H es de dimensión infinita, la
convergencia es muy lenta.

Desde el punto de vista práctico, suponiendo que H es de dimensión finita, el


algoritmo Matching Pursuit comienza con el cálculo y almacenamiento de todos
los productos escalares:

Como ya se ha adelantado, el algoritmo progresa de forma inductiva. Si se


conocen las cantidades:

entre ellas se debe seleccionar φn tal que:

lo que permite determinar:


418

o mejor:

Puesto que se conocen los valores <Rn(s), φn> y <Rn(s), φγ> solo es necesario
calcular los productos <φn, φγ>. Si se designa por I el número de operaciones
necesarias para este último cálculo y por Z el número medio de cantidades no
nulas así obtenidas, para un número de P iteraciones del algoritmo Matching
Pursuit, el coste computacional del proceso será del orden de O(PIZ).

El número de iteraciones adecuado, se obtiene en cada caso mediante la


comparación de la energía de la señal ||s||2 con las sumas:
419

Búsqueda de bases (Basis Pursuit)

El problema que se propone es el de aproximar una señal de longitud finita N


mediante combinaciones lineales de los elementos de un diccionario
redundante G, también de tamaño finito P>N:

En particular, se buscan bases, no necesariamente ortogonales de forma que

siendo {φγ0, φγ,..., φγN-1} la mejor base en el sentido de que la norma l1 de los
coeficientes sea mínima:

Este problema se puede así formular en los siguientes términos: Determinar un


conjunto de N coeficientes αk de forma que

para n=0,1,...,N-1, de manera que se satisfaga la condición de mínimo


precedente. En forma matricial,

con la condición Ga=b.


420

En virtud de la no diferenciabilidad de la norma l, se tiene un problema de


programación no lineal que, sin embargo, se puede transformar en otro de
programación lineal eventualmente de gran magnitud por el tamaño de los
vectores y matrices implicados.

El proceso así definido se denomina persecución de bases (Basis Pursuit).


421

ALGORITMOS PARA LA RESTAURACIÓN DE SEÑALES CON


DEGRADACIONES GLOBALES

Algoritmo de atenuación espectral (Tecnología de modificación)

El algoritmo de atenuación espectral para eliminar el ruido de fondo se


describe esquemáticamente en la gráfica que sigue:

Figura 174. Algoritmo de atenuación espectral.

En primer lugar, la señal de audio se subdivide en bloques de 1024 0 2048


muestras, aplicando una ventana de Hamming o de Hanning (ventaneado
previo) para determinar la transformada de Fourier discreta Y del bloque. Se
admite un solapamiento del 25 o del 50%. Seguidamente se aplica al espectro
obtenido la función f obteniendo una nueva versión del espectro X, del que se
determina la transformada inversa con ayuda de un ventaneado posterior. Ya
en el dominio temporal, se hace uso de una función de compensación en razón
de la pérdida de ganancia por efecto del ventaneado. Todas estas operaciones
se realizan en cada bloque, de forma que finalmente se debe insertar el
422

resultado en el emplazamiento conveniente, de forma análoga a como se hace


en la práctica de la STFT estándar.

La aproximación más directa para construir una regla de supresión consiste en


sustraer la magnitud del espectro del ruido de la magnitud del espectro de la
señal:

Otras reglas de supresión implican los espectros de potencia respectivos:

Los parámetros a y b se ajustan para controlar la cantidad de ruido que se


desea reducir y el nivel del ruido residual.

Una de las funciones de atenuación más utilizadas es la que se basa en el filtro


de Wiener, que posee la propiedad de que minimiza el error cuadrático medio
de reconstrucción en el dominio tiempo:

siendo SX el espectro de potencia de la señal y SD el espectro de potencia del


ruido.

La segunda de estas cantidades, el espectro de potencia del ruido, se puede


estimar a partir de segmentos de la señal que no tengan contenido musical o
de habla. Por otra parte, si SY es el espectro de potencia de la señal
degradada,
423

Si se admite la aproximación

se deduce una estimación para el espectro de potencia de la señal:

Así, la expresión de la función de atenuación sería la siguiente:

Una vez obtenida la estimación de |X^(n,m)| se puede escribir:

La permanencia de la fase de la señal degradada está motivada por el hecho


de que la fase es de una relevancia menor para la calidad del sonido.

El uso de los métodos de atenuación espectral, tal como han sido ilustrados
mediante el derivado del filtro de Wiener, tienen el inconveniente de
introducen varios artefactos en el ruido residual, el más molesto de los cuales
es el denominado 'ruido musical', que se debe a la clase de estimación
utilizada para SX. La formulación conduce a una sobre-estimación de SX cuando
|Y(n,m)| es demasiado alta y a una subestimación cuando |Y(n,m)| es
demasiada baja. En efecto, cada bloque siempre tendrá componentes
424

espectrales debidos al ruido de dicho bloque cuya potencia será superior que la
potencia estimada para el ruido SD. La generación de ruido musical se hace
evidente cuando se realiza el proceso sobre una señal y=0+d, de manera que
SX=0. Este inconveniente es compartido con las metodologías de umbral
basadas en la transformada wavelet discreta.

Una técnica de supresión que elimina el ruido musical se basa en la regla de


Ephraim y Malah, que en 1984 publicaron un estimador de amplitud espectral
que minimiza el error cuadrático medio bajo la suposición de que los
coeficientes de Fourier de la señal original pueden ser modelados como
variables aleatorias gaussianas, de media cero y estadísticamente
independientes. Para el caso de ruido aditivo blanco gaussiano de media cero
la regla de supresión resultante se escribe:

donde I0 e I1 son las funciones de Bessel modificadas de orden 0 y orden 1,


respectivamente y:

El coeficiente ξ (n,m) es la razón de las varianzas de los coeficientes de Fourier


de la señal subyacente y del ruido. Puesto que ambos tipos de coeficientes son
gaussianos por hipótesis, ξ (n,m) se interpreta como un SNR a priori, siendo

el SNR a posteriori porque está relacionado con la señal degradada y en lugar


de estarlo con la señal subyacente x.
425

En ocasiones se hace uso de una versión simplificada de la regla de supresión


de Ephraim y Malah:

La regla de supresión de Wiener se puede escribir en función de ψ (m):

Finalmente, existen muchas propuestas para eliminar ruidos de banda ancha


basados en wavelets. La más elemental consiste en considerar el modelo

donde, por ejemplo, d puede ser un ruido blanco gaussiano independiente de


x. Una vez calculados los coeficientes de la DWT de la señal y, se aplica sobre
ellos una transformación no lineal, que puede ser de naturaleza muy diversa.

Por ejemplo, los coeficientes que corresponden a una o varias escalas que
están por debajo de un umbral determinado se igualan a 0 (hard tresholding):

donde los índices i,m indican la escala y la posición temporal, respectivamente.


Otra posibilidad es hacer uso de un soft tresholding:
426

Se puede, en fin, combinar la selección de umbrales con algoritmos derivados


de las reglas de supresión de Wiener o de Ephraim y Malah

Algoritmo mediante Matching Pursuit (Tecnología de Sustitución)

Sea y la señal observada de manera que

siendo s la señal restaurada y Z el ruido. Para restaurar la señal se aplica el


proceso MP declarando eventualmente coherentes a los elementos del
diccionario Γ seleccionados por el proceso. Para k≥0 se dice que φk es una
estructura coherente si se cumple

Si M es el menor número natural tal que

entonces RM(y) no admite nuevas descomposiciones y la estimación de la señal


s se escribe:
427
428

Algoritmo mediante Basis Pursuit (Tecnología de Sustitución)

Sea y una señal observada que se descompone en dos sumandos

siendo s la señal restaurada y R la señal identificada como ruido. Para aplicar


el método Basis Pursuit, el modelo adecuado es el de una representación
aproximada:

donde

es una base de cardinal m no necesariamente ortonormada y R(m) representana


una señal residual que se identifica con el ruido.

El mecanismo de restauración con Basis Pursuit consiste un encontrar


soluciones para el problema:

La solución a este problema es una función a(λ) y proporciona una


descomposición:

donde,
429

El valor de λ se puede tomar:

siendo p la cardinalidad del diccionario.

El problema de optimización se puede escribir como uno de programación


cuadrática con restricciones de positividad:

Así,

sujeto a

Se demuestra que este problema es equivalente a

con las condiciones


430

Para resolver esta versión del problema, se puede hacer uso de un algoritmo
de punto interior.
445

ANEXO A

PAPER PUBLICABLE
446

La Restauración de Audio
Gustavo Adolfo Valencia Zapata
Nicolás Ramírez Echeverri

parecido al original (originalidad y fidelidad), y el desarrollo de


Abstract-- The restoration of audio is a discipline that embraces
topics that makes articulations between the physics and the audio. mecanismos que permitan escucharlo con una calidad tal cual fue
To understand the audio restoration process clearly it is necessary, grabado. Estos dos aspectos han generado, dentro de la ciencia
initially, to approach some concepts of the waves theory in order to que es el audio, múltiples disciplinas, entre ellas la restauración
identify the parameters associated with some characteristics of the del audio. Esta disciplina se viene aplicando empíricamente
musical perception. desde la aparición del primer mecanismo para registrar sonidos:
The process of audio restoration has gone by many stages and,
el fonógrafo.
along the history, diverse mechanisms have been created to
counteract the noise of the analogical recordings and to improve the La era digital le abrió al audio las puertas de la eternidad, la
quality of the recorded sound. However, it had never been so near fidelidad y la limpieza mediante su digitalización y tratamiento
the perfection as now, in a time where the digital audio, the digital digital, procedimientos que permiten, a través de una sucesión de
formats and the computers, with their programs of digital audio elementos perfectamente sincronizados, tomar una caduca señal
restoration, provide powerful tools to finish with the limitations of analógica y convertirla en una saludable señal digital mediante
analogical audio. It is clear that this perfection would not be
su restauración.
possible if a series of corrective actions are not taken, before
digitalization is done, on the analogical means and if the geniuses
La restauración digital de audio es un procedimiento complejo
that developed the restoration algorithms, present in digital audio que implica considerar unas medidas, tanto desde el punto de
restoration programs, had not existed. vista físico como digital, antes y después del tratamiento, con el
fin de obtener un resultado óptimo y duradero.
Desde lo físico, las consideraciones que deben asumirse
La restauración de audio es una disciplina que abarca tópicos que permiten una identificación del medio que se va a restaurar, sus
hace articulaciones entre la física y el audio. Para entender características técnicas y constructivas, así como la posibilidad
claramente el proceso de restauración de audio es necesario, de ejecutar sobre él una restauración física. La cual, si el medio
inicialmente, abordar conceptualmente la teoría ondulatoria para lo permite, debe ser llevada a cabo con sumo cuidado, ya que del
identificar los parámetros asociados con algunas características de excelente mecanismo de esta etapa dependen la eficiencia del
la percepción musical. tratamiento digital y, obviamente, sus resultados.
El proceso de la restauración de audio ha pasado por muchas En lo que respecta a lo digital, las consideraciones están
etapas y, a lo largo de la historia, se han creado diversos enmarcados dentro de lo técnico, ya que implican la
mecanismos para contrarrestar el ruido de las grabaciones identificación de parámetros que influyen directamente en la
analógicas y mejorar la calidad del sonido grabado. Sin embargo, calidad del audio digitalizado y la correcta selección de los
nunca se había estado tan cerca de la perfección como ahora, en una dispositivos de captura que, de acuerdo con las necesidades,
época en la que el audio digital, los formatos digitales y la pueden presentar características constructivas y especificaciones
computación, con sus programas de restauración digital de audio, técnicas muy diferentes. También en este nivel, se encuentra el
proveen de poderosas e ilimitadas herramientas para terminar
proceso de restauración digital a cargo de los programas de
definitivamente con las imperfecciones del audio analógico. Es claro
que esta perfección no sería posible si no se toman una serie de edición gráfica de audio, que son los encargados, por medio de
acciones correctivas, previas a la digitalización, sobre los medios poderosos algoritmos matemáticos que utilizan predicciones
analógicos y si la humanidad no hubiera contado con los grandes probabilísticas, de detectar los ruidos indeseados y reconstruir la
genios que han desarrollado los modelos matemáticos en los que señal de audio original. Además, tiene la posibilidad de agregar
descansan todos los algoritmos de restauración de señales presentes efectos con el fin de optimizar y enriquecer el sonido.
en los programas de restauración digital de audio.
Index Terms—Restauración de audio, audio analógico, audio digital,
formatos analógicos, formatos digitales, degradaciones, algoritmos II. FORMATOS ANALÓGICOS DE AUDIO
de restauración, ruidos, conversores de audio, programas de edición
grafica de audio, resolución digital, frecuencia de muestreado, Un formato, como su mismo nombre lo indica, puede
estructuras, tratamiento digital de audio, click, hiss, thumps, concebirse como la manera mediante la cual los datos son
scratches, crackles, distorsión, hum, Radio Bolivariana. organizados sistemáticamente para su procesamiento,
reproducción y transmisión. Los datos son, principalmente,
I. INTRODUCCION imágenes, sonidos, e información alfanumérica. Para cada
clase de dato existen diferentes formatos en los que se
D esde finales de 1800, época en la que comenzó una nueva
era en el mundo musical, la investigación referida al tema
del audio se ha centrado principalmente en dos aspectos: el
pueden organizar dichos datos. Estos formatos pueden ser
de dos clases: el formato analógico y el formato digital. A
desarrollo de métodos que permitan registrar el sonido lo más
447
continuación se mencionan en forma cronológica los
diferentes formatos de audio analógico.
• Cilindro de cera de Edison. 1877, su reproductor
es el fonógrafo.
• Disco de 78 RPM. 1887, su reproductor es el
gramófono.
• Alambre. 1920 aprox, su reproductor recibe el
mismo nombre.
• Cinta de carrete a carrete o de carrete abierto.
1934, su reproductor recibe el mismo nombre.
• Disco de vinilo. 1945, su reproductor es conocido
como tocadisco.
• Cartucho de 4 pistas. 1956, su reproductor es Fig. 1. Imagen del síndrome de Sticky Shed.
conocido como tocadisco.
• Cartucho RCA o RCA sound tape cartridge. 1958, disco e impidiendo su correcta reproducción. Otro tipo de
su reproductor recibe el mismo nombre. degradaciones, son las de naturaleza química que consiste
• Sanyo micro pack 35. 1960, su reproductor recibe en la descomposición del material base de los discos.
el mismo nombre.
• Cartucho de 8 pistas. 1960 aprox, su reproductor
recibe el mismo nombre. Dependiendo del nivel de estas degradaciones tanto en
• Casete de audio compacto. 1963, su reproductor cintas magnéticas como en discos, existen tratamientos
recibe el mismo nombre. físicos correctivos que logran recuperar en un alto
• Playtape. 1966, su reproductor recibe el mismo porcentaje la calidad sonora original del medio de
nombre. almacenamiento analógico de audio. Estos procedimientos
• Microcasete. 1970 aprox, su reproductor recibe el requieren de mucha técnica y cuidado y son referidos a
mismo nombre. especialistas y textos relacionados con la restauración de
audio.
• Elcaset. 1976, su reproductor recibe el mismo
Cuando se pretende realizar una restauración digital de
nombre.
audio sobre viejos fonogramas es necesario efectuar
correctamente la anterior etapa, asegurando la máxima
III. DAEGRADACIONES Y RUIDOS
calidad posible del medio analógico de almacenamiento,
A. Degradaciones físicas de los medios de almacenamiento de pues un formato con excesivas degradaciones impedirá un
audio analógico tratamiento digital exitoso. Sin embargo, es imposible
lograr una restauración física completa sobre el medio,
Cuando las cintas magnéticas de audio se exponen a siendo inherente a el una gran variedad de ruidos y
condiciones de humedad y temperatura inadecuadas, las elementos espurios causados por las degradaciones y fallas
distintas capas que las componen sufren procesos de en los equipos reproductores.
contracción y expansión, como podemos advertir en la
siguiente gráfica. Estas variaciones producen daños en la B. Ruidos o degradaciones en la señal de audio
superficie magnética, incluso, irreparables: pueden romper
el aglomerante y hacer que las partículas metálicas se El ruido, mezclado con una señal acústica destinada a ser
desprendan de su base plástica. Se trata de un fenómeno percibida por el hombre, constituye, generalmente, una
descrito en la literatura especializada como flaking off. parte subjetiva de la misma que transporta información no
Otra consecuencia del incorrecto almacenamiento en útil y que perturba la forma de onda de manera que
ambientes de alta humedad es el síndrome de Sticky Shed, modifica su significado, interfiriendo así la comunicación
que consiste en la caída del aglomerante que fija las de la parte útil. La parte útil transporta la información
partículas magnéticas a la base de la cinta. La degradación deseada y el ruido transporta información sobre los
causada por el síndrome de Sticky She, puede ser corregida elementos que han servido para generar la señal, grabarla y
por procesos de horneado donde se restablece la calidad transmitirla. El objetivo es implementar procesos de
del medio. En la Fig. 1. se aprecia el efecto causado por el separación de la señal útil del ruido, los que básicamente
síndrome de Sticky Shed a una cinta de carrete abierto. pueden ser contenidos por dos tipos: en el primer modelo,
En discos analógicos de audio, las degradaciones más se puede precisar la parte de la señal que se considera
comunes son la presencia de polvo y suciedades que ruido, procediendo a su eliminación. La señal restante será
generalmente causan rayones en la superficie del disco. la restaurada. En el segundo modelo, se puede precisar la
Las altas temperaturas alteran la estructura, deformando el parte de la señal que es de interés, música o palabra. Se
448
elimina la señal que no es de interés y queda la señal reproducción, se puede concluir, entonces, que son muy
restaurada. diferentes la sucesión de operaciones y el conjunto de
Los tipos de degradación, comúnmente asociados con dispositivos que es preciso poner en juego para la captura
viejas grabaciones, pueden ser clasificados en de señales de audio analógico.
perturbaciones localizables y globales. Por ejemplo, La captura de audio analógico se puede dividir en dos
impulsos cortos de ruido (clicks, crackles, y pops) como tipos generales, dependiendo de las posibilidades de los
también en baja frecuencia, pulsos largos, (thumps) son equipos reproductores. Cuando el equipo reproductor
localizables que afectan ciertas muestras en forma de posee salidas eléctricas de audio analógico la captura es del
impulsos, mientras continuas distorsiones de fondo o tipo limpio; cuando el equipo reproductor no posee
interferencias como el ruido de la banda ancha (hiss), (buzz salidas eléctricas de audio analógico la captura es del tipo
y hum), distorsión, distorsión armónica son usualmente sucio. Así, por ejemplo, para registros soportados en
clasificados como perturbaciones globales alterando todas cilindros de cera, se necesita capturar el sonido con ayuda
las muestras de la señal de audio. Otros ejemplos de de micrófonos. Esta etapa requiere una planificación
perturbaciones de audio incluyen las distorsiones no cuidadosa (posiblemente varios micrófonos dispuestos en
líneales (clipping), ruido de superficie y modulación rápida posiciones estratégicas) donde se filtran aquellas señales
o lenta en frecuencia, (wow y flutter), causadas por la sonoras, ajenas a la normal reproducción del registro.
alteración en la velocidad de reproducción del medio En el caso de soportes más modernos, como LP y
analógico de audio. casetes, se puede prescindir de la captura mediante
micrófono.
Tanto en la captura como en el tratamiento digital de
IV. TRATAMIENTO DIGITAL DE SEÑALES DE AUDIO PARA audio con fines de restauración es importante contar con
equipos de alto perfil que beneficien el proceso y no
SU RESTAURACION generen perdidas de información o alteren
perjudicialmente la señal de audio analógico capturada. En
la Fig. 2. Se esboza el proceso para la captura y tratamiento
A. Captura de la señal de audio analógico. digital de señales de audio, finalizando con el
Para comenzar un proceso de restauración y grabación almacenamiento del la señal modificada en un formato
digital de audio es necesario preparar una serie de digital de audio. En la Fig. 3. se ilustra el proceso de
dispositivos que cooperen en la captura de la señal. reproducción de la señal digital modificada, donde a través
Buscando con ello almacenarla en el disco duro de un del dispositivo llamado conversor análogo-digital y digital-
computador, donde la señal puede ser sometida a procesos análogo se logra migrar del mundo analógico al digital y
de restauración digital. De acuerdo con la edad de los viceversa.
registros de audio o fonogramas y los equipos de

Señal de audio Señal de audio


Señal analógica
digital digital modificada
de audio con
degradaciones 1010110 11 1010 0
0101001 0101101
0011110 000110 0
1100001 0100101

Medio de
ADC
almacenamiento
Computador digital

Fig. 2. Proceso de captura de señales de audio analógico

Señal de audio
Señal analógica
digital modificada
de audio sin
degradaciones
11 10100
0101101
00 0 110 0
0100101

Convensor D/A Amplificador Parlantes

Fig. 3. Proceso de reproducción de la señal de audio digital restaurada.


449
Al igual que en la etapa de restauración física de los líneal de vectores extraídos de un diccionario apropiado,
formatos analógicos, el fundamental precisar atención en la que se elige de acuerdo con la naturaleza de la señal.
correcta elección de los dispositivos que permiten realizar Las tecnologías de modificaciones diseñan modelos
los procesos de captura y tratamiento digital. matemáticos de la señal, que representan de manera precisa
la parte no degradada. Una vez detectado el segmento
B. Tratamiento digital para la restauración de audio degradado de la señal, es posible eliminarlo y sustituirlo
por otro que se cimentará en el modelo matemático.
La posibilidad de modificar las propiedades de una señal
Aquella parte de señal que no se identifica como
capturada a través de tratamiento digital es abundante,
degradación o ruido, se conserva en su estado original.
donde la aplicación de efectos sobre la señal logra realzar y
mejorar sus características emotivas en el caso de pretender Las técnicas de sustitución consisten en sustituir la señal
una restauración o en otros casos de crear nuevos e de audio por una combinación líneal, de señales
innovadores sonidos. Sin embargo el objetivo es conocer elementales extraídas de un diccionario adaptado a cada
las tecnologías de restauración de audio. Las tecnologías tipo de ruido. En el proceso se fijan límites de tolerancia
de restauración que se exponen están basadas en Procesos para la calidad de la representación, y el residuo
Digitales de Señales (DSP). Se dispone de dos áreas (fragmentos de la señal) que no es posible incluir en ella es
metodológicas que agrupan tecnologías con orientaciones precisamente el ruido que debe ser eliminado. En la Fig. 4.
diferentes. La primera se fundamenta en modificaciones se ilustra el tratamiento digital para la remoción de clicks
locales o globales de la señal de audio; la segunda se basa en una señal de audio a través de un programa
en la sustitución de la señal de audio por una combinación especializado en la edición grafica de audio.

Señal de audio
con clicks

Señal de audio
restaurada

Fig. 4. Detección y eliminación de clicks presentes en una señal de audio a través de tratamiento digital de audio.
450
V. CONCLUSIONES analógico, digitalización de audio analógico y posterior
tratamiento digital para la restauración.

La restauración de audio no es una disciplina que se


limita única y exclusivamente a estudiar conceptos REFERENCIAS
relacionados con la restauración de los soportes físicos de
almacenamiento y señal de audio, mediante el tratamiento [1]. AES: Audio Engineering Society. [en línea]. New York: AES, 2005
digital, pues, además, estudia detalladamente las <http://www.aes.org/> [consulta: 1 May. 2005].
[2]. AUDIO FORMATS. Wikipedia: list of audio formats [en línea]. s.l.:
características de las ondas y el análisis de algunos Wikipedia, 2005
conceptos referidos al audio analógico y digital, con el fin <http://en.wikipedia.org/wiki/List_of_audio_formats>
de ilustrar más claramente la naturaleza y los parámetros consulta: 17 Mar. 2005].
[3]. AUDIO RESTORATION. [en línea]. s.p.i.
que definen una onda de audio y su comportamiento, los <http://www.lnlrecording.com/FAQ/audio_restoration.htm>
que, a su vez, permiten identificar y percibir con precisión [consulta: 6 Mar. 2005].
las consecuencias de las degradaciones o ruidos en la [4]. AUDIO RESTORATION. WAVES: restoration bundle. [en línea].
s.l.: Waves Audio, 2005.
música. De esta manera se puede evaluar, con poco margen <http://www.waves.com/content.asp?id=59>
de error, las acciones correctivas que deben tomarse [consulta: 5 Mar. 2005].
[5]. BOLL. S, F. Suppression of Acoustic Noise in Speech Using Spectral
durante el tratamiento digital, en lo que se refiere a la Subtraction. En: IEEE Trans. Acoustics, Speech, and Signal
aplicación de algoritmos matemáticos, efectos o filtros Processing. Vol. ASSP- 27, No. 2 (Apr. – May. 1979) p. 113–120.
para resaltar o corregir un sonido en particular. [6]. CILETTI, Eddie. If I Knew You Were Coming I’d Have Baked A
Tape!: (A Recipe for Tape Restoration). [en línea]. s.l. CILETTI,
Eddie, 1998. <http://www.tangible-
La aplicación del Procesamiento Digital de Señales technology.com/tape/baking1.html>
(DSP) en problemas relacionados con la restauración de [consulta: 4 Abr. 2005].
[7]. ESQUEF A. A, Paulo. Model-Based Analysis of Noisy Musical
audio, ha sido una área de considerable crecimiento desde Recordings with Application to Audio Restoration. [en línea].
las primeras investigaciones en este tema, a principios de Helsinki: Helsinki University of Technology, 2004.
<http://lib.tkk.fi/Diss/2004/isbn9512269503/> [consulta: 6 Mar.
1970. Para 1980, los chips DSP ya eran suficientemente 2005].
poderosos como para ejecutar las complejas operaciones [8]. GODSILL, Simon and RAYNER, J.W. Digital Audio Restoration: A
requeridas por la restauración digital de audio en tiempo Statistical Model Based approach. [en línea], Cambridge: University
of Cambridge, 1998. <http://www-
real. Todo esto dio origen a los primeros sistemas sigproc.eng.cam.ac.uk/~sjg/springer>
comerciales de restauración digital por parte de CEDAR [consulta: Ene. 20].
Audio, en el Reino Unido y Sonic Solutions, en Estados [9]. HANDBOOK FOR SOUND ENGINEERS. 3 ed. Portland:
BALLOU, Glen, 2005. 1553p.
Unidos [10]. IEEE VIRTUAL MUSEUM. The beats goes on: How sounds are
recorded and played. [en línea]. s.l.: IEEE, 2005. <http://www.ieee-
virtual-museum.org/index.php> [consulta: 12 Abr. 2005].
Una de las ventajas que proporciona el audio digital [11]. CEDAR. Introducction to Audio restoration. [en línea]. s.l.: CEDAR,
sobre el audio analógico es que permite la experimentación 2005. <http://www.cedar-audio.com/> [consulta: 3 Mar. 2005].
y el ensayo, es decir, manipular información digital es más [12]. JORDÀ PUIG, Sergi. Conceptos avanzados de procesador digital de
audio. [en línea]. s.l.: Resonancias, 1997.
fácil y más seguro ya que hace posible la reversibilidad del <http://www.ccapitalia.net/reso/articulos/index.htm?frame=http%3A//
proceso. Reversibilidad en el sentido de que se pueden www.ccapitalia.net/reso/articulos/articulos.htm> [consulta: 12 Mar.
hacer copias con mayor facilidad y sin perder calidad de 2005].
[13]. VASEGHI S, V. and RAYNER. J, W. Detection and Suppression of
audio en el proceso de duplicación. El audio analógico no Impulsive Noise in Speech Communication Systems. Proc. IEEE Int.
posee esta flexibilidad ya que el tratamiento físico puede Conf. Acoustics, Speech, and Signal Processing. Vol. 137, No. 1 (Feb.
– Mar. 1990); p. 38-46.
ocasionar destrucción permanente, lo que quiere decir que
duplicar no es una solución, ya que con cada copia la
calidad del sonido va decayendo

Más allá del conocimiento adquirido en este trabajo por


la investigación y búsqueda de información relacionada
con la restauración de audio, es evidente que los frutos
más apreciados son los beneficios recibidos por la
comunidad universitaria, la naciente línea de formación en
audio de la Escuela de Ingeniería y, particularmente, por la
emisora de la Universidad Pontificia Bolivariana, con la
que compartimos el beneplácito de los logros obtenidos
con este trabajo, un texto rico en información técnica con
reales soluciones a la problemática referida a la
degradación de medios de almacenamiento de audio

También podría gustarte