Restauracion de Audio - Universidad Pontificia Bolivariana

LA RESTAURACIÓN DE AUDIO
GUSTAVO ADOLFO VALENCIA ZAPATA

NICOLÁS RAMÍREZ ECHEVERRI
UNIVERSIDAD PONTIFICIA BOLIVARIANA

FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
MEDELLÍN
2005
LA RESTAURACIÓN DE AUDIO
GUSTAVO ADOLFO VALENCIA ZAPATA

NICOLÁS RAMÍREZ ECHEVERRI
Trabajo de grado para optar al título de Ingeniero Electrónico e Ingeniero

Electricista
Director
JOSÉ RICARDO ZAPATA
Ingeniero Electrónico
UNIVERSIDAD PONTIFICIA BOLIVARIANA

FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
MEDELLÍN
2005
Nota de aceptación
_________________
_________________
_________________
_________________
_________________
Presidente del jurado
_________________
Jurado
_________________
Jurado
Medellín, 19 de julio de 2005

A Libia, Flor, Natalia, Flavio y Gabriel, mi familia
A quienes les debo todo.
Gustavo Adolfo Valencia Zapata

A mi familia
Nicolás Ramírez Echeverri

Mi reino es tan amplio como el universo y mis ambiciones no tienen límites.
Siempre voy avanzando, liberando espíritus y sopesando mundos, sin miedo,
sin compasión, sin amor, sin Dios. Me llamo Ciencia.
- Gustave Flaubert
El miedo y la ignorancia degradan nuestra mente, engendran oscuridad. La

Ciencia es el algoritmo restaurador que ilumina el camino a la libertad.
- Gustavo Valencia
- Nicolás Ramírez
AGRADECIMIENTOS
Agradecemos a nuestras familias, guías y participes de nuestros logros y a

nuestra Alma Mater.
Agradecimientos especiales a:
José Ricardo Zapata, nuestro director.

Hernán Valencia Gallón, quien con su apoyo y dedicación hizo posible este
trabajo.
Radio Bolivariana por su apoyo y calidad humana.
Finalmente, a nosotros.
CONTENIDO
Pag.
INTRODUCCIÓN ................................................................................... 34
1. CONCEPTOS DE SONIDO Y RESTAURACIÓN DE AUDIO¡Error! Marcador no
definido.
1.1. PRINCIPIOS BÁSICOS DE AUDIO............. ¡Error! Marcador no definido.
1.1.1. Onda.. .............................................. ¡Error! Marcador no definido.
1.1.2. Tipos de ondas................................... ¡Error! Marcador no definido.
1.1.2.1. Monodimensionales.......................... ¡Error! Marcador no definido.
1.1.2.2. Bidimensionales. ............................. ¡Error! Marcador no definido.
1.1.3. Algunos parámetros............................ ¡Error! Marcador no definido.
1.1.3.1. Periodo. ......................................... ¡Error! Marcador no definido.
1.1.3.2. Frecuencia...................................... ¡Error! Marcador no definido.
1.1.3.3. Fase.. ............................................ ¡Error! Marcador no definido.
1.1.3.4. Longitud de onda............................. ¡Error! Marcador no definido.
1.1.3.5. Amplitud ........................................ ¡Error! Marcador no definido.
1.1.3.6. Rapidez de la onda. ......................... ¡Error! Marcador no definido.
1.1.4. Sonido. ............................................. ¡Error! Marcador no definido.
1.1.4.1. Ondas de presión sonora. ................. ¡Error! Marcador no definido.
1.1.4.2. Características del sonido. ................ ¡Error! Marcador no definido.
1.1.4.3. Campos de investigación .................. ¡Error! Marcador no definido.
1.2. HISTORIA DE LA TECNOLOGÍA DE GRABACIÓN¡Error! Marcador no
definido.
1.2.1. La Historia......................................... ¡Error! Marcador no definido.
1.3. PRINCIPIOS BÁSICOS DE LA RESTAURACIÓN DE AUDIO. ............. ¡Error!
Marcador no definido.
1.3.1. Restauración tradicional de audio. ........ ¡Error! Marcador no definido.
1.3.2. Ruidos o degradaciones....................... ¡Error! Marcador no definido.
1.3.3. Clasificación de degradaciones. ............ ¡Error! Marcador no definido.
1.3.3.1. Clicks............................................. ¡Error! Marcador no definido.
1.3.3.2. Scratches. ...................................... ¡Error! Marcador no definido.
1.3.3.3. Crackles.. ....................................... ¡Error! Marcador no definido.
1.3.3.4. Thumps.......................................... ¡Error! Marcador no definido.
1.3.3.5. Distorsión....................................... ¡Error! Marcador no definido.
1.3.3.6. Clipping ......................................... ¡Error! Marcador no definido.
1.3.3.7. Hiss ............................................... ¡Error! Marcador no definido.
1.3.3.8. Buzz. ............................................. ¡Error! Marcador no definido.
1.3.3.9. Hum. ............................................. ¡Error! Marcador no definido.
1.3.3.10. Flutter y wow ................................ ¡Error! Marcador no definido.
2. FORMATOS DE AUDIO ANALÓGICO ........... ¡Error! Marcador no definido.
2.1. AUDIO ANALÓGICO ............................... ¡Error! Marcador no definido.
2.1.1. Limitaciones del audio analógico. ......... ¡Error! Marcador no definido.
2.2. FORMATO ............................................ ¡Error! Marcador no definido.
2.3. FORMATOS DE AUDIO ANALÓGICOS........ ¡Error! Marcador no definido.
2.3.1. Cilindro de cera de Edison. .................. ¡Error! Marcador no definido.
2.3.2. Disco de 78 RPM. ............................... ¡Error! Marcador no definido.
2.3.3. Alambre............................................ ¡Error! Marcador no definido.
2.3.4. Cinta de carrete a carrete o de carrete abierto.¡Error! Marcador no
definido.
2.3.5. Disco de vinilo. .................................. ¡Error! Marcador no definido.
2.3.6. Cartucho RCA o RCA sound tape cartridge.¡Error! Marcador no
definido.
2.3.7. Sanyo micro pack 35 .......................... ¡Error! Marcador no definido.
2.3.8. Cartucho de 4 pistas ........................... ¡Error! Marcador no definido.
2.3.9. Cartucho de 8 pistas ........................... ¡Error! Marcador no definido.
2.3.10. Casete de audio compacto.. ............... ¡Error! Marcador no definido.
2.3.11. Playtape.......................................... ¡Error! Marcador no definido.
2.3.12. Microcasete ..................................... ¡Error! Marcador no definido.
2.3.13. Elcaset. ........................................... ¡Error! Marcador no definido.
3. DEGRADACIONES Y TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE LOS
MEDIOS DE ALMACENAMIENTO ANALOGICOS . ¡Error! Marcador no definido.
3.1. DEGRADACIONES DE LOS SOPORTES MAGNÉTICOS¡Error! Marcador no
definido.
3.1.1. Otros Factores que inciden en la conservación de los soportes
magnéticos................................................. ¡Error! Marcador no definido.
3.1.1.1. La calidad de las cintas..................... ¡Error! Marcador no definido.
3.1.1.2. Las condiciones de almacenamiento. .. ¡Error! Marcador no definido.
3.1.1.3. El número de reproducciones. ........... ¡Error! Marcador no definido.
3.1.1.4. Polvo y suciedad.............................. ¡Error! Marcador no definido.
3.1.1.5. Campos magnéticos. ........................ ¡Error! Marcador no definido.
3.2. Degradaciones de los discos analógicos .... ¡Error! Marcador no definido.
3.2.1. Degradaciones en discos de acetato. ..... ¡Error! Marcador no definido.
3.2.2. Degradaciones en discos de ebonita ...... ¡Error! Marcador no definido.
3.2.3. Degradaciones en discos de vinilo......... ¡Error! Marcador no definido.
3.3. TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE LOS MEDIOS DE
ALMACENAMIENTO ANALOGICOS................... ¡Error! Marcador no definido.
3.3.1. Tratamiento físico de las cintas magnéticas¡Error! Marcador no
definido.
3.3.1.1. Determinación del tipo de cinta ......... ¡Error! Marcador no definido.
3.3.1.2. Determinación del estado de la cinta. . ¡Error! Marcador no definido.
3.3.1.3. Proceso de horneado de una cinta magnética¡Error! Marcador no
definido.
3.3.1.4. Tratamiento de una cinta magnética con problemas menores... ¡Error!
3.3.2. Tratamiento físico de las degradaciones en discos analógicos...... ¡Error!
3.3.2.1. Degradaciones químicas.. ................. ¡Error! Marcador no definido.
3.3.2.2. Degradaciones físicas ....................... ¡Error! Marcador no definido.
4. CAPTURA DE SEÑALES DE AUDIO ANALOGICO¡Error! Marcador no
definido.
4.1. FUNDAMENTOS DEL SONIDO DIGITAL ..... ¡Error! Marcador no definido.
4.1.1. Audio Analógico. ................................ ¡Error! Marcador no definido.
4.1.2. Audio Digital...................................... ¡Error! Marcador no definido.
4.1.2.1. Historia del audio digital. .................. ¡Error! Marcador no definido.
4.2. CAPTURA Y DIGITALIZACIÓN DE SEÑALES DE AUDIO.¡Error! Marcador
no definido.
4.2.1. Muestreo de señales de audio.. ............ ¡Error! Marcador no definido.
4.2.1.1. Muestreo con frecuencias inferiores o aliasing.¡Error! Marcador no
definido.
4.2.2. Cuantización...................................... ¡Error! Marcador no definido.
4.2.3. Codificación. ...................................... ¡Error! Marcador no definido.
4.2.3.1. Digitalización .................................. ¡Error! Marcador no definido.
4.3. REPRODUCCIÓN DE LA SEÑAL DE AUDIO DIGITAL¡Error! Marcador no
definido.
4.3.1. Conversor digital-analógico.................. ¡Error! Marcador no definido.
4.3.2. Tipos de conversores digital-analógico... ¡Error! Marcador no definido.
4.3.2.1. Conversores serie. ........................... ¡Error! Marcador no definido.
4.3.2.2. Conversores paralelos. ..................... ¡Error! Marcador no definido.
4.4. CRITERIOS PARA LA SELECCIÓN DE EQUIPOS¡Error! Marcador no
definido.
4.4.1. Equipos de reproducción de audio analógico.¡Error! Marcador no
definido.
4.4.2. Conversores análogo-digital y digital–análogo.¡Error! Marcador no
definido.
4.4.2.1. Resolución de los ADC/DAC............... ¡Error! Marcador no definido.
4.4.2.2. Frecuencia de muestreo de los ADC/DAC..¡Error! Marcador no
definido.
4.4.2.3. Interfaz de comunicación de los ADC/ DAC.¡Error! Marcador no
definido.
4.4.2.4. Tipos de ADC/DAC para audio. .......... ¡Error! Marcador no definido.
5. TRATAMIENTO DIGITAL DE SEÑALES DE AUDIO PARA SU RESTAURACIÓN
................................................................ ¡Error! Marcador no definido.
5.1. PROGRAMA PARA EDICIÓN Y MANIPULACIÓN DEL AUDIO DIGITAL ¡Error!
5.1.1. Editor gráfico de audio digital............... ¡Error! Marcador no definido.
5.1.1.1. Elección de un editor gráfico de audio. ¡Error! Marcador no definido.
5.1.1.2. Efectos que utilizan retardos. ............ ¡Error! Marcador no definido.
5.1.1.3. Procesadores de rango dinámico. ....... ¡Error! Marcador no definido.
5.1.1.4. Filtros.. .......................................... ¡Error! Marcador no definido.
5.1.1.5. Dither ............................................ ¡Error! Marcador no definido.
5.1.2. Multipistas de audio digital .................. ¡Error! Marcador no definido.
5.1.3. Secuenciador MIDI ............................. ¡Error! Marcador no definido.
6. TECNOLOGÍAS DE RESTAURACIÓN DIGITAL DE AUDIO¡Error! Marcador no
definido.
6.1. TECNOLOGÍAS DE MODIFICACIÓN .......... ¡Error! Marcador no definido.
6.1.1. Procesos de modificación..................... ¡Error! Marcador no definido.
6.1.1.1. De-thumping .................................. ¡Error! Marcador no definido.
6.1.1.2. De-clicking ..................................... ¡Error! Marcador no definido.
6.1.1.3. De-hissing ...................................... ¡Error! Marcador no definido.
6.1.1.4. De-scratching ................................. ¡Error! Marcador no definido.
6.2. TECNOLOGÍAS DE SUSTITUCIÓN ............ ¡Error! Marcador no definido.
7. FORMATOS Y MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL..... ¡Error!
7.1. FORMATOS DE ARCHIVO DE AUDIO DIGITAL¡Error! Marcador no
definido.
7.1.1. Tamaños en el audio digital. ................ ¡Error! Marcador no definido.
7.1.2. Compresión de archivos de audio ......... ¡Error! Marcador no definido.
7.1.2.1. Compresión y descompresion de Datos..¡Error! Marcador no
definido.
7.2. MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL¡Error! Marcador no
definido.
7.2.1. ADAT................................................ ¡Error! Marcador no definido.
7.2.2. DAT.................................................. ¡Error! Marcador no definido.
7.2.3. DDS. ................................................ ¡Error! Marcador no definido.
7.2.4. DASH.. ............................................. ¡Error! Marcador no definido.
7.2.5. DCC.. ............................................... ¡Error! Marcador no definido.
7.2.6. MD. .................................................. ¡Error! Marcador no definido.
7.2.7. CD ................................................... ¡Error! Marcador no definido.
7.2.8. CD-ROM............................................ ¡Error! Marcador no definido.
7.2.9. CD-R. ............................................... ¡Error! Marcador no definido.
7.2.10. CD-RW............................................ ¡Error! Marcador no definido.
7.2.11. CD+G. ............................................ ¡Error! Marcador no definido.
7.2.12. CD-i. .............................................. ¡Error! Marcador no definido.
7.2.13. UMD. .............................................. ¡Error! Marcador no definido.
7.2.14. DD-CD. ........................................... ¡Error! Marcador no definido.
7.2.15. MultiLevel........................................ ¡Error! Marcador no definido.
7.2.16. MO. ................................................ ¡Error! Marcador no definido.
7.2.17. SA.................................................. ¡Error! Marcador no definido.
7.2.18. DVD. .............................................. ¡Error! Marcador no definido.
7.2.19. DVD-R.. .......................................... ¡Error! Marcador no definido.
7.2.20. DVD-RW.......................................... ¡Error! Marcador no definido.
7.2.21. DVD+R. .......................................... ¡Error! Marcador no definido.
7.2.22. DVD+RW......................................... ¡Error! Marcador no definido.
7.2.23. DVD-RAM.. ...................................... ¡Error! Marcador no definido.
7.2.24. SACD.............................................. ¡Error! Marcador no definido.
7.2.25. DD. ................................................ ¡Error! Marcador no definido.
7.2.26. BD ................................................. ¡Error! Marcador no definido.
7.2.27. HD-DVD .......................................... ¡Error! Marcador no definido.
8. EQUIPOS DE ALMACENAMIENTO ................ ¡Error! Marcador no definido.
8.1. PERFIL DE UN DAW BASADO EN COMPUTADOR¡Error! Marcador no
definido.
8.1.1. Estabilidad ........................................ ¡Error! Marcador no definido.
8.1.2. El sistema operativo. .......................... ¡Error! Marcador no definido.
8.1.3. Procesador ........................................ ¡Error! Marcador no definido.
8.1.4. Mainboard o tarjeta madre. ................. ¡Error! Marcador no definido.
8.1.5. Memoria RAM. ................................... ¡Error! Marcador no definido.
8.1.6. Capacidad de almacenamiento. ............ ¡Error! Marcador no definido.
8.1.7. Tarjeta de video................................. ¡Error! Marcador no definido.
8.1.8. Monitor ............................................. ¡Error! Marcador no definido.
8.1.9. Dispositivos de grabación de medios externos.¡Error! Marcador no
definido.
8.1.10. Tarjeta de sonido. ............................ ¡Error! Marcador no definido.
8.1.11. Ruido acústico.................................. ¡Error! Marcador no definido.
9. TRABAJO CON LA EMISORA DE LA UNIVERSIDAD PONTIFICIA BOLIVARIANA
................................................................ ¡Error! Marcador no definido.
9.1. HISTORIA. ........................................... ¡Error! Marcador no definido.
9.2. EXPERIENCIAS EN LA EMISORA DE LA UNIVERSIDAD PONTIFICIA
BOLIVARIANA. ............................................ ¡Error! Marcador no definido.
10. CONCLUSIONES..................................... ¡Error! Marcador no definido.
BIBLIOGRAFÍA ................................................................................... 282
ANEXOS ............................................................................................ 295
LISTA DE FIGURAS
Pag.
Figura 1. Onda senoidal................................ ¡Error! Marcador no definido.
Figura 2. Octavas con imágenes de instrumentos musicales.¡Error! Marcador
no definido.
Figura 3. Amplitud y frecuencia de una onda sonora.¡Error! Marcador no
definido.
Figura 4. Fonógrafo de Edison ....................... ¡Error! Marcador no definido.
Figura 5. Sistema de Oberlin ......................... ¡Error! Marcador no definido.
Figura 6. Magnetófono AEG-BASF. ................. ¡Error! Marcador no definido.
Figura 7. Diagrama de modelos de separación. ¡Error! Marcador no definido.
Figura 8. Onda senoidal con clicks.................. ¡Error! Marcador no definido.
Figura 9. Onda senoidal con crackles. ............. ¡Error! Marcador no definido.
Figura 10. Onda senoidal con thumps. ............ ¡Error! Marcador no definido.
Figura 11. Onda senoidal con clipping............. ¡Error! Marcador no definido.
Figura 12. Onda senoidal con hiss .................. ¡Error! Marcador no definido.
Figura 13. Imagen aumentada de la superficie de un disco.¡Error! Marcador
no definido.
Figura 14. Cilindro de cera de Edison.............. ¡Error! Marcador no definido.
Figura 15. Disco de ebonita de 7" y 55 RPM .... ¡Error! Marcador no definido.
Figura 16. Carretes de alambre ..................... ¡Error! Marcador no definido.
Figura 17. Imagen de un carrete abierto de 7” con cinta de ¼”. ........... ¡Error!
Figura 18. Disco de vinilo. ............................ ¡Error! Marcador no definido.
Figura 19. RCA Sound Tape Cartridge............. ¡Error! Marcador no definido.
Figura 20. Sanyo micro pack 35. ................... ¡Error! Marcador no definido.
Figura 21. Cartucho de 4 pistas. .................... ¡Error! Marcador no definido.
Figura 22. Cartucho de 8 pistas ..................... ¡Error! Marcador no definido.
Figura 23. Audio casete compacto.................. ¡Error! Marcador no definido.
Figura 24. Imagen de un cartucho Playtape en su empaque original. .... ¡Error!
Figura 25. Microcasete. Fuente ...................... ¡Error! Marcador no definido.
Figura 26. Imagen comparativa de diversos cartuchos.¡Error! Marcador no
definido.
Figura 27. Corte transversal de una cinta magnética donde se observan las
diferentes capas que la conforman. .......... ¡Error! Marcador no definido.
Figura 28. Cintas magnéticas deformadas por exposición al calor ......... ¡Error!
Figura 29. Consecuencias de la pérdida de aglomerante en un reproductor de
cintas de carrete abierto. ........................ ¡Error! Marcador no definido.
Figura 30. Cinta magnética con síndrome de sticky shed¡Error! Marcador no
definido.
Figura 31. Imagen que ilustra el tamaño relativo de las suciedades al espacio
entre la cinta y la cabeza reproductora...... ¡Error! Marcador no definido.
Figura 32. Imagen aumentada de un disco con polvo y suciedad. ......... ¡Error!
Figura 33. Disco de vinilo con crecimiento de hongos en su superficie ... ¡Error!
Figura 34. Cinta de acetato ........................... ¡Error! Marcador no definido.
Figura 35. Cinta de poliéster ......................... ¡Error! Marcador no definido.
Figura 36. Cinta mal rebobinada .................... ¡Error! Marcador no definido.
Figura 37. Maquina limpiadora de discos. ........ ¡Error! Marcador no definido.
Figura 38. Diagrama de bloques de sistema de captura de audio tipo sucio y
limpio................................................... ¡Error! Marcador no definido.
Figura 39. Sistema de captura de audio tipo sucio.¡Error! Marcador no
definido.
Figura 40. Sistema captura de audio tipo limpio.¡Error! Marcador no
definido.
Figura 41. Muestreo de una señal senoidal. ..... ¡Error! Marcador no definido.
Figura 42. PAM de una onda senoidal. ............ ¡Error! Marcador no definido.
Figura 43. Generación de PCM. ...................... ¡Error! Marcador no definido.
Figura 44. DAC externo. ............................... ¡Error! Marcador no definido.
Figura 45. Reproductores de discos analógicos. ¡Error! Marcador no definido.
Figura 46. Procedimiento de restauración digital para fonogramas. ....... ¡Error!
Figura 47. Proceso de captura y almacenamiento digital de audio. ........ ¡Error!
Figura 48. Proceso de reproducción de la señal digital restaurada. ........ ¡Error!
Figura 49. Señal senoidal de 1 Hz muestreadas a diferentes resoluciones (k) y
frecuencias de muestreo (fm). ................. ¡Error! Marcador no definido.
Figura 50. Conector RCA. ............................. ¡Error! Marcador no definido.
Figura 51. Forma grafica del balanceo de señales de audio.¡Error! Marcador
no definido.
Figura 52. Conector ¼”. ............................... ¡Error! Marcador no definido.
Figura 53. Conector XLR (Cannon). ................ ¡Error! Marcador no definido.
Figura 54. Conectores de audio. a) RCA, b) ¼” y c) XLR macho hembra. ¡Error!
Figura 55. Cables balanceados a balanceados. . ¡Error! Marcador no definido.
Figura 56. Cables No balanceados a balanceados.¡Error! Marcador no
definido.
Figura 57. Tipos de conversores de audio........ ¡Error! Marcador no definido.
Figura 58. Chips DSP de audio....................... ¡Error! Marcador no definido.
Figura 59. Análisis espectral de una pista de audio en Sound Forge. ..... ¡Error!
Figura 60. Análisis tridimensional espectral de una pista de audio en Wavelab.
........................................................... ¡Error! Marcador no definido.
Figura 61. Funciones de transferencia de procesadores de rango dinámico.
Figura 62. Curvas de respuestas de filtros....... ¡Error! Marcador no definido.
Figura 63. Respuesta de ecualizador con 6 bandas de filtrado. ............. ¡Error!
Figura 64. Ecualizador gráfico de Audition. ...... ¡Error! Marcador no definido.
Figura 65. Ecualizador paramétrico de Sound Forge.¡Error! Marcador no
definido.
Figura 66. Hardware de ecualizador grafico de audio.¡Error! Marcador no
definido.
Figura 67. Programa de restauración de audio de CEDAR.¡Error! Marcador no
definido.
Figura 68. Programa de restauración de audio de SONIC Solutions ....... ¡Error!
Figura 69. Programa de restauración de audio de Steimberg Clean ...... ¡Error!
Figura 70. Programa de restauración de audio de Waves.¡Error! Marcador no
definido.
Figura 71. Programa de restauración de audio de Bias, inc.¡Error! Marcador
no definido.
Figura 72. Detección de segmento con ruido. .. ¡Error! Marcador no definido.
Figura 73. Eliminación del ruido..................... ¡Error! Marcador no definido.
Figura 74. Sustitución del ruido. .................... ¡Error! Marcador no definido.
Figura 75. Señal de audio con clicks y señal restaurada.¡Error! Marcador no
definido.
Figura 76. Representación de un click en el tiempo y el espectro. ......... ¡Error!
Figura 77. Señal de audio con thumps y señal restaurada.¡Error! Marcador
no definido.
Figura 78. Representación de thumps el tiempo y el espectro. ............. ¡Error!
Figura 79. Diagrama de bloques de-thumping.. ¡Error! Marcador no definido.
Figura 80. Diagrama de bloques de de-clicking por algoritmos AR......... ¡Error!
Figura 81. Diagrama de bloques de de-hissing por STSA¡Error! Marcador no
definido.
Figura 82. Diagrama de bloques de tecnología de sustitución.¡Error! Marcador
no definido.
Figura 83. Medios de almacenamiento a) ADAT, b) DAT y c) DDS. ........ ¡Error!
Figura 84. Formato DASH ............................. ¡Error! Marcador no definido.
Figura 85. Disco MD..................................... ¡Error! Marcador no definido.
Figura 86. Formato CD. ................................ ¡Error! Marcador no definido.
Figura 87. Formato UMD............................... ¡Error! Marcador no definido.
Figura 88. Formato DD-CD............................ ¡Error! Marcador no definido.
Figura 89. Formato MO................................. ¡Error! Marcador no definido.
Figura 90. Formato SA. ................................ ¡Error! Marcador no definido.
Figura 91. Formatos DVD. ............................ ¡Error! Marcador no definido.
Figura 92. Formato DVD-RAM........................ ¡Error! Marcador no definido.
Figura 93. Formato SACD híbrido................... ¡Error! Marcador no definido.
Figura 94. Formato Blu-ray ........................... ¡Error! Marcador no definido.
Figura 95. Formato HD DVD.......................... ¡Error! Marcador no definido.
Figura 96. Fonoteca de la emisora de la Universidad Pontificia Bolivariana.
Colección de cintas magnéticas. ............... ¡Error! Marcador no definido.
Figura 97. Fonoteca de la emisora de la Universidad Pontificia Bolivariana.
Colección de discos. ............................... ¡Error! Marcador no definido.
Figura 98. Discos analógicos de audio de la emisora radio Bolivariana. .. ¡Error!
Figura 99. Carretes abiertos de audio analógico de la emisora radio
Bolivariana............................................ ¡Error! Marcador no definido.
Figura 100. Conversor de audio y video DAC-100¡Error! Marcador no
definido.
Figura 101. Exposición introductoria a la restauración de audio. ........... ¡Error!
Figura 102. Exposición de restauración de audio digital¡Error! Marcador no
definido.
Figura 103. Exposición de tecnologías de audio digital.¡Error! Marcador no
definido.
Figura 104. Cinta magnética de audio con síndrome de sticky shed ...... ¡Error!
Figura 105. Fonógrafos. ............................... ¡Error! Marcador no definido.
Figura 106. Amberola................................... ¡Error! Marcador no definido.
Figura 107. Gramófonos ............................... ¡Error! Marcador no definido.
Figura 108. Grabadores y reproductores de alambre¡Error! Marcador no
definido.
Figura 109. Grabadores y reproductores de carrete abierto.¡Error! Marcador
no definido.
Figura 110. Tocadiscos.. ............................... ¡Error! Marcador no definido.
Figura 111 Tocadiscos óptico o láser. ............. ¡Error! Marcador no definido.
Figura 112. Grabador y reproductor de cartuchos RCA.¡Error! Marcador no
definido.
Figura 113. Sanyo Micro Pack 35. .................. ¡Error! Marcador no definido.
Figura 114. Grabadores y reproductores de cartuchos de 4 pistas......... ¡Error!
Figura 115. Grabadores y reproductores de cartuchos de 8 pistas. a) Portátil,
b) De mesa, c) De automóvil ................... ¡Error! Marcador no definido.
Figura 116. Grabadores y reproductores de casete de audio compacto. . ¡Error!
Figura 117. Playtape .................................... ¡Error! Marcador no definido.
Figura 118. Grabadores y reproductroes de microcasete..¡Error! Marcador no
definido.
Figura 119. Grabador y reproductor Elcaset..... ¡Error! Marcador no definido.
Figura 120. ADC/DAC móvil Audiophile USB. ... ¡Error! Marcador no definido.
Figura 121. ADC/DAC móvil FireWire Audiophile.¡Error! Marcador no
definido.
Figura 122. ADC/DAC móvil FireWire Solo. ...... ¡Error! Marcador no definido.
Figura 123. ADC/DAC móvil Waveterminal U24 ¡Error! Marcador no definido.
Figura 124. ADC/DAC móvil PHASE 26 USB. .... ¡Error! Marcador no definido.
Figura 125. ADC/DAC móvil PHASE 88 rack FireWire 751.¡Error! Marcador no
definido.
Figura 126. ADC/DAC móvil tipo rack MOTU 896HD.¡Error! Marcador no
definido.
Figura 127. ADC/DAC móvil tipo rack MOTU HD192.¡Error! Marcador no
definido.
Figura 128. ADC/DAC móvil ADI-2. ................ ¡Error! Marcador no definido.
Figura 129. ADC/DAC estático Delta 1010LT.... ¡Error! Marcador no definido.
Figura 130. ADC/DAC estático Delta 44 .......... ¡Error! Marcador no definido.
Figura 131. ADC/DAC estático Terratec phase 28¡Error! Marcador no
definido.
Figura 132. ADC/DAC estático PHASE 28. ....... ¡Error! Marcador no definido.
Figura 133. Grabador y reproductor ADAT....... ¡Error! Marcador no definido.
Figura 134. Grabador y reproductor DAT......... ¡Error! Marcador no definido.
Figura 135. Grabador y reproductor móvil DAT.¡Error! Marcador no
definido.
Figura 136. Grabador y reproductor portátil DAT¡Error! Marcador no
definido.
Figura 137. Grabador y reproductor interno DDS.¡Error! Marcador no
definido.
Figura 138. Grabador y reproductor externo DDS.¡Error! Marcador no
definido.
Figura 139. Grabador y reproductor DCC. ....... ¡Error! Marcador no definido.
Figura 140. Reproductor portátil DCC ............. ¡Error! Marcador no definido.
Figura 141. Grabador y reproductor MD. ......... ¡Error! Marcador no definido.
Figura 142. Grabador y reproductor móvil MD. ¡Error! Marcador no definido.
Figura 143. Grabador y reproductor portátil MD.¡Error! Marcador no
definido.
Figura 144. Reproductor de CD...................... ¡Error! Marcador no definido.
Figura 145. Grabador y reproductor de CD. ..... ¡Error! Marcador no definido.
Figura 146. Sega Saturn............................... ¡Error! Marcador no definido.
Figura 147. CD-I. ........................................ ¡Error! Marcador no definido.
Figura 148. PlayStation portátil. .................... ¡Error! Marcador no definido.
Figura 149. DD-CD RW................................. ¡Error! Marcador no definido.
Figura 150. Grabador y reproductor externo MO¡Error! Marcador no
definido.
Figura 151. Grabador y reproductor portátil SA.¡Error! Marcador no
definido.
Figura 152. Reproductor portátil SA. .............. ¡Error! Marcador no definido.
Figura 153. Grabador y reproductor de DVD .... ¡Error! Marcador no definido.
Figura 154. Reproductor de DVD. .................. ¡Error! Marcador no definido.
Figura 155. Reproductor portátil DVD ............. ¡Error! Marcador no definido.
Figura 156. PlayStation2. ............................. ¡Error! Marcador no definido.
Figura 157. Grabador y reproductor externo.... ¡Error! Marcador no definido.
Figura 158. Reproductor SACD. ..................... ¡Error! Marcador no definido.
Figura 159. PlayStation3. ............................. ¡Error! Marcador no definido.
Figura 160. Grabador y reproductor Blu-ray. ... ¡Error! Marcador no definido.
Figura 161. Grabador y reproductor HD DVD. .. ¡Error! Marcador no definido.
Figura 162. Señal AR ................................... ¡Error! Marcador no definido.
Figura 163. Estimación de la señal AR por la ecuación de Yule-Walker... ¡Error!
Figura 164. Fase asociado a valores de frecuencia del modelo senosoidal.
Figura 165. Función de coste para marcos bayesianos.¡Error! Marcador no
definido.
Figura 166. Señal con ruidos impulsivos. ........ ¡Error! Marcador no definido.
Figura 167. Señal de detección eD .................. ¡Error! Marcador no definido.
Figura 168. Localización de 37 clikcs con umbral λ=66.81.¡Error! Marcador
no definido.
Figura 169. Localización del defecto a partir de la muestra k=419, entre las
muestras 417 y 428. .............................. ¡Error! Marcador no definido.
Figura 170. Resultado de la interpolación. ....... ¡Error! Marcador no definido.
Figura 171. Suma de señales senosoidales una exponencial que decae
exhibiendo una discontinuidad de ruido blanco.¡Error! Marcador no
definido.
Figura 172. Máximos locales de la CWT .......... ¡Error! Marcador no definido.
Figura 173. Proyección ortogonal para Matching Pursuit¡Error! Marcador no
definido.
Figura 174. Algoritmo de atenuación espectral. ¡Error! Marcador no definido.
LISTA DE TABLAS
Pag.
Tabla 1. Condiciones óptimas de almacenamiento de una cinta magnética.
Tabla 2. Tiempos de horneado de una cinta magnética.¡Error! Marcador no
definido.
Tabla 3. Problemas menores de las cintas magnéticas.¡Error! Marcador no
definido.
Tabla 4. Relación longitud de código y niveles de cuantización. ............ ¡Error!
Tabla 5. Formatos de Plug-ins por DSP ........... ¡Error! Marcador no definido.
Tabla 6. Estándares de grabación de DAT. ...... ¡Error! Marcador no definido.
Tabla 7. Categorías de formatos DDS ............. ¡Error! Marcador no definido.
Tabla 8. Resumen del algoritmo de Kalman. .... ¡Error! Marcador no definido.
LISTA DE ANEXOS
Pag.
ANEXO A. Dispositivos reproductores y/o grabadores de audio analógico¡Error!
ANEXO B. Conversores análogo-digital y digital-análogo de audio......... ¡Error!
ANEXO C. Dispositivos reproductores y/o grabadores de audio digital ... ¡Error!
ANEXO D. Formatos de compresión de audio con perdidas “Lossy” y audio
multicanal............................................ ¡Error! Marcador no definido.
ANEXO E. Algirtmos de modelación matemática de señales de audio, deteccion
de ruidos y restauración.......................... ¡Error! Marcador no definido.
ANEXO F. Anteproyecto ................................ ¡Error! Marcador no definido.
ANEXO G. Paper publicable ........................... ¡Error! Marcador no definido.
GLOSARIO
Aglomerante: en una cinta magnética, se refiere al componente que

mantiene unidas las partículas magnéticas a la base de poliéster.
Ancho de banda: diferencia entre las frecuencias máxima y mínima que

permite pasar un filtro pasabanda o un dispositivo cualquiera.
Audiophile: individuo que tiene un alto interés en el audio de alta calidad.
Bit: digito binario.
Blue Book: normatividad que rige los estándares técnicos de calidad del
formato CD+G
Buffer: porción de memoria aislada, presente en varios dispositivos

electrónicos para almacenar información de manera temporal de manera que
este pueda operar sin verse interferido por otro.
Byte: 8 bits.
Chipset: conjunto de circuitos integrados auxiliares necesarios por un sistema
para realizar una tarea. Este conjunto se encuentra presente en las Tarjetas
Madre de los computadores y determinan sus características técnicas como
puertos, capacidad de gráficos, capacidad de procesamiento de audio, etc.
Codecs: abreviatura de Compresor-Decompresor. Describe una especificación

implementada en software, hardware o una combinación de ambos, capaz de
transformar un archivo con un flujo de datos o una señal. Los codecs pueden
codificar el flujo o la señal (a menudo para la transmisión, el almacenaje o el
cifrado) y recuperarlo o descifrarlo del mismo modo para la reproducción o la
manipulación en un formato más apropiado para estas operaciones. Los códecs
son usados a menudo en videoconferencias y emisiones de medios de
comunicación.
Codificación de fuente: tiene como objetivo comprimir la información

generada por una fuente eliminando posibles redundancias. Hay dos grandes
grupos de métodos de codificación de fuente: en los denominados lossless, la
información generada por la fuente se conserva en su totalidad, de manera
que es posible recuperarla exactamente; en los llamados lossy, se sacrifica la
fidelidad estricta a la información original por con el objeto de obtener una
mayor tasa de compresión.
Codificación entrópica: codificación sin perdida de información e

independiente del tipo de información.
Codigo ASCII: American Standard Code for Information Interchange (Código

Estadounidense Estándar para el Intercambio de Información) es un código de
caracteres basado en el alfabeto latino tal como se usa en inglés moderno y
otras lenguas occidentales. Casi todos los sistemas informáticos de hoy en día
utilizan el código ASCII o una extensión compatible para representar textos y
para el control de dispositivos que manejan texto.
Define 128 códigos posibles, dividido en 4 grupos de 32 caracteres, (7 bits de
información por código), aunque utiliza menos de la mitad, para caracteres de
control, alfabéticos (no incluye minúsculas), numéricos y signos de puntuación.
Su principal ventaja, aparte de constituir un estándar, consiste en la
ordenación alfabética de los códigos.
Copyright: o derechos de autor. Es una forma de protección proporcionada
por las leyes vigentes en la mayoría de los países para los autores de obras
originales incluyendo obras literarias, dramáticas, musicales, artísticas e
intelectuales.
Declorización: fenómeno químico que ocurre cuando el PVC se descompone

en cloruro de hidrógeno.
Disco óptico: disco circular y plano usualmente construido en policarbonato y

un material especial (por lo general aluminio) donde se almacenan datos que
se accesan mediante la iluminación de este material especial con un láser.
Dither: ruido de bajo nivel (típicamente equivalente a un error menor que un

bit) agregado a una señal analógica previamente a su muestreo y
digitalización. Mejora cualitativamente el ruido de digitalización, eliminando
componentes similares a la distorsión que se producen en señales de bajo
nivel.
Dolby: sistema de reducción de ruido complementario utilizado en el registro

magnético. Actúa comprimiendo los agudos durante la grabación, y
expandiéndolo durante la reproducción. Existen tres variantes: Dolby A
(profesional), Dolby B (consumo) y Dolby C (intermedio).
Ecualización: acción de corregir o compensar la respuesta en frecuencia de

un sistema para hacerla mas plana.
Escaneo helicoidal: es una tecnología que ha incrementado, en gran medida,
la capacidad de las unidades compactas de cinta. Las tecnologías de grabación
tanto longitudinales como de exploración helicoidal se basan en principios de
magnetización para grabar datos en las cintas. Las diferencias básica
existentes entre ambas es el patrón con el que se graban los datos, y el
posicionamiento de los cabezales empleados para leer, escribir y borrar los
datos. La grabación longitudinal convencional registra una pista de datos en
forma recta a través del ancho de una cinta de pista única, limitada en tamaño
por el ancho de la cinta. La grabación por exploración helicoidal agrupa más
datos en la cinta, ubicando dicha cinta con un ángulo de 5 grados respecto de
los cabezales de grabación. Toda pista de datos es una diagonal de 3 pulgadas
de longitud. La cinta magnética empleada en las grabaciones por exploración
helicoidal debe ser de alta calidad.
Extensión: en informática, es el grupo de letras (generalmente tres) que

acompaña el nombre de un archivo y suele indicar el tipo de información que
guarda el archivo.
Ferrita: material cerámico ferromagnético, compuesto por hierro, boro y

bario, estroncio o molibdeno.
Las ferritas tienen una alta permeabilidad magnética, lo cual les permite
almacenar campos magnéticos con más fuerza que el hierro.
Ficheros: un archivo o fichero informático es una entidad lógica compuesta

por una secuencia finita de bytes, almacenada en un sistema de archivos
ubicada en la memoria secundaria de un ordenador. Los archivos son
agrupados en directorios dentro del sistema de archivos y son identificados por
un nombre de archivo. El nombre forma la identificación única en relación a los
otros archivos en el mismo directorio.
Firmware: o Programación en Firme, es un bloque de instrucciones de

programa para propósitos específicos, grabado en una memoria tipo ROM, que
establece la lógica de más bajo nivel que controla los circuitos electrónicos de
un dispositivo de cualquier tipo. Al estar integrado en la electrónica del
dispositivo es en parte hardware, pero también es software, ya que
proporciona lógica y se dispone en algún tipo de lenguaje de programación.
Funcionalmente, el firmware es el intermediario (interfaz) entre las órdenes
externas que recibe el dispositivo y su electrónica, ya que es el encargado de
controlar a ésta última para ejecutar correctamente dichas órdenes externas.
Flaking off: fenómeno físico que ocurre en las cintas magnéticas que consiste
en el desprendimiento de las partículas metálicas de su base.
Formato de propiedad: formato con derechos de autor o Copyright.
Frame: muestra temporal de una pista de audio.
Front side bus: canal de información de un procesador con los otros

dispositivos de un computador.
Goma Laca: material que se obtiene a partir de un líquido que segrega el

insecto Laca o Laccifer Lacca habitante de las selvas de Asma, India y
Tailandia.
Green Book: normatividad que rige los estándares técnicos de calidad del
formato CD-i.
Hardware: se denomina hardware o soporte físico al conjunto de elementos

materiales que componen un computador. En dicho conjunto se incluyen los
dispositivos electrónicos y electromecánicos, circuitos, cables, tarjetas,
armarios o cajas, periféricos de todo tipo y otros elementos físicos.
i.i.d.: en teoría de probabilidades, una secuencia de variables aleatorias es
independiente e idénticamente distribuida (i.i.d), si todas poseen la misma
distribución de probabilidad y son mutuamente independientes.
Inteligible: que puede ser entendido. Que se oye clara y distintamente.
Interfaz: conexión de un dispositivo electrónico con el exterior.

Intermodulacion: modulación mutua entre dos tonos senoidales.
iPOD: reproductor de música digital basado en un disco duro creado por Apple
Computer. Puede reproducir archivos MP3, WAV, AAC/M4A, AIFF y Apple
Lossless. La capacidad del disco duro es de hasta 60 GB.
Java: lenguaje de programación expresamente diseñado para usarse en el

entorno distribuido de Internet. Se diseñó para que se "pareciera" al lenguaje
C++, pero es más sencillo de usar que éste y obliga a una visión de la
programación completamente orientada a objetos.
Latencia: tiempo que transcurre entre el inicio y el final de una acción. En

audio digital, es el tiempo que transcurre entre el momento en que el
computador capta un sonido y lo reproduce.
LCD: visor de cristal liquido de muy bajo consumo.
Lenguaje C: es un lenguaje de programación creado en 1969 por Ken

Thompson y Dennis M. Ritchie en los Laboratorios Bell basándose en los
lenguajes BCPL y B. Al igual que sus dos predecesores, es un lenguaje
orientado a la implementación de Sistemas Operativos (los sistemas operativos
Linux y UNIX están escritos mayormente en C), pero se ha convertido en un
lenguaje de propósito general de los más usados.
Mac: es el nombre de una serie de computadores fabricados y comercializados
por Apple Computer desde 1984. Apple autorizó a otras compañías, como
Motorola, Umax o PowerComputing para la fabricación de clones Macintosh en
los 90, aunque en la actualidad sólo Apple comercializa computadores
Macintosh o Mac.
Mapear: localizar y representar gráficamente la distribución relativa de las

partes de un todo.
Masterización: es el proceso de limpieza y optimización final de cualquier tipo
de producción de audio antes de que ésta salga al Mercado.
Material ignífugo: material resistente al fuego.
Metadata: la literatura especializada define los Metadata o Meta Tags, como

"Datos acerca de los datos" o "información acerca de la información" . A través
de esta metodología es posible describir el contenido de un recurso de
aprendizaje. Otra definición es: información sobre objetos web, comprensible
por máquinas.
Los metadata proporcionan un buen método para controlar la forma en que los
sitios web son indexados por los motores de búsqueda. También mejoran la
opción de encontrar páginas con poco texto, como es el caso de sitios
construidos con "Frame".
Mylar: material construido a base de poliéster desarrollado por la compañía

Dupont. Muy empleado para la fabricación de cintas magnéticas.
Orange Book: documento publicado por Philips que contiene los estándares y
especificaciones técnicas de los formatos MO, CD-R, CD-RW.
PC: (Personal Computer). Término genérico utilizado para referirse a

computadores que son compatibles con las especificación de IBM.
Playback: reproducir un fonograma o pista de audio.
Playstation: consola de juegos creada por Sony en la decada de los 90. Fue
desarrollada por Sony después de fallar un acuerdo con Nintendo para
desarrollar un añadido para la consola Super Nintendo lamado SNES
PlayStation.
Plug-ins: un plug-in (o plugin) es un programa de computador que interactúa

con otro programa para aportarle una función o utilidad específica,
generalmente muy específica. Los plugins típicos tienen la función de
reproducir determinados formatos de gráficos, reproducir datos multimedia,
codificar/decodificar emails, filtrar imágenes de programas gráficos, entre
otras.
Se utilizan como una forma de expansión programas de forma modular, de

forma que se puedan añadir nuevas funcionalidades sin afectar a las ya
existentes ni complicar el desarrollo del programa principal.
Pro Tools: plataforma computacional para producción y edición digital de

audio desarrollada por Digidesign. Usada ampliamente en la televisión, el cine
y la industria de la música.
Purple Book: normatividad que rige los estándares técnicos de calidad del
formato DD-CD.
Rack: armazón modular metálico de ancho estándar sobre cuyos rieles

metálicos laterales se atornillan los diferentes procesadores, efectos, paneles
de conexionado y hasta pequeñas consolas previstas para ser montadas en el.
Rango dinamico: diferencia en dB entre los niveles máximo y mínimo de una

señal.
Red book: documento publicado por Philips y Sony que contiene los
estándares y especificaciones técnicas del formato CD.
SATA (Serial ATA): interface de transmision de información de mayor

velocidad que su predecesor, el ATA, para la transferencia de información
desde y a un disco duro.
SCSI (Small Computer System Interface): interface para transmisión de

datos en un computador mas rápida que la SATA. Usualmente utilizada para
conexión de discos duros.
Silica Gel: sustancia granular y porosa sintetizada a partir del silicato de sodio
que tiene la propiedad de absorber la humedad.
Síndrome de sticky shed: fenómeno químico que ocurre, debido a la

humedad, en las cintas magnéticas de poliéster que consiste en la degradación
del aglomerante volviéndolo pegajoso.
Síndrome de vinegar: nombre que recibe el síndrome de sticky shed en las

cintas de acetato.
Sintetizador: instrumento musical electrónico diseñado para producir sonido

generado artificialmente, usando técnicas como síntesis aditiva, substractiva,
de frecuencia modulada, de modulación física o modulación de fase, para crear
sonidos.
Sistemas Embebidos: computador de propósito especial que esta

completamente encapsulado en el dispositivo que controla.
Software: es la parte lógica del computador, esto es, el conjunto de

programas que puede ejecutar el hardware para la realización de las tareas de
computación a las que se destina. Es el conjunto de instrucciones que permite
la utilización del equipo.
Software de Código fuente abierto: software cuyo código fuente esta disponible
para cualquiera que desee verlo, extenderlo, desarrollarlo y mejorarlo.
Subarmónicos: es un tono que dispone de una relación interválica --respecto

a dicha nota-- que se ajusta a algún intervalo natural de los armónicos
(respecto su fundamental). Es decir, los subarmónicos de una nota son los
tonos de los cuales la nota se puede considerar armónico.
Surfactante: los surfactantes o tensoactivos son sustancias que disminuyen la

tensión superficial de un líquido. Cuando se utilizan en la tecnología doméstica
se denominan como emulgentes o emulsionantes; esto es, sustancias que
permiten conseguir o mantener una emulsión.
Entre los tensoactivos se encuentran las sustancias sintéticas que se utilizan
regularmente en el lavado, entre las que se incluyen productos como
detergentes para lavar la ropa, lavavajillas, productos para eliminar el polvo de
superficies, y champús.
Sustancia antifúngica: sustancia que evita el crecimiento y la proliferación

de hongos.
Ticks: impulsos de corta duración y baja amplitud. Normalmente relacionados

con los clicks.
TFT (Thin film transistor): o transistor de capa fina. Es un tipo especial de

transistor de efecto de campo donde sus contactos metálicos, su capa
semiconductora y su capa dieléctrica están hechos en capas muy delgadas.
TFT LCD: variante del LCD donde se utilizan TFTs proporcionando mayor
estabilidad a la imagen.
Video CD: CD que además de almacenar audio almacena imágenes y video.
White Book: documento publicado por Philips, Sony, Matsushita y JVC que
contiene los estándares y especificaciones técnicas del formato Video CD.
Yellow Book: documento publicado por Philips y Sony que contiene los
estándares y especificaciones técnicas del formato CD-ROM. Fue la primera
extensión del Red Book.
Zoom: término utilizado para definir el factor de ampliación o reducción con el

que se visualiza un objeto. Normalmente se expresa en porcentajes, donde el
100% es el tamaño real.
RESUMEN
La restauración de audio es una disciplina que abarca tópicos que hace

articulaciones entre la física y el audio. Para entender claramente el proceso de
restauración de audio es necesario, inicialmente, abordar conceptualmente la
teoría ondulatoria para identificar los parámetros asociados con algunas
características de la percepción musical.
El proceso de la restauración de audio ha pasado por muchas etapas y, a lo

largo de la historia, se han creado diversos mecanismos para contrarrestar el
ruido de las grabaciones analógicas y mejorar la calidad del sonido grabado.
Sin embargo, nunca se había estado tan cerca de la perfección como ahora, en
una época en la que el audio digital, los formatos digitales y la computación,
con sus programas de restauración digital de audio, proveen de poderosas e
ilimitadas herramientas para terminar definitivamente con las imperfecciones
del audio analógico. Es claro que esta perfección no sería posible si no se
toman una serie de acciones correctivas, previas a la digitalización, sobre los
medios analógicos y si la humanidad no hubiera contado con los grandes
genios que han desarrollado los modelos matemáticos en los que descansan
todos los algoritmos de restauración de señales presentes en los programas de
restauración digital de audio.
34
INTRODUCCIÓN
Desde finales de 1800, época en la que comenzó una nueva era en el mundo
musical, la investigación referida al tema del audio se ha centrado
principalmente en dos aspectos: el desarrollo de métodos que permitan
registrar el sonido lo más parecido al original (originalidad y fidelidad), y el
desarrollo de mecanismos que permitan escucharlo con una calidad tal cual fue
grabado. Estos dos aspectos han generado, dentro de la ciencia que es el
audio, múltiples disciplinas, entre ellas la restauración del audio. Esta disciplina
se viene aplicando empíricamente desde la aparición del primer mecanismo
para registrar sonidos: el fonógrafo.
A partir del momento en que Thomas Alva Edison presentó su cilindro de cera
con tecnología de grabación en surco, se dio comienzo a una nueva tecnología
cuyo primer objetivo, logrado por Edison, fue plasmar sonidos en un medio o
soporte físico para ser escuchados posteriormente. Cuando llegó a concebirse
que éste era un avance tecnológico totalmente nuevo, significó la oportunidad
de desarrollar el mundo musical, pero, como toda tecnología que se respete,
también representó un gran desafío para la industria que ella misma generó.
En una época en que la Ingeniería de Materiales no había nacido, los medios

utilizados para registrar el sonido presentaban una serie de limitaciones
constructivas que los hacían vulnerables y estaban muy propensos a la
destrucción y desgaste. Sin embargo, esto no fue un inconveniente para que
35
esta industria progresara, ya que a la humanidad, dichosa y expectante, con lo

que esta nueva era representaba, sólo le importaba escuchar su voz o la
genialidad de Mozart y los grandes genios del mundo de la música en cualquier
momento. Esto dio fuerzas y permitió el desarrollo de nuevos métodos de
grabación y reproducción y otras formas de almacenamiento, unas mejores
que otras, o más exitosas, pero todas con alguna innovación respecto a la
anterior y con el mismo propósito: almacenar y reproducir el mejor sonido.
La primera evolución de estos métodos de grabación y reproducción, fue el

disco de ebonita, también con tecnología de grabación en surco, muy aceptado
pero aún muy frágil química y físicamente. Posteriormente, surgió la grabación
en alambre, cuyo principio de grabación magnético dio pie al desarrollo de la
cinta magnética, en la que ésta terminó convirtiéndose en la mejor forma de
almacenar sonido junto con la última evolución del disco de surco: el de vinilo.
Estos métodos de grabación, basados en la impresión de la onda de audio
sobre el medio, es lo que se conoce como Grabación analógica. Este tipo de
grabación fue la forma predominante de grabar audio durante muchos años, a
pesar de que sus soportes se destruían fácilmente, se perdía su información y
contenía ruidos indeseados, hasta que llegó el audio digital, el “audio
perpetuo”, y con él, el sendero óptimo de la digitalización.
La era digital le abrió al audio las puertas de la eternidad, la fidelidad y la

limpieza mediante su digitalización y tratamiento digital, procedimientos que
permiten, a través de una sucesión de elementos perfectamente sincronizados,
tomar una caduca señal analógica y convertirla en una saludable señal digital
mediante su restauración.
La restauración digital de audio es un procedimiento complejo que implica

considerar unas medidas, tanto desde el punto de vista físico como digital,
36
antes y después del tratamiento, con el fin de obtener un resultado óptimo y

duradero.
Desde lo físico, las consideraciones que deben asumirse permiten una

identificación del medio que se va a restaurar, sus características técnicas y
constructivas, así como la posibilidad de ejecutar sobre él una restauración
física. La cual, si el medio lo permite, debe ser llevada a cabo con sumo
cuidado, ya que del excelente mecanismo de esta etapa dependen la eficiencia
del tratamiento digital y, obviamente, sus resultados.
En lo que respecta a lo digital, las consideraciones están enmarcados dentro de

lo técnico, ya que implican la identificación de parámetros que influyen
directamente en la calidad del audio digitalizado y la correcta selección de los
dispositivos de captura que, de acuerdo con las necesidades, pueden presentar
características constructivas y especificaciones técnicas muy diferentes.
También en este nivel, se encuentra el proceso de restauración digital a cargo
de los programas de edición gráfica de audio, que son los encargados, por
medio de poderosos algoritmos matemáticos que utilizan predicciones
probabilísticas, de detectar los ruidos indeseados y reconstruir la señal de
audio original. Además, tiene la posibilidad de agregar efectos con el fin de
optimizar y enriquecer el sonido.
Finalmente, se debe recordar que es de suma importancia la selección del

equipo que se encargará de almacenar y procesar el audio digitalizado y
restaurado, ya que debe cumplir con unas especificaciones mínimas para
garantizar un efectivo proceso de restauración, almacenamiento y traslado de
la señal restaurada a un medio digital externo, con especificaciones técnicas
superiores y características constructivas mucho más estables que los frágiles
medios analógicos.
37
Todo este proceso sobre la señal de audio es precisamente lo que se intenta

ilustrar y analizar en este trabajo, recorriendo en forma secuencial el
procedimiento de la restauración digital, desde la identificación del problema
para proseguir con la formulación de la solución y, posteriormente, ejecutar las
acciones adecuadas, las cuales incluyen la captura, el almacenamiento, el
tratamiento digital y la reproducción de la señal.
Adicionalmente, para facilitar la comprensión de todo el procedimiento, se

recurre, inicialmente, a la aclaración de algunos conceptos referentes al audio
y a su restauración.
En términos pedagógicos, vale la pena agregar que se han utilizado una serie
de imágenes y gráficas, con el objeto de hacer mayor claridad en unos
procesos que tienen un alto grado de complejidad en su descripción, y que
permiten, entonces, complementar cada una de las etapas que están
implicados en cada proceso descrito. Vale la pena resaltar que se han hecho
algunas recomendaciones de marcas de equipos con el objeto de permitir la
selección de quienes tienen la tarea fundamental y delicada de trabajar
profesionalmente con el sonido. No hacemos tales recomendaciones con otro
fin.
Finalmente, se brindó apoyo a la emisora de la Universidad Pontificia

Bolivariana, Radio Bolivariana, como uno de los principales objetivos de este
trabajo de grado, ya que esta se encuentra actualmente en una etapa de
transición entre el audio analógico y el digital y comenzando un proyecto de
restauración del audio de su fonoteca analógica.
38
1. CONCEPTOS DE SONIDO Y RESTAURACIÓN DE AUDIO
1.1. PRINCIPIOS BÁSICOS DE AUDIO
El propósito fundamental de este capítulo es definir denotativamente cada uno

de los conceptos que determinan, en un área del saber, los comportamientos y
características del sonido y su restauración. Es pertinente aclarar que estos
conceptos se definen para que haya una mayor comprensión del tema por
parte del lector.
Dentro de los principios básicos de audio es preciso comenzar con el concepto

de onda y sus tipologías. Se verá, entonces, su definición más básica:
1.1.1. Onda. Una onda es una perturbación que se propaga en un medio

material o en el vacío. Sin importar la naturaleza de tales perturbaciones, las
ondas tienen un comportamiento similar. La teoría general sobre ondas se
emplea para describir el sonido e, igualmente, los fenómenos sonoros permiten
entender más claramente la teoría general de ondas.
Para propagarse, algunas ondas precisan de la existencia de un medio material

que cumpla con la función de soporte de la perturbación; éstas,
genéricamente, se denominan ondas mecánicas. El sonido es un tipo de onda
mecánica que se propaga únicamente en presencia de un medio elástico que
soporta la perturbación. Las ondas que se forman en la superficie del agua y
las ondas en cuerdas, son ejemplos claros de lo que se denomina ondas
mecánicas y corresponden a compresiones, deformaciones y, en general, a
39
perturbaciones del medio en el que se propagan por medio del mismo.

También existen ondas que pueden propagarse en ausencia de un medio
material, es decir, en el vacío. Son las ondas electromagnéticas o campos
electromagnéticos; a esta segunda categoría pertenecen las ondas luminosas.
Independientemente de su naturaleza, existen algunas características que son

comunes a todas las ondas, y que en conjunto definen el llamado
comportamiento ondulatorio.
1.1.2. Tipos de ondas
1.1.2.1. Monodimensionales. Son aquellas que se propagan en el espacio

a lo largo de una sola dirección.
1.1.2.2. Bidimensionales. Se propagan en cualquiera de las direcciones de

un plano de una superficie. Se denominan también ondas superficiales.
Atendiendo a la periodicidad de la perturbación local que las origina, las ondas

se clasifican en:
Periódicas. Corresponden a la propagación de perturbaciones de

características periódicas como vibraciones u oscilaciones, las que suponen
variaciones repetitivas de alguna propiedad.
No periódicas. La perturbación que las origina se da aisladamente en el

tiempo y en el caso de que se repita, las perturbaciones sucesivas tienen
características diferentes. Las ondas aisladas se denominan también pulsos.
40
De acuerdo con que la dirección de propagación coincida o no con la dirección

en la que se produce la perturbación, las ondas pueden ser:
Longitudinales. El movimiento del medio alcanzado por la perturbación se

efectúa en la dirección de avance de la onda. El sonido es un ejemplo de una
onda no periódica longitudinal.
Transversales. La perturbación del medio se lleva a cabo en dirección

perpendicular a la de propagación.
1.1.3. Algunos parámetros. Para avanzar en el estudio del sonido, es

conveniente repasar las características de la oscilación más sencilla. En la
figura 1, se puede apreciar una onda senoidal. Algunos elementos que
caracterizan estas ondas son:
1.1.3.1. Periodo. (T) El periodo es el tiempo T que tarda la onda en

recorrer un ciclo, es decir, lo que se demora para volver a su posición inicial.
Cuando la onda se repite, se dice entonces que la onda es periódica.
1.1.3.2. Frecuencia. (f) Es el número de veces o ciclos que se presentan

por unidad de tiempo (número de veces que la onda se repite por segundo).
En otras palabras, la frecuencia es la rapidez con la que la onda se repite por sí
misma.
La frecuencia y el período están relacionados por las siguientes expresiones:
f=1/T [=] Herz (1.1)

41
T=1/f [=] Segundos (1.2)
1.5
Cresta
1
0.5 Nodo
Amplitud
-0.5
T
-1
Valle
-1.5
0 10 20 30 40
Tiempo (seg)
Figura 1. Onda senoidal.
La frecuencia se mide en ciclos/segundos o, mejor, en Hertz, que es la unidad

que se ha adoptado internacionalmente y que corresponde a una unidad
estándar en el ámbito global.
1.1.3.3. Fase. ( ϕ ) Mide la cantidad de ciclo de señal que ha transcurrido a
partir de un instante de tiempo de referencia cualquiera. La fase se mide

generalmente en grados (º), y va desde los 0º hasta 360º.
42
1.1.3.4. Longitud de onda. ( λ ) En una onda periódica es la distancia entre

dos puntos idénticos de la onda. Por ejemplo, entre dos crestas consecutivas,
dos valles consecutivos o dos nodos no consecutivos. La longitud de onda se
mide generalmente centímetros o metros.
1.1.3.5. Amplitud. (A) Es el máximo valor que puede alcanzar la señal en el

eje vertical. La amplitud puede ser tomada positiva o negativamente. La
amplitud se mide normalmente para audio en voltios o decibeles.
1.1.3.6. Rapidez de la onda. (V) Es la magnitud de la velocidad de

propagación de la onda, la cual depende únicamente de las características del
medio y del tipo de onda, pues las ondas electromagnéticas son
independientes del medio de propagación.
1.1.4. Sonido. Sensación producida en el órgano del oído por el movimiento

vibratorio de los cuerpos y trasmitido por un medio elástico, como el aire.
El sonido está compuesto por ondas sonoras. Éstas tienen la virtud de

estimular el oído humano por medio de vibraciones y generar la sensación
sonora en nuestro cerebro. Estas vibraciones se propagan a través de un
medio elástico (el aire) y se producen por el desplazamiento de las moléculas
del aire causado por la acción de una presión externa o perturbación. Cada
molécula trasmite la vibración a la que está a su lado, provocando un
movimiento en forma de avalancha. De lo anterior, se puede inferir, entonces,
que el sonido es el resultado de estos desplazamientos.
43
1.1.4.1. Ondas de presión sonora. El oído es un órgano capacitado para

detectar cambios en la presión del aire. El sonido llega al oído en forma de
aumentos y disminuciones de tal presión. Estos aumentos y disminuciones son
repetitivos y se conocen con el nombre de ondas de presión sonoras. Cualquier
objeto real, es decir, que exista en el plano tangible, puede ser el origen de la
perturbación del aire que consiste en el aumento o la disminución en la presión
del mismo. La perturbación que este objeto realiza cuando vibra, involucra el
movimiento de las moléculas contenidas en el aire. El resultado de este
movimiento es la transmisión de energía acústica de un lugar a otro. Las ondas
de presión sonora comienzan a propagarse a medida que las moléculas
comienzan a moverse desde la fuente.
1.1.4.2. Características del sonido. El sonido puede describirse en su

totalidad especificando tres características de su percepción: el tono, la
intensidad y el timbre. Estas características corresponden exactamente a tres
características físicas: la frecuencia, la amplitud y la composición armónica,
contenido espectral o forma de onda. Para hacer una explicación simple de
tales conceptos puede decirse que la intensidad, que depende de la amplitud,
distingue un sonido fuerte de uno débil; el tono depende de la frecuencia, y
distingue un sonido agudo (tono alto) de otro grave (tono bajo); y el timbre,
que depende de la forma de la onda, distingue dos sonidos de la misma o
diferente intensidad y del mismo tono, pero producidos por distintas fuentes ya
que tienen distintos contenidos en sus armónicos.
Para ilustrar más claramente estas definiciones, se puede utilizar un ejemplo

sencillo: dos cantantes pueden interpretar la misma melodía en el mismo tono
y con la misma intensidad, pero no con igual timbre de voz.
44
Compresión y rarefacción. Las regiones donde un gran número de

moléculas se agrupan y se articulan entre sí se llaman compresiones o
regiones de alta presión. Las regiones cuya presencia de moléculas es escasa
se conocen como rarefacciones o regiones de baja presión.
Cuando las ondas de presión sonora comienzan a propagarse, a medida que

las moléculas se empiezan a mover desde la fuente, las moléculas pasan la
energía de una a otra originando una reacción en cadena por los continuos
choques entre ellas. Estos choques involucran dos pasos en un ciclo, que son la
compresión y la rarefacción.
Frecuencia y altura. Cuando una onda de presión sonora pasa por el proceso
de compresión-rarefacción se dice que ha completado un ciclo de movimiento
o vibración. El número de ciclos o vibraciones que realiza una onda de presión
sonora en un segundo, es lo que se conoce con el nombre de frecuencia y ésta
es una característica física del sonido. El Hertzio o Hertz (Hz) es la unidad de
medida de la frecuencia y describe la relación entre el número de ciclos de
compresión–rarefacción que ocurre en un segundo. Para los seres humanos
esta característica física está asociada con la altura de un sonido que, en
términos cualitativos simples, puede definirse como lo grave o lo agudo del
mismo. Así, una onda de altura grave tiene un número de ciclos por segundo
menor que una onda de altura aguda.
Número de ciclos/ Tiempo [=] Hertzio o Hertz (Hz.) (1.3)

El oído humano puede percibir frecuencias en un rango de 20 hasta 20.000 Hz,
aproximadamente. Este rango audible de las frecuencias que pueden ser
detectadas por el oído humano, está dividido en diez partes llamadas octavas.
Cada octava es la relación tonal de 2 a 1 entre dos frecuencias. Es decir, una
relación del doble del valor de una de ellas. Por ejemplo, entre 20 y 40 Hz
45
existe una octava (20 multiplicado por 2, da como resultado 40 Hz), entre 40 y
80 Hz existe otra octava (40 multiplicado por 2, da como resultado 80 Hz). Las
frecuencias correspondientes a las primeras cuatro octavas (20 a 320 Hz)
hacen parte de lo que se denomina el rango de las frecuencias bajas o bajos.
Las frecuencias correspondientes a las segundas cuatro octavas (320 a 5.120
Hz) hacen parte de lo que se conoce como el rango de las frecuencias medias o
medios. Las frecuencias correspondientes a las dos últimas octavas (5.120 a
20.460 Hz) hacen parte de lo que se conoce como el rango de las frecuencias
altas. En la siguiente figura se observa la relación de octavas utilizando
algunos instrumentos musicales.
Amplitud y volumen. Como se mencionó anteriormente, cuando una onda

de presión sonora pasa por el proceso de compresión-rarefacción, se dice que
ha completado un ciclo de movimiento oscilatorio o vibración. Pero no sólo
ocurre esto, pues también hay un determinado número de moléculas que son
desplazadas. Este número de moléculas desplazadas depende de la intensidad
de la vibración. La intensidad es directamente proporcional al número de
moléculas desplazadas. La cantidad de moléculas desplazadas determina, por
lo tanto, el tamaño de la onda, que es lo que se conoce con el nombre de
amplitud. Esta característica física del sonido está asociada subjetivamente con
la percepción de lo que comúnmente se conoce como volumen.
46
Primera Segunda Tercera Cuarta Quinta Sexta Séptima Octava Novena Déc ima
Octava octava octava oct ava octava octava octava octava octava octava
20 40 80 160 320 640 1280 2560 5120 10240 20460
Frecuencias Bajas Frecuencias Medias Frecuencias Altas
Guitarra eléctrica
Platos
Voz humana
Violonchelo
Tuba
Tumbadora Trompeta
Figura 2. Octavas con imágenes de instrumentos musicales.

Fuente: Música. Galería de imágenes de ABCMúsicos. [en linea]. s.l.: ABCMúsicos, s.f.
<http://www.abcmusicos.com/modules.php?name=coppermine>
[consulta: 10 Mar. 2005]
* Diseñada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás
El Decibelio o Decibel (dB) es una medida adimensional del valor relativo que
se asigna a una señal para cuantificar su amplitud. Este valor expresa la
relación de dos valores o cantidades de igual naturaleza (niveles de presión
sonora, niveles de potencia, niveles de voltaje) donde uno de ellos sirve de
base de cálculo o referencia. El audio esta comprendido entre 0 y 130 dB.
Velocidad. La velocidad de la onda describe la rapidez con la que ésta se

mueve en un medio determinado. Para las ondas de presión sonora, el medio
en el cual se mueve está constituido por las moléculas de aire. Las variaciones
en la temperatura del aire inciden en la densidad del mismo y tienen un efecto
47
sobre la velocidad de las ondas de presión sonora. Dicho efecto se puede

calcular a partir de la expresión:
γPo
V= (1.4)
ρo
Donde:
γ es el índice adiabático del gas.
Po es la presión.
ρo es la densidad.
Si el medio elástico es el aire entonces:
γ = 1.4
Po = 1.013x105 Pa
ρo = 1.293 Kg/m3
Se obtiene para la velocidad de propagación del sonido en el aire: V= 331 m/s.
Longitud de onda. Es la distancia que existe entre el comienzo y el final de

un ciclo de compresión-rarefacción. Ésta puede ser calculada por la relación
entre la velocidad de una onda de presión sonora y la frecuencia de la misma,
como se establece en la siguiente ecuación:
λ = V F [=] metros (1.5)

48
Donde:
λ (Lambda) es la longitud de onda expresada en metros.
V es la velocidad del sonido en el aire a 23 grados centígrados (que es igual a
344 metros por segundo).
F es la frecuencia expresada en Hz.
Fase. Es la diferencia de tiempo que existe entre dos ondas de presión sonora
en un punto dado del ciclo de compresión-rarefacción en el que ocurren. Para
entender este fenómeno, se supone una onda senoidal como la onda de
presión sonora más sencilla, pudiendo ser dividida en intervalos que ocurren
con regularidad. Estos intervalos son medidos en grados. En la primera parte
del ciclo, se tiene (en el punto de arranque de la onda de presión sonora) una
compresión nula, y por tanto, una amplitud nula. Este punto se referencia a 0
grados. La máxima compresión y amplitud se presenta a los 90 grados. La
rarefacción y, por ende, la amplitud, vuelven a ser nulas en 180 grados.
En 270 grados se obtiene una máxima rarefacción y amplitud pero en sentido

negativo. En 360 grados se completa el ciclo de movimiento y se verifica una
amplitud nula. Si dos ondas coinciden en su punto de arranque y
desplazamiento se dice que están en fase. De no ser así, entonces se dice que
están en desfase. A continuación en la figura 3 se pueden observar las zonas
de compresión y rarefacción de una onda senoidal.
El estudio del sonido ha adquirido un carácter multidisciplinar porque abarca

varios campos de la física, tiene desarrollos teóricos y prácticos de gran
relevancia, que lo proyectan hacia una ciencia de la ingeniería. Este aspecto es
de suma importancia para nuestro trabajo ya que pone de relieve su vigencia
en el campo que nos compete.
49
1.5
1 ciclo o
Compresión período
1
Amplitud(Volt)
0.5
270º
0 90º 180º 360º
-0.5
-1
Rarefacción
-1.5
0 10 20 30 40
Tiempo o wt (Radianes)
Figura 3. Amplitud y frecuencia de una onda sonora.
1.1.4.3. Campos de investigación
En este apartado se intenta hacer algunos acercamientos teóricos por

investigaciones previas que pueden tener aplicabilidad en varios campos
interdisciplinarios e integrales de nuestro saber específico.
Acústica física. Estudia las características y propiedades de las

vibraciones sonoras audibles (20 a 20.000Hz), sus tipos y los diferentes
medios por los que se propaga. Como una extensión de la acústica física
se estudian también otras vibraciones como las que se describen a
continuación:
50
• Vibraciones ultrasónicas. Son las que presentan frecuencias por

encima del umbral de sensibilidad humana, es decir, frecuencias
mayores a los 20.000 Hz.
Algunas de sus aplicaciones se evidencian en medicina (terapia y

ecografía), en oceanografía (medición de profundidades, detección de
iceberg, funcionamiento del sónar, entre otras).
• Vibraciones infrasónicas. Son las que presentan frecuencias por

debajo del umbral de sensibilidad humana, es decir, frecuencias
menores de 20 Hz.
Algunas de sus aplicaciones están orientadas a la atenuación o

eliminación de frecuencias perjudiciales para la salud.
Las fuentes generadoras de vibraciones infrasónicas son de dos tipos:

fuentes artificiales como motores, sistemas de ventilación y sistemas
de calefacción y fuentes naturales como tormentas, terremotos,
fuertes vientos y, en general, todo fenómeno que suponga movimiento
de grandes masas
Se ha descubierto que los infrasonidos de baja intensidad provocan

mareos, náuseas y vómitos, los infrasonidos de alta intensidad
producen fricciones entre los órganos internos que pueden producir
hemorragias internas.
Acústica fisiológica y psicoacústica. Estudian las características y el

comportamiento del oído humano y de las cuerdas vocales; las reacciones
del hombre respecto al estímulo sonoro y los criterios psicoacústicos para
la ponderación de la sonoridad y nocividad del sonido (audiometría). En
51
este campo se incluye el estudio del ruido y su influencia en el organismo

humano.
Electroacústica. Trata del diseño de los transductores

electromecánicos, de las técnicas de conversión mutua de energía
eléctrica en mecánica y de los sistemas de registro y reproducción del
sonido. La tecnología de la alta fidelidad es una aplicación de la
electroacústica. Con ella se consigue una reproducción sonora de
excepcional calidad.
Acústica arquitectónica. Se encarga, específicamente de la absorción y

aislamiento del sonido en ambientes cerrados como en los edificios. Busca
la prevención del eco y el control de los efectos de reverberación en los
auditorios y salas de música.
Acústica musical. Estudia las leyes de las combinaciones armónicas de

las vibraciones sonoras producidas por generadores mecánicos y
electrónicos, lo que comúnmente es llamado como instrumentos
musicales, incluida la voz humana.
Lingüística y fonética. Estudian la estructuración del lenguaje, los

formantes del sonido y la producción de la palabra, mediante
sintetizadores1.
1
CARRETERO MONTERO, Alfonso. Sistemas de sonido: definiciones de sonido y
campos que lo estudian [en linea]. s.l. ALFOCAMO WEB, 1999, actualizada 9 Sep. 2004
<http://www.terra.es/personal/alfocamo/Sonido.htm> [consulta: 12 Mar. 2005]
52
1.2. HISTORIA DE LA TECNOLOGÍA DE GRABACIÓN
Se considera oportuno, y muy pertinente, hacer un recorrido histórico por los

aspectos más relevantes del mundo de la tecnología de la grabación, pues es
un aspecto muy significativo ya que se trata de un tema que no nació por
generación espontánea, es decir, existen unos datos, unos paradigmas y,
sobre todo, unos acontecimientos históricos que han determinado el
conocimiento humano.
Thomas Alva Edison inventó el fonógrafo, primer ingenio capaz de grabar y

reproducir en formato analógico el sonido, cuyo desarrollo abrió nuevas
posibilidades en el campo de la comunicación. Desde entonces, muchos
esfuerzos se han hecho para encontrar los mejores caminos para grabar y
reproducir sonidos. A mediados de los años veinte, apareció el primer
grabador eléctrico y gradualmente las grabaciones electroacústicas.
El desarrollo de las computadoras, la invención de los transistores, a mediados

de los cincuentas, del microprocesador en los tempranos setentas, junto con la
habilidad de grabar los datos en medios magnéticos u ópticos, culminó en la
estandarización del formato del CD (Compact Disc) o disco compacto en 1980.
Hoy en día, con la tecnología digital disponible, es posible implementar

aplicaciones especializadas de audio. Por ejemplo, ésta es usada para mejorar
la calidad de modernas y antiguas técnicas de grabación y reproducción.
53
1.2.1. La Historia. En 1877 Thomas Alva Edison (1847-1931) creó un

aparato capaz de transformar la energía acústica en mecánica: el fonógrafo.
Los sonidos se grababan en un cilindro de cera; para escucharlos, una aguja,
unida a un audífono de considerable diámetro, debía recorrer los surcos para
recoger las ínfimas vibraciones allí escritas. Para hacer más comprensible este
sistema, hemos recurrido a la figura 4 que corresponde al fonógrafo de Edison.
En 1888, Emile Berliner (1851-1921) terminó su gramófono, este sistema no
se diferencia mucho en cuanto a los principios (aguja vibrante que transmite
vibración a un diafragma), pero incorpora una gran modificación, que posibilita
la comercialización masiva. Se trata del disco plano con surco en espiral. Estos
discos se prensaban sobre ebonita (una goma endurecida) y, aunque eran
menos costosos que los cilindros de cera, no alcanzaban la calidad sonora de
éstos, por lo que tomó un tiempo y algunos ajustes masificarlo.
Oberlin Smith publicó una descripción de un sistema de grabación magnética

en la edición de Sep. 8 de 1888 de Electrical World, basado en su propia visita
al laboratorio de Edison, 10 años antes. En la figura 5 se ve el sistema de
grabación magnética de Oberlin.
Su idea estaba basada en un electroimán y una cuerda cubierta de limaduras

de hierro. Probablemente haya construido un prototipo funcional, pero ninguno
ha sobrevivido hasta ahora.
La palabra hablada es traducida en señal eléctrica a través del micrófono A,

que es transmitida al sustrato C mediante la cabeza de grabación B. F Batería,
E carrete receptor, D carrete de entrega, J freno del carrete. Esta fue la
primera forma de grabación en alambre de acero.
54
Figura 4. Fonógrafo de Edison.

Fuente: Restauración de audio. Proceso de señales y aplicaciones en la restauración de
registros sonoros: las tecnologías de registro y reproducción de las señales sonoras.
[en linea]. Oviedo: Universidad de Oviedo, s.f.
<http://coco.ccu.uniovi.es/brahms/tecnologiasregistro/tecnologiasregistro.htm>
[consulta: 25 Feb. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás
55
D B
C
J E
F
Figura 5. Sistema de Oberlin.

Fuente: CABEZAS G, Alonso. Apunte reunificado de grabación de sonido: grabación de
sonido [en linea]. s.l. s.n. 2003 <http://z.tardis.cl/sd/ap_grab_1y2.fh11.pdf>
El principio fue redescubierto con bastante mayor éxito por Valdemar Poulsen
en 1894, empleado del telégrafo de Copenhagen. Éste, el telegráfono de
Poulsen, se puede considerar el primer modelo exitoso de un sistema de
grabación magnética de audio. Al expirar la patente de Poulsen, en 1918, se
abrió la posibilidad para que en Alemania se alcanzaran sucesivos desarrollos,
para culminar, en 1928, con la fórmula patentada por Fritz Pfleumer para
recubrir papel u otra cinta con polvo ferromagnético, dando origen al desarrollo
de la cinta magnética. Con este nuevo avance tecnológico, la empresa alemana
AEG decide, en 1930, comenzar a desarrollar el magnetófono basado en el
principio de Pfleumer. Dos años más tarde, BASF, industria alemana pionera en
la fabricación de polímeros y material ferromagnético, llega a un acuerdo con
AEG para la fabricación del formato que se reproduciría en su magnetófono, y
así, en 1934, BASF fabrica una cinta magnética con base en acetato de
celulosa con partículas de óxido férrico, y con ésta, la primera distribución
masiva de cinta magnética. Este es el magnetófono AEG-BASF.
56
Figura 6. Magnetófono AEG-BASF.

sonido [en linea]. s.l. s.n. 2003 <http://z.tardis.cl/sd/ap_grab_1y2.fh11.pdf>
A pesar de estos progresos, hasta la segunda guerra mundial no se

perfeccionaron los procedimientos mecánico y magnético. Luego dio lugar al
nacimiento de los discos de vinilo de los 16, 33 1/3 y 45 revoluciones por
minuto (1948, disco de microsurcos de larga duración; 1958, disco
estereofónico). Para la grabación se emplea un disco de aluminio recubierto de
acetato y un buril (rubí tallado) que se desplaza de acuerdo con las vibraciones
sonoras. En 1965, apareció la cinta magnética, con distintos formatos. Hoy en
día, para la grabación del sonido, se emplean esencialmente dos técnicas: la
grabación por rayo láser y el procedimiento magnético.
El proceso de transformación de energía acústica en mecánica y magnética se

basaba en un procedimiento analógico. Las vibraciones producidas por los
sonidos eran representadas por surcos y niveles de imantación, cuyas
variaciones eran semejantes a las de los sonidos percibidos. En micrófonos y
altavoces hubo enormes progresos.
57
En los sistemas digitales se toman muestras del sonido hasta de 192.000

veces por segundo. La forma de cada una de estas “porciones” de sonido se
convierte en largas series intangibles de 0 y 1.
El Blu-ray disc, HD DVD (High Definition Density Digital Versatile Disc) y el

SACD (Super Audio CD) se consideran como lo más avanzado en el campo de
la alta fidelidad.
1.3. PRINCIPIOS BÁSICOS DE LA RESTAURACIÓN DE AUDIO.
De acuerdo con lo anterior, y siguiendo con la necesidad de definir algunos

conceptos y principios básicos que han determinado el mundo de la
reproducción de audio, se analizan los principios que se requieren en la
restauración del audio.
Desde los inicios de las grabaciones de audio se emplearon los formatos

analógicos de almacenamiento. Ejemplos típicos han sido los discos de vinilo,
casetes, cintas magnéticas, etc. Formatos que se describirán más
profundamente en el capítulo 2 de este trabajo. En la actualidad aún se debate
si los medios de almacenamiento digital permiten mayor fidelidad del sonido
que el ofrecido por los formatos analógicos. El audio analógico presenta una
gran desventaja originada por el deterioro al que se ven sometidos los
diferentes medios de almacenamiento. Muchos medios analógicos van
perdiendo calidad con el paso del tiempo, debido a daños en las cintas
magnéticas causados por la presencia de campos magnéticos cercanos, alta
temperatura, estiramiento o, en el caso de los discos, el polvo y otras
suciedades que producen distorsión. En cintas magnéticas se evidencia esto al
ver cómo factores como la humedad y la suciedad hacen perder su calidad. La
58
respuesta a estos inconvenientes se encuentra en la restauración de audio

mediante la digitalización y posterior tratamiento digital. Cualquier fuente de
audio se puede ver beneficiada por la aplicación de métodos de reducción
digital de ruido.
1.3.1. Restauración tradicional de audio. La restauración de audio

apunta básicamente a mejorar el sonido de grabaciones viejas o nuevas
deterioradas. El principal objetivo es reducir ruidos espurios, que normalmente
se introducen por los mecanismos de grabación y reproducción o playback;
mientras se trata, hasta donde sea posible, de conservar el sonido original.
El primer paso para la restauración típica de audio, es transferir el sonido de

viejos formatos analógicos a un formato digital. Esta tarea involucra localizar
las matrices originales, o las copias sonoras de mejor calidad, hallando el
mejor medio o equipo para su reproducción. La transferencia de formatos de
sonido viejos a modernos, como por ejemplo de 78 revoluciones por minita
(RPM) a los discos de vinilo, era una práctica común antes de la era del audio
digital. De los diferentes formatos de audio analógicos se hablará en el capítulo
2. La idea es mejorar las características de los formatos de almacenamiento
con rasgos de sistemas de grabación más avanzados. Otras mejoras relacionan
una capacidad de almacenamiento de datos más grande con un tiempo de vida
más largo, más fácil manejo y cuidado, fácil duplicación del material y mayor
acceso por parte del público. La restauración de audio va más allá de digitalizar
el audio analógico. Gracias al crecimiento tecnológico de los procesadores, un
mayor número de sofisticados y poderosos procesos de digitalización de datos,
han sido posibles en la práctica. Hoy en día, la restauración de audio se logra
por medio de algoritmos DSP (Procesamiento Digital de Señales) destinados a
suprimir ruidos espurios; perturbaciones introducidas por los viejos sistemas
de grabación y playback y, finalmente, la reconstrucción de la señal de audio.
59
1.3.2. Ruidos o degradaciones. El ruido, mezclado con una señal acústica

destinada a ser percibida por el hombre, constituye, generalmente, una parte
subjetiva de la misma que transporta información no útil y que perturba la
forma de onda de manera que modifica su significado, interfiriendo así la
comunicación de la parte útil. La parte útil transporta la información deseada y
el ruido transporta información sobre los elementos que han servido para
generar la señal, grabarla y transmitirla. El objetivo es implementar procesos
de separación de la señal útil del ruido, los que básicamente pueden ser
contenidos por dos tipos: en el primer modelo, se puede precisar la parte de
la señal que se considera ruido, procediendo a su eliminación. La señal
restante será la restaurada. En el segundo modelo, se puede precisar la parte
de la señal que es de interés, música o palabra. Se elimina la señal que no es
de interés y queda la señal restaurada. En la figura 7 se pueden complementar
gráficamente estos procesos descritos.
1.3.3. Clasificación de degradaciones. Los tipos de degradación,

comúnmente asociados con viejas grabaciones, pueden ser clasificados en
perturbaciones localizables y globales. Por ejemplo, impulsos cortos de ruido
(clicks, crackles, y pops) como también en baja frecuencia, pulsos largos,
(thumps) son localizables mientras continuas distorsiones de fondo o
interferencias como el ruido de la banda ancha (hiss), (buzz y hum),
distorsión, distorsión armónica son usualmente clasificados como
perturbaciones globales. Otros ejemplos de perturbaciones de audio incluyen
las distorsiones no lineales (clipping), ruido de superficie y modulación rápida o
lenta en frecuencia, (wow y flutter), respectivamente.
60
Señal de audio
con ruido
Modelos Matemáticos
Modelos matemáticos
para describir defectos
para describir audio
del audio
Figura 7. Diagrama de modelos de separación.

registros sonoros: ruidos o degradaciones. [en linea]. Oviedo: Universidad de Oviedo,
s.f. <http://coco.ccu.uniovi.es/brahms/tecnologiasregistro/tecnologiasregistro.htm>
• Perturbaciones localizables. Son discontinuidades en la forma de

onda, que afectan ciertas muestras en forma de impulsos como golpes
secos (clicks), crujidos (crackles), chasquidos (pops) y golpes (thumps).
Perturbaciones tipo impulso. Corto estallido de ruido. La palabra “impulso”

significa “la más corta perturbación posible”. En términos generales de audio,
un impulso sólo sería una muestra de corto tiempo. Un pop o un click y otras
formas de perturbaciones localizables se consideran impulsos desde la
percepción del oído.
61
1.3.3.1. Clicks. Son cortos estallidos al azar en el tiempo y en amplitud. Los

clicks se pueden percibir de diferentes maneras: al azar, como pequeños
‘ticks’ de ruido que pueden ocurrir en cualquier medio de grabación analógica.
Por ejemplo, la pobre calidad de un formato de 78 RPM podría contener
alrededor de 2,000 clicks por segundo de material grabado, con duraciones
que van de 20 µ s. a 40 ms. en el peor de los casos. Estas perturbaciones
normalmente son causadas por imperfecciones en pequeña escala en las

ranuras de la pared de un disco. Otras causas de estas imperfecciones pueden
ser la intrínseca porosidad del material del medio, sólidos que se adhieren a las
ranuras de las paredes, o la presencia de rayones superficiales.
1.3.3.2. Scratches. Son pulsos discontinuos de gran amplitud en tiempo y

en frecuencia, seguidos de una etapa transitoria de bajas frecuencias que está
asociada con la respuesta impulsiva del medio de reproducción. Posiblemente
producidos por arañazos o roturas en la superficie de los discos. Los scratches
son pulsos transitorios de duración mayor que la correspondiente a los clicks,
aproximadamente de 20 ms. y con una proporción relativamente alta de
contenido de energía de baja frecuencia, pero exhibiendo contenido frecuencial
a lo largo de todo el espectro. Dependiendo de la disposición del defecto en la
superficie del disco, los pulsos pueden evolucionar en forma casi periódica.
1.3.3.3. Crackles. Son degradaciones impulsivas de pequeña amplitud y

corta duración, causantes de una gran variedad de ruidos con diferentes tipos
de percepción sonora. Por ejemplo, existe un hongo que come los
componentes vegetales contenidos en el material de formatos de grabación
viejos de 78 RPM. Esto deja millones de huecos en la superficie del disco,
creando impulsos de perturbaciones en la forma de onda reproducida.
62
A continuación, y para permitir mayor comprensión de los argumentos

expuestos, se presentan dos gráficas que dejan visualizar, primero, una onda
senoidal con clicks, y, segundo, una onda senoidal con crackles.
Click
Click
Amplitud
Click
Tiempo (seg)
Figura 8. Onda senoidal con clicks.

63
Rarefacción
Crackle
Amplitud
Tiempo (seg)
Figura 9. Onda senoidal con crackles.
1.3.3.4. Thumps. Los Thumps, o golpes, surgen por la aparición de pulsos

largos, contenidos en bajas frecuencias que alteran la señal de audio. Estos
pulsos se relacionan con la respuesta mecánica del sistema o mecanismo de
playback a una excitación anormal. Por ejemplo, en un tocadiscos, la respuesta
del aparato conjunto de brazo y aguja (stylusarm) a grandes discontinuidades
en las ranuras de las paredes de un vinilo. Se esboza, a continuación, una
onda senoidal con thumps.
64
Amplitud
Tiempo (seg)
Figura 10. Onda senoidal con thumps.
• Perturbaciones globales. Las perturbaciones globales son aquellas

que afectan todas las muestras de la onda.
1.3.3.5. Distorsión. Es la adición de armónicos no deseados a la señal

original. Es una clase de perturbación muy general que cubre un amplio rango
de defectos de amplitud tipo no lineal relacionados con exceso de ranuras en
la pared del disco (clipping) y deformaciones. Básicamente existen 2 tipos de
distorsiones, armónica y de intermodulación.
65
• Distorsión armónica. Es la adición de nuevas frecuencias a una señal

que están relacionadas con la frecuencia de entrada en forma de
múltiplos. Así, por ejemplo, una señal con frecuencia de 400 Hz puede
distorsionarse con armónicos de 800 Hz, 1.200 Hz, etc.
• Distorsión de intermodulación. Distorsión que agrega nuevas

frecuencias que son la suma o resta de las frecuencias de entrada. Por
ejemplo, 800 y 1.000 Hz tendrían distorsión de intermodulación en 200
y 1.800 Hz.
1.3.3.6. Clipping. El clipping, o recorte, es una distorsión que consiste en

que una onda es recortada por la parte superior o por la parte inferior. Por
ejemplo, si fuese una señal senoidal, las partes superiores e inferiores de la
onda serían planas en vez de curvas. En la figura 11 se observa una onda
senoidal con clipping.
1.3.3.7. Hiss. Ruido de banda ancha. El ruido aleatorio de fondo es una

forma de degradación común a cualquier sistema de audio analógico:
almacenamiento y equipos de reproducción. En el caso de audio las señales de
ruido que, generalmente, el oyente las percibe como hiss, están compuestas
de ruidos presentes en los circuitos eléctricos, por irregularidades en el medio
de almacenamiento y por el ruido ambiental de las condiciones externas de
grabación. El hiss es común en todas las formas de registro, usualmente es
aditivo e independiente de la señal, y se manifiesta, en mayor grado, en las
cintas magnéticas. La figura 12 se muestra claramente una onda senoidal con
hiss.
66
Amplitud
Tiempo (seg)
Figura 11. Onda senoidal con clipping.
1.3.3.8. Buzz. El término buzz, o zumbido, se utiliza para hacer referencia a

varias degradaciones de audio. Involucra los ruidos producidos por problemas
de encendido y apagado de equipos. A menudo, estos ruidos asumen formas
compactas en el tiempo, regulares ticks en la señal. El buzz es usado para
describir sonidos producidos por fallas eléctricas como los problemas
relacionados con las conexiones de tierra. Éstos pueden llevar a una variedad
de ruidos no deseados como el simple hum o complicaciones armónicas.
1.3.3.9. Hum. Se refiere al ruido generado en dispositivos de audio u otros

dispositivos electrónicos por perturbaciones en la fuente de alimentación de
corriente directa con el que funciona el equipo. Se debe, específicamente, al
alto rizado causado por daños en algunos componentes del filtro asociado al
circuito rectificador de la fuente.
67
Amplitud
Tiempo (seg)
Figura 12. Onda senoidal con hiss.
1.3.3.10. Flutter y wow. Hacen parte de las distorsiones que se producen

en las variaciones en la velocidad de una cinta o disco, por la conmutación
defectuosa de cabezas lectoras o motores de los equipo de reproducción. Esto
conlleva a una desviación en la frecuencia de la señal durante la reproducción
(flutter sería el periodo más largo y wow el más corto), alterando la tonalidad
de la grabación original.
68
2. FORMATOS DE AUDIO ANALÓGICO
Como se anunció en el capítulo anterior, en éste capítulo se va a desplegar y a

profundizar algunos aspectos que están referidos a los formatos de audio. En
primera instancia, unas definiciones aclaratorias y, después, la profundización
temática y argumentativa de tales formatos.
2.1. AUDIO ANALÓGICO
El audio analógico puede definirse como la representación del sonido por medio
de su forma de onda natural o como ésta se vería en el mundo real.
Así pues, los dispositivos que graban sonido de forma análoga lo que hacen,
esencialmente, es imprimir la forma de onda en un medio. Esto se evidencia en
los discos en los que un torno dibuja surcos que simulan una onda de audio,
como se aprecia en siguiente figura. En las cintas magnéticas, el cabezal de
grabación genera una fuerza magnética proporcional a la señal que al aplicarla
a las partículas metálicas presentes en la cinta reaccionan produciendo un
campo magnético que va disminuyendo a medida que se mueve la cinta hasta
llegar al magnetismo remanente. Esto va generando un patrón de alineación
de las partículas magnéticas en la cinta que sigue las variaciones de la señal de
audio original y al pasar la cinta por la cabeza de reproducción esta genera una
corriente que adquiere una forma de onda de audio.
69
Figura 13. Imagen aumentada de la superficie de un disco. Sus surcos simulan una
onda de audio.
Fuente: MICROGRAPHIA. The microscopy of vinyl records: the record surface
[en linea]. s.p.i. <http://www.micrographia.com/projec/projapps/viny/viny0100.htm>
[consulta: 5 Abr. 2005]
2.1.1. Limitaciones del audio analógico. Durante el proceso de impresión

de la forma de onda en el medio analógico, se introducen ruidos que luego se
perciben en su reproducción. En el caso de los discos, algunos rayones y pops,
van empeorando en cada reproducción. En el caso de las cintas, su calidad y
velocidad de grabación limitan su fidelidad y el hiss que, aunque se ve
reducido con la técnica de reducción de ruido Dolby, no deja de ser uno de sus
peores problemas, además presenta muy bajo rango dinámico que en
promedio para sistemas de grabación y reproducción analógicos es de 70
contra 120 dBs de los sistemas digitales.
El principal enemigo de los formatos de audio analógicos es el desgaste y la

degradación del medio. Si se quiere extender su vida útil, es imperativo un
manejo y almacenamiento correctos.
70
En resumen, el audio analógico:
• Se registra en cintas magnéticas o discos analógicos.
• Se edita usando métodos lineales, como el doblaje en tiempo real o

corte y pegado de la cinta misma.
• Es una impresión directa de la forma de la onda sonora.
• Está sujeto a degradación significativa en la calidad ya que es duplicado

sucesivamente.
• Su rango dinámico es menor que el de los sistemas digitales y las ondas

de presión sonora que nos rodean
2.2. FORMATO
Un formato, como su mismo nombre lo indica, puede concebirse como la

manera mediante la cual los datos son organizados sistemáticamente para su
procesamiento, reproducción y transmisión. Los datos son, principalmente,
imágenes, sonidos, e información alfanumérica. Para cada clase de dato
existen diferentes formatos en los que se pueden organizar dichos datos. Estos
formatos pueden ser de dos clases: el formato analógico y el formato digital.
Dentro de cada uno de estos formatos existen divisiones que crean las
distinciones particulares. Por ejemplo, cuando se habla de formato “carta”, se
refiere a un formato en papel (analógico), con unas dimensiones de 216 X 279
mm. Otro ejemplo de formato analógico es un casete o un disco, medios que
se usaron por mucho tiempo y aún se usan como mecanismos para almacenar
sonidos. También se clasifican dentro del formato analógico las fotografías
convencionales sobre papel fotográfico o transparencias.
71
Los formatos digitales son otra manera de representar elementos utilizando

sistemas computarizados; éstos, en su más mínima expresión, se reducen a
secuencias de unos y ceros que, combinados entre sí, representan códigos que
pueden ser interpretados como letras, colores, frecuencias, entre otros. En el
capítulo 7 se hablará má profundamente de los formatos digitales.
2.3. FORMATOS DE AUDIO ANALÓGICOS
A continuación se describe en forma cronológica los diferentes formatos de

audio analógico. Sus respectivos reproductores podrán ser consultados en el
anexo A.
2.3.1. Cilindro de cera de Edison. En 1877 surgió el primer estándar de

grabación de la industria: el cilindro de cera de Edison fue la primera forma de
grabación análoga de audio y se ilustra a continuación. Estaba compuesto por
un cilindro construido en un material de consistencia similar a la cera de abeja,
pero más denso, envuelto en una fina lámina de estaño.
El proceso de grabación se fundamentaba en hacer rotar el cilindro, por medio

de una manivela, sobre el cual descansaba una aguja que, solidariamente
unida a un diafragma, recibía el sonido que era amplificado por un embudo. En
la medida que el diafragma vibraba, lo hacía la aguja, hendiendo la superficie
del cilindro con un patrón analógico al de la vibración del diafragma.
72
Figura 14. Cilindro de cera de Edison.

sonido [en linea]. s.l. s.n. 2003. <http://z.tardis.cl/sd/ap_grab_1y2.fh11.pdf>
Para la reproducción, se hacía girar el cilindro en sentido contrario. Al invertir

el sentido de giro, se reducía la resistencia de la aguja que, en lugar de arañar
la superficie, seguía el camino descrito, trasmitiendo de vuelta la vibración al
diafragma, que la susurraba en el embudo de amplificación. La velocidad de
rotación variaba según la aplicación. Con el cilindro rotando a 90 RPM era
posible registrar casi 4 minutos de voz hablada. Más adelante, para
aplicaciones musicales (2-2,5 min.) se usaron velocidades entre 120 y 160
RPM.
En las primeras etapas de la fabricación de cilindros, sus dimensiones variaban

de acuerdo con el fabricante, pero en 1889, Edison Records, Columbia
Phonograph y otros fabricantes, se pusieron de acuerdo para estandarizar las
dimensiones del dispositivo en 10 cm. de longitud, 6 cm. de diámetro, con lo
cual se podían reproducir 2 minutos de audio.
73
Los primeros cilindros sólo podían ser escuchados unas doce veces y,
posteriormente, se entregaban como créditos para la compra de otros
cilindros. Otra característica es que la superficie podía suavizarse para volver a
grabar. Con el paso del tiempo el tipo de cera se fue mejorando hasta obtener
un cilindro que se podría reproducir más de 100 veces.
En 1906, la Indestructible Record Company cambió la cera por celuloide y el

cilindro ya se reproducía miles de veces, y, aunque era resistente a los golpes,
este material no podía ser suavizado para ser grabado otra vez. La respuesta
de la Edison Records fue hacer el cilindro en un tipo de plástico llamado
Amberol (conocidos como cilindros de Amberol) que, además de ser muy
resistente, permitió aumentar su capacidad de reproducción de 2 a 4 minutos.
El fonógrafo, para reproducir este tipo de cilindros mejorados, se conoció con
el nombre de Amberola.
2.3.2. Disco de 78 RPM. La grabación en disco fue experimentada por

varios inventores, entre ellos Thomas Alva Edison; pero el primero en
desarrollar un modelo funcional de esta tecnología fue el alemán Emil Berliner,
en 1884, que para entonces vivía y trabajaba en Washington. En 1887 obtuvo
patentes en Berlín y Washington para el disco y su equipo reproductor llamado
gramófono.
Los primeros discos fueron construidos en ebonita, pero dada su naturaleza

quebradiza, este material fue reemplazado por el shellac o la goma laca. La
producción en masa de discos de shellac comenzó en 1889 en Hanover,
Alemania, y sus primeras grabaciones fueron comercializadas en 1895. A partir
de este momento se convirtió en el medio de grabación más popular,
desplazando al cilindro de Edison de esta posición, ya que era más barato,
menos frágil y más fácil de almacenar.
74
Al comienzo, la velocidad de rotación era muy variable, pero, a partir de 1920,

los discos que rotaban 78 veces por minuto, se convirtieron en la medida
estándar. Fue así como obtuvieron el popular nombre de disco de 78 o 78’s.
Sin embargo, este término sólo se utilizó después de la Segunda Guerra
Mundial, para distinguirlo de otros formatos en disco que comenzaban a surgir.
Para entonces, otro material había aparecido en los discos de 78: el acetato,
con las ventajas de ser más resistente y proporcionar mejor calidad de sonido.
El tamaño de los discos también fue muy variable. Inicialmente su diámetro

fue de 7”, luego pasó a 10”, siendo éste el más popular y con capacidad de
almacenar 3 minutos de sonido por cada lado; luego 12”, utilizados,
principalmente, para música clásica, con capacidad de grabar 5 minutos de
música por cada lado. Veamos una representación gráfica de un disco de
ebonita.
Figura 15. Disco de ebonita de 7" y 55 RPM.

[en linea]. s.p.i. <http://www.micrographia.com/projec/projapps/viny/viny0100.htm>
75
2.3.3. Alambre. Este sistema de grabación utilizaba alambre delgado como

medio de almacenamiento del sonido. Su grabación y reproducción se hacía a
una velocidad de 24 pulgadas por segundo y sólo podía almacenar una pista de
audio, siendo la primera forma d e grabación magnética y muy confiable.
El alambre se almacenaba en carretes cuyas dimensiones iniciales fueron de

3 ¾” de diámetro y 1 ¼” de ancho, como se ilustra en la imagen izquierda de
la figura que aparece a continuación de este párrafo. Luego, sus dimensiones
se estandarizaron a 2 ¾” de diámetro y ¾” de ancho, como se ilustra en la
imagen derecha de la siguiente figura. Un carrete de dimensiones estándar
podía almacenar hasta 7200 pies de alambre, o sea, una hora de sonido, ya
que era muy delgado (un poco más que un cabello humano). Posteriormente,
se fabricaron carretes de 15 y 30 minutos. Este tipo de formato tuvo su era en
los años 30 y 40, sobre todo para la grabación de voz en dictáfonos y
telégrafos. Hasta que fue reemplazado definitivamente por la cinta magnética.
Figura 16. Carretes de alambre.

Fuente: Audio formats. Wire recorders: spool sizes. [en linea]. Waldoboro: video
interchange, 2005. <http://www.videointerchange.com/wire_recorder1.htm>
76
2.3.4. Cinta de carrete a carrete o de carrete abierto. El carrete abierto

u open reel ilustrado a continuación, fue creado pensando en la forma de
almacenar la recién desarrollada cinta magnética, y su primer uso fue en los
magnetófonos de AEG, fabricados en 1934. En este tipo de formato, la cinta
magnética de audio está retenida en un carrete que la deja expuesta, a
diferencia de la cinta en cartucho o casete, que queda contenida
completamente dentro de él. Originalmente, no tenía nombre ya que todos los
grabadores magnéticos lo usaban. Cuando apareció el cartucho se bautizó
como carrete abierto.
Figura 17. Imagen de un carrete abierto de 7” con cinta de ¼”.

Fuente: B. SMITH, Daniel. Audio formats. Reel-to-reel tape recording. [en linea]. s.l.:
Wikipedia s.f. < http://en.wikipedia.org/wiki/Reel-to-reel_audio_tape_recording>
La cinta en este tipo de formato se puede encontrar en dimensiones que van

desde ¼” hasta 2”, la más utilizada. Este formato presenta pistas grabables
monofónicas con anchuras de ¼”. En cintas de 2” se pueden grabar hasta 32
pistas discretas.
77
Algunas velocidades de grabación y sus aplicaciones fueron:
• 1 7/8 pulgadas por segundo (pps): la más lenta de las velocidades de

uso doméstico. Para grabaciones de voz muy extensas.
• 3 ¾ pps: la más común de las velocidades en las grabadoras de uso

doméstico.
• 7 ½ pps: la más alta de las velocidades domésticas y la más lenta de las

profesionales.
• 15 pps: grabaciones musicales profesionales y programación de radio.
• 30 pps: cuando se necesitaba alta respuesta en frecuencia.
A pesar de la aparición de la cinta en cartucho o casete, en 1963, el formato

de carrete abierto fue el medio preferido por los profesionales del audio debido
al ancho de sus pistas y a su velocidad de grabación. Este último factor y el
ancho del entrehierro del cabezal de reproducción definen la calidad del audio
grabado en una cinta magnética ya que influyen directamente en la respuesta
en frecuencia.
Si se graba una onda de frecuencia f en una cinta que se mueve a velocidad v

y sabiendo que un ciclo de la onda demora un tiempo T, la distancia recorrida
por la cinta durante un ciclo será:
v
d = vT = (2.1)
f
78
Esto significa que cada ciclo de la onda ocupara sobre la cinta una longitud
igual a d.
Para la fabricación de equipos reproductores de cintas magnéticas existe un

criterio que dice:
d
e≤ (2.2)
5
Donde e es el ancho del entrehierro del cabezal de reproducción.
Despejando d de la ecuación (2.2) y reemplazándola en la ecuación (2.1) se

tiene que:
v v
5e = → f = (2.3)
f 5e
De la ecuación (2.3) se deduce que la máxima frecuencia que se puede

obtener durante la reproducción de una cinta es directamente proporcional a la
velocidad de grabación de la cinta e inversamente proporcional al ancho del
entrehierro del cabezal de reproducción.
El carrete abierto fue ampliamente utilizado hasta 1980, cuando apareció

comercialmente el audio digital.
79
Los equipos de reproducción de este tipo de cintas son muy diversos en cuanto
a su forma, ya que es un asunto que define autónomamente cada fabricante.
Sin embargo, su funcionamiento es el mismo para todos ellos.
2.3.5. Disco de vinilo. En 1945, un ingeniero de la Columbia Broadcasting

System (CBS), llamado Peter Golmark, se concentró en el desarrollo de un
disco de larga duración. Tres años más tarde, el 21 de junio de 1948, presentó
el resultado de su trabajo: el disco de larga duración o "long play" (LP), que
podía hacer sonar, efectivamente, 45 minutos de música.
El disco, construido con cloruro de polivinilo (de allí su nombre) y de 30

centímetros de diámetro, era irrompible; característica que le daba ventaja
sobre los discos fonográficos en uso, que no habían cambiado desde el año
1895. Al contrario de los discos de 78 RPM, el LP giraba a 33 1/3 RPM. Sus
microsurcos eran tan finos como un cabello humano, lo que incrementaba
enormemente la calidad. Un LP contenía 118 surcos. Más aún, era más liviano
y ocupaba menos espacio. Lo que un coleccionista de discos de 78 RPM
acumulaba en 2,4 metros de estantería, ocupaba sólo medio metro con la
misma música grabada en LPs.
"Es el disco del futuro", decían al unísono vendedores y compradores, quienes,

al mismo tiempo que el disco, debían adquirir un tocadiscos que remplazaría
al viejo y anticuado gramófono. A largo plazo, el cambio resultaba económico,
pues un LP costaba menos que los cinco discos de 78 RPM necesarios para la
misma cantidad de música.
No obstante, el triunfo definitivo del LP tuvo que esperar, porque el rival, la

RCA-Víctor, no quiso embarcarse en la producción del LP, sino que sacó al
80
mercado, en 1949, su propio disco de 45 RPM. Se trataba de un disco que

necesitaba su propio tocadiscos y que fascinó a la juventud desde el comienzo.
Los aficionados a la música tenían que decidirse: aquí comenzó la guerra de las
velocidades. En 1950 la RCA-Víctor abandonó definitivamente la batalla por el
formato y adoptó el disco de larga duración. Los "singles" o sencillos de 45
RPM, sin embargo, siguieron siendo el formato favorito de la música popular
hasta entrados los años 80s. El disco de vinilo se mantuvo como el disco del
futuro sin variaciones hasta que, a partir de la década de los años 80s, fue
sustituido por el CD.
Los discos de vinilo más comunes fueron:
• 12” (30 cm) 33 1\3 RPM. Conocido como Long Play (LP) o larga
duración. En la siguiente figura se observa un LP de 12”. Tenía
capacidad para contener entre 5 y 10 canciones por cada lado.
• 7” (17.5 cm.) 45 RPM. Conocido como Single o sencillo, pues sólo
contenía una canción por cada lado.
• 10" (25 cm) 33 1\3 RPM, Long-play (LP) o larga duración de 10”.
Otros formatos menos comunes fueron:
• 12" (30 cm) 45 RPM. Extended-playing (EP), Maxi Single o Reproducción

extendida.
• 10" (25 cm) 45 RPM. Extended-playing (EP) o reproducción extendida.
• 7" (17.5 cm) 33 1\3 RPM. Extended-playing (EP) o reproducción

extendida.
81
La calidad del sonido en un disco de vinilo depende de la calidad del vinilo

usado para su fabricación. La mayoría de discos de vinilo eran fabricados en
vinilo reciclado. Sin embargo, para obtener mejor calidad de audio, algunas
veces se utilizaba vinilo sin reciclar (virgen) o “pesado”, como se le conoce.
Actualmente todos los discos de vinilo se fabrican en vinilo virgen.
Figura 18. Disco de vinilo.

Fuente: Audio formats. Viyl record. [en linea]. s.l.: Wikipedia, s.f.
<http://en.wikipedia.org/wiki/Vinyl_record>
2.3.6. Cartucho RCA o RCA sound tape cartridge. En 1958 RCA (Radio
Corporation of America) introdujo al mercado este tipo de formato que fue uno
de los primeros intentos de incorporar la cinta dentro de un contenedor
portátil, que se hiciera más cómodo de llevar que las aparatosas cintas de
carrete abierto. En la siguiente figura se observan dos cartuchos RCA.
Las medidas de este cartucho eran de 5” x 7 1/8” x ½”, su velocidad era de 3

¾ pulgadas por segundo, con 30 minutos de audio en una cinta de ¼”, o 1 7/8
82
pulgadas por segundo. Bastaba mover una pequeña palanca en el dispositivo

reproductor y grabador.
La RCA intentó convertir su cartucho en un medio popular de música

pregrabada pero no fue más que un fracaso y para 1960 abandonó su
producción.
Figura 19. RCA Sound Tape Cartridge.

Fuente: Audio formats. RCA cartridge tapes. [en linea]. s.l.: Human Software
Corporation and Past reMasters, 2005.
< http://www.connell-labs.com/tape/RCACartridgeTapes.html>
2.3.7. Sanyo micro pack 35. A principios de 1960 la compañía japonesa

Sanyo (tres océanos, en japonés), lanza la más temprana de las máquinas de
grabación y reproducción de dictado portátil para el ejecutivo de los años 60s:
la Sanyo micro pack 35, que se refiere gráficamente con la siguiente imagen.
La cinta estaba contenida en un cartucho transparente de 2.6 x 2.9 x 1.9

pulgadas y una de sus principales innovaciones es que la cinta estaba enrollada
83
en carretes dispuestos uno encima del otro, lo que redujo considerablemente

su tamaño.
Figura 20. Sanyo micro pack 35. Reproductor y cartucho.

Fuente: Audio formats. Vintage audio history: sanyo micro pack 35. [en linea].
Waldoboro: video interchange, 2005.
<http://www.videointerchange.com/audio_history.htm#Sanyo%20Micro%20Pack%20
35%20(Early%201960s%20)>
2.3.8. Cartucho de 4 pistas. Este formato fue desarrollado en 1954 por

George Eash, pero sólo fue tenido en cuenta en 1956, cuando Earl “Madman”
Muntz, un mercader de autos usados, vio la oportunidad de incrementar la
venta de automóviles implementando el sistema en ellos. En la siguiente figura
se ilustra este formato.
84
Este tipo de formato fue popular en los automóviles pero no pasó de ahí,
además, pocos años después, llegó el cartucho de 8 pistas y el casete
compacto que lo desplazaron definitivamente de esta aplicación.
Originalmente, el cartucho tenía 4 pistas monofónicas o dos pistas con sonido

estéreo, pero luego se pudo doblar su tiempo de reproducción reduciendo el
ancho de las pistas a la mitad. Este mecanismo produjo, entonces, 4 pistas con
sonido estéreo. Sin embargo, esto hizo que se perdiera calidad en el sonido. El
cartucho de 4 pistas fue el precursor del medianamente exitoso cartucho de 8
pistas.
Figura 21. Cartucho de 4 pistas.

Fuente: Audio formats. Vintage audio history: stereo 4 track cartridge. [en linea].
Waldoboro: video interchange, 2005.
35%20(Early%201960s%20)>
85
2.3.9. Cartucho de 8 pistas. El ahora obsoleto cartucho de 8 pistas que se

observa en la siguiente imagen complementaria, tuvo su era durante los años
60s y 70s.
Después de que su creador, Bill Lear, diera un paseo a bordo de uno de los
automóviles de Earl “Madman” Muntz, equipado con equipos de cartuchos de 4
pistas, propuso a Ampex, Ford, Motorola y RCA Records, que, junto con su
compañía Lear Jet, desarrollaran un sistema de audio para autos de lujo. Así
nació el cartucho de 8 pistas o Estéreo-8.
El formato fue desarrollado en 1958 y estaba conformado por un carrete en el

que se enrollaba la cinta, la cual tenía sus dos extremos adheridos a un trozo
de lámina conductiva metálica de manera que se formara un loop continuo.
Cuando la cinta metálica pasaba a través de un par de contactos cercanos a la
cabeza de lectura del equipo reproductor se enviaba una señal que indicaba
terminación de la pista y la cabeza lectora se desplazaba a la siguiente pista
permitiendo una reproducción continua sin necesidad de rebobinar. Fue el
primer formato en utilizar la automatización para obtener una reproducción
continua.
El formato usaba cinta de ¼” dividida en 8 pistas que se grababan a 3.75

pulgadas por segundo, lo que permitía una calidad de sonido aceptable para
los estándares de la época.
Además de ser un logro en la industria automotriz, gracias a Ford, el cartucho

de 8 pistas fue el primer formato en cinta magnética en convertirse en un
verdadero éxito para la industria de la distribución comercial de música
pregrabada. A continuación se ilustra un cartucho de 8 pistas.
86
Así mismo, éste y el cartucho de 4 pistas, fueron los primeros formatos en ser
considerados como portátiles, pero en realidad estaban lejos de serlo.
Figura 22. Cartucho de 8 pistas.

Fuente: Audio formats. Vintage audio history: 8 track cartridge. [en linea]. Waldoboro:
video interchange, 2005.
35%20(Early%201960s%20)>
2.3.10. Casete de audio compacto. Este medio de almacenamiento

analógico de audio fue presentado por Philips en 1963. Consiste en una tira de
cinta BASF, enrollada dentro de una cubierta protectora de plástico que tiene
dos lados llamados A y B. A continuación se ilustra un casete de audio
compacto.
Paradójicamente, el formato analógico de cinta magnética más popular de la

historia nunca fue pensado para comercializarse en masa, pues éste estaba
pensado para la nueva línea de grabadoras de marca Philips, pero su tamaño
compacto, su fiabilidad, el bajo costo de manufactura, y la capacidad de grabar
audio estéreo, le otorgaron gran aceptación en el mercado.
87
Figura 23. Audio casete compacto.

[en linea]. s.p.i. <http://en.wikipedia.org/wiki/Compact_cassette>
Para 1965 comenzó su producción en masa, aunque su popularidad la alcanzó

en los comienzos de los años 70s, pues se convirtió en el formato en cinta
magnética de mayor consumo.
El formato consta de una cinta de 1/8” con 4 pistas corriendo a 1 7/8 pulgadas
por segundo por cada lado, posee 2 pistas estéreo, una para reproducirse o
grabarse con el casete puesto por el lado A y la otra, por el lado B.
Inicialmente se lograron 30 ó 45 minutos de música estéreo por cada lado.
Estas características eran suficientes para uso doméstico, pero no para uso
profesional, y por ello las cintas de carrete abierto siguieron siendo las
preferidas para aplicaciones que requerían mayor calidad.
La capacidad de este formato se distinguía por la longitud de la cinta medida

en minutos. Los más populares fueron los C60 (30 minutos por cada lado), los
C90 (45 minutos por cada lado) y los C120 (60 minutos por cada lado), esta
última, tenía un inconveniente por ser muy delgada y, por ende, arriesgaba su
destrucción durante su reproducción. Otras capacidades menos comunes
fueron las de los C46, C50, C74, C80, C100 y C110. Casetes de 180 minutos
88
(C180) e incluso de 240 minutos (C240) llegaron a fabricarse, pero la calidad

de su cinta era tal que no fueron adecuados para uso general.
Al principio, la cinta se fabricó en ferrita (Fe2O3), pero luego se usaron otros

materiales como el dióxido de cromo (CrO2) y el metal, para obtener mejor
calidad en el sonido. Además del material, se utilizaron sistemas de reducción
de ruido que se implementaban tanto en las grabadoras como en las máquinas
reproductoras. Uno de los sistemas más conocido fue el universal Dolby B. Los
sistemas de reproducción y grabación de este formato son muy diversos y aún
se fabrican y comercializan.
2.3.11. Playtape. En 1966 el cartucho de 8 pistas era el formato

dominante; sin embargo, no era un formato pequeño que entrara
completamente en la categoría de portátil. Entonces apareció el Playtape,
nombre que llevaba tanto el reproductor como el formato y ambos tenían la
virtud de ser, realmente, portátiles, pues se llegó a considerar como el
reemplazo del radio de transistores, pero solamente llego a ser una alternativa
de este.
Frank Stanton, innovador y creador del Playtape, concibió la idea durante los
años 40, mientras prestaba servicio en la Marina de Estados Unidos, en plena
guerra mundial, pero fue en 1966, cuando Sears y MGM records, después de
perfeccionar el primer modelo funcional, adquirido años antes de Stanton,
presentó al mundo el Playtape y fue un éxito casi instantáneo. En la siguiente
figura se ilustra un Playtape.
89
Figura 24. Imagen de un cartucho Playtape en su empaque original.

Fuente: M. HINTZE. Audio formats. The playtape. [en linea]. s.l.: M. HINTZE, 2005.
<http://mhintze.tripod.com/audio/playtape/pt-beatles_1.jpg>
Los pequeños cartuchos medían 2 ¾” x 3 3/8” x ½” y alojaban un cinta

magnética de 1/8”, que contenía 2 pistas estéreo y tenían duraciones que iban
desde 8 hasta 24 minutos.
A pesar de estas características, inferiores a las de un cartucho de 8 pistas, el

playtape fue un éxito, pues su tamaño, más pequeño que el estéreo-8, lo
convirtió en el formato que permitió llevar la música a cualquier parte.
En septiembre de 1967 los cartuchos se clasificaron por colores, así:
• Rojo – Equivalente a un disco de 45 RPM “Sencillo”.
• Negro – Equivalente a un disco EP de 4 canciones.
• Azul – Infantiles.
90
• Blanco – Capacidad de 8 canciones como un LP.
• Gris – Narraciones y educativos.
Para principios de 1968 ya había en el mercado 3000 títulos en playtape.
2.3.12. Microcasete. Es un formato que posee las mismas características

de un casete compacto, con la diferencia de ser más pequeño y poseer una
velocidad de grabación más lenta, lo que implica que debe ser grabado
exclusivamente en grabadoras de microcasetes. Tiene diferentes capacidades
de almacenamiento, su cinta es de la misma dimensión y cuenta con la misma
cantidad de pistas, pero su gran diferencia radica en su velocidad de
grabación, es más lenta que la del casete compacto y esto hace posible que se
reduzca su tamaño, sin perder la capacidad de almacenamiento. Esta
característica hace que el microcasete sea de uso casi exclusivo para grabación
de voz en máquinas contestadoras y grabadoras para dictar textos o grabar
entrevistas. Rara vez se usa para grabar música. En la siguiente figura se
ilustra un microcasete.
Figura 25. Microcasete.

Fuente: Audio formats. Microcassette. [en linea]. s.l.: Wikipedia, s.f.
<http://en.wikipedia.org/wiki/Microcassette>
91
2.3.13. Elcaset. Fue un formato de corta vida, creado por Sony en 1976.
Para entonces el sentimiento general era que el casete compacto nunca iba a
alcanzar los niveles de calidad de los sistemas de carrete abierto, así que la
intención del elcaset fue la de competir, con calidad, pero con la conveniencia
y comodidad de un casete compacto. El casete como tal era muy similar al
casete compacto, pero más grande. El nombre elcaset tiene su origen en L-
cassette o Large cassette.
Sus dimensiones eran de 6” x 4 1/8” x ¾”. Albergaba una cinta de ¼” con

cuatro pistas corriendo a 3.75 pulgadas por segundo, lo cual era mucho mejor
que los 1 7/8 de pulgadas por segundo del casete compacto. Sin embargo, el
formato fue un fracaso comercial puesto que los reproductores eran costosos y
para la mayoría de la gente la calidad del casete compacto era adecuada y los
beneficios de elcaset resultaban muy limitados. No obstante, el sistema era
técnicamente excelente y para 1976 dicha tecnología era considerada como
adelantada para la época. En la siguiente figura se ilustra una comparación del
tamaño del cartucho RCA, casete compacto y elcaset.
92
Figura 26. Imagen comparativa de diversos cartuchos. De arriba hacia abajo: casete
compacto, elcaset, RCA sound tape cartridge.
Fuente: Audio formats. RCA cartridge tapes. [en linea]. s.l.: Human Software
Corporation and Past reMasters, 2005.
<http://www.connell-labs.com/tape/RCACartridgeTapes.html>
93
3. DEGRADACIONES Y TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE

LOS MEDIOS DE ALMACENAMIENTO ANALOGICOS
3.1. DEGRADACIONES DE LOS SOPORTES MAGNÉTICOS
Las cintas magnéticas de audio se componen de una base de poliéster y una

serie de capas superpuestas de distinta composición química y de diversa
flexibilidad y resistencia a la tracción como se muestra en la figura a
continuación. Estos elementos son los siguientes:
• Base de poliéster (polietilterephtalato, Mylar®)
• Adhesivo aglomerante (poliuretano)
• Partículas de óxidos metálicos (dióxido de cromo, dióxido de hierro etc.),

que están integradas en el adhesivo. Adicionalmente, en las cintas de
alta calidad, se incorpora una sustancia antifúngica para prevenir la
proliferación de hongos.
• Capa inferior de carbono, que protege la cinta de rayones, minimiza las

cargas de electricidad estática y disminuye los rozamientos mecánicos.
94
Figura 27. Corte transversal de una cinta magnética donde se observan las diferentes
capas que la conforman.
Fuente: VAN BOGART, John. Magnetic tape storage and handling. What can go wrong
with magnetic media?. [en linea]. s.l.: National Media Laboratory, 1995.
<http://www.clir.org/pubs/reports/pub54/2what_wrong.html>
* Editada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás
Cuando las cintas se exponen a condiciones de humedad y temperatura

inadecuadas, las distintas capas que las componen sufren procesos de
contracción y expansión, como podemos advertir en la siguiente gráfica. Estas
variaciones producen daños en la superficie magnética, incluso, irreparables:
pueden romper el aglomerante y hacer que las partículas metálicas se
desprendan de su base plástica. Se trata de un fenómeno descrito en la
literatura especializada como flaking off.
95
Figura 28. Cintas magnéticas deformadas por exposición al calor.

Fuentes: FONTAINE, Jean Marc (izq). Audio formats. Typology and history: mechanical
integrity [en linea]. s.l.: FONTAINE, Jean Marc, 2005.
<http://webworld.unesco.org/safeguarding/en/loupe/vmagn_h36.htm>
HESS, Richard L. (der).Audio formats. Vignettes Media Audio Tape Restoration &
Mastering: resources. [en linea]. s.l.: HESS, Richard L, 2004.
<http://www.richardhess.com/tape>
El principal problema relacionado con la conservación de las cintas magnéticas

radica en la estabilidad del aglomerante, es decir, el componente que mantiene
unidas las partículas magnéticas al soporte plástico. Las condiciones
ambientales inadecuadas (principalmente la temperatura y la humedad)
degradan el adhesivo a través de la hidrolización del poliuretano, su
componente principal, volviéndolo pegajoso y haciendo imposible su lectura
hasta destruir la cinta, como se ilustra en la figura 29. A este efecto, de
naturaleza química, se le conoce con el nombre de sticky shed que se
evidencia en la figura 30.
96
Figura 29. Consecuencias de la pérdida de aglomerante en un reproductor de cintas de

carrete abierto.
Fuente: Austrian Academy of Sciences. Sound archives. Typology and history:
Humidity [en linea]. s.l.: Austrian Academy of Sciences, 2005.
Figura 30. Cinta magnética con pérdida de aglomerante o síndrome de sticky shed.
Fuente: FONTAINE, Jean Marc. Audio formats. Typology and history: temperature [en
linea]. s.l.: FONTAINE, Jean Marc, 2005.
97
Un almacenamiento inapropiado, bajo condiciones de humedad excesiva, crea

problemas adicionales, favoreciendo la proliferación de hongos, que también
pueden causar severos daños en el aglomerante, produciendo la destrucción
del soporte y la contaminación de otros documentos magnéticos mediante la
liberación de esporas.
3.1.1. Otros Factores que inciden en la conservación de los soportes

magnéticos
3.1.1.1. La calidad de las cintas. Respecto a la calidad de las cintas

utilizadas, éstas han de cumplir la norma ANSI X3.40-1981; un estándar que
especifica las características físicas mínimas de una cinta de calidad aceptable.
Así, los materiales magnéticos han de tener cobertura de protección en su
dorso, para reducir las cargas de electricidad estática acumulada y evitar el
desplazamiento de los residuos hacia los cabezales de lectura.
3.1.1.2. Las condiciones de almacenamiento. Las condiciones de

almacenamiento deben ser sometidas a un control estricto, con el objetivo de
evitar las diferencias extremas de temperatura y humedad, así como para
prevenir la suciedad originada por las huellas digitales, el polvo, los cabezales
sucios, resultado de un manejo poco cuidadoso.
Una alternativa para el almacenamiento de cintas en un entorno húmedo

consiste en almacenar cada unidad en bolsas de plástico selladas. Las cintas
deben almacenarse verticalmente para evitar deformaciones, además, hacer
copias de seguridad de cada unidad almacenada, comprobando su estado y
rebobinándolas cada seis meses.
98
La utilización de materiales ignífugos es otro elemento que hay que tener en

cuenta. Por ello se recomienda evitar los muebles de madera. No se aconsejan
los sistemas antiincendios mediante aspersores, pues, en caso de dispararse
accidentalmente, provocarán graves daños en el material depositado.
Paralelamente, la iluminación debe ser controlada, manteniendo las
grabaciones en un lugar oscuro, mientras no sean consultadas. Si se dispone
de iluminación, mediante tubos fluorescentes, deberán acoplarse filtros para
mantener la radiación ultravioleta por debajo de los 75µw/lm
(microwatios/lumen).
Tabla 1. Condiciones óptimas de almacenamiento de una cinta magnética.
Condiciones ambientales recomendadas de almacenamiento

Temperatura ±/24h ±/año HR ±/24h ±/año
O O O % O O
C C C C C
Para Entre 5 y 10 ±1 ±2 30 ±5 ±5
preservación
Para uso Alrededor de ±1 ±2 40 ±5 ±5
normal 20
Fuente: FONTAINE, Jean Marc. Audio formats. Typology and history: temperature [en
linea]. s.l.: FONTAINE, Jean Marc, 2005.
<http://webworld.unesco.org/safeguarding/en/txt_magn.htm>
Nicolás
3.1.1.3. El número de reproducciones. Es otro factor que hay que tener

en cuenta ya que la vida útil de una cinta depende de su frecuencia de uso,
sobre todo, si no se tienen en cuenta las recomendaciones de almacenamiento
y mantenimiento del equipo reproductor.
99
3.1.1.4. Polvo y suciedad. Contaminan la superficie de la cinta e impiden

el contacto pleno entre ésta y la cabeza de reproducción que, a la larga, puede
impedir la lectura de la cinta. Además, la acumulación de polvo y suciedad
atrapada entre espiras puede tener efectos abrasivos sobre la cinta y causar
su deformación. En la siguiente figura se observan los tamaños relativos de
las suciedades.
Figura 31. Imagen que ilustra el tamaño relativo de las suciedades al espacio entre la
cinta y la cabeza reproductora.
Fuente: VAN BOGART, John. Magnetic tape storage and handling. How Can You
Prevent Magnetic Tape from Degrading Prematurely? [en linea]. s.l.: National Media
Laboratory, 1995.
<http://www.clir.org/pubs/reports/pub54/5premature_degrade.html>
Nicolás
3.1.1.5. Campos magnéticos. La presencia de campos magnéticos muy

intensos cerca de un soporte magnético puede ocasionar la pérdida de
información, ya que las partículas magnéticas presentes en la cinta pierden su
100
patrón de alineación. Por esto es importante mantener la cinta en lugares

apartados de fuentes de campos magnéticos.
En cuanto a los dispositivos de lectura, deben observarse principalmente dos

pautas:
• Someter a los equipos reproductores a una limpieza frecuente, ya que

es habitual el desprendimiento de residuos de la propia cinta (a veces,
de aspecto pegajoso o polvoriento) que dificultan la reproducción de
datos. Además, todos los dispositivos de arrastre y lectura han de ser
ajustados periódicamente, para mantener un perfecto alineamiento de
los diversos componentes mecánicos y evitar erosiones y plegamientos
en el soporte magnético
• La tensión de enrollamiento de la cinta no debe sobrepasar el 1% de los

límites aconsejados por el fabricante, pues de otra forma, se producirán
deformaciones en los bordes de la cinta que alterarán su lectura
3.2. Degradaciones de los discos analógicos
3.2.1. Degradaciones en discos de acetato. Previo al advenimiento de la

cinta magnética, la mayoría de grabaciones se hacían en discos de acetato. La
composición química de estos discos debía guardar la proporción adecuada
entre facilidad de grabación y calidad del sonido resultante.
Desde 1930, la mayoría de discos de acetato eran construidos en una base de

aluminio cubierta con nitrocelulosa plastificada con aceite de castor. Debido a
las propiedades inherentes a la nitrocelulosa, los discos de acetato son los
medios de grabación de sonido menos estables. La caída del recubrimiento de
101
nitrocelulosa, por la pérdida del aceite de castor plastificante, es su principal

causa de degradación. La caída gradual del plastificante causa
quebrantamiento progresivo y pérdida permanente de información. Además, el
acetato de nitrocelulosa se descompone continuamente y con el tiempo puede
reaccionar con vapor de agua u oxígeno para crear ácidos que actúan como
catalizadores de otras reacciones químicas, que se ven aceleradas por altas
temperaturas y niveles altos de humedad.
3.2.2. Degradaciones en discos de ebonita. La vulcanización es un

proceso para tratar caucho crudo con sulfuro o componentes de sulfuro en
diferentes proporciones y a diferentes temperaturas. El resultado es un
aumento en la dureza y elasticidad del caucho.
La ebonita, en la oscuridad, es estable, retiene su apariencia y propiedades

muy bien, pero en presencia de luz o calor, el material pierde sulfuro y, por
ello, se vuelve quebradizo y pierde su brillo. La luz, en presencia de humedad,
induce a la creación de óxidos de sulfuro y ácido sulfúrico que degradan el
material. Además, la ebonita también presenta complicaciones durante la
fabricación de los discos, ya que durante el proceso de enfriamiento, éstos
tienden a contraerse de manera dispareja ocasionando deformaciones en su
superficie.
Además de estos inconvenientes, está el mayor problema del disco de ebonita:

su superficie áspera introduce un enorme ruido de fondo afectando
notoriamente la calidad del sonido.
102
3.2.3. Degradaciones en discos de vinilo. Hasta ahora, el vinilo ha

probado ser el material más estable que se ha usado en la fabricación de
grabaciones sonoras analógicas. Sin embargo, su vida útil no es indefinida.
Estos discos están hechos, en su mayoría, de PVC (cloruro de polivinilo) y un
pequeño porcentaje de materiales de relleno, estabilizadores, pigmentos,
sustancias antiestáticas, etc.
El cloruro de polivinilo se degrada químicamente cuando se expone a luz

ultravioleta o calor, lo cual puede ser el catalizador de una declorización que
eventualmente produce cloruro de hidrógeno (HCI) (que, a su vez, al
combinarse con agua, produce ácido clorhídrico) del PVC como resultado de
una termo-degradación.
Además de todas las degradaciones químicas que pueden sufrir los diferentes
materiales utilizados en los discos, están el polvo, la suciedad y los hongos
que los afectan igualmente y a sus equipos reproductores. Un disco con
exceso de polvo y suciedad como el que se observa en la figura 32, puede
ocasionar que la música no se escuche con fluidez sino con leves
interrupciones que se oyen como ausencia de sonido, pops y otros ruidos.
Además, durante su barrido, la aguja puede recoger estos agentes externos y
ocasionar rayones en otros discos en el momento de ser reproducidos. Los
hongos ilustrados en la figura 33 producen descomposición del material y
pueden infectar otros discos cercanos.
103
Figura 32. Imagen aumentada de un disco con polvo y suciedad.

Fuente: GODSILL, Simon and RAYNER, Peter. Digital audio restoration. Paris: CAPPÉ,
Olivier, 1997. 71p.
Figura 33. Disco de vinilo con crecimiento de hongos en su superficie.

Fuente: MICROGRAPHIA. The microscopy of vinyl records: biological agents of vinyl
degradation [en linea]. s.p.i.
<http://www.micrographia.com/projec/projapps/viny/viny0200.htm>
104
3.3. TRATAMIENTO FÍSICO “RECONSTRUCTIVO” DE LOS MEDIOS DE

ALMACENAMIENTO ANALOGICOS
Después de haber analizado los distintos formatos de audio analógicos y las

descripciones en cuanto a sus formas de degradación, es preciso abordar la
etapa más crítica del proceso de restauración de audio. Pero antes de ellos, se
hace necesario tener presente que el audio no es únicamente lo que se
restaura, pues también se restaura su soporte físico. Es esto, precisamente, lo
que la hace crítica, pues un error, por mínimo que parezca, puede acarrear la
destrucción del el medio para “reconstruir”.
Se utiliza el término reconstruir entre comillas, pues los procesos que se llevan
a cabo en esta etapa son realizados en medios que pueden estar muy
deteriorados pero en condiciones físicas estables y enteros; ya que a niveles de
degradación muy severos, como medios con partes faltantes, quemados, o
cintas de acetato con síndrome de vinegar o en condiciones en las que el
medio ya no es reproducibles en ningún equipo, haciendo que los procesos
descritos en esta etapa ya no sean aplicables.
El proceso se aplica generalmente para cintas magnéticas discos, ya que son

los medios más comunes que se presentan para restaurar. No se incluyen los
cilindros de Edison ni las grabaciones en alambre, ya que conseguirlos en
condiciones de ser reproducibles es difícil y no de menor dificultad es encontrar
sus reproductores en buenas condiciones.
Los procesos aquí descritos, aunque pueden ser ejecutados con el único fin de
restaurar el medio físico analógico (cinta o disco) para prolongar su vida útil,
deberían ser concebidos como la antesala de un tratamiento digital, pues lo
105
ideal es reconstruir para digitalizar la información y de esta manera garantizar

una vida prolongada a los recuerdos sonoros que en cintas magnéticas o
discos, (a pesar de los tratamientos) tarde o temprano terminarían por
deteriorarse definitivamente.
3.3.1. Tratamiento físico de las cintas magnéticas Tal vez las cintas
magnéticas fueron el medio de almacenamiento de audio analógico más común
debido a su versatilidad, además, se podían grabar una y otra vez con facilidad
y eran portátiles. Sin embargo, paradójicamente, esta ventaja puede ser su
peor enemigo ya que si no se conservan y manipulan adecuadamente se
convierten en el medio más propenso a degradarse. De todas formas, la mejor
manera de conservar las cintas magnéticas es llevando su contenido a un
medio de almacenamiento digital y, preferiblemente, óptico, puesto que las
cintas magnéticas digitales actuales, aunque sus componentes y procesos de
manufactura han mejorado, pueden sufrir de todos los problemas inherentes a
este medio.
Los procesos que se describen a continuación aplican únicamente para cintas

en carrete abierto ya que para cartuchos cerrados estos procesos son muy
laboriosos y complejos.
El primer factor para llevar a cabo este proceso de “reconstrucción” es

determinar el estado y tipo de la cinta que se va a restaurar.
106
3.3.1.1. Determinación del tipo de cinta. La cinta magnética se

encuentra principalmente en dos tipos de material: poliéster y acetato.
Aunque el acetato en las cintas magnéticas se dejó de usar hace mucho

tiempo, éste fue reemplazado por el poliéster, gracias a sus características más
estables de composición. Hoy en día se encuentran muchas cintas de acetato
que tienen la posibilidad de ser restauradas.
Para reconocer si una cinta es de acetato o de poliéster basta con un

procedimiento simple: se ponen en posición de contraluz y allí se debe
observar lo siguiente: si la cinta es traslucida, como se muestra en la figura
34, es acetato, si la cinta es opaca, como se muestra en la figura 35, es
poliéster. Este procedimiento es fácil de llevar a cabo, pero es fundamental
para reconocer sus características.
Figura 34. Cinta de acetato

Fuente: CILETTI, Eddie. If I Knew you were comino I’d have baked a tape!: goo “U”.
[en linea]. s.l.: CILETTI, Eddie. 1998.
<http://www.tangible-technology.com/tape/baking1.html> [consulta: 6 Abr. 2005]
107
Figura 35. Cinta de poliéster.

3.3.1.2. Determinación del estado de la cinta. Verificar el estado de una

cinta magnética determina la magnitud de la restauración para ejecutar.
A continuación se mencionan los pasos a seguir para determinar el estado de

una cinta magnética.
• Revisar el contenedor de la cinta para determinar su integridad

estructural.
El deterioro del soporte físico es un síntoma fehaciente de un manejo

inadecuado, y como éste es el protector de la cinta con el contacto
externo directo, es importante verificar su estado ya que de encontrarse
muy deteriorado, es posible pensar que su cinta también se encuentre
en malas condiciones. Si el contenedor se encuentra en mal estado, pero
la cinta está bien, se debe llevar a un soporte en buen estado.
• Explorar el interior del contenedor y los bordes de la cinta, para

observar que no presenten coloraciones y sustancias extrañas que
108
indican la presencia de hongos, factor común en cintas expuestas a alta

humedad. De presentarse esta situación, se debe aislar la cinta para
evitar la propagación de estos hongos en otras cintas. Posteriormente,
se debe terminar la inspección y proceder a su limpieza, ya que los
hongos dañan las cintas y suelen ser peligrosos para la salud.
• Observar si en los bordes de la cinta hay presencia de polvos blancos o

residuos cristalinos y si dentro del contenedor se presentan algunas
coloraciones amarillentas que indiquen óxido. La presencia de estos
elementos indica que la cinta tiende a degradarse. En este punto no es
necesario hornearla, pero se debe considerar la posibilidad de llevar su
información a otro medio que esté en buenas condiciones.
• Observar los bordes de la cinta y el interior del contenedor con el fin de

detectar partículas sólidas y signos de óxido, que puedan manifestar
contaminación líquida. Las partículas sólidas en la cinta pueden bloquear
la señal de reproducción y ocasionar rayones tanto en la cinta como en
la cabeza de lectura. Aspirar delicadamente la cinta y el contenedor
puede solucionar temporalmente este problema. La contaminación
líquida acelera la degradación de la cinta.
• Reproducir la cinta y observar si hay residuos blancos o en la cabeza de

reproducción. Si se confirma, entonces se infiere que existe pérdida de
lubricante.
• Oler la cinta. En cintas de poliéster, cuando se hidroliza el poliuretano

del aglomerante se crean esteres que producen olores astringentes, así
se determina que la cinta sufre del síndrome de Sticky Shed. En este
estado la cinta se encuentra en proceso de autodestrucción, lo que
indica que requiere atención inmediata. El tratamiento correctivo en este
punto consiste en hornear la cinta. Se debe estar seguro de que el
problema de la cinta es el síndrome de Sticky Shed y no de lubricante,
109
pues hornear una cinta con defecto de lubricante empeora este

problema. Cuando la base se comienza a degradar, en cintas de acetato,
se produce un olor a vinagre, signo de que la cinta sufre del síndrome de
Vinegar. Lamentablemente, en este punto, las cintas de acetato no
tienen reparación.
De acuerdo con el estado de la cinta se utilizan las herramientas y

tratamientos correspondientes para cada caso en particular.
Como es claro que el tratamiento de horneado es el más delicado de todos, a

continuación se describe el proceso en forma detallada y se mencionan algunos
aspectos para tener en cuenta para su correcta ejecución.
Más adelante se detalla el tratamiento para problemas menores.
3.3.1.3. Proceso de horneado de una cinta magnética. Hornear una

cinta estabiliza el poliuretano del aglomerante, detiene su hidrolización y
elimina la sustancia pegajosa que se produce y que es la causante de los
problemas de la degradación.
Consideraciones que se deben tener en cuenta previamente al horneado:
• Antes de someter la cinta a este proceso, se recomienda, si es posible,

sacarle una copia, ya que un descuido puede ser catastrófico y es
preferible tener la grabación con un sonido deficiente que perderla
completamente.
• El proceso de hornear una cinta magnética corrige temporalmente el

problema del síndrome de Sticky Shed, mas no es un tratamiento
110
definitivo ni absoluto. De este proceso se obtiene una cinta que puede

funcionar perfectamente por unas semanas, tiempo suficiente para
llevar su información a un medio más estable, preferiblemente en
formato digital.
• No se deben utilizar hornos de gas ya que éste produce vapor de agua

cuando se quema.
• Utilizar un horno que tenga excelente control de temperatura y con un

termómetro de buena exactitud para asegurarse de que la temperatura
de horneado es la adecuada.
• No utilizar hornos de microondas. El calor generado por las microondas

es excesivo y este es un proceso que, en términos culinarios, debe ser
“a fuego lento”. Además, el campo electromagnético generado por el
horno, puede ocasionar pérdida de información de la cinta.
• El proceso de horneado afecta el lubricante de la cinta, por lo tanto, no

se recomienda hornear una cinta más de dos o tres veces.
• No deben presentarse salientes de cinta por los lados, como se ilustra en

la figura 36. Estas finas salientes de cinta, al calentarse individualmente,
pueden deformar la cinta.
111
Figura 36. Cinta mal rebobinada. Se pueden ver las salientes de cinta que al calentarse
pueden traer otros problemas.
• No se deben hornear cintas de acetato. El síndrome de Vinegar no tiene

corrección. Además, con el calor, el acetato se vuelve quebradizo y
pierde tensión.
Teniendo en cuenta las sugerencias anteriores, se comienza a hornear la cinta

precalentando el horno a temperatura de horneado, por 30 minutos, antes de
introducirla. La temperatura de horneado puede estar entre 50 y 60º C. para
cintas de cualquier dimensión y sus tiempos de horneado varían de acuerdo
con la siguiente tabla.
112
Tabla 2. Tiempos de horneado de una cinta magnética.
ANCHURA DE LA CINTA TIEMPO DE HORNEADO

¼-pulgada 1 a 4 horas
½-pulgada 2 a 5 horas
1-pulgada 3 a 6 horas
2-pulgadas 4 a 8 horas
[en linea]. s.l.: CILETTI, Eddie, 1998.
Se debe dar vuelta a la cinta cada 30 ó 45 minutos. Los tiempos de horneado

son muy variantes ya que dependen del fabricante, de la condición y del
número de carretes de cinta que se estén horneando a la vez. Por esta razón,
la mejor manera de verificar si la cinta está lista es tomando un tramo de cinta
de 15 cm. y pasarle periódicamente un paño suave (que no desprenda
partículas) por la superficie, hasta que los residuos sobre el paño sean
mínimos. Después de hornear la cinta, y antes de reproducirla, se recomienda
dejarla enfriar por un tiempo no menor al tiempo de horneado.
El resultado de este proceso debe ser el de una cinta en óptimas condiciones,

es decir, lista para reproducirse y digitalizarse.
Para mantener la cinta en estas condiciones, mientras se llega la hora de

digitalizar, se recomienda almacenarlas en bolsas plásticas bien selladas y con
bolsas de silica gel para contrarrestar la humedad.
113
3.3.1.4. Tratamiento de una cinta magnética con problemas menores.
Tabla 3. Problemas menores de las cintas magnéticas.
PROBLEMA PROCEDIMIENTO
Enjuagar la cinta con agua destilada
Agua y dejarla secar a temperatura
ambiente.
Limpiar con agua jabonosa y
Pantano o agua sucia enjuagar con agua destilada. Dejar
secar a temperatura ambiente
Limpiar la cinta en una solución de
HCI para remover la sal y otras
Agua salada o marina suciedades marinas. Enjuagar con
agua limpia y dejar secar a
temperatura ambiente.
Utilizar una aspiradora para extraer
toda la cantidad posible del
Polvo, hollín y partículas sólidas contaminante tanto de la cinta como
del contenedor. Limpiar el contenedor
con un paño húmedo.
Si el problema solo afectó el soporte
físico, basta con reemplazarlo.
Si además deformó la cinta no hay
Calor nada que se pueda hacer para
arreglar la deformación. Sin embargo
en estas condiciones la cinta no
pierde demasiado la calidad y puede
ser reproducida.
114
Aislar la cinta y el soporte físico de

otros medios ya que se pueden
contaminar.
Aspirar la cinta y el contenedor
delicadamente.
Utilizar un cepillo suave para limpiar
Hongos restos de contaminación.
Reproducir la cinta en un equipo
limpiador de cintas con la aplicación
previa de un fungicida.
Evitar soplar ya que dispersaría los
hongos en el ambiente, que, además,
son nocivos para la salud.
Si se vio afectado el soporte físico,
Golpes llevar la cinta a uno en buenas
condiciones.
Limpiar la cinta con un paño seco y
Perdida de lubricante suave. Puede ser necesario aplicarle
un poco de lubricante.
Fuente: UNESCO. Audiovisual archives: A practical reader: magnetic tape

deterioration: recognition, recovery and prevention. [en linea]. s.l.: UNESCO, s.f.
<http://www.unesco.org/webworld/ramp/html/r9704e/r9704e00.htm#Contens>
* Traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
115
3.3.2. Tratamiento físico de las degradaciones en discos analógicos
A diferencia de las cintas magnéticas, los discos son menos propensos a las
degradaciones, siempre y cuando estén en condiciones de almacenamiento
adecuadas, ya que, usualmente, se prefiere trasladar la información del disco a
una cinta magnética para aprovechar su versatilidad, y, a su vez, contribuir a
incrementar la vida útil del disco ya que se está disminuyendo su
manipulación.
El párrafo anterior no quiere decir que la intención de este capítulo sea

sostener que todos los discos se van a encontrar en buenas condiciones,
simplemente se está concluyendo que ésta es una razón más de porqué un
disco puede llegar a durar más que una cinta magnética. Esto quiere decir, en
última instancia, que un disco nunca se encuentra en condiciones óptimas de
ser digitalizado sin un previo tratamiento, ya que requiere un sencillo proceso
de limpieza, como mínimo, para discos mantenidos en condiciones óptimas de
conservación, y hasta tratamientos en máquinas especializadas o procesos de
presión en caliente para discos deformados.
3.3.2.1. Degradaciones químicas. Para las degradaciones químicas que

sufren los discos analógicos, causadas por la descomposición o reacción de sus
componentes con otras sustancias del medio, hasta el momento no han sido
descubiertos tratamientos correctivos. Por esta razón, el tratamiento que debe
aplicarse, después de percibir la degradación, es la limpieza del disco y el
traslado de la información a otro medio, ya que en este punto el disco está
próximo a destruirse completamente.
116
3.3.2.2. Degradaciones físicas
Polvo y contaminantes sólidos. El polvo y la contaminación por partículas

sólidas constituyen la degradación más común en discos. Afortunadamente,
existen métodos muy eficientes para combatirla, basados en procesos de
limpieza en los que la variación está en el fluido utilizado para ello. El problema
de esta degradación se produce cuando ha causado rayones que originan
saltos y ocasionan pérdida de información. Físicamente no es posible
eliminarlos, pero se puede aplicar un tratamiento artesanal que consiste en
suavizar el rayón por medio de un elemento puntiagudo en los puntos por
donde pasa la aguja y así lograr que ésta pueda seguir su barrido por la
superficie del disco sin deslizarse.
El tratamiento de limpieza de un disco consta de un primer paso en el que se

eliminan las suciedades más livianas y superficiales del disco, tarea que se
puede realizar soplando el disco con aire a presión. Puede hacerse con un
aerosol de aire comprimido o cualquier otro medio que garantice un aire seco
sin humedad. No se recomienda soplar con la boca, pues el aire expulsado es
muy húmedo. Para esta tarea también se puede utilizar un cepillo suave con
cerdas de fibra de carbono.
No se debe limpiar el disco con paños o piezas de tela secas. El polvo se

mantiene adherido a la superficie del disco por atracción electrostática, y la
fricción, al pasar el paño seco sólo contribuirá a aumentar la carga
electrostática en el disco atrayendo más partículas de polvo.
Luego de la limpieza superficial, el segundo paso consiste en una limpieza un

poco más profunda mediante la aplicación de una solución de agua destilada y
117
un surfactante como el tetracloruro de carbono (Ccl4) para desengrasar. Ésta

debe hacerse humedeciendo un paño con la solución, luego se aplica en la
superficie del disco en dirección de las manecillas del reloj. Por último, se
enjuaga con agua destilada.
En discos de ebonita se recomienda ejecutar esta limpieza lo más rápido

posible ya que este material tiende a absorber rápidamente los fluidos.
Se utiliza agua destilada ya que presenta las siguientes ventajas:
• Su composición química es conocida con precisión
• No deja residuos
• Es segura y no tóxica
• Es económica
• Es fácil de conseguir
• Dispersa cargas estáticas
Además del agua destilada, en el mercado se pueden adquirir otros líquidos

para limpiar discos con muy buenos resultados. Para estos casos, se
recomienda seguir las instrucciones de limpieza del fabricante.
Este es el método de limpieza más sencillo y más barato que se puede aplicar.
Sin embargo, si se quieren resultados óptimos, se puede recurrir a máquinas
especializadas en limpieza de discos en la que sólo es cuestión de aplicar el
118
fluido limpiador y ésta se encarga del resto. Los resultados de esta limpieza
son óptimos. En la figura 37 se ilustra una máquina especializada en limpieza
de discos.
Figura 37. Maquina limpiadora de discos.

Fuente: NITTY GRITTY. Cleaning systems. [en linea]. s.p.i.
<http://www.nittygrittyinc.com>
Algunos fabricantes de estos aparatos son:
• Nitty Gritty www.nittygrittyinc.com
• VPI Industries www.vpiindustries.com
• Spin-Clean www.garage-a-records.com/spin.html
• Keith Monks www.keithmonks-rcm.co.uk
Para mayor información consultar sus páginas Web.

119
Deformaciones. La consecuencia del calor excesivo en un disco es la

deformación. Esta degradación es muy delicada de tratar, pues requiere de un
proceso en que el disco puede quebrarse fácilmente.
El tratamiento sólo es aplicable a discos de vinilo y consiste en presionar el

disco entre dos láminas de vidrio y calentar, utilizando un secador de aire
caliente hasta que el disco esté lo más plano posible. Al terminar este proceso
se debe dejar enfriar el disco antes de reproducirlo.
La delicadeza del procedimiento consiste en que la presión debe ir

aumentándose lenta y cuidadosamente cada cierto tiempo ya que si se aplica
más presión de la requerida en algún momento puede quebrarse el disco.
Este proceso, aunque deja el disco en condiciones aptas para ser reproducido,
no mejora su calidad sonora.
120
4. CAPTURA DE SEÑALES DE AUDIO ANALOGICO
Para comenzar un proceso de restauración y grabación digital de audio es

necesario preparar una serie de dispositivos que cooperen en la captura de la
señal. Buscando con ello almacenarla en el disco duro de un computador,
donde la señal puede ser sometida a procesos de restauración digital.
De acuerdo con la edad de los registros de audio o fonogramas y los equipos

de reproducción, se puede concluir, entonces, que son muy diferentes la
sucesión de operaciones y el conjunto de dispositivos que es preciso poner en
juego para la captura de señales de audio analógico.
La captura de audio analógico se puede dividir en dos tipos generales,

dependiendo de las posibilidades de los equipos reproductores. Cuando el
equipo reproductor posee salidas eléctricas de audio analógico la captura es del
tipo limpio; cuando el equipo reproductor no posee salidas eléctricas de
audio analógico la captura es del tipo sucio. Así, por ejemplo, para registros
soportados en cilindros de cera, se necesita capturar el sonido con ayuda de
micrófonos. Esta etapa requiere una planificación cuidadosa (posiblemente
varios micrófonos dispuestos en posiciones estratégicas) donde se filtran
aquellas señales sonoras, ajenas a la normal reproducción del registro.
En el caso de soportes más modernos, como LP y casetes, se puede prescindir

de la captura mediante micrófono. En la figura 38 se observan los tipos de
captura de señales analógicas de audio.
121
Registro de Equipo Amplificador Conversor

Micrófono Señal digital
audio reproductor A/D
Sistema de captura tipo sucio
Registro de Equipo Conversor

Amplificador Señal digital
audio reproductor A/D
Sistema de captura tipo limpio
Figura 38. Diagrama de bloques de sistema de captura de audio tipo sucio y limpio.
Para ilustrar estos tipos de captura se muestran a continuación, en las figuras

39 y 40, los sistemas con ejemplos particulares de equipos utilizados para la
captura tipo sucio y limpio, respectivamente.
Señal
Digital
Gramófono Micrófono Amplificador Convensor A/D
Figura 39. Sistema de captura de audio tipo sucio.

Fuente: Phonophan. Antique Phonographs for Sale [en línea]. s.l.: Phonophan, 2005.
<http://www.phonophan.com/sales.html> [consulta: 27 May. 2005]
Fuente: Audio products. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
<http://www.m-audio.com/index.php?do=products.family>
122
Señal
Digital
Carrete abierto Amplificador Convensor A/D
Figura 40. Sistema captura de audio tipo limpio.

Fuente: Audio recorder. Reel-to-reel recorder. [en linea]. s.l.: Wikipedia, s.f.
<http://en.wikipedia.org/wiki/Image:Reel-to-reel_recorder_tc-630.jpg>
4.1. FUNDAMENTOS DEL SONIDO DIGITAL
Es muy pertinente argumentar que cuando se habla de fundamentos, se alude

a aquellos soportes teóricos en los que está cimentada una hipótesis de
cualquier orden. En este caso, se trata del sonido digital y sus bases
conceptuales. Las ondas de presión sonora son analógicas, es decir, son
señales continuas en el tiempo que tienen la capacidad de fluctuar en la
amplitud, gradualmente. En el audio analógico existe una relación directa y
casi lineal entre cambios en la presión del aire y los del flujo de corriente en un
circuito. En otras palabras, lo que se quiere expresar es que las señales
eléctricas que fluyen por los circuitos de los equipos de grabación y
reproducción de audio, son análogas a las ondas de presión sonora que han
transducido.
123
Las ondas de presión sonora pueden ser digitalizadas, es decir, pueden

convertirse en patrones de números que constituyen una codificación de las
mismas.
4.1.1. Audio Analógico. Entendido el fenómeno físico del sonido, y el de las

ondas de presión sonora, el audio analógico hace referencia a los procesos de
grabación y registros analógicos de particular interés. En el caso de una
grabación o un registro analógico, los cambios en la presión del aire originados
por una onda sonora, hacen vibrar la membrana del dispositivo transductor
(micrófono) que convierte la energía acústica en energía eléctrica. Los
movimientos de la membrana producen pequeñas diferencias de voltaje, las
que, a su vez, son trasladadas a una cinta o disco, donde quedan grabadas
como una réplica casi exacta de la señal sonora. Dichas diferencias de voltaje
son proporcionales con el movimiento de la membrana del micrófono y, a
mayor vibración, mayor diferencia de señal eléctrica será trasladada al formato
de almacenamiento, creando una copia que es análoga a las ondas de presión
sonora que llegaron al micrófono. Posteriormente, el cabezal de reproducción
del grabador o de la máquina reproductora se encargará de convertir esas
variaciones en señales que, amplificadas a través de circuitos y parlantes,
llegarán al oído humano.
4.1.2. Audio Digital. El audio digital está conformado por ficheros

informáticos (archivos) que se encuentran almacenados en un computador o
en algún medio de almacenamiento de audio digital, como el CD, para su
posterior reproducción o tratamiento digital. Estos ficheros se obtienen por la
grabación (digitalización) del sonido real (ondas de presión sonara), ya sea
procedente de la voz, instrumentos musicales acústicos o electrónicos,
grabaciones analógicas, entre otras. Este proceso de digitalización, también
denominado muestreo y retención (sample and hold), se realiza gracias a los
denominados Conversores Análogo-Digital (ADC). Éstos son unos dispositivos
124
que, de acuerdo con sus parámetros, toman muestras del sonido y lo

convierten en números para almacenar en el computador.
Además del ADC, existe un dispositivo dual llamado Conversor Digital-

Análogo (DAC), que brinda la posibilidad de escuchar el sonido digitalizado en
el computador o en cualquier otro reproductor de audio digital, convirtiendo los
números almacenados en el computador o cualquier medio digital en señales
eléctricas para luego filtrarlas y obtener una señal sonora válida.
Posteriormente se ahondará más profundamente sobre este dispositivo y de
los procesos para transformar una señal digital de audio en una señal sonora.
Una de las ventajas del audio digital sobre el analógico, es la posibilidad de

almacenamiento de la información en forma perdurable, es decir, sin sufrir los
padecimientos a los que normalmente están expuestos los medios de
almacenamiento analógicos.
En un tratamiento de audio, y en particular la restauración, la información

digital puede ser manipulada con facilidad. Lo contrario ocurre en lo que tiene
que ver con la información analógica en un disco o cinta, pues dicha
información se almacena en surcos y alineamientos de partículas magnéticas,
respectivamente, lo que hace poco efectivo tal proceso.
Otra ventaja es que permite realizar un tratamiento DSP (Procesamiento

Digital de Señales) sobre la señal para introducir modificaciones como efectos
y mejoras, cambios y transformaciones imposibles o muy difíciles de lograr
analógicamente. Un ejemplo de esto es permitir la restauración, por medios
digitales, de una señal de audio degradada, o efectuar la compresión o
implementación de efectos de retardos y reverberaciones, entre otros.
125
4.1.2.1. Historia del audio digital.
En este apartado es de suma trascendencia volver sobre las condiciones

históricas en las que se presentaron las primeras alusiones al audio
digital.
Los primeros experimentos en audio digital datan de finales de los

cincuenta, cuando Max Mathews, ingeniero y compositor estadounidense,
obtuvo en los laboratorios Bell los primeros sonidos generados por
computador. En esta época el bajo nivel de potencia de las computadoras
no permitía una velocidad suficiente para digitalizar el sonido. Los
experimentos intentaban obtener sonidos sintéticos, generando los
números en el computador.
Tras muchos experimentos, que ayudaron a comprender mejor la

naturaleza del sonido digital, el primer grabador comercial, el Sony PCM-
1, se hizo realidad en 1977. El conversor era de 13 bits y utilizaba como
soporte cintas de Video Beta. Pero al año siguiente, el modelo PCM-1600
ya utilizaba conversión de 16 bits. En 1982 apareció el CD, desarrollado
conjuntamente por Sony y Phillips, con un éxito fulminante.
Los primeros sistemas domésticos de grabación digital llegaron durante

los últimos años de la década de los ochentas, inicialmente con la cinta
DAT (Digital Audio Tape) o cinta de audio digital y, posteriormente, con el
DCC (Digital Compact Cassette) o casete digital compacto, el MiniDisc y
varios formatos de multipistas digitales (Alesis, Tascam, etc.). Las
tarjetas de sonido para computadores, dotadas de ADC y DAC, aparecidas
126
en los últimos años, han supuesto la definitiva democratización del sonido

digital2.
4.2. CAPTURA Y DIGITALIZACIÓN DE SEÑALES DE AUDIO.
En los sistemas de audio digital, la señal analógica se discretiza en función del

tiempo, es decir, se capturan muestras de la señal original en un intervalo de
tiempo. Este proceso se denomina muestreo o sampling. Igualmente, se
discretiza la amplitud o cuantiza, asignando un código numérico para
diferentes valores de la amplitud de la señal en idénticos intervalos de tiempo.
Estos códigos se llaman niveles discretos y el proceso se denomina
cuantización.
4.2.1. Muestreo de señales de audio. Como se mencionó anteriormente,

la palabra muestreo está referida a la acción de capturar muestras en
intervalos de tiempo regulares. Para digitalizar un sonido es necesario
muestrearlo con una frecuencia particular. El teorema del muestreo, o teorema
de Nyquist, indica cuál debe ser esta frecuencia. Dicho teorema establece que
la frecuencia de muestreo debe ser mínimo dos veces la frecuencia máxima de
la señal para capturar si se quiere tener una buena réplica de la señal original.
Así, por ejemplo, para muestrear correctamente una señal de X Hz, se requiere
como mínimo una frecuencia de muestreo de 2X Hz. De acuerdo con lo
esbozado teóricamente en el capítulo 1, en los campos de investigación del
sonido, la acústica física indica que el oído humano es capaz de percibir
2
JORDÀ PUIG, Sergi. Principios del Sonido Digital: breve historia del audio digital.
[en linea]. s.l. JORDÀ PUIG, Sergi, 2003.
<http://www.ccapitalia.net/reso/articulos/audiodigital/pdf/02-SonidoDigital.pdf>
127
frecuencias sonoras de 20 Hz hasta aproximadamente 20.000 Hz. Lo que

implica, entonces, que para muestrear correctamente cualquier sonido la
frecuencia de muestreo deberá ser superior o igual a 40.000 Hz. De aquí
proceden los famosos 44.100 Hz. utilizados en los CDs de audio. En la figura
41 se observa el muestreo para una señal senoidal.
Nivel 1
1
0.8 Señal analógica
0.6
Nivel 2
0.4
Amplitud
0.2 Señal digital

Nivel 3
0
-0.2
-0.4 Nivel 4
-0.6
-0.8
Nivel 5
-1
0 0.2 0.4 0.6 0.8 1
Tiempo (seg)
Figura 41. Muestreo de una señal senoidal.
4.2.1.1. Muestreo con frecuencias inferiores o aliasing. Si en el caso de

la acústica física se muestrea a una frecuencia inferior, como por ejemplo a
20.000 Hz, los resultados obtenidos serán correctos para las frecuencias por
debajo de los 10.000 Hz, (la mitad de la frecuencia de muestreo). Para
aplicaciones que no requieran de la máxima fidelidad, estas cifras son
suficientes. Sin embargo, el sonido será un poco menos fiel, pero, aún así, se
128
parecerá al original ya que normalmente la zona frecuencial con mayor energía

o sensibilidad al oído humano se encuentra aproximadamente entre los 1.000
y los 3.000 Hz.
Al seleccionar la frecuencia de muestreo por debajo del doble de la frecuencia

de la señal sonora que se va a capturar, o sea, por debajo de 40.000 Hz, se
genera un problema adicional: el surgimiento de señales de frecuencias
fantasmas que realmente no pertenecen al sonido original y que alteran el
sonido muestreado. Este fenómeno recibe el nombre de aliasing, o espectro
plegadizo.
El efecto de aliasing genera, generalmente, dos señales fantasmas, que se

caracterizan por ser:
• Una, de frecuencia fi (f inferior) igual a la frecuencia de muestreo fm

menos la frecuencia de la señal muestreada fa. Como se muestra en la
ecuación 4.1.
fi = fm – fa (4.1)
• Otra, de frecuencia fs (f superior) igual a la frecuencia de muestreo fm

más la frecuencia de la señal muestreada fa. Como se muestra en la
ecuación 4.2.
fs = fm – fa (4.2)
Para evitar estas señales fantasmas, cuando se desee muestrear a frecuencias

inferiores a 40.000 Hz, se debe filtrar previamente la señal a capturar (fa),
eliminando todos los valores por encima de la mitad de la frecuencia de
muestreo seleccionada; esto se logra haciendo pasar la señal de entrada por
129
un filtro pasabajos, que garantice que las frecuencias existentes en la señal de

entrada, no son superiores a la mitad de la frecuencia de muestreo. Por
ejemplo, si se muestrea a 20.000 Hz, se debe filtrar la señal original,
eliminando todas sus componentes, por encima de 10.000 Hz.
Un ejemplo muy claro se encuentra aplicado en la telefonía: la voz humana

produce sonidos comprendidos entre 100 y 10.000 Hz. Haciendo pruebas y
medidas se llegó a la conclusión de que al filtrar la gama de frecuencias de la
voz humana, hasta dejarla entre 300 y 3.400 Hz, se obtiene una buena
inteligibilidad (se entiende con claridad suficiente el 99% de las palabras) y se
reconoce al interlocutor; posteriormente, se muestrea a una frecuencia de
8.000 Hz, que es mayor al doble de la nueva frecuencia máxima.
En el caso de seleccionar una frecuencia de muestreo de 40.000 Hz, o

superior, no es necesario implementar el filtro pasabajos, pues fi y fs no son
percibidas por el oído humano, como se muestra a continuación:
fa: 20.000 Hz. Cota superior máxima aproximada de las frecuencias

perceptibles por el oído humano.
fm: 44.100 Hz. Frecuencia de muestreo correcta, según el teorema de Nyquist.
fs = 44.100 Hz + 20.000 Hz = 64.100 Hz (frecuencia no perceptible por el oído

humano)
fi = 44.100 Hz – 20.000 Hz = 24.100 Hz (frecuencia no perceptible por el oído

humano)
130
4.2.2. Cuantización. Discretizar la amplitud, o cuantizar, significa asignar

un código para diferentes valores de la amplitud de la señal analógica en
idénticos intervalos de tiempo. Consiste en la subdivisión de las amplitudes de
las señales en un predeterminado número de niveles discretos de amplitud.
Las señales que resultan se denominan cuantizadas. Contrario del proceso de
muestreo, este resultado produce una pérdida irreparable de información,
debido a que es imposible reconstruir la señal analógica original a partir de su
versión cuantizada, pues, al mismo tiempo que se realiza la cuantización, cada
una de las muestras es atribuida al nivel de cuantización más aproximado
logrando que ésta sólo tome valores discretos que pueden ser representados
por códigos binarios digitales, mediante su codificación. Sin embargo, en el
análisis del concepto de información no es necesario transmitir todas las
posibles amplitudes de las señales. Por causa del ruido que se introduce
durante la transmisión y en el receptor, el circuito demodulador o detector no
es capaz de distinguir entre las variaciones muy finas de la amplitud de una
señal. Además, el último receptor de la información, el oído humano, cuando
se trata de sonidos o música, presenta limitaciones en cuanto al más pequeño
nivel de señal que puede distinguir. La imposibilidad de distinguir entre las
amplitudes, hace que el proceso de cuantización sea aplicable.
4.2.3. Codificación. Consiste en la asignación de códigos a los diferentes

niveles de discretización de la señal analógica en una secuencia ordenada de
números. El procedimiento más utilizado en la actualidad se denomina
Modulación por Codificación de Pulsos (PCM) y consiste en reemplazar una
señal por una secuencia de bits que representan su forma de onda. Una de las
ventajas de esta modulación es que la señal codificada sólo tiene dos valores
posibles: 0 y 1 en conjuntos de 2 hasta 24 bits, que dependen de la longitud
del código. Para reconstruir una señal es necesario tener un mecanismo
decodificador capaz de reconocer la diferencia entre dos valores definidos, lo
cual hace que el proceso sea menos sensible a errores.
131
4.2.3.1. Digitalización. Existen diferentes métodos para convertir una señal

analógica en una secuencia de bits. En el proceso de muestreo se realiza una
modulación de pulsos, donde se utiliza un tren de pulsos, cuyas características
se hacen variar de acuerdo con la señal modulada o de entrada. En nuestro
caso, la señal de audio analógico. Entre los sistemas de modulación de pulsos
PAM (Modulación por Amplitud de Pulsos), PPM (Modulación por Posición de
Pulso), PDM o PWM (Modulación por Duración de Pulso) y PCM. Sólo PCM tiene
importancia práctica, los demás sistemas rara vez se utilizan. El proceso de
conversión analógica a PAM es el primer paso en la conversión de una señal
analógica en una señal PCM. En PAM la amplitud de un tren de pulsos de ancho
constante varía en proporción con los valores muestreados de la señal
analógica de audio, es decir, la información es denotada en la amplitud de los
pulsos (la elección de la frecuencia de muestreo es determinada por el teorema
de Nyquist). En la figura 42 se observa la modulación por amplitud de pulsos
de una señal senoidal. Cuando la altura de estos pulsos es cuantizada en
niveles, y expresada mediante un código numérico, el resultado es conocido
como PCM. En la figura 43 se ilustra el diagrama para la generación de PCM.
Existe además, un proceso conocido como DPCM (Modulación Diferencial por

Código de Pulso), en el que el parámetro que se cuantifica es la diferencia
entre los valores absolutos de la muestra anterior y la actual.
132
0.8
0.6
0.4
Amplitud
0.2
-0.2
-0.4
-0.6
-0.8
-1
0 0.2 0.4 0.6 0.8 1
Tiempo (seg)
Figura 42. PAM de una onda senoidal.
Señal PAM
Señal analógica Señal PAM cuantizada Señal PCM
Muestreo y Cuantizador Codificador
Retención
Figura 43. Generación de PCM.
La pérdida de exactitud de información es conocida como ruido de

cuantización y es disminuido aumentando el número de niveles de
cuantización.
K = log 2 N (4.1)
133
Donde:
K es la longitud del código en bits.
N es el número de niveles.
En la tabla 4 se muestra la relación entre la longitud de código y el número de

niveles de cuantización comerciales de ADC y DAC.
Tabla 4. Relación longitud de código y niveles de cuantización.
Bits (K) Niveles (N)

8 265
16 65536
20 1048576
24 16777216
Se puede concluir que a mayor número de niveles de cuantización para definir

la amplitud de una señal analógica, se requiere una longitud de código mayor y
más exacta será la señal digital resultante.
4.3. REPRODUCCIÓN DE LA SEÑAL DE AUDIO DIGITAL
La reproducción de la señal define el momento culminante de un proceso de

tratamiento digital de audio y en especial el de restauración de audio, pues es
aquí donde se escucha el resultado definitivo de varios días de trabajo y se
extraen las conclusiones pertinentes. Por esta razón se dedica esta muy corta
sección a los conversores digital–analógicos, que son los responsables de llevar
la señal de audio del mundo digital al mundo analógico.
134
Todos los dispositivos reproductores de medios digitales y amplificadores de

audio poseen este tipo de conversor, puesto que el sonido, para que sea
percibido por el ser humano, debe ser sometido a este proceso. Esta tarea
también puede hacerse mediante DAC’s externos como el que se aprecia en la
figura 44, conectados a una salida digital de los reproductores. Con ello,
según sus fabricantes, se logra obtener sonido de mejor calidad. Esta
afirmación está soportada en teorías que aún no han sido probadas y
confirmadas definitivamente.
Figura 44. DAC externo.

Fuente: Conversores de audio. Products: progression DAC model 4705. [en linea].
Jefferson: Sakura Systems, 2005.
<http://www.sakurasystems.com/products/47dac.html> [consulta: 28 May. 2005]
4.3.1. Conversor digital-analógico. Conocido abreviadamente como DAC o

D/A. Se trata de un dispositivo que convierte un código o señal digital en una
señal analógica que puede ser voltaje, corriente, entre otras. Los DACs son la
interface entre el abstracto mundo digital y el analógico mundo real.
135
Lo que hace fundamentalmente el proceso de conversión digital–analógica es

tomar las miles de muestras de la señal digital y reagruparlas para obtener
una silueta que pareciera estar delineada de forma continua, creando la ilusión
de una señal con forma de onda analógica. Para hacerse una mejor idea de
este proceso se pueden tomar las pirámides. Cada pirámide está hecha de
miles de bloques que forman a sus lados un patrón escalonado que va hasta la
parte más alta de la estructura. Pero al observar desde lejos pareciera que los
bloques se combinaran entre sí dando la impresión de formar una línea recta
continua. En otras palabras, digitalizar es guardar una señal como una serie de
bloques de diferente altura. Cuando se ven estos bloques en el mundo
analógico se tiene la ilusión de ver una línea que va desde el tope de un bloque
al tope del siguiente, recreando la forma original de la señal.
4.3.2. Tipos de conversores digital-analógico. De acuerdo con la forma

en que se aplica la información digital a la entrada de un DAC, éstos se pueden
clasificar en:
4.3.2.1. Conversores serie. Son aquellos en los que la señal o el código

digital para convertir se aplica a través de un único terminal en el que
aparecen, en secuencia, los diferentes bits que la constituyen.
4.3.2.2. Conversores paralelos. Son aquellos en los que la señal para

convertir se aplica, en paralelo, a su entrada. Éstos, a su vez, según la forma
en que realiza la conversión, pueden clasificarse en:
Conversores de conversión simultánea o directa. La señal digital se

convierte de manera directa a analógica sin realizar ningún paso intermedio.
136
Conversores de conversión secuencial o indirecta. En este tipo de

conversores, la señal digital se convierte en una secuencia de impulsos que, a
su vez, se transforma en una señal analógica. Algunos de los procedimientos
de conversión secuencial son:
• Conversión por sobremuestreo. Consiste en utilizar, durante la

etapa de conversión, frecuencias de dos o más veces la frecuencia de
muestreo de la señal digital. Esto se logra mediante un mecanismo de
interpolación que agrega 2 o más muestras por cada muestra en la señal
original. Por ejemplo, una señal a 44.100 Hz entrega 44.100 muestras
por segundo, con un mecanismo de interpolación que agregue tres
muestras más, se obtendrían 176.400 muestras para entregar al DAC y
de esta manera el requerimiento del filtro de reconstrucción análogo
sería cortar en 88.200 Hz, lo cual es un proceso más fácil de efectuar
para la mayoría de los filtros. Un proceso similar se puede aplicar
tomando otro parámetro de la señal digital: la resolución. Si se tiene
una señal de 16 bits y se hace la conversión a 18 ó 20 bits, se obtendría
una señal con un mayor rango dinámico y, por lo tanto un
funcionamiento del conversor más holgado y una conversión digital
analógica más efectiva.
• Conversión PWM. Está basado en la generación de una secuencia de

impulsos cuya frecuencia es constante y la relación entre el tiempo en
que estos se encuentran en cero y en uno es variable y depende de la
información digital para convertir. Posteriormente, la señal analógica es
llevada a un filtro pasabajos que elimina todas las frecuencias por
encima del umbral de percepción del ser humano aproximadamente
20.000 Hz.
• Conversión MASH o Multistage Noise Shaping. En este caso se

genera una señal intermedia que se forma por el valor de varios bits,
gracias a que todos estos bits tienen el mismo nivel, la amplitud de esta
137
señal será constante. Para distinguir el valor de cada bit se usa un

proceso de PDM, donde el valor de cada bit está dado por su ancho y no
por su amplitud. Como la presencia del ruido implica una diferencia de
amplitud, que en este caso no existe, la componente de ruido en la
señal obtenida será muy reducida.
• Conversión híbrida. Cuando se aplica una combinación de las técnicas

mencionadas anteriormente.
4.4. CRITERIOS PARA LA SELECCIÓN DE EQUIPOS
Estos criterios que se pondrán a consideración deben ser muy sólidos para
permitir que esa selección no se haga de manera casual. El objetivo de cada
procedimiento en el tratamiento digital para la restauración de audio, es
obtener la mejor calidad de sonido en el momento de la captura y
digitalización. La nitidez y calidad se pueden garantizar, si la atención se
centra en tres aspectos fundamentales:
• El tratamiento previo de formatos de audio analógicos
• La selección de los equipos de reproducción
• La selección de equipos de captura digital
En el tratamiento de los formatos de audio analógico, analizado en el capítulo

3, es claro que el objetivo era reducir la mayor cantidad de ruidos espurios
causados por el mal estado de los formatos aplicando técnicas de limpieza y
reparación. Logrado esto, el segundo paso será la correcta elección de los
equipos encargados de la reproducción (playback) de los formatos analógicos.
138
El tercer aspecto está determinado por la adecuada y coherente selección de

los equipos de captura y digitalización.
4.4.1. Equipos de reproducción de audio analógico. Cada formato de

audio analógico tiene su reproductor y su calidad de reproducción será
directamente proporcional con las condiciones en las que se encuentre el
equipo reproductor, además de la calidad de sus dispositivos. Estos dos
aspectos son trascendentales en el momento de pensar en la restauración de
audio, pues un equipo reproductor descalibrado, que presente desgaste en sus
piezas mecánicas y eléctricas, o con un bajo perfil de calidad, perjudicará
notablemente el proceso, aumentará el número de degradaciones y tornará
poco efectivo el proceso de restauración digital.
Actualmente, existen modernos equipos diseñados para una óptima

reproducción de audio analógico con fines de restauración, los cuales abarcan
varios tipos de equipos que, usualmente, utilizan técnicas ópticas para el
proceso de restauración. En la figura 45 se observan dos tipos de
reproductores de discos. Algunos de estos modernos equipos, al igual que los
tradicionales equipos de reproducción de audio analógico, pueden ser
consultados en el anexo A, en el que se indican sus características y
especificaciones técnicas.
139
Reproductor óptico Reproductor tradicional

de discos analógicos de discos analógicos
Figura 45. Reproductores de discos analógicos.

Fuente: ELP Laser Turntable [en línea]. s.l.: WAUGH, Max, 2005.
<http://www.elpj.com> [consulta: 1 Jun. 2005]
Fuente: Amazon. Electronics. Turntables & Accessories: Sony PSLX350H Stereo
Turntable System [en línea]. s.l.: Amazon, 2005.
<http://www.amazon.com> [consulta: 15 May. 2005]
* Editada por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI, Nicolás.
4.4.2. Conversores análogo-digital y digital–análogo. Estos equipos,

citados con antelación varias veces, son los que brindan la posibilidad de
cambiar del mundo analógico al digital y viceversa; por ello se convierten en
factores definitivos en los procesos de digitalización y restauración de las
señales de audio. Los seres humanos no generan ni reciben directamente la
información digital, pues los procesos naturales son analógicos, los ADC y DAC
son equipos electrónicos encargados de traducir el lenguaje analógico a digital
y viceversa.
Las señales de audio analógico no son las únicas señales que pueden ser
digitalizadas para realizar un tratamiento digital: las señales de video y medida
de parámetros, por métodos de instrumentación, (voltaje, fuerza, velocidad,
etc.) son aplicaciones en las que las señales analógicas son capturadas y
tratadas digitalmente. Por ejemplo, un electrocardiógrafo es un equipo
140
electrónico que captura las señales del corazón (señales analógicas) y las
digitaliza (hace conversión análoga–digital), procesa la señal digitalizada
(hace tratamiento digital) e imprime las gráficas (hace conversión digital-
análoga) del comportamiento del corazón (señal analógica). Puede observarse
que la señal analógica de entrada (señal cardiaca) no es de la misma
naturaleza que la señal analógica de salida (impresión de la señal cardiaca),
pero esta última describe perfectamente la señal de entrada.
En el caso que nos compete, el audio (como señal analógica) es digitalizado

(conversión análoga–digital), para realizar luego un proceso sobre la señal
digitalizada (restauración de audio) y reproducir, posteriormente, la señal de
audio restaurada (conversión digital-análoga). Se observa cómo la señal
analógica de entrada es de la misma naturaleza que la señal analógica de
salida (señales de audio), pero esta última con características que le ofrece un
tratamiento digital de restauración. En la figura 46 se observa, mediante un
diagrama de bloques, el proceso de restauración digital de audio.
Señal analógica Señal Señal analógica

de audio con Señal digital de audio sin
degradaciones digital tratada degradaciones
Tratamiento DAC
ADC
digital
Figura 46. Procedimiento de restauración digital para fonogramas.
En las figuras 47 y 48 se aprecia el proceso de restauración de audio en dos

etapas, captura de la señal analógica para su restauración digital y
reproducción de la señal digital restaurada.
141
Señal de audio Señal de audio

Señal analógica
digital digital modificada
de audio con
degradaciones 1010110 1 1 1010 0
0101001 0101 101
0011110 00 0 110 0
1100001 0 100 101
Medio de
ADC
almacenamiento
Computador digital
Figura 47. Proceso de captura y almacenamiento digital de audio.

Fuente: Computers. Products: store [en línea]. s.l.: MAC, 2005.
Señal de audio
Señal analógica
digital modificada
de audio sin
degradaciones
11 10100
0101 101
00 01100
0100 101
Convensor D/A Amplificador Parlantes
Figura 48. Proceso de reproducción de la señal digital restaurada.

<http://store.apple.com/1-800-MY-APPLE/WebObjects/AppleStore.woa>
Entendidos los procesos fundamentales de muestreo, cuantización y

codificación para la captura de señales de audio analógico, es necesario definir
los criterios para la correcta selección del conversor.
142
Se trata, básicamente, de cuatro aspectos:
• Resolución de los ADC/DAC
• Frecuencia de Muestreo de los ADC/DAC
• Interfaz de comunicación de los ADC/DAC
• Tipos de ADC/DAC
4.4.2.1. Resolución de los ADC/DAC. La resolución de un conversor de audio

digital es definida como el número de bits que utiliza para representar las
muestras de audio, es decir, la cantidad de bits que conforma cada palabra
digital. Retomando la ecuación 4.1 en la que se relacionan la cantidad de
niveles con la longitud de códigos en bits, inferimos que la longitud del código
es sinónimo de resolución digital. Cuanto mayor sea la resolución, más precisa
será la representación. Por ejemplo, con una resolución de 8 bits, el rango de
variación de la señal se divide en 256 niveles, mientras que con una resolución
de 16 bits lo hace en 65.536 niveles. Esta relación se advierte en la tabla 4. El
audio digital para el consumo masivo (por ejemplo como el CD) tiene una
resolución de 16 bits. En sistemas de audio profesional se utilizan conversores
de 20 bits, aun, 24 bits.
4.4.2.2. Frecuencia de muestreo de los ADC/DAC. Como se señaló

anteriormente, la frecuencia mínima de muestreo para audio, sin pérdidas de
componentes ni aparición de frecuencias fantasmas, es de 40.000 Hz. A una
mayor frecuencia de muestreo, más precisa será la representación de la señal
de audio analógica digitalizada. En audio digital, para consumo masivo (por
ejemplo como el CD) tienen una frecuencia de 44.100 Hz. En sistemas de
audio profesional se utilizan ADC/DAC de 48.000, 96.000 y aún de 192.000 Hz.
143
En la figura 49 se observan el muestreo y cuantización de una onda senoidal

con variaciones en la frecuencia de muestreo y longitud del código.
1 1
0.8 0.8
0.6 0.6
0.4 0.4
Amplitud
Amplitud
0.2 0.2
0 0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1 -1
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1
Tiempo (seg) Aa) Tiempo (seg) Ab)

1 1
0.8 0.8
0.6 0.6
0.4 0.4
Amplitud
Amplitud
0.2 0.2
0 0
-0.2 -0.2
-0.4 -0.4
-0.6 -0.6
-0.8 -0.8
-1 -1
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1
Tiempo (seg) Ac) Tiempo (seg) Ad)
Figura 49. Señal senoidal de 1 Hz muestreadas a diferentes resoluciones (k) y

frecuencias de muestreo (fm). a) K= 16 bits, fm= 50 Hz , b) K= 16 bits, fm= 1000 Hz,
c) K= 4 bits, fm= 50 Hz y d) K= 4bits, fm= 1000 Hz.
4.4.2.3. Interfaz de comunicación de los ADC/ DAC. Cada formato de

audio analógico tiene su respectivo reproductor. En su gran mayoría los
equipos reproductores poseen interfaces de audio eléctricas de tipo
salida/entrada (in/out); estas interfaces son ideadas para diferentes
propósitos, entre los que se pueden mencionar: amplificación, ecualización,
grabación y tratamiento digital. En el caso de los equipos reproductores que
144
no poseen este tipo de interfaces eléctricas, el procedimiento de captura se

realiza a través de micrófonos que convierten las ondas de presión sonora en
variaciones eléctricas. Los equipos de reproducción poseen diferentes
interfaces de conexión, algunas con perfil bajo (en equipos para el hogar) y
otros con perfil profesional (en equipos de estudio de audio). En el anexo A se
muestran los equipos de reproducción de formatos analógicos y se indican sus
características y especificaciones técnicas, así como las interfaces de
comunicación.
De acuerdo con el tipo de interfaz eléctrica del equipo reproductor, se

selecciona el ADC/DAC que posea esta misma interfaz para hacer posible la
captura. Existen dos maneras para llevar señales eléctricas de audio analógico:
• No balanceado
• Balanceado
Interfaz de audio no balanceado. La primera forma de transportar señales

eléctricas de audio es la no balanceada. La señal viaja a través de un cable de
dos conductores. Los conectores de señal no balanceada tienen dos contactos,
como el tipo RCA (Radio Corporation of America), también llamado Phono,
utilizado habitualmente por los equipos domésticos y el 1/4" no balanceado (a
menudo llamado Jack, usado en los instrumentos musicales y de audio
semiprofesional). Los conectores de más pines, utilizados para audio
balanceado, también pueden llevar señal no balanceada, eliminando algunos
de sus pines. Por ejemplo, un XLR (Cannon) de tres pines, podría transportar
señales no balanceadas, dejando un pin sin usar.
145
Las conexiones no balanceadas son simples y se usan, normalmente, para la

conexión de instrumentos musicales. Este tipo de conexiones no son
consideradas profesionales, pues son susceptibles a contaminación por
interferencia electromagnética, específicamente, cuando las distancias de cable
son largas. En la figura 50 se ilustra un conector típico RCA.
Positivo
Tierra
Figura 50. Conector RCA.
Interfaz de audio balanceado. La señal se envía dos veces, una de ellas con
la polaridad invertida. A este procedimiento se le conoce comúnmente como
balanceado de una señal.
Para transportar una señal balanceada se necesitan conectores de tres pines y

cable de tres conductores, uno de los cuales trabaja como apantallador para
las interferencias electromagnéticas. La entrada del dispositivo al que se lleva
la señal, realiza lo que se conoce como desbalanceado, que consiste en sumar
las dos señales que le llegan, después de invertir una de ellas. El balanceado
consiste en reforzar la señal original y anular las interferencias que se
generaron en el cable. El transporte balanceado de señal es el más adecuado
para aplicaciones profesionales. En la figura 51 se explica de forma gráfica el
balanceado. El dispositivo de salida genera dos copias de la misma señal, una
de la cuales está con polaridad invertida. Si existe interferencia
electromagnética se produce de igual manera para las dos señales que se
146
envían por el cable. En el dispositivo de destino la señal, inicialmente invertida,

nuevamente se invierte para ser sumada con la señal no invertida, con el
objeto de cancelar la interferencia.
S(t) S(t) + n(t) S(t) + n(t) 2S(t)
+ =
-S(t) -S(t) + n(t) S(t) - n(t)
Figura 51. Forma grafica del balanceo de señales de audio.

Fuente: Forms de transporte de señal. [en línea]. s.l.: Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas/balanceado.htm>
Habitualmente se nombran los terminales de los conectores como positivo,

negativo y tierra. En la figura 52 se ilustra un conector típico de ¼” TRS (Tip
ring-sleeve).
La asignación de los terminales en el conector XLR se realiza de acuerdo con

las normas de la AES (Audio Engineering Society), de forma que se conecta el
pin 2 al positivo, el 3 al negativo y el 1 a la tierra. En la figura 53 se ilustra un
conector conocido como XLR.
147
Positivo
Negativo
Tierra
Figura 52. Conector ¼”.

Positivo
Negativo
Tierra
Figura 53. Conector XLR (Cannon).

148
En la figura 54 se observan los tres tipos de conectores.
Aa) Ab) Ac)
Figura 54. Conectores de audio. a) RCA, b) ¼” y c) XLR macho hembra.

Fuente: Connectors and accessories. [en línea]. s.l.: Van Den Hul, 2005.
<http://www.vandenhul.com/other/c-connec.htm#BNC-RCA>
[consulta: 4 May. 2005]
Mezcla de sistemas balanceados y no balanceados. Es habitual que se

utilicen fuentes de sonido no balanceadas en conjunto con fuentes de sonido
balanceado, pero es necesario seguir unos procedimientos que minimicen la
aparición de ruidos originados en el uso de dichas aplicaciones. Existen
dispositivos en el mercado que convierten las salidas no balanceadas de alta
impedancia y -10 dBV (equipos domésticos) a salidas balanceadas de +4 dBV y
baja impedancia (equipos profesionales). También, están disponibles
dispositivos adaptadores que convierten entradas no balanceadas en
balanceadas. Estos adaptadores se deberán poner lo más cerca posible de los
dispositivos no balanceados para evitar el ruido por falta de apantallamiento.
• Conexiones balanceado a Balanceado. Es una conexión pin a pin.

En caso de zumbidos en las conexiones de salida a entrada balanceada,
basta desconectar la tierra del conector de entrada. En la figura 55 se
ilustran los tipos de cables balanceados.
149
• Conexiones No Balanceado a Balanceado. En general, para conectar

una fuente no balanceada a un dispositivo balanceado, se unen dos de
los conductores del cable (tierra y negativo). Es claro que al llevar una
señal no balanceada a un dispositivo balanceado se pierden las
propiedades y beneficios de la interfaz balanceada. En la figura 56 se
muestran los tipos de cables no balanceados.
XLR a XLR
1/4” a 1/4”
XLR a 1/4”
Figura 55. Cables balanceados a balanceados.

Fuente: Conexiones a entradas balanceadas: balanceado a balanceado. [en línea]. s.l.:
Doctor ProAudio, 2001.
<http://www.doctorproaudio.com/doctor/temas/ref_con.htm>
150
XLR a XLR
XLR a 1/4”
1/4” a XLR
1/4” a 1/4”
RCA a XLR
RCA a 1/4”
Figura 56. Cables No balanceados a balanceados.

Fuente: Conexiones a entradas balanceadas: no balanceado a balanceado.
[en línea]. s.l.: Doctor ProAudio, 2001.
<http://www.doctorproaudio.com/doctor/temas/ref_con.htm>
4.4.2.4. Tipos de ADC/DAC para audio. Generalmente, sólo son dos tipos de
conversores de audio los que se pueden encontrar en el mercado; el primero,
llamado conversor de audio estático (tarjeta interna) y el segundo, llamado
conversor de audio móvil (tarjeta externa). Dentro de estos dos tipos de
conversores encontramos de alto y bajo perfil, diseñados para diferentes
aplicaciones. En los conversores del tipo móvil se encuentra un mayor número
de modelos diseñados para el procesamiento de señales de audio y
aplicaciones profesionales. En la figura 57 se observan los tipos de ADC/DAC
de audio.
151
Conversor Móvil Conversor Estático
Figura 57. Tipos de conversores de audio.

Un conversor de audio profesional, además de una buena calidad de

audio, posee un chip DSP (Procesador Digital de Señales) que acelera la
gestión y transmisión del audio liberando al computador de esta tarea.
Estos conversores suelen incluir un tipo de drivers (controladores por
software del hardware) llamados Firmware o programas de firma muy
especiales con tiempos de latencia (tiempo de respuesta de las órdenes
de audio) muy bajos. Existen drivers tipo ASIO (Audio Streaming Input
Output de Steinberg) de código abierto, EASI (Enhanced Audio Streaming
Interface) de Emagic, muy similar a ASIO, DAE (Digidesing Audio Engine)
de Digidesign, un "super-driver" que incluye todo el manejo del motor
DSP de Pro Tools (programa profesional de sonido y edición de sonido
digital) y E-WDM (Enhanced Audio MIDI Driver) de Ego-Sys, un formato
que mejora el WDM (Windows Model Driver) de Microsoft. Estos drivers
deben ser proporcionados por los fabricantes de los conversores de audio
profesionales. Dentro de éstos, el más común, sin duda alguna, es el
formato ASIO.
152
Los drivers multimedia normales, insuficientes en el mundo del audio

profesional, son los llamados MME (Microsoft Multimedia Extensions) y
Direct X3.
Es habitual que en los estudios profesionales de audio se trabaje con los dos
tipos de conversores de audio. El conversor estático o tarjeta interna será de
alto perfil, con chips DSP para el tratamiento digital de audio (Software de
edición, restauración y creación de audio), y el conversor móvil o tarjeta
externa, igualmente con un perfil alto y con chips DSP. Por otra parte, se
utiliza para la correcta importación de audio de las diferentes fuentes (equipos
reproductores de audio analógico y digital) y exportación a receptores de audio
(para la grabación y monitoreo).
Un procesador DSP está diseñado inicialmente para aplicaciones con

computadores, conocidos como “Sistemas Embebidos”, en los que el
procesador es parte integral del producto. En otras palabras, un procesador
DSP ayuda al producto a ejecutar su función, pero el propósito del producto va
más allá de la computación. Los usuarios finales de los “Sistemas Embebidos”,
generalmente, no saben que el producto utiliza un procesador, pues estos
productos son tan comunes y prácticos como los reproductores de video, CD
player, hornos microondas o videograbadoras.
Los procesadores usados para DSP son rápidos y tienen una precisión media (8
a 24 bits) en los cálculos. A diferencia de los computadores personales o
estaciones de trabajo de una red, estos procesadores no soportan periféricos.
El procesamiento digital de señales también es útil para ayudar a cualquier
3
Software de edición y manipulación de audio digital: multipistas de audio digital. [en
linea]. s.l. La oreja digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Frevista%2Ftutorial%2Fesdi
_audio3%2Fdocu.php3%3F> [consulta: 30 Mar. 2005]
153
computador en el procesamiento de imágenes de alta velocidad, cálculos

científicos, procesamiento de audio u otras aplicaciones de cálculos intensivos.
Los dispositivos de captura de señales (ADC/DAC) que poseen los
procesadores DSP se conectan a los computadores personales o a las
estaciones de trabajo. Estos dispositivos ejecutan los cálculos pesados,
mientras que el computador al que se conectó proporciona otros servicios al
usuario. En la figura 58 se ilustran chips DSP típicos para aplicaciones de
audio.
El auge del uso de los DSP se debe a que éstos mejoran los productos
existentes, son de bajo costo y abren puertas a nuevos productos. Los avances
en los procesadores DSP ofrecen grandes capacidades de computación a un
costo mucho menor que el tradicional procesamiento analógico de señales.
Los DSP están diseñados para el desarrollo de las tareas de los programas
multipistas, edición gráfica de audio y secuenciadores MIDI (Musical
Instruments Digital Interface) o interfaces digital para instrumentos musicales,
que son todas aquellas aplicaciones que permitan grabar, capturar, manipular,
crear, restaurar y mezclar audio digital. El proceso de los efectos o algoritmos
implementados en cada aplicación puede ser de dos tipos y pueden combinarse
entre sí.
• Proceso por DSP físico
• Proceso nativo
154
Figura 58. Chips DSP de audio.

Fuente: Software de edición y manipulación de audio digital: multipistas de audio
digital. [en linea]. s.l. La oreja digital, 2005.
• Proceso por DSP físico: Las tareas son procesadas por chips DSP,
ubicados en conversores móviles o tarjetas PCI (Peripheral Component
Interconnect) o conector de componentes periféricos. El ejemplo clásico
es Pro Tools, un programa de edición gráfica de audio acompañado de
un potente conversor que posee hasta 18 chips DSP y con posibilidad de
ampliar su capacidad. En este caso, el computador solamente gestiona
tareas secundarias como generar los gráficos del programa y realizar un
control sobre los procesos, pero en ningún caso requiere enormes
cantidades de recursos. Los efectos DSP (Proceso digital de señales)
existen porque un mismo fabricante desarrolla el hardware (la tarjeta
DSP) y el software, lo cual supone una gran dependencia de tal
fabricante. En la actualidad hay varios formatos de drivers por DSP, de
los que se muestran algunos en la tabla 5.
155
• Proceso nativo: Las tareas nativas son las más comunes y no

requieren un conversor móvil o una tarjeta PCI con chips DSP. Utilizan la
CPU (Unidad Central de Proceso) del computador, (Intel Pentium 4,
Motorota G5, AMD Athlon XP, entre otros) para calcular los efectos en
tiempo real. En este caso, el computador debe realizar ambas tareas,
generar los gráficos del programa y realizar un control sobre los
procesos y todos los cálculos del audio (mezcla, efectos, etc.) lo cual
requiere de una gran cantidad de recursos, pero evita la dependencia de
un único fabricante. Existen varios formatos de drivers nativos.
Tabla 5. Formatos de Plug-ins por DSP
Proceso Nativo Por PC MAC Comentario

DSP
VST (Virtual Studio Si No Si Si De Steinberg, el
Technology) estándar nativo actual
EASI (Enhanced Si No Si Si De Emagic, sólo incluido
Audio Streaming en Logic Audio
Interface)
DirectX (DX) Si No Si No Estándar de Microsoft
MAS (MOTU Audio Si No No Si De MOTU y utilizado por
System) Digital Performer
RTAS (Real Time Si No Si Si De Digidesign y sólo
Audio Suite) funciona con hardware y
software Digidesign
HTDM (Host Time No Si Si Si Nuevo formato, híbrido
Division entre TDA y RTAS
Multiplexing)
TDM (Time Division No Si Si Si Primer estándar por DSP
Multiplexing) físico. Sólo funciona con
156
hardware Digidesign
SoundScape No Si Si De Soundscape y sólo
funciona con hardware y
software Soundscape
Pulsar/ SCOPE No Si Si Si De Creamware,
funciona con todos los
programas
Fuente: Software de edición y manipulación de audio digital: multipistas de audio

digital. [en linea]. s.l. La oreja digital, 2005.
Existen programas que soportan los formatos principales de drivers (VST, DX,
RTAS, HTDM, etc.) minimizando el problema de compatibilidad de software y
hardware.
Conversores de audio estáticos. En el mercado es muy común encontrarlos con

el nombre de tarjetas de sonido. Varían en precio y calidad. Las tarjetas
convencionales que posee un computador personal son de muy bajo perfil, y
no están dotados de procesadores DSP, lo que dificulta enormemente las
posibilidades de procesamiento de señales de audio. Menos precisa será
también la representación de la señal de audio analógica digitalizada y poco
efectiva con los programas profesionales de edición, restauración y creación de
audio. Los conversores estáticos poseen una conexión PCI para su
compatibilidad con los computadores de hoy en día. Las posibilidades de estas
tarjetas varían de acuerdo con la marca y el modelo: existen modelos con
procesos nativos, reducidas entradas y salidas de audio analógico no
balanceado, resolución baja y modesta frecuencia de muestreo que
empobrecen el correcto tratamiento digital de audio. Otros modelos con
procesos por DSP físicos, numerosas entradas y salidas de audio analógico
157
balanceado y no balanceado, resolución y frecuencia de muestreo altas,

interfaz MIDI e interfaces digitales para formatos S/PDIF (Sony/Philips Digital
Interface), Dolby Digital AC3 (Sistema de sonido envolvente digital) y DTS
(Digital Theater Surround), son ampliamente utilizadas. En el anexo B se
muestran diferentes marcas y modelos de conversores estáticos con sus
características y especificaciones técnicas.
Conversores de audio móviles. En el mercado es muy común encontrarlos con

diferentes nombres: Interfaces móviles (M-Audio), Interfaces Audio/MIDI
(Tascam) e Interfaces de Audio (MOTU), entre otros. Generalmente, los
conversores de audio móviles guardan un perfil profesional con procesos DSP
físicos, aunque existen modelos muy discretos para aplicaciones no
profesionales. Este tipo de conversor tiene dos valores agregados sobre los
conversores estáticos (tarjetas de audio PCI). El primero es, como su nombre
lo indica, un dispositivo móvil con posibilidad de ser trasladado y conectado en
cualquier computador, con las interfaces digitales de datos necesarias para la
correcta comunicación con el conversor. En la actualidad son FIREWIRE (IEEE
1394) y USB 2.0 (Universal Serial Bus) las interfaces de conexión de datos
digitales para estos equipos. La segunda ventaja de los conversores móviles es
que poseen diferentes dispositivos que proporcionan un pretratamiento de la
señal de audio analógico; entre los que se destacan:
• Entradas para micrófono (XLR) control de ganancia, indicadores de

saturación, atenuador, etc.
• Entradas para instrumentos musicales (1/4”) con controlador de

ganancia, indicador de saturación, etc.
• Canales preamplificados
158
Al igual que en las tarjetas de audio PCI, los conversores móviles poseen
numerosas entradas y salidas de audio analógico balanceado y no balanceado,
resolución y frecuencia de muestreo altas, interfaz MIDI e interfaces digitales
para formatos S/PDIF, Dolby Digital AC3 y DTS. En el anexo B se muestran
diferentes marcas y modelos de conversores móviles con sus características y
especificaciones técnicas.
159
5. TRATAMIENTO DIGITAL DE SEÑALES DE AUDIO PARA SU

RESTAURACIÓN
5.1. PROGRAMA PARA EDICIÓN Y MANIPULACIÓN DEL AUDIO

DIGITAL
Cuando se habla de edición y manipulación de audio digital, se está haciendo

referencia, indudablemente, a todas aquellas aplicaciones en programas
(software), y, en cierta medida, hardware, que permiten alterar las secuencias
de bits de las señales de audio codificadas.
Actualmente existen muchas aplicaciones orientadas al audio digital que no se

relacionan con la edición, transformación y manipulación con fines de
restauración y creación musical. Sin embargo, se centrará únicamente en
aquellas aplicaciones orientadas a la restauración de audio digital. El audio
digital se aplica en tecnología de telefonía móvil, sonares, radares, reducción
de ruido en maquinaria, exploración del espacio, aplicaciones médicas,
arquitectónicas y psicología, entre muchas otras.
Inicialmente, se debe capturar el audio digital por medio de los ADC y

almacenarlo en el computador. Para ello se necesita un programa que realice
la comunicación con el ADC y almacene el audio digital para luego restaurarlo
(tratamiento digital) y reproducirlo posteriormente, enviándolo a través de un
DAC. El primer y el último pasos son procesos básicos, precisos y muy sencillos
para manejar (capturar y reproducir). El tratamiento digital es muy distinto
porque incluye toda una gama de procesos más densos y complejos.
160
El tratamiento digital de audio puede ser de dos tipos: destructivo (la

secuencia de bits es alterada) o a tiempo real (se calcula el resultado a medida
que se reproduce sin cambios en la secuencia de bits).
Un programa de tratamiento digital de audio deberá gozar de la posibilidad de

captura del audio a través de las interfaces digitales del computador con la
ayuda de los ADC móviles o estáticos. Existen variadas aplicaciones shareware
(programas pagos que pueden ser utilizados durante un periodo de prueba) o
freeware (programas gratuitos que pueden ser utilizados sin restricciones) que
permiten dicha captura.
En el contexto profesional se definen tres tipos de aplicaciones:
• Editor gráfico de audio digital
• Multipistas de audio digital
• Secuenciador MIDI
5.1.1. Editor gráfico de audio digital. Estos programas permiten grabar,

exportar, importar y manipular audio digital, sin incluir funciones de mezcla y
producción musical. Esto significa que no tiene la capacidad de reproducir
múltiples pistas de forma simultánea ni realizar la mezcla y ecualización de
dichas pistas.
Anteriormente se han descrito los mecanismos para digitalizar señales de audio

procedente de diversas fuentes analógicas, y en el capítulo 7 se analiza el
161
almacenamiento de audio digital, pero el potencial que ofrece comienza a

intuirse en el momento de interactuar con un editor gráfico de audio digital.
Este tipo de aplicaciones son de un manejo relativamente sencillo y varía muy
poco de un fabricante a otro. Básicamente consiste en aplicar utilidades de
edición a un audio por medio de procesos matemáticos DSP (Proceso Digital
de Señales) con la ayuda de un entorno gráfico que permita seleccionar
cómodamente los fragmentos para tratar y que muestre los resultados
auditivos y visuales. Mediante estos procesos se consigue modificar el audio o
algunos de sus fragmentos con diferentes propósitos: corregir defectos en los
sonidos originales, en el caso de elementos espurios y ruidos, ensalzar o
modificar ligeramente fragmentos o generar otros totalmente irreconocibles.
Los editores gráficos de audio son las aplicaciones más utilizadas para la
restauración de audio.
Un buen editor de audio deberá almacenar cualquier audio digitalizado en

diferentes formatos de archivo e, igualmente, importarlo. Algunos de los
formatos de archivos o ficheros más utilizados son: WAV y AIFF, aunque
existen muchos otros formatos dedicados a la multimedia y entretenimiento en
general (audio para Internet, juegos, codificación, compresión, cine, etc.) y
sobre todo formatos de audio propios de hardware externo como grabadores
de audio digital autónomos (conversores móviles). En el capítulo 6 se
describen diferentes formatos de archivo de audio digital, empleados,
generalmente, para fines de restauración.
Las utilidades de un programa de edición gráfica de audio son, en su mayoría,

de tipo destructivo, es decir, alteran en alto porcentaje los datos originalmente
grabados, y ofrece, entre sus posibilidades, un historial de los procesos, que
permite recuperar las distintas versiones del audio tratado. Gran parte del
trabajo de los editores gráficos de audio se basa en procesos de masterización,
es decir, la creación del archivo final. Los efectos con retardos (delay),
162
procesadores de rango dinámico, procesos de filtrado y dithering, son algunas

de las herramientas que ofrecen los editores gráficos de audio. Los algoritmos
DSP de un editor gráfico con procesos destructivos deben tener mayor calidad
que los procesos de tiempo real, pues no se requiere de una rapidez del
proceso ya que el resultado no debe entregarse en tiempo real. Entre las
utilidades de un editor gráfico se destacan los procesos por paquetes, en los
que se programan acciones de edición para ser aplicadas a un número
determinado de pistas, es decir, listar "n" archivos de audio, seleccionar los
procesos para aplicar y que el programa se encargue del resto sin necesidad
de la participación del operador o editor. Otro aspecto importante son las
herramientas de medición, estadísticas y análisis del audio.
En la figura 59 se observa el espectro de una pista de audio en el programa

Sound Forge, de Sony, donde se ofrece un análisis gráfico-espectral que
permite identificar diferentes componentes, como degradaciones y efectuar el
procedimiento requerido para la restauración.
En la figura 60 se observa el espectro tridimensional de una pista de audio en

el programa Wavelab de Steinberg, que ofrece un análisis gráfico-espectral
para efectuar correctamente el procedimiento de restauración.
163
Figura 59. Análisis espectral de una pista de audio en Sound Forge.

164
Figura 60. Análisis tridimensional espectral de una pista de audio en Wavelab.
Además de las más comunes herramientas de edición, estos programas

ofrecen otras funciones extras, aplicadas al video. Por ejemplo, extraer el
audio de un video digital, procesarlo (tratamiento digital) e insertar el nuevo
audio al video. Otra función extra son las listas de reproducción, en las que se
efectúa un orden de reproducción de “n” pistas de audio en una lista virtual. La
última herramienta de este tipo de aplicaciones es el proceso de
almacenamiento del audio digital llevado a un medio como el CD o DVD
(Digital Versatile Disc). Vale la pena citar que existen varias aplicaciones de
tipo shareware y freeware que permiten el almacenamiento de audio en un
medio digital, como por ejemplo “Get it On CD” de Steinberg, que ofrece la
posibilidad de crear CD en todos los formatos disponibles.
165
Existe otro grupo de editores de audio especializados en procesos muy

concretos, como programas de restauración de audio. Un ejemplo es Clean,
también de Steinberg o NoNOISE, de SONIC Solutions. Resaltan algunos
programas que reúnen edición, almacenamiento digital y restauración, como
es el ejemplo de Sound Forge, de Sony y Wavelab, de Steinberg.
5.1.1.1. Elección de un editor gráfico de audio. Generalmente, los

conversores de audio (tarjetas de audio) incorporan un programa de edición
gráfica de audio que, en muchos casos, son excesivamente sencillos, limitando
las posibilidades de tratamiento digital de audio. Para una correcta elección de
un editor gráfico de audio, se deben tener en cuenta las necesidades del
usuario y definir prioridades. Como se mencionó, existen dos grupos de
editores de audio, los primeros de propósito general, con numerosas
herramientas de edición de audio y los segundos dedicados a procesos muy
concretos. La gran mayoría de programas de propósito general poseen
herramientas aceptables para la restauración de audio, pero son débiles si se
comparan con las herramientas que ofrece un programa especializado en
Posibilidades de un editor gráfico de audio digital. Cada programa de

edición gráfica de audio digital posee calidad, versatilidad y soporte técnico
diferentes a los demás, por ello resulta muy complejo describir las diferentes
herramientas, funciones y procesos representativos en una forma general.
El proceso se inicia cargando un archivo de sonido digital (frecuentemente tipo

WAV, AIFF u otro formato digital compatible con el programa de edición) o se
digitaliza desde el mismo programa, a través de un ADC teniendo en cuenta
todas las consideraciones mencionadas en el capítulo 4. Inmediatamente la
onda podrá ser representada gráficamente en una ventana. Con el mouse del
166
computador se seleccionan los fragmentos o el fichero en su totalidad para que

mediante opciones de menú se le apliquen los procesos de edición y
modificación digital. Un criterio para juzgar la calidad de estos programas es el
número, calidad y versatilidad de los efectos disponibles. A continuación se
enuncian algunos aspectos representativos y herramientas mínimas que debe
poseer un programa de edición gráfica de audio.
Multiventana. Posibilita tener varios ficheros de audio abiertos y visibles, es

fundamental para realizar composiciones con fragmentos de diferentes
ficheros.
Deshacer y rehacer. Es una opción configurable por el usuario y permite

deshacer y rehacer las acciones efectuadas sobre el fichero de audio.
Edición independiente de canales. Los ficheros estéreo se muestran en dos

ventanas superpuestas, una por canal para facilitar la modificación de uno o
ambos canales.
Zoom. Para lograr un mayor detalle o definición de la onda observada. Con el

zoom es posible modificar la escala de visualización. El zoom puede aplicarse a
dos parámetros: el tiempo (eje horizontal) y la amplitud (eje vertical).
Unidades temporales. Normalmente son tres las unidades empleadas para

medir las coordenadas temporales, éstas son: tiempo, muestras o frames y
compases. Esta última es útil para la edición de fragmentos musicales con un
tiempo preciso y exigencias de composición profesional.
167
Puntos de marca. Cuando un archivo es largo (pesado), es común perderse

mientras se navega hacia delante y hacia atrás en el eje del tiempo. Con el
punto de marca es posible poner marcas en algunos puntos de la onda
observada.
Importación y exportación de formatos. Aunque los formatos más

empleados son WAV y AIFF, en ocasiones es necesario importar o exportar
formatos diferentes. El número de formatos soportados varía de un programa
a otro. En el capítulo 7 se describen los formatos de archivo más
representativos para audio digital.
Salvar configuraciones. Muchas de las herramientas orientadas para efectos

incorporan parámetros configurables. Al salvar (guardar) las diferentes
configuraciones, se simplifica el trabajo.
Programación de nuevos efectos. Esta herramienta es compleja, pues

requiere de las nociones básicas de programación por parte del editor, además
de un profundo conocimiento del proceso digital de señal (DSP). Por ejemplo,
Gold Wave dispone de un editor de fórmulas, con el que se crean efectos
sorprendentes. Otro ejemplo es la arquitectura abierta que se aplica en Sound
Forge y Wave Lab, que permiten crear plug-ins, en lenguaje C.
Proceso por lotes. Esta herramienta permite repetir acciones sobre un cierto
número de ficheros. La cantidad depende de cada programa.
Síntesis de sonidos. Existen opciones que permiten crear sonidos sintéticos,

nuevos, es decir, partiendo de cero.
168
Control de dispositivo de audio. La mayoría de los programas de edición

posibilitan el manejo de la unidad de CD de audio del computador.
Extracción digital. Esta opción es útil cuando se desea extraer pistas

directamente de un CD de audio.
Herramientas de procesado digital de audio. Las posibilidades de

modificar el audio digital, mediante los programas de edición, son
interminables. A continuación se describen puntualmente algunas de estas
posibilidades, en lugar de seguir los menús de opciones de un determinado
programa, que varía de acuerdo con cada fabricante.
Los efectos más frecuentes se pueden dividir en tres grandes grupos:
Efectos básicos en el dominio temporal. Suelen estar en la opción de

menú editar. Algunos son:
• Copiar, Cortar, Pegar
• Reverse (Darle la vuelta a un sonido)
• Eliminar silencios (borrar los fragmentos silenciosos)
• Insertar silencios
169
Efectos básicos en el dominio de la amplitud. Los efectos descritos a

continuación realizan multiplicaciones para cada muestra de un fragmento.
Algunos son:
• Modificar ganancia (multiplicar las muestras por un valor real)
• Silenciar (multiplicar por cero la zona seleccionada)
• Normalizar (lograr la máxima amplitud de una muestra sin distorsión)
• Aplicar envolventes (la envolvente determina la variación temporal de la

amplitud)
• Modulación de amplitud (multiplicar un fragmento por una señal

periódica)
• Invertir (diferente a reverse. Hay un cambio de fase)
• Mezclar (suma de dos fragmentos)
• DC offset (elimina componentes indeseables de directa)
Efectos básicos en el dominio de la frecuencia. Son operaciones sencillas

en el dominio de la frecuencia. Algunos son:
• Modificación de la frecuencia de muestreo
• Resample (modifica la frecuencia de muestreo sin alterar la frecuencia

del audio)
170
• Transpositor (modificar la altura manteniendo la frecuencia de

muestreo)
En este apartado se abordarán conceptos más avanzados relacionados con la

teoría del proceso digital de señales (DSP) y la restauración de audio.
5.1.1.2. Efectos que utilizan retardos. Un gran número de efectos se

consiguen sumando varias copias con retardos y modificaciones a la señal
original. Los ejemplos más típicos son los de eco y reverberación, aunque,
como se mostrará a continuación, no son los únicos que manejan este tipo de
técnicas. De acuerdo con el tipo de efecto deseado, los tiempos de estos
retardos pueden ser de milisegundos o segundos y, en algunos casos,
benéficos en un proceso de restauración digital de audio.
Eco y reverberación
Naturaleza. La reverberación se produce de forma natural en una sala o

recinto porque los sonidos no proceden de un único punto emisor; los sonidos
captados por el oído humano son copias reflejadas por el techo, las paredes, el
suelo, y otros objetos. Cuanto más grande es la distancia de los reflectores al
oído, más retardadas y atenuadas serán las copias.
El tiempo de reverberación es una cualidad de las salas, y se define como el

tiempo que debe transcurrir para que el sonido inicial se atenúe en 60 dB. El
tiempo de reverberación cambia de acuerdo con el tamaño de la sala
171
Cuando se aborda el tema de la reverberación, es preciso tener en cuenta un

factor determinante como lo es la absorción de energía de los materiales
reflectantes, puesto que las superficies poco absorbentes, incrementarán el
tiempo de reverberación. Se puede citar un ejemplo: el cristal. Las superficies
como telones, madera o el propio público, hacen que el tiempo de
reverberación disminuya. La absorción no sólo varía con el tipo de material de
las superficies reflectantes, pues también es función de la frecuencia (los
agudos se absorben más que los graves).
Cuando la duración de los retardos es suficientemente amplia como para oírse

de forma aislada se denominan ecos y sólo se producen en grandes espacios y
con pocos obstáculos.
Reverberación y eco digitales. Un gran porcentaje del audio es escuchado

en salas pequeñas y con tiempos de reverberación mínimos. Precisamente es
en estos lugares en los que se usan métodos de reverberación para enriquecer
el audio y hacer la experiencia sonora más grata al oído. Los programas de
edición gráfica de audio digital posibilitan la configuración de este tipo de
efectos, realizando cambios en el tiempo, en la amplitud y en la frecuencia.
Con retardos menores de 30 milisegundos y una realimentación se altera la

tímbrica, lo que le da al sonido un carácter metálico, hasta el punto de adquirir
resonancias muy definidas en determinadas frecuencias. Con retardos entre 20
y 80 milisegundos se afecta principalmente la presencia de los instrumentos
musicales, ya que gracias al efecto Haas que explica la capacidad para ubicar
una fuente sonora que se confunde por las reflexiones y ecos, se pueden
"sumar" dos sonidos iguales y físicamente separados en el tiempo, de manera
que se genera la sensación de un sonido más "grueso", o un conjunto de
instrumentos sonando al unísono. Este tipo de retardos se implementan
172
comúnmente en procesos de restauración de audio, para el que su objetivo

principal no es eliminar ruidos sino resaltar algún instrumento musical que
presenta una frágil presencia en la grabación, ya sea por el deterioro del medio
de almacenamiento analógico o por las limitadas técnicas de grabación
implementadas en su creación.
Flanger y phaser. Los efectos de flanger o flanging, consisten en mezclar la

señal original con una copia con retardo corto, pero variable de forma
periódica.
Normalmente los parámetros para configurar, son: el mínimo porcentaje de

señal retardada; el margen de variación del retardo (regularmente en
milisegundos), la frecuencia de variación de este retardo (habitualmente entre
algunas décimas y varios hertzios), y el porcentaje de realimentación. De
acuerdo con los valores asignados, el efecto conseguido puede ser variado.
Este efecto se evidencia en los sonidos del pop sicodélico de los años 70, que
se lograba de una forma analógica, mezclando la señal de dos magnetófonos
retardando o acelerando uno de ellos.
Cuando no hay realimentación, el efecto es más discreto y suele llamarse

phaser o phasing, que es común encontrar en pedales para guitarras
eléctricas. Pero cuando la realimentación es completa se denomina chorus, que
tiene beneficios en procesos de restauración de audio.
Retroalimentación o feedback. La retroalimentación (feedback) no es un

efecto propiamente dicho, sino una manera de procesar el audio. Se produce
cuando parte del sonido generado por los parlantes es captado por el
micrófono y esta señal es reenviada al sistema, llegando, poco a poco, a un
173
punto crítico tal que el nivel captado por el micrófono, tanto de la fuente como
de los parlantes, tienen la misma intensidad. Este proceso de retroalimentación
genera un molesto zumbido cuando un micrófono capta el sonido proveniente
de los parlantes y lo reingresa al sistema, y causa una amplificación
permanente, es decir, un lazo cerrado de amplificación. El feedback se expresa
mediante un porcentaje que indica la cantidad de sonido procesado que se
vuelve a procesar. Cuando este valor es del 0%, no se genera
retroalimentación, pero cuando es superior al 100%, la intensidad del sonido
resultante aumentará paulatinamente hasta llegar a la saturación. En el caso
de la restauración de audio, es sumamente perjudicial en aquellos procesos en
los que la digitalización es del tipo sucio, donde la señal analógica para
restaurar es capturada a través de micrófonos. Es importante, en
consecuencia, manejar criterios para evitar este molesto efecto. Algunos de
estos criterios se pueden enumerar de la siguiente manera:
• La correcta ubicación y orientación de los parlantes y micrófonos. Los

micrófonos deben estar muy cerca del reproductor analógico y muy lejos
de los parlantes
• Pocas reflexiones acústicas locales. Es importante eliminar las

reflexiones acústicas cercanas a los micrófonos
• Mínima reverberación del lugar
• Implementar ecualizadores para controlar la retroalimentación que se

presente
• El lugar de trabajo (estudio de audio o auditorio), debe cumplir con

parámetros establecidos4. La construcción de estos espacios es
4
Handbook for sound engineers. Boston. BALLOU M, Glen, 2002.
174
fundamental para asegurar una correcta captura, grabación y

reproducción de audio.
Chorus. Es un efecto muy sutil y ampliamente utilizado, en el que un solo

instrumento o una sola voz, suena como si se tratara de varios instrumentos o
un coro al unísono. Se consigue retardando sutilmente la copia del sonido
original.
En la actualidad es muy aplicado a los cantantes, para dar más realce a la voz.
Muchos sintetizadores, y algunos conversores de audio con procesadores DSP,
incorporan este efecto en tiempo real. Este tipo de retardos se implementan
comúnmente en procesos de restauración de audio, en el que el objetivo es
resaltar la voz o algún instrumento que presenta una débil participación en la
grabación, ya sea por el deterioro del medio de almacenamiento analógico o
por las limitadas técnicas de grabación implementadas en su creación.
Excitador o enhancer. Genera armónicos pares de la señal de entrada, de

forma que ayuda con la mayor presencia o mejor brillo de esa señal. También
se emplea para generar subarmónicos con el propósito de realzar instrumentos
con tendencia grave. Suele utilizarse satisfactoriamente en restauración digital
de grabaciones analógicas en vinilos u otros formatos con degradaciones, y en
los que algunos instrumentos son resaltados notoriamente en la pista sonora.
Transpositor. Originalmente, se empleaban transposiciones mecánicas que

alteraban la velocidad de reproducción de una cinta o disco respecto de su
velocidad original de grabación, pero también se alteraba el timbre, ya que
este tipo de transformación no conserva las estructuras propias de muchos
instrumentos y la voz humana. Los efectos sonoros sobre la voz, llamados
175
“Pitufo” y “Ogro”, son el resultado de transposiciones, en las que el primer

efecto se relaciona con un aumento en la velocidad de reproducción y el
segundo con una disminución. Existen transpositores digitales que se
fundamentan en esta base para alterar la velocidad de reproducción, aunque
algunos equipos y programas modernos brindan la posibilidad de transponer,
incluso en tiempo real, sin alterar significativamente las características del
instrumento. Es común cambiar el aspecto sonoro de un instrumento musical
aumentando su sonido y, agregando pequeños retardos, se construyen señales
de audio estéreo a partir de señales monofónicas, incluso se pueden deformar
sonidos para generar nuevos arreglos. También se aplican transposiciones
digitales con el propósito de restaurar audio, en los que se da solución a los
problemas relacionados con la alteración de la velocidad de reproducción que
se genera por el mal estado del medio de almacenamiento analógico o por
problemas en el equipo reproductor analógico. Resulta, además, benéfico
aplicar transposiciones en viejas grabaciones, pues se da un aire más moderno
al nuevo audio.
5.1.1.3. Procesadores de rango dinámico. La diferencia (en dBs) entre la

intensidad más fuerte y la más débil es conocida como rango dinámico de un
fragmento de una señal de audio. Los efectos de rango dinámico manipulan
directamente la amplitud de las muestras, modificando, de múltiples maneras,
el rango dinámico de un determinado fragmento de audio. Los más
representativos son los compresores, expansores, limitadores y las puertas de
ruido. Una correcta forma de representar estos procesos es mediante su
función de transferencia, que establece la relación entre las amplitudes de
entrada y las amplitudes de salida.
En la figura 61 se muestran varias funciones de transferencia de este tipo, al

igual que su efecto en un fragmento sonoro. La función de transferencia, de la
figura 61 a), es una recta con una inclinación de 45º, lo que significa que, en
176
este caso, no se produce ninguna modificación del rango dinámico, es decir, a

cualquier valor de amplitud de entrada le corresponde el mismo valor en la
amplitud de salida.
Compresores y limitadores. Los compresores son empleados para disminuir

el rango dinámico de una señal de audio. Se emplea ampliamente en
grabaciones vocales, pues, la señal emitida por la voz y transducida por un
micrófono, presenta armónicos muy débiles que se suelen confundir con el
ruido de fondo. Con una compresión más alta se consigue un efecto
comúnmente utilizado en las guitarras eléctricas, creando el típico sonido de
heavy, como se ilustra en la figura 61 b). Parecido al comportamiento realizado
por los efectos que emplean retardos, donde se realzan instrumentos
musicales o la voz humana, los compresores tienen como finalidad reducir el
nivel de las señales con demasiado volumen, para el realce de aquellas
señales con un nivel bajo. Cuando algún sonido de interés, la voz o un
instrumento musical, es opacado por el ruido de piso u otra degradación
global, es útil la implementación de compresores.
Los limitadores son un caso particular de compresores, que limitan la amplitud

máxima posible a un valor límite. Suelen utilizarse en grabaciones al aire libre
como conciertos, para evitar que se produzca saturación. Su función de
transferencia presenta pendientes horizontales en los extremos, como se
muestra en la figura 61 c).
Expansores. Tienen el efecto opuesto de un compresor. Minimiza los

cambios, disminuye los niveles débiles y aumenta los fuertes, como se ilustra
en la figura 61 d). Se emplean normalmente en combinación con puertas de
ruido y para mejorar grabaciones antiguas que presentan un rango dinámico
estrecho con fines de restauración. Produce realce del sonido y restaura la
177
fuerza o emotividad que le imprime algún instrumento o ejecutante, incluido el

cantante.
Distorsión. Este término tiene connotaciones peyorativas, pues,

normalmente, significa la pérdida o degradación inevitable de una señal,
factores ocasionados por los diferentes dispositivos o procesos (micrófono,
grabación, amplificador, parlantes) a los que se ve sometida. Sin embargo, los
efectos descritos anteriormente son, en realidad, casos particulares de
distorsión, que, por su uso frecuente, reciben un nombre propio.
Puertas de ruido. Silencian las muestras por debajo de determinado valor

límite, introducido como parámetro de porcentajes sobre la amplitud máxima
de las muestras, y silencia las muestras por debajo de dicho porcentaje. Las
puertas de ruido se emplean, regularmente, para conferencias donde hay
varios micrófonos y se desea que sólo un micrófono, el del interlocutor, capte
las señales sonoras. Este efecto es muy común en la reducción de hiss o ruido
de fondo, comúnmente llamado ruido de piso, aunque existen formas más
sofisticadas y efectivas de reducción de este tipo de ruido a través de
algoritmos DSP (Procesamiento Digital de Señales).
La combinación de compresores y puertas de ruido en procesos de grabación,

junto con expansores, se utiliza ampliamente como técnica de reducción de
ruido, un ejemplo es el sistema Dolby, implementado en muchos equipos de
reproducción y grabación de audio.
178
Señal original
0
+1
Amplitud
Aa) 0
-1
-1 +1 Tiempo
Compresor
Amplitud
Ab)
Tiempo
Limitador
Amplitud
Ac)
Tiempo
Expansor
Amplitud
Ad)
Tiempo
Figura 61. Funciones de transferencia de procesadores de rango dinámico.

Fuente: JORDÀ PUIG, Sergi. Conceptos avanzados de procesado digital de audio:
procesadores de rango dinámico. [en linea]. s.l.: JORDÀ PUIG, Sergi, 2003.
<http://www.ccapitalia.net/reso/articulos/audiodigital/pdf/06-ProcesadoSonido.pdf>
179
5.1.1.4. Filtros. La teoría de filtros digitales es un tema importante y

extenso, y puede ocupar todo un curso en una carrera de ingeniería. Por ello,
no se tratará aquí la forma de implementación de estos filtros digitales ni las
teorías matemáticas sobre los que se apoyan, pues no es el propósito central
de este trabajo que ha asumido como eje temático central la restauración de
audio. A continuación, se describirán superficialmente los filtros digitales como
complemento del tema de editores gráficos de audio digital. Dejando aclarado
que los filtros digitales son la herramienta fundamental para lograr alterar la
estructura tímbrica de un sonido para posibilitar aquellos procesos como
efectos con retardo, procesadores de rango dinámico y algoritmos DSP
(Procesamiento digital de señales) orientados a la restauración de audio.
La implementación de filtros en procesamiento digital de señales es una etapa

necesaria y amplia, ya que son muchas las situaciones, entre ellas la
restauración de audio, en las que se pretende acentuar o atenuar
determinadas frecuencias. Un ejemplo para graficar lo antes argumentado
puede ser la aparición de filtros en la entrada de los equipos digitales como
ADC, consolas digitales u otro dispositivo que procese señales analógicas de
audio, para evitar la presencia de señales de muy baja o muy alta frecuencia
que, sin ser útiles, implican la adición de ruido a la señal procesada.
En un contexto más riguroso, cualquier algoritmo, o proceso digital sobre una

señal de audio que, a partir de una entrada (una secuencia de bits) genere una
salida (otra secuencia de bits), se considera un filtro digital. Todos los procesos
comentados hasta el momento se constituyen en casos particulares de filtros
digitales, pero en la práctica este término se reserva para aquellos dispositivos
que modifican el espectro de una señal de audio.
180
Espectro de una señal. En el primer capítulo se argumentó que la mayoría

de sonidos están compuestos por diferentes frecuencias. En el estudio de los
sistemas y señales se exhibe el teorema de Fourier, quien afirma que cualquier
señal periódica compleja puede descomponerse en una suma de señales
senoidales de frecuencias y amplitudes diferentes. Dicha descomposición es
denominada como espectro de frecuencias, y se representa mediante un
gráfico con frecuencias en el eje horizontal y amplitudes en el eje vertical, en
el que se observan diferentes amplitudes de todas las frecuencias que
componen un sonido.
Esta teoría data desde hace más de un siglo y se aplicaba rigurosamente a las
señales totalmente periódicas, pero los sonidos nunca lo son plenamente, pues
siempre varían con el paso del tiempo. Afortunadamente, desde hace varias
décadas, y mediante elaborados y complejos procesos matemáticos, es posible
el análisis por Fourier de señales variables en el tiempo. La representación
espectral de un sonido no es una única distribución bidimensional de
frecuencias, sino una superficie tridimensional, compuesta por una sucesión de
cortes temporales, en la que cada una muestra la forma del espectro en un
instante de tiempo determinado.
Ya se mostró cómo algunos programas de edición gráfica de audio son capaces

de realizar este análisis para un fragmento seleccionado de un archivo y de
mostrar gráficamente el resultado. Estos gráficos permiten estudiar el cambio
temporal de los diferentes componentes frecuenciales que conforman un
sonido para realizar una correcta ecualización sobre éste, además de identificar
componentes no deseados como ruidos o elementos espurios para estudiar con
mayor profundidad sus comportamientos en frecuencia y amplitud.
181
Filtros básicos. Un filtro se define por su respuesta en frecuencia

(atenuación o amplificación) mediante la función de transferencia, que
establece la relación entre las frecuencias de entrada y las frecuencias de
salida.
Los filtros más usuales pueden clasificarse en cuatro grupos:
• Pasa-bajo
• Pasa-alto
• Pasa-banda
• Rechazo de banda (Elimina-banda).
Filtro pasa-bajo. Permite pasar las señales cuyas frecuencias están por
debajo de un determinado umbral, denominado frecuencia de corte. En un
filtro ideal estas frecuencias suponen una discontinuidad en la curva de
respuesta, de forma que se atenúan las frecuencias mayores al umbral y
todas aquellas frecuencias por debajo del umbral pasaran sin atenuación. En la
práctica esto no es viable y los filtros reales presentan una pendiente en la
región próxima a la frecuencia de corte. Mientras mayor sea la inclinación de la
pendiente de atenuación, más preciso será el filtro.
Filtro pasa-alto. Es el filtro que se caracteriza por ser el opuesto al pasa-

bajo, ya que únicamente deja pasar las señales cuyas frecuencias sean
superiores a la frecuencia de corte y atenúa las señales cuyas frecuencias
están por debajo del punto de corte.
182
Filtro pasa-banda. Permite pasar señales dentro de una banda de

frecuencias. Se determina por una frecuencia central y un ancho de banda.
Filtro de rechazo de banda. Es el opuesto al filtro pasa-banda, ya que

permite pasar las señales de frecuencias, excepto las de frecuencias de una
banda restringida, que se determina por una frecuencia central y un ancho de
banda.
En la figura 62 se muestran las curvas de respuesta de frecuencia de estos

cuatro filtros básicos.
Ecualizadores. Un ecualizador gráfico es un arreglo de filtros pasa-banda en

paralelo, que permite seleccionar las bandas deseadas en baja, media o alta
frecuencia para filtrar una señal de audio. En la figura 63 se aprecia la
respuesta de un ecualizador compuesto de 6 filtros pasa-banda. Es el
dispositivo más empleado para transformar el timbre de un sonido, de manera
que permite modificar la señal de entrada en forma tal que determinados
componentes de su estructura o espectro resultan aumentadas o amplificadas.
Las transformaciones logradas con un ecualizador no son radicales, aunque
ayudan atenuando determinadas frecuencias molestas como es el caso del
ruido de piso, muy común en registros sonoros analógicos o realzando
determinadas características tímbricas de registro sonoro antiguo que presenta
degradaciones en su calidad sonora.
183
Pasa-bajo Pasa- alto
Frecuencia Frecuencia
de corte de corte
Aa) Ab)
Amplitud
Amplitud
Pasa-banda Elimina-banda
central central
Ac) Ad)
Amplitud
Amplitud
Figura 62. Curvas de respuestas de filtros.

Fuente: JORDÀ PUIG, Sergi. Conceptos avanzados de procesado digital de audio: los
filtros. [en linea]. s.l.: JORDÀ PUIG, Sergi, 2003.
<http://www.ccapitalia.net/reso/articulos/audiodigital/pdf/06-ProcesadoSonido.pdf>
184
Respuesta del
ecualizador
Amplitud
Frecuencia
Filtros pasa-banda
Figura 63. Respuesta de ecualizador con 6 bandas de filtrado.

Fuente: PENA GIMÉNEZ, Antonio. Sistemas de audio y video: procesos sobre la señal
de audio. [en linea]. Vigo: Universidad de Vigo, 2005.
<http://www.gpi.tsc.uvigo.es/%7Ecbarcena/Web-SAV/sav0405_tema3_procesos.pdf>
Un ecualizador permite, como máximo, manipular 3 parámetros:
• Frecuencia central: Determina sobre qué zona del espectro de desea

ecualizar
• Anchura de banda o factor Q: Define la región alrededor de la frecuencia

central
• Nivel de atenuación y amplificación: Señala la magnitud en dBs,

necesaria para realzar o acentuar la región o banda elegida.
185
Los tipos de ecualizadores son:
• Paramétricos: Son los que permiten manipular los 3 parámetros
• Semiparamétricos: En ellos Q está predefinida y sólo es posible cambiar

los otros dos parámetros
• Gráfico o de bandas: Posee un número fijo de frecuencias de

atenuación, con Q fija, de forma que sólo es posible modificar el nivel de
atenuación o amplificación
En las figuras 64 y 65 se observan dos ecualizadores, el primero un ecualizador

grafico del programa Audition y el segundo un ecualizador paramétrico del
programa Sound Forge. En la figura 66 se ilustra un hardware de ecualización
gráfica de audio.
5.1.1.5. Dither. Es un método de reducción del ruido de aliasing y

distorsión, producido por el truncamiento de bits (al pasar de 24 a 16 bits). El
dither agrega un tipo de ruido que elimina el ruido por efecto de "aliasing" o
espectro plegadizo.
186
Figura 64. Ecualizador gráfico de Audition.
Figura 65. Ecualizador paramétrico de Sound Forge.

187
Figura 66. Hardware de ecualizador grafico de audio.

Fuente:Equalizer. Products: equalizer & accessories. [en linea]. s.l.: Behringer, 2005.
<http://www.behringer.com/DEQ2496/index.cfm?lang=ENG>
5.1.2. Multipistas de audio digital. Son programas que permiten grabar,

manipular y mezclar audio digital. La característica primordial de estas
aplicaciones es que pueden reproducir varios archivos de audio
simultáneamente.
El estudio de los programas multipista es un tema interesante y profundo, y

puede ocupar todo un curso en el manejo de este tipo programas de audio.
Por ello, no se tratará aquí sus procesos ni características ya que no es el
objetivo alejarse de los temas centrales relacionados con la restauración de
audio.
Un multipistas de audio requiere un conversor de audio (tarjeta de audio)

profesional que, además de una buena calidad de audio, posea uno o varios
chips DSP que aceleren los procesos de transmisión del audio liberando al
computador de esta tarea (para mayor información y claridad remítase al
capítulo 4). La mayoría de los multipistas de audio incluyen sencillas
herramientas de edición pero insuficientes para la restauración de audio.
Tampoco poseen funciones de importación y exportación de registros vía MIDI
o SCSI (Small Computer System Interface) o sistema de interfaz para
computadora pequeña, ni herramientas de análisis de señales o listas de
188
reproducción. Los procesos implementados se calculan de forma independiente

por cada pista y puede ser por DSP físico o nativo.
Los siguientes son algunos programas multipistas reconocidos en el mercado:
Proceso Nativo. (No requieren chip DSP, aunque mejorarían su rendimiento)
• Nuendo (PC/MAC)
• Audition (PC/MAC)
• Vegas Audio (PC)
• Cool Edit Pro (PC/MAC)
Proceso DSP. (Requieren chip DSP)
• Proo Tools (PC/MAC)
• SoundScape (PC)
• P.A.R.I.S (PC/MAC)
5.1.3. Secuenciador MIDI. Es la aplicación más exigente relacionada con

la potencia del computador y los procesos DSP. Requiere conversores con
múltiples chips DSP para un correcto funcionamiento, en parte, porque un
secuenciador MIDI debe poseer las funciones de un multipistas de audio más la
funcionalidad propia de todo un secuenciador MIDI.
189
El estudio de los secuenciadores MIDI es un tema innovador y extenso, y

puede ocupar todo un curso en el manejo de este tipo programas de audio.
Por ello, no se tratará aquí sus procesos ni características ya que no es el
objetivo alejarse de los temas centrales de la restauración de audio.
Generalmente, los datos MIDI son mucho más pequeños que los datos de
audio digitalizados, lo que hace más exigente el cálculo de los efectos
aplicados, como reverberaciones en tiempo real. Un secuenciador requiere de
un buen conversor de audio (tarjeta de audio), al igual que el multipista de
audio digital, pero, además, requiere de una excelente interfaz MIDI que ayude
al computador en la gestión y transmisión de datos MIDI. Se emplean los
mismos tipos de drivers que en los multipistas de audio ya que la exigencia de
procesamiento es la misma o superior.
Los secuenciadores, igualmente, incluyen sencillas herramientas de edición de

audio, aunque no ofrecen un alto grado de profundidad.
Los siguientes son algunos programas secuenciadores MIDI, reconocidos en el

mercado:
Proceso Nativo. (No requieren chip DSP, aunque mejorarían su rendimiento)
• Cubases VST (PC/MAC)
• Logia Audio (PC/MAC)
• Cakewalk / SONAR (PC)
• Digital Performer (MAC)

190
Proceso DSP. (Requieren chip DSP)
• Logic Audio Platinum (MAC)

191
6. TECNOLOGÍAS DE RESTAURACIÓN DIGITAL DE AUDIO
Como se esbozó inicialmente en los primeros capítulos, y luego se argumentó

profundamente en el trabajo, las señales de audio contienen una mezcla de
señales musicales y de voz, además de otros elementos de información,
incluyendo ruidos, cuya composición y origen son de naturaleza diversa. Por
tales razones, se consideró pertinente hacer un análisis sobre las tecnologías
de restauración. Asunto que no ha sido reflexionado profundamente en nuestro
contexto, de acuerdo con las indagaciones hechas para los propósitos descritos
en este trabajo de grado.
Las tecnologías de restauración que se exponen están basadas en Procesos

Digitales de Señales (DSP). Se dispone de dos áreas metodológicas que
agrupan tecnologías con orientaciones diferentes. La primera se fundamenta
en modificaciones locales o globales de la señal de audio; la segunda se basa
en la sustitución de la señal de audio por una combinación lineal de vectores
extraídos de un diccionario apropiado, que se elige de acuerdo con la
naturaleza de la señal.
Algunas de las empresas más sobresalientes en el campo de la restauración

digital son:
• CEDAR. (Computer Enhanced Digital Audio Restoration), Cambridge. Es

una de las empresas pioneras en la creación y distribución de productos
para restauración de señal de audio con ruidos, basados en software y
en hardware. El producto DC1 elimina ruidos impulsivos y pulsos
192
transitorios. El producto CR1 ataca los zumbidos y distorsiones no

lineales. La interfaz gráfica de este producto se observa en la figura 67.
Diseñado para sistemas operativos MAC y Windows. En caso de requerir

mayor información sobre este aspecto, por favor visite la página Web:
http://www.cedar-audio.com
Figura 67. Programa de restauración de audio de CEDAR.

registros sonoros: tecnologías de restauración. [en linea]. Oviedo: Universidad de
Oviedo, s.f. <http://coco.ccu.uniovi.es/brahms/tecnolgiasresta/tecnologiasresta.htm>
• SONIC Solutions. Creadora de NoNOISE, paquete de aplicaciones para

la restauración de señales de audio con ruidos, que incluye herramientas
para eliminar ruidos impulsivos, de banda ancha y un filtrado complejo
193
para el tratamiento de los ruidos de baja frecuencia. La interfaz gráfica

de este producto se observa en la figura 68.
Diseñado para sistemas operativos MAC y Windows. Para ampliar esta

información puede visitar la página Web: http://www.digidesign.com
Figura 68. Programa de restauración de audio de SONIC Solutions.

Fuente: Restauración de audio. SONIC: Sonic NoNOISE. [en linea]. Novato: Sonic
Solution, 2005. <http://www.digidesign.com/products/details.cfm?product_id=3180>
• Pinnacle. Ofrece gran variedad de programas relacionados con el

tratamiento de audio, en edición, multipista y secuenciadores MIDI; pero
es el programa Steimberg Clean el más especializado en la limpieza de
194
todo tipo de audio y en restaurar discos y cintas magnéticas. La interfaz

gráfica de este producto se observa en la figura 69.
Diseñado para sistemas operativos Windows. Sobre este tema en

particular se halla mayor información en la página Web:
http://www.pinnaclesys.com
Figura 69. Programa de restauración de audio de Steimberg Clean.

Fuente: Restauración de audio. PINNACLE SYSTEMS: audio. [en linea]. s.l.: Pinnacle
systems, 2005.
<http://www.pinnaclesys.com/ProductPage_n.asp?Product_ID=1477&Langue_ID=6>
• Waves. Ofrece un programa para la reducción de ruidos y restauración

de audio. Apoyado en investigaciones psicoacústicas y de algoritmos de
195
restauración de varios niveles. Sus aplicaciones X-Hum, X-Click, X-

Crackle y X-Noise ofrecen una excelente alternativa en la restauración y
remoción de ruidos que se presentan en los medios de almacenamiento
analógico. La interfaz gráfica de este producto se observa en la figura
70.
Diseñado para sistemas operativos MAC y Windows. Si se desea ampliar

esta información, indague en la página Web: http://www.waves.com
Figura 70. Programa de restauración de audio de Waves.

Fuente: Restauración de audio. WAVES: restoration bundle. [en linea]. s.l.: Waves
Audio, 2005. <http://www.waves.com/content.asp?id=59> [consulta: 25 Abr. 2005]
• Bias, inc. Ofrece SoundSoap Pro, constituye un conjunto de

herramientas de restauración de audio, diseñado para profesionales del
audio: ingenieros, músicos e incluso científicos. Su característica
primordial es que no divide el proceso de restauración en plug-ins
196
individuales, sino que ofrece una interfaz integrada que permite ejecutar
la herramienta deseada rápidamente. Algunas de sus aplicaciones son:
Hum, Click & Cracke, Broadband y Noise Gate. La interfaz gráfica de
este producto se observa en la figura 71.
Diseñado para sistemas operativos MAC y Windows. Para ampliar esta

información puede remitirse a la página Web: http://www.bias-inc.com
Figura 71. Programa de restauración de audio de Bias, inc.

Fuente: Restauración de audio. SoundSoap Pro de Bias. [en linea]. s.l.: La oreja
digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Fnoticia.php3%3Fidnoticia
%3D1225> [consulta: 26 Abr. 2005]
197
Existe gran variedad de programas de edición gráfica de audio, con amplios

paquetes de herramientas que incluyen opciones de restauración de registros
de audio. Algunos ya citados anteriormente, son:
• Sound Forge (PC/MAC)
• Audition (PC/MAC)
• Wavelab (PC)
• Proo Tools (PC/MAC)
• Cool Edit Pro (PC/MAC)
• SoundTrack (MAC)
• Gold Wave (PC)

198
6.1. TECNOLOGÍAS DE MODIFICACIÓN
Las tecnologías de modificaciones diseñan modelos matemáticos de la señal,

que representan de manera precisa la parte no degradada. Una vez detectado
el segmento degradado de la señal, es posible eliminarlo y sustituirlo por otro
que se cimentará en el modelo matemático. Aquella parte de señal que no se
identifica como degradación o ruido, se conserva en su estado original. En la
figura 72 se ilustra la detección de un segmento degradado de una señal. En la
figura 73 se grafica la eliminación del ruido; y en la figura 74 se muestra la
sustitución.
Amplitud
Tiempo (seg)
Figura 72. Detección de segmento con ruido.
199
Amplitud
Tiempo (seg)
Figura 73. Eliminación del ruido.
Amplitud
Tiempo (seg)
Figura 74. Sustitución del ruido.
200
De acuerdo con el modelo matemático elegido para representar la señal de

audio, se usan las diferentes tecnologías para detectar las degradaciones
localizables y globales que luego serán eliminadas.
El proceso de restauración digital se compone de tres etapas:
• La detección de los fragmentos degradados
• La eliminación del contenido de dichos fragmentos
• La sustitución de los fragmentos eliminados, por técnicas de

interpolación que, generalmente, relacionan valores de muestras que
anteceden al fragmento eliminado, valores de las muestras que le
siguen y probablemente los valores de algunas muestras del fragmento
degradado eliminado previamente.
201
A continuación se describen algunos ruidos identificados en pistas de audio y

restaurados por técnicas de interpolación.
En la figura 75 se observa una señal de audio degradada con abundantes clicks

y su equivalente restaurada pero sin presencia de clicks.
Señal de audio
con clicks
Señal de audio
restaurada
Figura 75. Señal de audio con clicks y señal restaurada.

202
En la figura 76 se advierte muy detalladamente la forma de un click en el

tiempo, además de su representación espectral en tercera dimensión.
Click
Amplitud
Tiempo
Click
Amplitud
23 m s
20.5
00 HZ
Fr ec u
e n ci a 640 H
Z po
Ti e m
0 ms
20 HZ
Figura 76. Representación de un click en el tiempo y el espectro.

203
En la figura 77 se muestra una señal de audio degradada con abundantes

thumps y su equivalente restaurada, sin presencia de thumps.
Señal de audio
con thumps
Señal de audio
restaurada
Figura 77. Señal de audio con thumps y señal restaurada.

204
En la figura 78 se detalla la forma de dos thumps en el tiempo, además de su

representación espectral en tercera dimensión.
Amplitud Thump Thump
Tiempo
Thump
Thump
Amplitud
23 m s
20.5
00 HZ
Fr ec u
e n ci a 640 H
o
Z
Ti e m p
0 ms
20 HZ
Figura 78. Representación de thumps el tiempo y el espectro.

205
La teoría de los modelos matemáticos para describir señales de audio,

detección de degradaciones y generación de algoritmos de restauración, es un
tema importante y extenso y puede ocupar todo un curso en una carrera de
ingeniería o un trabajo de grado. Por ello, se ha decidido no profundizar
teóricamente sobre dichos modelos, ni sobre sus teorías matemáticas en las
que se apoyan. En su lugar, y para efectos de mantener los propósitos
centrales del trabajo, se enuncian los modelos matemáticos para representar
señales de audio y detección de degradaciones como también los algoritmos
utilizados para la restauración. En el anexo E se encuentran algunos de los
modelos matemáticos más representativos. Se describen, en consecuencia, los
modelos matemáticos existentes para la restauración de audio,
posteriormente, en los procesos de modificación se señalarán cuáles son los
más empleados en los programas de edición gráfica de audio.
Modelos matemáticos para describir señales de audio:
• Modelos AR (auto-Regressive)
• Modelos de espacio de estado y filtros de Kalman
• Modelos sinusoidales
• Marcos bayesianos
• Transformada Wavelet continua
• Transformada Wavelet discontinua

206
Modelos matemáticos para detectar clicks:
• Modelos AR por bloques
• Filtros adaptados (matched filter)
• Técnicas bayesianas
• Técnicas Subbanda
• Empaquetado de muestras
Algoritmos para restaurar señales con clicks:
• Interpolación AR
• Técnicas espectrales
Modelos matemáticos para detectar scratches:
• Utilización de pulsos patrón
• Técnicas bayesianas: separación de señales
• Filtro adaptativo y sustracción

207
• Métodos espectrales de localización
Algoritmos para restaurar señales con scratches:
• Filtros adaptivos (matched filter)
• Técnicas Subbanda
• Empaquetado de muestras
Modelos matemáticos para degradaciones globales:
• Modificación espectral
• Métodos basados en la transformada Wavelet de la señal
• Métodos basados en la transformada Wavelet continua

208
Algoritmos para restaurar señales con degradaciones globales:
• Atenuación espectral
6.1.1. Procesos de modificación. Estos procesos tienen lugar después de

pasar la señal de audio analógica a digital, y elegir los procedimientos de
restauración para realizar en el programa de edición gráfico de audio digital. Es
importante recordar que cada programa define diferentes criterios y
parámetros para la evaluación de la señal de audio digital: identificación de
elementos espurios y reparación. En muchas aplicaciones el usuario es quien
define los parámetros, modelos y aproximaciones matemáticas para esta labor.
6.1.1.1. De-thumping. Como se señaló en el primer capítulo, los Thumps o

golpes, surgen por la aparición de largos pulsos contenidos en bajas
frecuencias que auditivamente alteran la señal de audio. Estos pulsos se
relacionan con la respuesta mecánica del sistema o mecanismo de playback a
una excitación anormal.
Además de las técnicas simples, como filtros pasa-altos, existen unos pocos
métodos con altos grados de complejidad para tratar este tipo de pulsos de
bajas frecuencias. Se denomina De-thumping al proceso de remoción de
thumps de un registro sonoro digital. El modelo que se observa en la figura 79,
ocupa las primeras posiciones en popularidad y corresponde al método
introducido por Vaseghi5. El argumento básico en el que se apoya este método
5
ESQUEL A, Paulo. Model-Based Analysis of Noisy Musical Recordings with application
to Audio Restoration. En: VASEGHI S, V. Algorithms of Restoration of Archived
Gramophone Recordings. Cambridge: Cambridge University, 1988.
209
es que todos los pulsos largos de baja frecuencia son idénticos y que sólo
varían en amplitud. Así, dado un modelo de un pulso corrupto, se logra
localizar otras ocurrencias de pulsos a través de altos valores del coeficiente de
cross-correlation, medido entre el modelo y la señal degradada.
Posteriormente, la eliminación del ruido se lleva a cabo sustrayendo un modelo
de amplitud escalado de la porción degradada de la señal, después de una
sincronización adecuada de tiempo.
Señal Restaurada
Señal + Pulso
- Interpolador
Ganancia
Filtro
detector + Detector
clicks
Pulso de
referencia
Retardo
Figura 79. Diagrama de bloques de-thumping.

Fuente: VASEGHI S, V. and FRAYLING-CORK, R. En: J. Audio Eng. Soc. Cambridge.
Vol. 40, No. 10 (Oct. – Sep. 1992); p. 791-801.
* Diseñada y traducida por: VALENCIA ZAPATA, Gustavo y RAMIREZ ECHEVERRI,
Nicolás
El click de alta amplitud que usualmente aparece en el inicio de un thump será

removido por el algoritmo de-clicking. En el modelo de la figura 79, se muestra
el diagrama de bloques que ilustra las fases del modelo que corresponden al
método De-thumping. Su principal limitante es la falta de potencia detectando
210
y suprimiendo pulsos cuyas formas varían con el tiempo o pulsos que se

superponen6.
Otro acercamiento a un modelo basado en la eliminación de thumps, plantea

que la señal de audio degradada es modelada como una mezcla de dos
procesos AR (Auto-Regressive) diferentes. Así, la restauración de la señal se
logra separando estos dos procesos. Los modelos AR de alto orden son usados
para adaptar la señal fundamental de audio y los modelos AR de bajo orden
para los pulsos y el click inicial es incorporado como parte del pulso. La
principal desventaja de la separación AR es su alta exigencia computacional.
Este método se ha desarrollado hasta el punto de permitir el surgimiento de
aplicaciones más eficientes que utilizan técnicas basadas en filtros de Kalman.
6.1.1.2. De-clicking. Los clicks son cortos estallidos al azar en el tiempo y

la amplitud. Se pueden percibir de manera aleatoria, como pequeños ticks de
ruido que pueden ocurrir en cualquier medio de grabación analógica. Las
perturbaciones son causadas, regularmente, por las imperfecciones en
pequeña escala en las ranuras de la pared de un disco. Otras causas de estas
imperfecciones pueden ser la inherente porosidad del material del medio,
sólidos que se adhieren a las ranuras de las paredes, o la presencia de rayones
superficiales. Se denomina De-clicking al proceso de remoción de clicks de un
registro sonoro digital.
En los modelos basados para la detección de clicks, pequeñas muestras de la

señal de audio fundamental son modeladas con un orden N de un proceso AR
6
to Audio Restoration. En: GODSILL. S. J. and RAYNER. P, W. Digital Audio Restoration
A Statistical Model Based Approach. London: Springer Verlag, 1988.
211
modelo. Además, el mecanismo de degradación asume la forma de la ecuación

6.1.
Y(n)= x(n) + i(n)d(n) (6.1)
Donde:
x(n): muestras de la señal de audio
i(n)d(n):componente de ruido
i(n): sucesión binaria de la presencia de ruido
El objetivo del algoritmo de detección de clicks es estimar la secuencia i(n) que

minimiza el porcentaje de error de detección y falsa alarma de clicks. La
magnitud de excitación del modelo AR es obtenida por vía de filtrado inverso y
comparada con un umbral adaptable. Las muestras de la excitación con valores
que exceden el umbral reflejan las muestras degradadas en la señal de audio.
El mejoramiento del desempeño del detector de clicks puede lograrse usando
un filtrado por comparación (match filter)7, alternativas de predicción lineal8 y
esquemas más elaborados de umbrales9. La supresión de ruido se logra
reemplazando las muestras corrompidas con otras que simulan la señal
fundamental. Esta tarea puede lograrse satisfactoriamente a través de los
métodos de interpolación AR. El de-clicking también puede llevarse a cabo por
7
ESQUEL A, Paulo, Op. Cit., p. 8.
8
to Audio Restoration. En: VASEGHI S, V. and RAYNER. J, W. Detection and
Suppression of Impulsive Noise in Speech Communication Systems. Proc. IEEE Int.
Conf. Acoustics, Speech, and Signal Processing. Vol. 137, No. 1 (Feb. – Mar. 1990); p.
38-46.
9
to Audio Restoration. En: ESQUEL A, Paulo and BISCAINHO. L, W. A Double-Threshold-
Based Approach to Impulsive Noise Detection in Audio Signals. in Proc. X European
Signal Processing Conf., Tampere. Vol. 4 (Sep. – Oct. 2000) p. 2041-2044.
212
técnicas bayesinanas y técnicas espectrales. En las aproximaciones

bayesianas, los modelos son utilizados para la señal fundamental y en los
procesos de ruido. Además, la detección y eliminación del clicks se lleva a cabo
dentro de una misma fase del proceso. Otros métodos para el proceso de De-
clicking incluyen los algoritmos de red neural10 (neural –network) y modelos
basados en técnicas de filtros adaptivos11. En el anexo E se exponen algunos
de estos diferentes métodos. En la figura 80 se puede observar el diagrama de
bloques con las fases del modelo basado en De-clicking por algoritmos AR.
6.1.1.3. De-hissing. El ruido de banda ancha o hiss es un ruido aleatorio

de fondo, es una forma de degradación común a todo sistema de medida
analógica, almacenamiento y sistemas magnetofónicos. En el caso de audio las
señales de ruido, que generalmente percibe el oyente como hiss, están
compuestas de ruidos en circuitos eléctricos, irregularidades en el medio de
almacenamiento y ruido ambiental de las condiciones externas de grabación.
10
to Audio Restoration. En: CZYZEWSKI, A. Learning Algorithms for Audio Signal
Enhancement, Part I: Neural Network Implementation for the Removal of Impulsive
Distortions. J. Audio Eng. Soc. Vol. 45, No. 10 (Oct. – Sep. 1997); p. 815–831.
11
to Audio Restoration. En: NIEDZWIECKI, M and CISOWSKI, K. Adaptive Scheme for
Elimination of Broadband Noise and Impulsive Disturbances from AR and ARMA
Signals. IEEE Trans. Signal Processing. Vol. 44, No. 3, ( Mar. – Apr. 1996) p. 528–537.
213
Señal + Ruido impulsivo Señal Restaurada

Interpolador
Modelo AR Indice de
muestras
corruptas
Filtrado Filtro Detector

inverso detector clicks
Figura 80. Diagrama de bloques de de-clicking por algoritmos AR.

Fuente: VASEGHI S, V. and FRAYLING-CORK, R. En: J. Audio Eng.
Soc. Cambridge. Vol. 40, No. 10 (Oct. – Sep. 1992); p. 791-801.
Nicolás
Es común a todas las formas de registro, usualmente aditivo e independiente

de la señal. Los estudios del De-hissing se han abordado a través de diferentes
connotaciones conceptuales. Quizás el método más común es la atenuación
espectral de corto tiempo STSA (Short-Time Spectral Attenuation) que tienen
origen en la exposición de-noising12. En la práctica, debido en general al
comportamiento no estacionario de las señales de audio, el método STSA
emplea un bloque de traslapo y adición esquemático del proceso. Además, las
transformaciones de tiempo en frecuencia y viceversa se llevan a cabo
mediante la transformada discreta de Fourier. En los métodos STSA, la
reducción del hiss se cumple sustrayendo un estimado del espectro de potencia
12
to Audio Restoration. En: BOLL. S, F. Suppression of Acoustic Noise in Speech Using
Spectral Subtraction. En: IEEE Trans. Acoustics, Speech, and Signal Processing. Vol.
ASSP- 27, No. 2 (Apr. – May. 1979) p. 113–120.
214
del ruido realizado de la observación del espectro de potencia de la señal

degradada. Esta estrategia es conocida con el nombre de Regla de supresión
por sustracción de espectro de potencia. Otras reglas de supresión
relacionadas incluyen la sustracción espectral de la magnitud y filtrado de
Wiener13. A continuación se ilustran las fases del proceso tradicional de
métodos STSA de-hissing en la figura 81.
Continuando con las clases de técnicas no paramétricas, el modelo de Wavelet

recibe mucha atención en la literatura atinente con la restauración de audio14.
En este método la señal de ruido es proyectado (mapeado) dentro de una
representación multi-resolución tiempo-frecuencia por vía de la transformada
discreta de Wavelet.
Además de las técnicas no paramétricas, existen sofisticados modelos

propuestos para el proceso de De-hissing en señales de audio. Por ejemplo, el
esquema del modelo AR para señales de audio que se ha mencionado, modelos
estáticos basados con técnicas que emplean modelos AR y ARMA (Auto
Regressive Moving-Average) que también han sido desarrollados para el
tratamiento del ruido de banda ancha y ruidos impulsivos15, esquemas de
filtros adaptivos para el tratamiento del ruido de banda ancha16 y modelos
13
14
to Audio Restoration. En: BERGER, J, COIFMAN, R and GOLDBERG. M, J. Removing
Noise from Music Using Local Trigonometric Bases and Wavelet Packets. J. Audio Eng.
Soc. Vol. 42, No. 10 (Oct. – Sep. 1994) p. 808–818.
15
16
Ibid, p. 18
215
híbridos que combinan diferentes esquemas no paramétricos17 o mezcla de no

paramétricos y paramétricos. Algunos de estos modelos pueden ser
consultados en el anexo E.
Estimación
de ruido
Reglas de
Análisis supresión
Señal + Ruido STFT
Síntesis
STFT
Señal Restaurada
Figura 81. Diagrama de bloques de de-hissing por STSA.

Fuente: P.J WOLFE. P, J and y GODSILL. S, J. Efficient Alternatives to the Ephraim and
Malah Suppression Rule for Audio Signal Enhancement. En: EURASIP Journal on
Applied Signal Processing – Special Issue on Digital Audio for Multimedia
Communications. Vol. 2003, No. 10 (Sept. – Oct. 2003) p. 1043–1051.
Nicolás
17
to Audio Restoration. En: S. B. JEBARA. S, B, BENAZZA-BENYAHIA, A and KHELIFA. A,
B. Reduction of Musical Noise Generated by Spectral Subtraction by CombiningWavelet
Packet Transform and Wiener Filtering. Proc. X European Signal Processing Conf.,
Tampere. Vol. 2 (Sept. – Oct. 2000).
216
6.1.1.4. De-scratching. Los scratches son producidos por arañazos o

roturas en la superficie de un disco. Son pulsos discontinuos de gran amplitud
en tiempo y en frecuencia, seguidos de una etapa transitoria de bajas
frecuencias que está asociada con la respuesta impulsiva del medio de
reproducción. Los scratches son pulsos transitorios de duración mayor que la
correspondiente a los clicks, aproximadamente de 20 ms. y con una proporción
relativamente alta de contenido de energía de baja frecuencia, pero exhibiendo
contenido frecuencial a lo largo de todo el espectro. Por otra parte, esta clase
de defectos es menos frecuente que los clicks. Mientras que puede haber
varias decenas de clicks por segundo, apenas se presenta un scratch en el
mismo intervalo de tiempo. En general, la señal que representa esta clase de
defectos puede dividirse en dos partes:
• Una parte inicial que consiste en una discontinuidad semejante a la que

se presenta en un ruido impulsivo de gran amplitud
• Una segunda parte está constituida por oscilaciones amortiguadas de

bajas frecuencias, de larga duración, asociadas con la respuesta
impulsiva del dispositivo reproductor
Los métodos para la detección de estos pulsos transitorios están basados en la

utilización de conjuntos de patrones de pulsos previamente organizados,
teniendo en cuenta las semejanzas que presentan los clicks y los scratches
entre sí: las técnicas bayesianas para la separación de señales (señal
fundamental y pulso transitorio), técnicas que combinan un filtro adaptivo con
un proceso de sustracción en el dominio temporal y técnicas espectrales18 son
los métodos para la detección. En el contexto de las técnicas bayesianas, se
puede formular el problema de supresión de los pulsos transitorios como un
18
217
asunto de separación de señales, adoptando la hipótesis general de que se

conoce la localización de los citados pulsos, es decir se supone que se sabe
distinguir entre bloques de señal que contienen un pulso de aquellos que no
están degradados por el defecto. Algunos de estos modelos y algoritmos para
la restaurar señales con scratches pueden ser consultados en el anexo E.
6.2. TECNOLOGÍAS DE SUSTITUCIÓN
Estas técnicas consisten en sustituir la señal de audio por una combinación

lineal, de señales elementales extraídas de un diccionario adaptado a cada tipo
de ruido. En el proceso se fijan límites de tolerancia para la calidad de la
representación, y el residuo (fragmentos de la señal) que no es posible incluir
en ella es precisamente el ruido que debe ser eliminado. En la figura 82 se
muestra un diagrama de bloques de esta tecnología.
Las sustituciones por combinaciones lineales intervienen generalmente en los

procesos no lineales, de los que se destacarán tres métodos:
• Selección de la mejor base ortogonal, "Best Orthogonal Basis", de R.

Coifman, Y. Meyer y V. Wickerhauser
• Búsqueda de bases, "Basis Pursuit", de S. Chen y D. Donoho
• " Matching Pursuit", de S. Mallat y Z. Zhang

218
Diccionario
de señales
elementales
Ruido
Señal + Ruido Selección de los

mejores elementos
del diccionario
Señal Restaurada
Figura 82. Diagrama de bloques de tecnología de sustitución.

registros sonoros: tecnologías de sustitución. [en linea]. Oviedo: Universidad de
Oviedo, s.f. <http://coco.ccu.uniovi.es/brahms/sustitucion/sustitucion.htm>
En el anexo E se muestran los algoritmos de restauración por técnicas de

sustitución.
219
7. FORMATOS Y MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL
7.1. FORMATOS DE ARCHIVO DE AUDIO DIGITAL
Un formato de archivo de audio es el mecanismo mediante el cual se

almacenan datos de audio en un computador. Se distingue por el grupo de tres
letras, llamado Extensión, que aparecen después del punto posterior del
nombre del archivo. La información contenida en un archivo de audio digital no
es más que un arreglo de bytes. Se define un byte como la unidad básica de
almacenamiento de información (1 byte corresponde a 8 bits). De acuerdo con
la longitud del código ésta puede ser de 8, 16, 20 ó 24 bits, como se
argumentó en el capítulo 4. La cantidad de formatos de este tipo es muy
numerosa porque cada sistema operativo y, a veces cada programa, tiene
preferencia sobre algunos tipos de formatos, es decir, este tipo de formatos se
ha privilegiado más que otros. Las diferencias de tales formatos radican
principalmente en el tipo de compresión utilizado, en sus características
multicanal y en la forma de ordenar las muestras. Por ejemplo, para sonido
estéreo, algunos formatos prefieren guardar cada canal de forma
independiente, mientras que otros optan por almacenar muestras alternas de
cada una de las pistas. Todos los formatos poseen unos bits de encabezado
que indican la resolución, la frecuencia de muestreo y el número de canales. Lo
que sí se puede predeterminar es que las características como el tamaño, el
contenido y la ordenación, varían sustancialmente de un formato a otro.
También hay archivos que no poseen estos bits, como ejemplo se puede citar
el caso de las extensiones PCM, en los que el usuario es quien define la
220
resolución, la frecuencia de muestreo y el número de canales. Los programas

de edición y manipulación de audio digital, que se abordan en el capítulo 5,
ofrecen normalmente opciones para cargar y salvar formatos diferentes. En
este caso conviene tener en cuenta que dos archivos no comprimidos, que
presenten el mismo fonograma y tengan la misma resolución y frecuencia de
muestreo, contendrán la misma información (aunque organizada de diversas
formas) y el sonido será exactamente igual, independiente del formato. Para
propósitos de restauración de audio los archivos maestros no deberán tener
ningún tipo de compresión y, a partir de ellos, se efectuarán los procesos de
edición y compresión. Hay dos grupos especializados de formatos de archivos
de audio, aunque existen otros formatos de archivos que no hacen parte de
estos grupos.
• Formatos sin pérdidas (Lossless), como WAV, PCM, FLAC, AU, entre
otros
• Formatos de compresión con pérdidas (Lossy), como MP3, Ogg Vorbis,

WMA, AAC, entre otros
Los archivos con formato de compresión lossy se basan en modelos

psicoacústicos, que excluyen sonidos que los humanos no alcanzan oír. Un
formato de audio lossless como TTA (True Audio) proporciona una compresión
aproximadamente de 1:2; pero la relación de datos-calidad no se pierde con la
compresión. Cuando el archivo es descomprimido, los datos serán idénticos al
original. Los codecs de audio lossless son una excelente alternativa para
almacenar la música con la mejor calidad.
Si se quiere rigurosidad conceptual en el tema de la restauración de audio, se

debe concluir que ninguno de los formatos de compresión lossy ofrece las
garantías y la calidad de reproducción, por lo que resulta vano e infructuoso
221
cualquier intento por llevar a cabo una excelente restauración digital sobre
estos archivos comprimidos. Para una correcta restauración digital de audio,
los archivos sometidos a los algoritmos de restauración deben estar libres de
compresión con pérdidas. En el anexo D se describirán los formatos de
compresión con pérdida o lossy.
Como se expuso en el capítulo 4, el sistema PCM empezó utilizando 14 bits

para codificar cada muestra, pero se estandarizó finalmente en 16 bits; sin
embargo, es posible la codificación con un número mayor de bits 20 y 24 bits,
con lo que se consigue mayor calidad del sonido (Audio profesional). También
es posible incrementar la cantidad de muestras, aumentando la frecuencia de
muestreo desde 44.100, 48.000, 96.000 y 192.000 Hz. Después de obtener el
archivo PCM, una vez completado el proceso de captura de la señal de audio
analógico, se almacena en el computador como archivo maestro que contiene
la información más fiel del audio original. Este archivo maestro es procesado
con diferentes algoritmos de compresión para la implementación en Internet,
multimedia o video, entre otros.
7.1.1. Tamaños en el audio digital. Como se concluyó anteriormente: a

mayores longitudes de código y mayores frecuencias de muestreo, se obtendrá
una representación más fiel de la señal de audio analógica capturada, pero
esto tiene varios costos. El primero, es contar con un excelente conversor de
audio y el segundo es que se debe contar con un potente computador que
administre la gestión de captura y almacenamiento. El computador debe
poseer suficiente espacio en disco duro para almacenar los archivos PCM.
Para saber cuánto espacio en disco duro ocuparía un segundo de audio

estéreo, con una longitud de código de 16 bits y una frecuencia de muestreo
de 44.100 Hz, se recurre al siguiente cálculo:
222
En un audio digital 16 bits, cada muestra ocupa dos bytes (recuérdese que un
byte equivale a 8 bits). Si la frecuencia de muestreo es 44.100 Hz, significa
que cada segundo requiere de 44.100 muestras. Además, si el audio es
estéreo, utiliza dos canales, lo que significa que dichas muestras se ven
duplicadas.
Así que:
2 bytes/muestra x 44.100 muestras/segundo x 2 (canales) = 176.400
bytes/segundo o 172,2 Kb/s.
En conclusión, un segundo de audio, bajo estos parámetros, ocuparía en disco

duro 172.2 Kb. Si para el mismo segundo de audio en estéreo se cambia la
longitud del código por 24 bits y la frecuencia de muestreo por 192.000 Hz, el
espacio que ocuparía en disco sería:
En un audio digital de 24 bits, cada muestra ocupa tres bytes. Si la frecuencia

de muestreo es 192.000 Hz, significa que cada segundo requiere de 192.000
muestras. Pero si el audio es estéreo, utiliza dos canales, y dichas muestras se
ven duplicadas.
Así que:
3 bytes/muestra x 192.000 muestras/segundo x 2 (canales) = 1’152.000
bytes/segundo o 1125 Kb/s o 1.098 Mb/s.
En conclusión, un segundo de audio, bajo los anteriores parámetros, ocuparía

en disco duro 1.098 Mb.
223
De ahí, entonces, que si se desea trabajar con un audio profesional, se

requiere un computador de gran capacidad en disco duro, además de las
condiciones mínimas inherentes al proceso.
7.1.2. Compresión de archivos de audio. Por lo evidenciado en el

apartado anterior, cuando se vio que el audio profesional alcanza grandes
tamaños en Mb (megabytes), se hizo necesario buscar formas de compresión
con la capacidad de reducir el tamaño de la información, con el fin de ahorrar
espacio en el medio de almacenamiento. Esto se hace bajo el supuesto de que
tienen la capacidad de comprimirse y descomprimirse en tiempo real.
Inmediatamente debe aclararse que no pueden confundirse con la compresión
de archivos en diferido, como el popular ZIP (Zone Information Protocol) que
son de codificación entrópica, independiente del tipo de información, que
también puede aplicarse en archivos de audio, aunque no son formatos de
compresión de audio. La codificación de fuente es la aplicada para audio, en la
que se aprovechan las características de la fuente para producir una
representación comprimida adecuada
La teoría de sistemas de algoritmos matemáticos involucrados en cualquier

sistema de compresión es muy significativa y extensa y puede abordarse, sin
ser agotado, un curso completo en una Facultad de Ingeniería, lo que implica
que no está dentro de los propósitos de este trabajo. Sin embargo, se
mencionarán algunas ideas relacionadas con el tema. Muchos de estos
sistemas son independientes de los dos grupos mencionados anteriormente:
lossless y lossy, de forma que un mismo formato de archivo puede soportar
varios métodos de compresión.
224
Otras codificaciones de fuente para audio, además de PCM, son:
• DPCM. (PCM Diferencial). Se codifican las diferencias de una

muestra con la anterior, su deficiencia está representada en el
hecho de que cada muestra contiene un error, que se acumula y
sólo se va corrigiendo a través de técnicas de predicción.
• ADPCM. (PCM Diferencial Adaptativo). Se usan menos bits para

codificar las muestras que son poco diferentes. Se reduce el
número de bits de la señal (por ejemplo a 4 bits) tratando
únicamente las diferencias entre una muestra y la siguiente. Se
intuye que este proceso provoca una inevitable degradación de la
señal ya que el sistema es incapaz de representar saltos grandes
de amplitud entre dos muestras.
• APC. (Codificación Predictiva Adaptativa). Las predicciones de los

valores anteriores se hacen de forma adaptativa, en función de
las características de la señal.
• LPC. (Codificación Predictiva Lineal). En lugar de tomar muestras

de la señal, se analizan las características de la forma de onda y
se envían para que la señal pueda ser “recreada” en el destino.
Normalmente para voz.
• Perceptual Coding. (Codificación basada en la percepción):

como en LPC y derivados, pero transmitiendo sólo las
características perceptibles al oído humano. Se tiene en cuenta la
sensitividad del oído y el enmascaramiento de frecuencias.
225
Las codificaciones Ley-µ y Ley-A (utilizados en telefonía), usan un sistema de

codificación no lineal que permite una resolución de 8 bits, pero ofrece una
calidad sonora y un rango dinámico próximos a los obtenidos con 14 bits.
Algunos de estos sistemas de codificación se ven favorecidos por la presencia

de hardware especializado, como puede ser la inclusión de chips DSP en los
conversores (tarjeta de audio), mientras que otros funcionan perfectamente
por software.
7.1.2.1. Compresión y descompresion de Datos. Se adquieren usando

un tipo de algoritmo que permite comprimir y reconstruir exactamente los
datos originales a partir de los datos comprimidos. Estos algoritmos son
utilizados en programas con herramientas de compresión como el popular
archivo de formato ZIP y otros formatos como Stuffit (algoritmo de compresión
estándar de archivos para MAC), RAR (extensión de archivos comprimidos) y
7z (formato con niveles elevados de compresión).
Comparada con la compresión de imágenes lossless, la compresión de audio

lossless no es ampliamente usada. Aunque esto ha ido cambiando con el uso
frecuente de formatos lossless como FLAC (Free Lossless Audio Codec). Los
usuarios primarios de la compresión lossless son ingenieros de audio,
audiophiles (individuos que tienen un alto interés en el audio de alta calidad) y
aquellos consumidores que desean preservar la máxima calidad de sus
archivos de audio y que, además, desprecian las técnicas de compresión lossy
como Ogg Vorbis y MP3, por la pérdida de calidad.
Una primera razón para implementar la compresión lossless, es que la inmensa

mayoría de grabaciones está fundada en sonidos naturales, grabados en el
226
mundo real, de tal manera que los datos no son fácilmente comprimibles.
Hasta el peor sonido generado por un computador puede contener formas de
ondas que presentan un desafío a muchos algoritmos de compresión, puesto
que los valores de las muestras de audio cambian muy rápido, de esta manera
los algoritmos genéricos de compresión no alcanzan la calidad requerida para
audio. Estos factores se deben, fundamentalmente, a la naturaleza del audio
en su forma de onda que, generalmente, resulta difícil de simplificar sin la
conversión de la información de frecuencia y amplitud, como el realizado por el
oído humano. Este aspecto fue analizado en los capítulos 1 y 4, en los que se
indican las propiedades de una onda de audio y los procedimientos de captura
de una señal de audio analógico.
A continuación se describen los formatos de audio lossless más representativos

y válidos antes de iniciar un proceso de restauración digital.
IFF. (Interchange File Format) Es un formato de archivo genérico,

originalmente introducido por la compañía Electronics Arts, en 1985, para
facilitar la transferencia de datos entre programas de diferentes compañías.
RIFF. (Resourse Interchange File Format) RIFF o Recursos de Intercambio de

Formatos de Archivos, es un formato genérico que está muy extendido en
plataformas Apple. Se fundamenta en el formato IFF, que permite almacenar la
información en segmentos. Este fue introducido en 1991 por Microsoft e IBM.
Las aplicaciones principales de formatos de audio de Microsoft son AVI (Audio

Video Interleave) y WAV, que utilizan formatos de base RIFF.
227
El formato WAV se almacena dentro de un archivo con formato RIFF,

definiendo unos segmentos concretos que puede contener. Por lo tanto, es
adecuado analizar el formato general de un archivo RIFF y qué segmentos se
definen para los archivos WAV.
WAV. (Waveform Audio File Format), Es un formato estándar para el

almacenamiento de audio en el computador, y fue desarrollado por Microsoft e
IBM. Apareció por primera vez para el ambiente Windows en el año 1995. Con
el paso del tiempo, se convirtió en un estándar de grabación para música de
CDs. Su soporte de reproducción es uno de los más importantes, pues funciona
en cualquier aplicación Windows y en equipos domésticos comunes que
incorporan reproductor de CDs.
El WAV es una variante del formato RIFF que emplea un método de

almacenamiento de datos en trozos, parecido a los formatos IFF y AIFF, usados
en los ordenadores Macintosh. No obstante, un archivo WAV puede tener audio
comprimido con cualquier codec, lo que hace que el formato de datos de audio
más común sea el PCM. Desde entonces PCM usa una compresión sin pérdidas
(método de almacenamiento lossless) y conserva todas las muestras de un
audio. Los profesionales o expertos en audio pueden y suelen utilizar el
formato WAV para una máxima calidad de audio.
El formato WAV también puede ser editado y manipulado con relativa facilidad
usando programas especializados. Frente al file sharing (actividad que consiste
en permitir la viabilidad de los archivos para que los usuarios puedan
descargarlos a través de Internet). El WAV ha declinado en popularidad,
principalmente por causa de su naturaleza no comprimida. Hoy en día es más
frecuente la implementación de formatos lossy, como el MP3, Ogg Vorbis y
AAC (Advanced Audio Coding) para el almacenamiento y transferencia de
228
audio, ya que los archivos son de muy pequeño tamaño, lo que facilita una
rápida transferencia sobre Internet y porque las grandes colecciones de
archivos ocupan muy poco espacio en un disco duro.
Existen también otros codecs más eficientes: como Monkey’s Audio, FLAC, TTA
o Apple Lossless.
PCM. (Modulación por Código de Pulsos) El método más común para la

creación de audio digital es PCM. El audio digital PCM es tradicionalmente
muestreado a 44.100 Hz para las grabaciones en CD, o superiores para
aplicaciones de audio profesional. Las más altas frecuencias de muestreo para
grabación profesional son 88.200, 96.000 y 192.000 Hz. La amplitud de cada
muestra es un valor numérico que representa un arreglo de bits. Refiérase al
capítulo 4.
TTA. (True Audio) Es un codec gratuito de audio de tiempo real, basado en el

pronóstico de filtros adaptivos, los que demuestran resultados satisfactorios si
se comparan con la mayoría de filtros analógicos modernos. Sus características
más relevantes son:
• Una compresión de datos lossleess, mínimo del 30%
• Algoritmos de codificación y decodificación en tiempo real
• Velocidad de operación rápida con mínimos requerimientos de

sistema
• Puede ser compilado y ejecutable en varias plataformas diferentes

229
• Es gratuito, con código abierto y documentación
TTA realiza la compresión lossless en multicanal de 8, 16 y 24 bits de datos de

archivos de entrada WAV no comprimidos. La proporción de compresión de TTA
depende del tipo de archivo musical para comprimir. Luego del proceso de
compresión el tamaño será, generalmente, entre un 30 y un 70% del original.
El formato TTA soporta dos etiquetas de información ID3v1 e ID3v2.
ID3 es un formato de etiqueta para MP3. Contiene metadata (información en

datos de datos) como el título, nombre del artista, álbum, número de pista,
entre otros, para adicionar a los archivos MP3. ID3 posee varias versiones.
FLAC. (Free Lossless Audio Codec). Es un codec de audio popular. A diferencia

de los codecs lossy, como MP3 y AAC, éste no quita ninguna información del
audio y es conveniente para realizar playbacks continuos y para archivar
colecciones de audio. El formato FLAC es común y bien soportado por muchos
software y hardware de audio.
FLAC se diferencia de los algoritmos generales de codificación entrópica como,

ZIP y RAR, en que está especialmente diseñado para un empaquetado eficiente
de datos de audio. Mientras ZIP, por ejemplo, puede comprimir la calidad de
un archivo CD de audio en un 20 al 40%, FlAC realiza una compresión del 30 al
70%.
FLAC se ha convertido en el formato lossless preferido para intercambiar

música en línea. Este es un archivo de pequeño tamaño y diferente al MP3,
que ofrece asegurar la fidelidad más alta de la fuente del material, lo que
230
permite la comercialización de música en vivo. Igualmente, es popular en

formatos de archivo para usuarios de CD’s y otros medios, que desean
preservar sus invaluables colecciones de audio. Si el medio original se pierde,
daña o cae en desuso, una copia FLAC de las pistas de audio original asegura
que un duplicado exacto de los datos sea recuperado en cualquier momento.
AU. (Audio para Unix). El formato AU se utiliza para archivos de sonido con
sistema Unix de Sun Microsystems & NeXT. La extensión AU también funciona
como estándar acústico para el lenguaje de programación JAVA. Su estructura
es muy sencilla. Las razones de compresión que ofrece son pequeñas y destaca
por su soporte de longitudes de muestras muy altas comparadas con otros
formatos (32 y 64 bits).
Se compone de tres secciones:
• Una cabecera, en la que se describe la codificación de audio

utilizada
• Un campo de longitud variable para almacenar otro tipo de

información como texto en formato ASCII
• El conjunto de datos de audio
Monkey’s. Es un codec de compresión diferente de los métodos que, como

MP3, Ogg Vorbis, o AAC, permanentemente descartan datos para salvar
espacio. Monkey’s Audio comprime de una manera matemática perfecta,
creando copias bit a bit. Por consiguiente, un archivo comprimido por Monkey’s
Audio siempre sonará de la misma manera que el archivo fuente. La extensión
de un archivo Monkey’s Audio es APE.
231
7.2. MEDIOS DE ALMACENAMIENTO DE AUDIO DIGITAL
Se presentan, a continuación, los formatos de almacenamiento de audio digital

más utilizados, además de sus características técnicas más relevantes.
7.2.1. ADAT. (Alesis Digital Audio Tape) Este medio fue introducido en
1991. Graba simultáneamente ocho pistas de audio en una, sobre una cinta
magnética de Super VHS, cinta similar a la utilizada por los usuarios de VCR’s
(Video Cassette Record).
Se han producido muchas versiones de reproductores. La primera generación

de máquinas ADAT usó 16 bits de longitud de código. Una versión más
moderna soportaba 20 bits de longitud de código. Ambas máquinas tenían la
capacidad de muestrear a unas frecuencias de 44.100 y 48.000 Hz. El ADAT es
considerado como un formato de audio profesional y, mientras es reemplazado
por el computer-based DAW, aún es ampliamente utilizado en la industria de
grabación. En la figura 83 a) se ilustra un casete ADAT.
232
Aa) Ab) Ac)
Figura 83. Medios de almacenamiento a) ADAT, b) DAT y c) DDS.

Fuente. Audio formats. ADAT Audio Tape. [en linea]. s.l.: tapeonline, 2005
<http://www.tapeonline.com/store/product.asp?dept%5Fid=2010&pf%5Fid=AHP%2D
ADAT45> [consulta: 25 May. 2005]
Fuente. SCHOENHERR. E, Steven. Audio formats. The Digital Revolution. [en linea].
s.l.: SCHOENHERR. E, Steven, 2004
<http://history.acusd.edu/gen/recording/images2/dat01.GIF> [consulta: 25 May.
2005]
Fuente. Audio formats. Electronics: DDS [en linea]. s.l.: Amazon, 2005
7.2.2. DAT. (Digital Audio Tape) La cinta de audio digital (DAT o R-DAT) es
un medio de grabación y reproducción de audio introducido por Sony en 1987.
En apariencia, es muy similar al casete de audio compacto y, como su nombre
sugiere, la grabación es digital. Este sistema digitaliza el sonido con muy alta
calidad de 32.000, 44.000 ó 48.000 Hz, y lo almacena sin compresión de datos
en una cinta magnética. Esto significa que la señal de entrada es
completamente retenida. Si una fuente de audio digital es copiada en un DAT,
su reproducción será una copia exacta de la fuente original, diferente de lo que
ocurre en otros formatos digitales, como DCC o MiniDisc, que utilizan
compresión con pérdida lossy. En la figura 83 b) se ilustra un casete DAT.
La tecnología de DAT está basada en un porcentaje muy alto en grabadores de

video, usando cabezas giratorias y escaneo helicoidal para grabar los datos.
233
Esto evita que el DAT pueda ser editado físicamente, como sí ocurre con el
ProDigi, DASH, o cintas de grabación analógicas.
Los estándares del DAT permiten cuatro posibilidades que se observan en la

tabla 6.
Tabla 6. Estándares de grabación de DAT.
Frecuencia Longitud del

Opciones de Muestreo (Hz) Código (Bits)
1 32.000 12
2 32.000 16
3 44.100 16
4 48.000 16
Fuente: Audio storage. Digital audio tape. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Digital_Audio_Tape> [consulta: 30 May. 2005]
Algunos grabadores trabajan fuera de las especificaciones, con frecuencias de

muestreo de 96.000 Hz y longitud de código de 24 bits. Los DAT soportan dos
canales estéreos en todas las posibilidades de grabación, pero el estándar R-
DAT soporta cuatro canales de grabación a 32.000 Hz.
234
7.2.3. DDS. (Digital Data Storage) El almacenamiento de datos digitales

DDS representa un formato para guardar y hacer copias de seguridad de datos
procedentes de un computador a un DAT, el cual fue originalmente creado por
CD-quality audio recording. En 1989, Sony y Hewlett Packard definieron el
formato DDS para el almacenamiento usando cartuchos de DAT. Las cintas que
conforman un DDS pueden ser reproducidas por cualquier máquina DAT o
DDS. Sin embargo, una máquina DDS no puede reproducir el audio
almacenado en un cartucho DAT. En la figura 83 c) se ilustra un casete DDS.
DDS usa cintas de 4 milímetros de ancho e inicialmente las cintas eran de 60 a

90 m. de largo. En versiones posteriores los avances tecnológicos de los
materiales han permitido aumentar significativamente la longitud. Una cinta
DDS implementa un escaneo helicoidal para grabar como si se tratara del
mismo proceso usado para un grabador de video casete (VCR). Son dos
cabezas de lectura y dos de escritura. Las cabezas lectoras verifican los datos
que han sido grabados y, si hay errores, las cabezas de escrituras vuelven a
escribir los datos. Un cartucho DDS debe ser remplazado después de 2.000
reproducciones o 100 grabaciones. Existen 5 categorías del formato DDS, que
se presentan en la tabla 7.
7.2.4. DASH. (Digital Audio Stationary Head) Fue un formato de cinta digital
de audio usando open reels (carretes de video o audio abiertos) con capacidad
de grabar 8, 16, 24 o más canales de audio en 1” ó ½” de cinta. Los datos son
grabados linealmente en una cinta, con una cabeza grabadora estacionaria,
proceso opuesto al del formato DAT, en el que los datos son grabados
helicoidalmente con una cabeza giratoria.
Los datos de audio se ponen como PCM lineal, con fuertes interrupciones de
corrección de error, permitiendo que la cinta sea físicamente editada, como por
235
ejemplo para cortar, empalmar y reproducir sin ningún tipo de pérdida en la

señal. En la figura 84 se ilustra una cinta DASH.
Tabla 7. Categorías de formatos DDS.
Formato Fecha Capacidad (GB) Capacidad (GB) Longitud Velocidad

sin con (m) (MB/s)
compresión compresión
DDS-1 1989 2.0 2.6 60 0.6
DDS-2 1993 4.0 8 120 0.6
DDS-3 1996 12.0 24 125 1.1
DDS-4 1999 20.0 40 150 2.4
DAT 72 2003 36.0 72 170 3.6
Fuente: Audio storage. Digital data storage. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Digital_Data_Storage> [consulta: 30 May. 2005]
Figura 84. Formato DASH.

Fuente. Audio formats. All blank media. [en linea]. s.l.: P Dogra & Sons, 2005
<http://www.pdograandsons.sonydealer.co.uk/default.asp?qsid=8122>
236
7.2.5. DCC. (Digital Compact Cassette) El casete digital compacto fue un

formato de audio de corta vida, creado por Phillips en los años 90’s. Concebido
para competir con el formato MD (MiniDisc). A diferencia del DAT o el CD
Audio, el DCC utiliza un sistema llamado PASC (Precision Adaptative Sub
Coding) o Subcodificación de Precisión Adaptativa que, por no grabar la
información de las frecuencias que no es capaz de percibir el oído humano
normal, permite almacenar más minutos de música en menos espacio. Este
tipo de compresión tiene una relación de 4:1 y con un esquema muy similar al
MPEG-1.
El DCC tiene la misma forma de los casetes estándar de audio compacto

analógico, de manera que sus reproductores puedan aceptar ambos tipos de
cintas. El objetivo de la creación del DCC era proporcionar compatibilidad, para
que los usuarios pudieran adoptar el formato digital y no hacer obsoletas las
colecciones de cintas analógicas.
Un DCC es un multi-track stationary-head recorder (una cabeza de grabación

estacionaria multi-pista). A diferencia de una cabeza rotatoria o un grabador
de escaneo helicoidal, como un DAT o VCR, donde la cabeza tiene un
movimiento relativo a la cinta, las cabezas son fijas (así, sólo la cinta está en
movimiento). La capacidad de información de un DCC es mucho menor que la
de un DAT. DCC salió del mercado en 1996.
7.2.6. MD. (MiniDisc) Es un disco que sirve para almacenar cualquier dato,
usualmente audio. Fue introducido al mercado por Sony en 1992. Junto con el
sistema DCC, el MD tuvo como objetivo central sustituir los casetes de audio
compacto analógico. Su tamaño físico es de 3.5”, y en él se pueden almacenar
70 minutos de música. Del mismo modo que el DCC, utiliza un sistema de
compresión de datos, llamado ATRAC (Adaptative Transform Acoustic Coding)
237
o Codificación Acústica de Transformación Adaptativa, que le permite ahorrar

espacio sacrificando una pequeña pérdida de calidad. En la figura 85 se ilustra
un disco MD.
Figura 85. Disco MD.

Fuente. Audio formats. Audio Recordable Media. [en linea]. s.l.: Cunnings recording
associates, 2005 <http://www.cunnings.co.uk/product/audiorecmedia/index.html>
7.2.7. CD. (Compact Disc) Es un disco óptico usado para almacenar datos,
originalmente desarrollado para audio digital. Un disco compacto estándar,
nombrado a menudo como un CD de audio, para diferenciarlo de las otras
variantes que se mencionan a continuación, almacena datos de audio en un
formato que cumple con los estándares del libro rojo (red book). Un CD de
audio consiste en varias pistas de audio estéreo almacenadas, usando una
codificación PCM con longitud de código de 16 bits y una frecuencia de
muestreo de 44.100 Hz. La mayoría de los discos compactos tiene un diámetro
de 120 mm. o 80 mm. diseñado para soportar 74 minutos de audio, pero en la
práctica almacenan un poco más. En la figura 86 se ilustra un CD.
238
Figura 86. Formato CD.

Fuente. Audio formats. Compact disc. [en linea]. s.l.: FreeFoto, 2005
<http://www.freefoto.co.uk/preview.jsp?id=11-12-9> [consulta: 25 May. 2005]
La tecnología del compact disc fue adoptada posteriormente para ser utilizada
como dispositivo de almacenamiento de datos, comúnmente conocida como
CD-ROM.
7.2.8. CD-ROM. (Compact Disc Real-Only Memory) Es un medio óptico de

almacenamiento de datos que emplea el mismo formato y dimensiones físicas
de un CD de audio, la cual es legible por un computador que posee una unidad
de CD-ROM. Un CD-ROM es un disco plano de plástico con información digital
puesta en algún código en éste, en una espiral desde el centro al límite del
borde externo. El CD-ROM fue establecido en 1985 por Sony y Philips, aunque
Microsoft y Apple, son los máximos exponentes de la promoción de CD-ROMs.
En general, los CDs de audio son diferentes de los CD-ROMs, pues un
reproductor de CDs (CD player) no puede leer y reproducir un CD-ROM de
datos, aunque las unidades de CD-ROM, generalmente, pueden leer y
reproducir los CDs de audio. Es posible producir CDs compuestos que
contengan datos y audio con la posibilidad de escuchar el último en un
239
reproductor de CDs, mientras que los datos (posiblemente videos y audio)

pueden ser vistos y escuchados en un computador. Un CD-ROM estándar
puede almacenar aproximadamente 650-700 Megabytes de datos.
Los CD-ROMs son leídos usando unidades lectoras de CD-ROM, equipo

periférico común en los computadores de hoy en día. En caso de requerir
grabación (burning), son empleados los CD-Burners, conocidos como
quemadores de CD.
7.2.9. CD-R. (Compact Disc-Recordable) Es un disco óptico, construido de

policarbonato, al igual que el CD y el CD-ROM, y que emplea el mismo
formato y dimensiones físicas de un CD de audio, que es principalmente usado
para el almacenamiento de datos o música. Sin embargo, a diferencia de un
CD convencional, en un CD-R el núcleo es de fibra sintética en lugar de metal.
Un CD-R estándar tiene la capacidad de almacenar 74 minutos de audio o 650

MB de datos. Los CD-Rs no convencionales tienen capacidades de 80 minutos
o 703 Mb, los cuales exceden las tolerancias especificadas por el libro naranja
de estándares para CD-R (Orange Book). La gran mayoría de CD-Rs en el
mercado posee esta última capacidad. Existen también capacidades de 90
minutos o 790 Mb y 99 minutos o 870 MB.
7.2.10. CD-RW. (Compact Disc Rewritable) Es una versión regrabable del

CD-ROM en la que se puede grabar y regrabar datos varias veces. Un CD-ROM
tiene la información almacenada de una manera permanente en su capa
reflejante de aluminio, pero un CD-RW posee una capa reflejante de aluminio
adicional llamada Recubrimiento de cambio de fase, que permite una sobre-
escritura de información. Su capacidad estándar es de 650 MB, aunque en el
240
mercado es más común encontrarlos de 700 MB. Un CD-RW tiene una

capacidad de sobre escritura cercana a las 1.000 veces. Este factor depende,
en última instancia, de cada fabricante, lo que explica sus múltiples
variaciones.
7.2.11. CD+G. (Compact Disc Graphics) Es un CD de audio que contiene

datos gráficos adicionales a los de audio. Este disco puede ser reproducido en
un CD player convencional. Cuando es reproducido en un CD+G player, puede
observarse señales gráficas como las proporcionadas por un video-juego o
ambientación musical. Es necesario conectar el CD+G player a un receptor de
video, como un TV, para lograr el propósito señalado.
El CD+G es utilizado, regularmente, para consolas de video-juegos, como por

ejemplo Sega CD, Sega Saturn y la Atari Jaguar CD.
7.2.12. CD-i. (Compact Disc Interactive) Regido por los estándares del
libro verde (Green Book), fue un formato multimedia comercializado en 1991.
Fue creado por Philips y en menor grado por Sony, aunque sólo Philips lo
comercializó. El CD-I es capaz de almacenar 19 horas de audio, 7.500
imágenes o 72 minutos de video. Fue implementado para video-juegos con la
exclusividad de Nintendo. Su venta se extendió hasta 1998 y luego perdió
mucha popularidad.
241
7.2.13. UMD. (Universal Media Disc) Es un disco óptico desarrollado por

Sony para usar en consolas de PlayStation portátiles. Este puede almacenar
1.8 GB de datos, los cuales incluyen juegos, películas o música. Sony no
comercializó los UMD vírgenes para evitar la copia ilegal. En la figura 87 se
ilustra un UMD.
Figura 87. Formato UMD.

Fuente: Audio storage. Universal media disc. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Universal_Media_Disc> [consulta: 30 May. 2005]
7.2.14. DD-CD. (Double Density Compact Disc) Es un CD basado en

tecnología óptica desarrollado por Sony. Su capacidad de almacenamiento es
de 1.3 GB. En a figura 88 se ilustra un DD-CD.
242
Figura 88. Formato DD-CD.

Fuente: Audio storage. Sony CD-R Double Density. [en linea]. s.l. Bulldog, 2005.
<http://www.bdog.fi/cgi-bin/netstore/tuote.pl?tuote=067140754897>
7.2.15. MultiLevel. Es un CD basado en tecnología óptica, desarrollado por

Calimetrics. Este triplica la capacidad de 650 MB de un CD y la velocidad nativa
de transferencia de datos de las unidades ópticas (drives) estándar.
7.2.16. MO. (Magneto Optical Disc) Es un formato de almacenamiento que

combina tecnología óptica y magnética. Su tamaño es de 3.5” ó 5.25”, con
capacidades de almacenamiento de 128/230/540/640 MB o
1.3/2.6/4.1/4.8/5.2 GB. Para su reproducción es necesario un Magneto-optical
drive (reproductor magnético –óptico). En la figura 89 se ilustra un disco MO.
El disco regrabable MD usa tecnología magneto óptica para la grabación de

datos.
243
Figura 89. Formato MO.

Fuente: Audio storage. Magneto-optical drive. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/Magneto-optical> [consulta: 30 May. 2005]
7.2.17. SA. (Silicon Audio) Formato desarrollado por NEC, que consta de
circuitos integrados (chips de silicio) donde es posible almacenar audio digital
con la calidad de un CD audio y tiene una capacidad hasta 192 minutos. Su
forma física es similar a la de una tarjeta de crédito.
Existen dos tipos de SA: la primera, RAM (Random Access Memory) en la que
se puede escuchar y grabar audio; la segunda, ROM (Read Only Memory) que
sólo permite escuchar audio. En la figura 90 se ilustra un SA.
244
Figura 90. Formato SA.

Fuente: Audio storage. Silicon Audio. [en linea]. s.l. Minidisc.org, 2005.
<http://www.minidisc.org/main_chip_music.html> [consulta: 30 May. 2005]
7.2.18. DVD. (Digital Versatile Disc) Es un disco óptico para el

almacenamiento de datos, generalmente empleado para películas con una alta
calidad de video y sonido. Posee las mismas dimensiones de un CD de audio,
aunque con pistas más finas, lo que proporciona una mayor densidad y
capacidad de almacenamiento en su superficie.
En los inicios de los 90’s había dos estándares de almacenamiento de alta

densidad óptica en desarrollo; uno, el MMCD (Disco Compacto Multimedia),
respaldado por Philips y Sony, y el otro, el SD (Super Disco) respaldado por
Toshiba, Time-Warner, Matsushita Electric, Hitachi, Mitsubishi Electric, Pioneer,
Thomson y JVC. IBM realizó esfuerzos para unir todas estas compañías para el
desarrollo de un solo estándar, que arrojó como resultado el formato DVD,
comercializado en 1996.
245
Los tipos de formato existentes son: DVD-ROM (datos), DVD-Video (video y

audio), y DVD-Audio (alta calidad de audio).
• DVD-ROM: (DVD Real-Only Memory) permite almacenar todo tipo

de dato, similar que en el CD-ROM, pero con una mayor
capacidad.
• DVD-Video: básicamente es un DVD-ROM con un nivel de

aplicación definido que limita sus funciones a la reproducción de
películas. Las especificaciones de un DVD-video simula las pistas
de audio Dolby AC-3, PCM o DTS, entre otras.
• DVD-Audio: es un formato que entrega alta fidelidad en audio, es

multicanal (desde audio monofónico hasta 5.1 de audio surround)
a diferentes frecuencias de muestreo.
Dentro de estas categorías existen 5 tipos de discos:
• DVD-5 contiene sólo una cara grabada en una capa de

información y su capacidad es de 4.7 GB
• DVD-9 contiene sólo una cara en dos capas de información y su

capacidad es de 8.5 GB
• DVD-10 contiene dos caras y una sola capa por cara, su capacidad
es de 9.5 GB
• DVD-14 contiene dos caras, una de dos capas y la otra de capa

simple, su capacidad es de 13.2 GB
• DVD-18 contiene dos caras y dos capas por cara, su capacidad es

de 17 GB
246
En la figura 91 a) se ilustra un DVD-5 y en la 91 b) un DVD-10.
Existen 7 formatos de grabación:
• DVD-R
• DVD-R DL (doble cara)
• DVD-RW
• DVD+R
• DVD+R DL (doble cara)
• DVD+RW
• DVD-RAM
Aa) Ab)
Figura 91. Formatos DVD.

Fuente: Audio storage. DVD. [en linea]. s.l. Wikipedia, 2005.
<http://en.wikipedia.org/wiki/DVD> [consulta: 30 May. 2005]
247
7.2.19. DVD-R. (DVD Dash Recordable) Igual que un CD-R, es utilizado

para almacenar datos o música, pero con una mayor capacidad de
almacenamiento. Este formato fue desarrollado por Pioneer, en 1997, y sólo
puede ser grabado una sola vez. La grabación de un DVD-R necesita un
proceso de inicialización y de finalización. Para grabar información, es
indispensable formatear el disco en su totalidad. Una vez finalizada la
grabación, el DVD-R debe cerrarse para que sea leído por un reproductor de
DVD.
7.2.20. DVD-RW. (DVD Dash Rewritable) Es una versión regrabable del

DVD-R en la que se pueden grabar y regrabar datos, varias veces.
7.2.21. DVD+R. (DVD Plus Recordable) Tiene el mismo propósito que un

DVD-R. Este formato fue desarrollado en el año 2002 por una asociación
llamada DVD+RW Alliance. La grabación de un DVD+R no requiere los
procesos de inicialización y de finalización. Una vez terminada la grabación se
visualiza la información de forma inmediata; por esta razón el tiempo de
grabación es más corto que en un DVD-R.
7.2.22. DVD+RW. (DVD Plus Rewritable) Es una versión regrabable del

DVD+R en la que se pueden grabar y regrabar datos, varias veces.
7.2.23. DVD-RAM. (DVD – Random Access Memory) Es un disco óptico

regrabable con tecnología de cambio de fase para grabación. Fue desarrollado
por Panasonic, Hitachi y Toshiba. En la figura 92 se ilustra un DVD-RAM.
248
Figura 92. Formato DVD-RAM.
Dentro de estas categorías existen 2 tipos de discos:
DVD-RAM 1.0
• Un sola cara en una capa de información y su capacidad es de

2.58 GB
• Dos caras y una sola capa por cara, su capacidad es de 5.16 GB
DVD-RAM 2.0
• Un sola cara en una capa de información y su capacidad es de

4.7 GB
• Dos caras y una sola capa por cara, su capacidad es de 9.4 GB

249
Están diseñados para aplicaciones que contengan grandes cantidades de datos

con exigencia de alto rendimiento. En un DVD-RAM se maneja la información
de la misma manera que en un disco duro, es decir, no requiere de un Burning
software (programa de grabación de datos) para manipular datos.
Tiene una vida útil aproximada de 30 años y capacidad de sobre escritura

mayor a las 100.000 veces, aunque esto varía de acuerdo con el fabricante.
7.2.24. SACD. (Super Audio CD) Es un nuevo formato de grabación de

audio con la finalidad de brindar una alta fidelidad en la reproducción
superando al CD de audio. Este formato fue desarrollado por Sony y Philips y
comercializado en 1999. Emplea el mismo formato y dimensiones físicas de un
CD de audio, pero las señales no son almacenadas en PCM sino en un formato
de compresión lossless DSD (Direct Stream Digital) de 1 bit o bitstream y una
frecuencia de muestreo aproximada de 2.822.000 Hz. Tiene la posibilidad
multicanal de 2, 3, 4 y hasta 5.1 canales de audio sin distorsiones y sin
pérdida de calidad. Existe un formato de SACD llamado Híbrido, que cuenta
con dos capas en las que se almacenan dos versiones de audio, una, estéreo
con codificación PCM; otra, multicanal con codificación DSD. Estos discos
tienen una capacidad de almacenamiento de 8.5 GB y son compatibles con
reproductores de CD de audio. Los formatos de SACD de una sola capa sólo
pueden ser leídos en reproductores SACD y su capacidad es de 4.7 GB. En la
figura 93 se ilustra un SACD.
250
Figura 93. Formato SACD híbrido.
7.2.25. DD. (Dual Disc) Es un formato digital de almacenamiento óptico

producido por RIAA (Recording Industry Association of America) y considerado
como la competencia de SACD. Esencialmente, el DD es una combinación de
un CD con un DVD, ofreciendo audio en el formato de CD y video, juegos y
multimedia en el formato DVD en la otra cara.
7.2.26. BD. (Blu-ray Disc) Es la próxima generación del formato de disco

óptico desarrollado por BDA (Blu-ray Disc Association), conformada por 75
compañías, entre las que se destacan: Apple, Dell, Hitachi, HP, JVC, LG,
Matsushita, Mitsubishi, Panasonic, Pioneer, Philips, Samsung, Sharp, Sony,
TDK y Thomson. El formato fue estructurado para posibilitar la grabación, la
sobre escritura y la reproducción de video HD (High Definition), como también
para almacenar gran cantidad de datos. Mientras las tecnologías actuales del
disco óptico, como el DVD, emplean un láser rojo para leer y escribir datos,
este nuevo formato usa un láser azul-violeta que hace referencia a su nombre:
Blu-ray. El beneficio de un láser azul-violeta está representado en su longitud
de onda de 405 nm más corta que un láser rojo que es de 650 nm, lo que hace
posible enfocar el haz de luz con mayor precisión, lo que, a su vez, permite
251
almacenar los datos más herméticamente y que sean guardados en menos

espacio. Blu-ray fue diseñado para soportar grabación directa MPEG-2 TS
(Transport Stream) usada para transmisión compatible con los estándares de
HDTV (High Definition TV) y TV estándar. Sus capacidades de almacenamiento
son de 25 Gb que permite almacenar dos horas de video HD o 13 horas de
video estándar. En el caso doble cara, su capacidad es de 54 GB, hasta 100
GB. En la figura 94 se ilustra un Blu-ray disc.
El Blu-Ray será lanzado oficialmente al mercado en el año de 2006.
Figura 94. Formato Blu-ray.

Fuente: Audio storage. Blue-ray Media. [en linea]. s.l. Blu-ray, 2005.
<http://www.blu-ray.com/media/> [consulta: 30 May. 2005]
7.2.27. HD-DVD. (High Definition/Density DVD) Es un formato de

almacenamiento de video y datos, creado por Toshiba y NEC con el apoyo de
Sanyo y Memory Tech, a partir de la tecnología del láser azul-violeta,
implementada igualmente por Blu-ray. En compañía del Blue-ray es otro
candidato para suceder al actual DVD. Además, cuenta con el apoyo de Warner
Bros, Universal, Columbia, Eisner & Co. y Paramount que, aunque no darán
252
exclusividad a ningún formato, apoyan con recursos y publicidad al HD-DVD.

También es posible que Microsoft lo adopte en su nueva generación de
videojuegos para Xbox en contrapartida del próximo lanzamiento de SONY con
su consola de juegos PlayStation 3, que implementará tecnología Blu-ray.
Proporciona una capacidad de almacenamiento de 15 a 30 GB con discos de

triple capa e incluso se realizan híbridos de DVD y HD-DVD. Sin embargo, Bue-
ray, lo supera en capacidad de almacenamiento. En la figura 95 se ilustra un
HD DVD disc.
Figura 95. Formato HD DVD.

Fuente: Audio storage. Les Numeriques: Disque HD-DVD. [en linea]. s.l. Les
Numeriques, 2005.
<http://www.lesnumeriques.com/article-66-380-92.html>
[consulta: 4 Jun. 2005]
253
8. EQUIPOS DE ALMACENAMIENTO
Antes de comenzar a presentar algunas recomendaciones sobre los aspectos

más relevantes que deben tenerse en cuenta para la selección del equipo
(computador) que se ha de usar en el almacenamiento temporal, es pertinente
hacer un breve recorrido por las formas, el tratamiento de la señal que se va a
restaurar y su posterior grabación en un medio digital. Este capítulo,
entonces, se dedicará exclusivamente a la parte práctica de lo que hay que
tener en cuenta a la hora de seleccionar el equipo, la grabación y la
reproducción de audio.
En el ámbito del audio profesional se les conoce a estos equipos como Digital
Audio Workstations (DAW) o Estaciones de Trabajo de Audio Digital.
Las DAWs se pueden encontrar de dos tipos:
• DAWs integradas. Están conformadas por una serie de dispositivos

electrónicos integrados en una consola conocida como consola de mezcla
o mezclador de audio en el que todo el proceso de tratamiento de las
señales de audio se hace mediante circuitos electrónicos discretos y
convencionales.
Estos equipos eran la única opción hasta que los computadores se

hicieron lo suficientemente potentes y económicos para ejecutar estas
tareas mediante el uso de los poderosos programas de edición grafica de
audio con los que se cuenta hoy en día. Sin embargo, este tipo de DAWs
siguen siendo la primera opción en los estudios profesionales de
254
grabación que cuentan con presupuestos ilimitados, además de que sus

niveles de procesamiento aun superan los de un computador.
Actualmente se usan y se fabrican DAWs convencionales pero su costo

comparativo hace inclinar la balanza hacia el lado de los DAWs basados
en computador.
• DAW´s basados en computador. Son DAWs construidos por un

computador, una tarjeta de sonido y un programa de edición grafica de
audio.
El computador, además de ser el soporte del software y la tarjeta de
sonido, tiene la misión de proveer el procesamiento y almacenamiento
de la información del registro de audio.
Los DAWs de este tipo son los que se analizan en este capítulo porque
en éstos se puede lograr un excelente trabajo y con precios
relativamente bajos.
A diferencia de lo que se suele pensar, una DAW basada en computador no

necesita estar equipada con lo más moderno en tecnología informática. La
Sony, por ejemplo, para su última versión del Sound Forge recomienda un
procesador de 500 MHz, 128 MB de RAM y una capacidad en disco de 150 MB.
Sin embargo, estas características son muy básicas, y los 150 MB sirven para
alojar el programa y no el audio que se ha de procesar.
Indudablemente, mientras más capacidad, mayor será el rendimiento y los

procesos podrán ejecutarse con mayor rapidez. En última instancia, se
requiere una máquina estable y que funcione adecuadamente cuando se
procese el audio.
255
8.1. PERFIL DE UN DAW BASADO EN COMPUTADOR
Las siguientes son las consideraciones para tener en cuenta antes de hacer
una selección de un DAW basado en computador:
8.1.1. Estabilidad. La estabilidad de un computador es función de su

versatilidad, esto quiere decir que mientras más utilidades o usos se pretendan
obtener de él, más inestable será.
A partir de esta consideración surge la primera recomendación:
Exclusividad Para trabajar con audio se recomienda contar con un

computador para uso único y exclusivo, con el propósito de garantizar la
máxima estabilidad del sistema. Obviamente, esto no es más que una
recomendación para obtener máximo desempeño, así que si se pretende
utilizar una máquina multifuncional puede hacerse perfectamente, pero
haciendo conciencia de que puede perderse eficiencia en el proceso de
restauración.
8.1.2. El sistema operativo. Para beneplácito de los antagonistas de

Microsoft, la producción de audio es un caso en el que su popular sistema
operativo no es la única opción; lo que no equivale a decir que Windows sea
malo para este efecto, sino que puede considerarse la opción Mac, que, en este
campo, supera en experiencia a Windows en 10 años, aproximadamente.
A pesar de esta diferencia, la recomendación es la opción Microsoft Windows

XP Home Edition.
256
La popularidad de Windows hace que se prefiera este sistema porque para la

mayoría de las personas que habitan un ambiente “no tan profesional” puede
ser más mencionado y, por lo tanto, más amigable que Mac. Además, se debe
tener en cuenta que fue la nada despreciable y elogiable compañía Steinberg,
con sus drivers ASIO (Audio Streaming Input/Output), la que introdujo a la PC
en el medio de la producción profesional de audio, pues la MME, de Windows,
no era suficiente para un trabajo profesional que exige tanta calidad. Un buen
antecedente para Windows. Adicionalmente, hoy en día, la gran mayoría de
empresas que desarrollan software y hardware profesional, orientados a la
producción de audio en DAWs basadas en computador, proveen las
herramientas necesarias para convertir un PC en un poderoso DAW.
Equipado con cualquiera de los drivers profesionales de audio mencionados en

el capitulo 5, Windows XP puede considerarse como una plataforma apta y
poderosa para producción de audio.
Se recomienda Windows XP Home Edition ya que su precio es más bajo y se

espera que no se necesiten las aplicaciones de la edición profesional. Sin
embargo, si se desea, se puede recurrir a esta versión.
8.1.3. Procesador. En cuanto al procesador no hay mucho qué decir ya que

tanto AMD e Intel cuentan con procesadores lo suficientemente potentes para
trabajar la producción de audio. No se hace ninguna recomendación en cuanto
a la marca.
En relación con el tipo de procesador y la velocidad de procesamiento, la

recomendación es AMD Athlon XP o Intel Pentium IV.
257
El procesador no tiene que ser el más rápido en el mercado. Lo importante es

lograr un buen rendimiento en el proceso, trabajar a un ritmo adecuado y
obtener una buena relación precio–beneficio. Además, si la tarjeta de sonido
cuenta con chips DSP, se libera al procesador de las tareas relacionadas al
procesamiento del audio como tal. De todas formas, se recomienda un
procesador de características sobresalientes en cuanto a su velocidad de
procesamiento y de comunicación con otros dispositivos (Front Side Bus) y su
actualización a medida que las necesidades y los procesos lo vayan exigiendo.
Vale la pena mencionar que algunos de los fabricantes de programas de

manipulación de audio realizan convenios con los fabricantes de procesadores
con el fin de optimizar procesos cuando se ejecuta el programa en una PC
equipada con este procesador.
8.1.4. Mainboard o tarjeta madre. Este componente no es un punto

crítico en producción de audio, basta con ser confiable y de reputación
conocida. Aquí no hay una recomendación específica.
Algunas de las marcas de mainboards más reconocidas son ASUS, MSI,

Supermicro e Intel y todas, complementadas con una buena plataforma para
producción profesional de audio, como las mencionadas en el capitulo 5,
cuentan con chipsets aceptables para producción de audio.
8.1.5. Memoria RAM. La memoria RAM en un computador es importante

para cualquier proceso que se quiera efectuar, ya que con una buena cantidad
de ella se optimizan los procesos y se incrementa el rendimiento.
258
Por esta razón la recomendación es de 1 GB de Memoria RAM. Esta cantidad

es lo mínimo para trabajar con audio, puesto que se trata de un proceso que
puede requerir ejecución de varias tareas simultáneas o trabajo en tiempo
real.
8.1.6. Capacidad de almacenamiento. Luego de analizar, en capítulos

anteriores, el proceso de digitalización de una señal y describir los formatos
digitales en los que se puede almacenar al audio digitalizado, se puede intuir
que la capacidad de almacenamiento de un DAW basado en computador debe
ser bastante amplia, pues lo ideal es almacenar el audio lo más parecido (fiel)
al original. Esto implica niveles de digitalización muy altos y almacenamiento
en formatos lossless. Fidelidad de sonido es un objetivo principal para todo
trabajo de carácter profesional.
Repasando un poco el proceso de digitalización de audio, la frecuencia de

muestreo debe ser tal que no se pierda ninguna componente de la frecuencia
audible por un ser humano, esto es, mínimo una frecuencia de 40.000Hz, La
cuantización, para obtener calidades aceptables de audio, debe hacerse
mínimo a 16 bits y, por último, para que no haya pérdida de información, no
se deben utilizar formatos comprimidos o lossy. Todo esto implica una gran
capacidad de almacenamiento.
De acuerdo con estos argumentos expuestos, se puede inferir que la mejor

recomendación es: Dos discos duros: 1 x 400 GB + 1 x 80 GB.
Un total de 480 GB es la mínima capacidad recomendada para producción de

audio profesional, ya que el audio digitalizado a niveles profesionales
aceptables y en formatos lossless, ocupan bastante espacio (Ej. 1 minuto de
259
audio en formato WAV a 44.100Hz y 16 bits, ocupan aprox. 10 MB. Es decir:

un LP o un casete de 60 minutos necesitan de 600 MB en disco para
almacenarse).
Además, con el Internet, los virus, los espías informáticos o hackers y la

misma inestabilidad que pueden presentar los sistemas operativos, los
computadores son vulnerables a fallas que pueden ocasionar pérdida de
información. Por esta razón, utilizar dos discos duros brinda seguridad y
confiabilidad. El disco de 80 GB para el sistema operativo y el software, y el
disco de 400 GB únicamente para almacenar el audio para procesar,
garantizan que las pérdidas, en caso de presentarse un problema grave, serán
mínimas, pues sólo se vería afectado el disco del sistema y no el disco de
almacenamiento.
Adicionalmente a la capacidad, se recomiendan discos con un buffer mínimo de

8 MB y que giren a un mínimo de 7200 RPM para acceder más rápidamente a
la información y agilizar la grabación de información de un lugar a otro.
La interface de estos discos puede ser tanto SATA como SCSI pero estos
últimos presentan capacidades de grabación menores, lo que originaría que se
necesitara más de dos discos duros, además de que son más costosos.
8.1.7. Tarjeta de video. Para producción de audio el video es un factor

poco relevante, a menos que se contemple la opción de trabajar a la vez con
producción de video e imagen. No obstante, aun trabajando sólo con el audio,
puede verse la necesidad de un ambiente de trabajo en dos monitores para
supervisar un proceso o llevar a cabo dos tareas simultáneas en pantallas
260
completas. Por esta razón práctica es que se recomienda una tarjeta de video
que tenga soporte para dos monitores.
8.1.8. Monitor. El monitor, como un componente activo en la producción de

audio, es secundario, pero como dispositivo productivo puede jugar un papel
importante, pues es lógico que un monitor amplio permite visualizar más
detalladamente un proceso y, más aun, si se necesitan realizar dos tareas
simultáneamente y sólo se cuenta con un monitor. El trabajo con audio es un
proceso que requiere que las personas le dediquen horas continuas sentadas
frente a una pantalla, por esta razón, un monitor de baja radiación es
imprescindible para evitar cansancio excesivo en los ojos. Cumpliendo con
estas condiciones, se recomienda un monitor de 17” de panel plano de TFT
(Thin Film Transistor) LCD (Liquid Cristal Display).
8.1.9. Dispositivos de grabación de medios externos. Luego del

tratamiento digital es necesario llevar el audio a un medio externo,
preferiblemente digital y óptico, para que se conserve sin los problemas
señalados en capítulo 2. Éste puede ser un CD, un DVD o uno de los tantos
que fueron mencionados en el capítulo 7. Se requiere de un equipo grabador
del medio seleccionado que bien puede ser interno o externo, el cual iría
conectado a la tarjeta de sonido del DAW por medio de un cable óptico, coaxial
digital o uno que sea de transmisión digital. Para esta consideración no hay
una recomendación específica, ya que cualquier grabador interno o externo
confiable realiza esta tarea de forma adecuada. En el anexo C se presentan las
características y especificaciones técnicas más relevantes de algunos
grabadores internos y externos digitales.
8.1.10. Tarjeta de sonido. Una de las partes más importantes de un DAW,

ya que, entre sus principales tareas se encuentra la conversión analógica–
261
digital de la señal de audio: contribuir poder de procesamiento al proceso de

tratamiento de la señal de audio y proporcionar entradas y salidas para
transmisión de señales. Estas características ya fueron analizadas en el
capítulo 4.
Vale la pena mencionar que la conversión analógica-digital puede hacerse

mediante un dispositivo externo, pero es absolutamente necesario que el PC
cuente con la interfaz para comunicarse con éste.
8.1.11. Ruido acústico. Este aspecto sólo es importante si se harán

grabaciones en vivo por medio de dispositivos externos como micrófonos. Un
ejemplo: si se quiere restaurar audio proveniente de un medio cuyo
reproductor no tenga salidas eléctricas como es el caso de un fonógrafo o un
gramófono. En este proceso es importante que la señal captada por el
micrófono sea únicamente lo que se desea grabar, libre de ruido externo.
Además de un ambiente completamente aislado acústicamente, se debe

utilizar un computador que produzca un mínimo de ruido, para esto se
recomienda un chasis que aísle los ruidos internos provenientes de
ventiladores, discos y demás componentes o simplemente tener el computador
en una sala diferente, cerca de la sala de grabación.
Para este tipo de grabaciones se deben tener en cuenta las consideraciones

mencionadas en el capítulo 5 referidas al efecto feedback.
262
9. TRABAJO CON LA EMISORA DE LA UNIVERSIDAD PONTIFICIA

BOLIVARIANA
Sería inconcebible que se hubiera abordado un tema como el del presente

trabajo y no se hiciera alusión a un lugar que ocupa un espacio preponderante
dentro del ámbito del sonido: la emisora de la Universidad Pontificia
Bolivariana. En este capítulo se integran varios aspectos que tienen que ver
con la digitalización de audio, la historia de la emisora de la Universidad y los
formatos en los que se almacena la información que emite cotidianamente
tanto en la frecuencia AM como en la de FM.
La emisora de la Universidad Pontificia Bolivariana, Radio Bolivariana, lleva 57

años divulgando cultura y haciendo pedagogía a través del medio de
comunicación con mayor cobertura en nuestro medio, como la radio. Esta
experiencia la ha adquirido porque con el paso del tiempo ha tenido la
oportunidad de vivir parte del periodo en el que reinaba el audio analógico y la
tecnología de la computación apenas estaba apareciendo con pasos
agigantados, pero su presencia era tenue. Estas vivencias le dieron el estatuto
para apoderarse de una gran cantidad de música en formatos analógicos, como
discos y cintas magnéticas. Algunos de ellos son hoy valorados como tesoros
invaluables en cuanto a su contenido musical. Otros, se consideran artículos
valiosos como piezas de colección, pero, lo más relevante, todos son pedazos
invaluables de su historia, la historia de la emisora de la Universidad Pontificia
Bolivariana. Y, entonces, antes de seguir adelante, recordemos algunos
aspectos que marcaron sus orígenes y su quehacer actual.
263
9.1. HISTORIA.
1948 El 11 de Agosto se inaugura RADIO BOLIVARIANA A.M., gracias a

la gestión de Monseñor FELIX HENAO BOTERO y al entusiasmo de un
grupo de estudiantes amantes de la radio, entre los cuales se destaca el
primer Director de la Emisora JAIME SALAZAR MONTOYA. Nota Especial:
Desde la inauguración de la Emisora A.M., se empieza a editar un Boletín
de Programación.
1955 Se estructura la Programación con nuevas ideas y nuevos

programas. Los estudiantes de la Facultad de Derecho son los encargados
de la Programación Cultural y los de la Facultad de Ingeniería Eléctrica, de
los equipos y de la parte técnica.
1962 Radio Bolivariana A.M. empieza a dar frutos: Se vinculan a

importantes medios de comunicación y a grandes empresas, los que
antes, como estudiantes conducían los destinos de la Emisora. Estos son
algunos de ellos: BERNARDO HOYOS, IVO MEJÍA, MIGUEL RESTREPO,
DAIRO CÁRDENAS, RAÚL AGUILAR, JAIME SALAZAR, ALBERTO UPEGUI,
JOSÉ LUIS RESTREPO, etc.
1969 Se vincula a Radio Bolivariana, siendo estudiante de segundo año

de la Facultad de Derecho, su actual Director HUMBERTO MESA R., quien
primero fue locutor, luego programador y finalmente Director en 1972.
1973 La emisora, en sus Bodas de Plata, amplía sus emisiones de 7

horas a 18 horas diarias.
264
1980 La Universidad dispone una renovación total de los equipos. Se

adquiere un transmisor de 10 Kilovatios de Potencia que asegura un
mayor cubrimiento sobre casi toda la región antioqueño.
1990 La Universidad participa y gana la Licitación para el

establecimiento de una nueva emisora educativa en Frecuencia Modulada
en los 92,4 Mhz. para la ciudad de Medellín.
1992 El 1° de Diciembre la Universidad Pontificia Bolivariana le entrega

a la ciudad de Medellín y Municipios vecinos, la nueva estación RADIO
BOLIVARIANA F.M. 92.4 Mhz. "La Máxima Nota".
1993 Se establecen estrategias de programación para las dos emisoras

A.M. y F.M: RADIO BOLIVARIANA A.M. 1110 Khz. "SOCIAL
PARTICIPATIVA", informa y forma sobre los aspectos generales de la
Salud, la Comunidad, la Religión, la Familia, la Educación, etc. RADIO
BOLIVARIANA F.M. 92.4 Mhz. "CULTURAL RECREATIVA", dirigida a un
público empresarial, ejecutivo, universitario adulto, amante de la "música
culta" y especializada.
Se adquieren equipos de Video Audio Digital y de esta manera, Radio

Bolivariana se convierte en pionera de nuevos esquemas de producción
radial con el VIDEO CONCIERTO DIGITAL, espacio emitido los domingos y
festivos a través del canal regional de TV. TELEANTIOQUIA, con su
explicación respectiva en el periódico EL COLOMBIANO y la transmisión
simultánea por Radio Bolivariana F.M.
265
1995 Reinstalación locativa de la emisora. Se gestionan las

retransmisiones vía satélite con la BBC de Londres, Radio Neederland, La
Voz de América y Radio Vaticano. La CNC (Centro Nacional de
Consultoría), muestran que Radio Bolivariana F.M. ocupa el primer puesto
de sintonía en el Estrato Medio-Alto entre las emisoras de Medellín. Por
primera vez en Colombia una emisora cultural ocupa el primer puesto en
el "Rating", compitiendo con casi 40 emisoras comerciales
1998 Con éxito, el 11 de agosto se celebran los 50 años de Radio

Bolivariana. En el mes de diciembre, se instalan nuevos equipos
transmisores del sistema A.M. mientras se diseña una programación aún
más específica en los temas sociales y cristianos.
1999 Se elabora una Página en Internet, la cual apoya y complementa la

información de Radio Bolivariana para todos los navegantes en el
ciberespacio. La página es bien acogida por el público y junto con el
Boletín Bimestral de Programación, se convierte en otro medio alternativo
de la emisora.
2000 El 12 de enero, el sistema F.M. de Radio Bolivariana es el "audio

ambiente" de las veinticinco estaciones del Metro de Medellín. Gracias a
esta gestión, la emisora es escuchada por un gran público cautivo, "para
que ese 'santuario' en el que viajan los antioqueños, además de ser
limpio y tranquilo, sea también una experiencia auditiva grata y deliciosa
con un alto nivel de contenido cultural."
2001 Se realizan las siguientes estrategias comerciales: arrendamiento

de espacios radiales, patrocinios y pauta publicitaria, contactos y alianzas
266
estratégicas con diferentes empresas públicas y privadas, esquemas de

programación comercial, incursión en la pedagogía hacia el medio radial
como proyecto alternativo de educación no formal.
2004 Alianza estratégica con EDATEL, lo cual permite que Bolivariana

F.M. entre en el sistema Real Audio (sistema de enlace virtual para
escuchar la emisora desde cualquier país del mundo). Esta estrategia
impulsa a Radio Bolivariana hacia la conquista de una nueva audiencia y
hacia otros campos de tecnología y de proyección.
2005 Con éxito, Radio Bolivariana ingresa a la tecnología digital,

mediante la adquisición de cinco computadores para sus estudios y dos
"software" especiales para la edición y transmisión de audio19.
En cifras, la emisora tiene aproximadamente 12.000 discos de vinilo y 5.000

cintas de carrete abierto, de los cuales, afortunadamente, muchos se
encuentran en condiciones aceptables, gracias al cuidado que han tenido los
empleados, los directores y, en general, las personas que han estado dentro de
la organización. Afortunadamente se han preocupado por almacenarlos de
forma adecuada y su manipulación se corresponde con las condiciones
mínimas. Sin embargo, y a pesar de los cuidados, los formatos analógicos, aun
en condiciones de almacenamiento adecuadas, no son eternos y tienden a
degradarse con el tiempo, como se vio en el desarrollo de este trabajo.
Adicionalmente, su uso continuado implica manipulación, contacto directo con
el polvo, el calor, la humedad, etc. Además de estas degradaciones
generadoras de ruidos, también se encuentra el ruido de fondo, que es
19
Radio Bolivariana. Historia de radio bolivariana. [en linea]. Medellín. Universidad
Pontificia Bolivariana, 2005.
<http://www.bolivarianafm.com/historia_de_radio_bolivariana.htm>
267
inherente en todos los medios de almacenamiento analógicos; factores que

inciden directamente para que la música no se escuche con plenitud.
17.000 medios de almacenamiento de audio analógico, en proceso de

deterioro, no era una cifra despreciable como para ignorar sin más. Por ello, la
emisora avistó la necesidad de comenzar un proceso de renovación que fue
definitivamente ejecutado en el momento que en este trabajo se expresó el
deseo de confirmar y apoyar tal renovación.
Fue así como comenzó este trabajo conjunto, en el que ambas partes se verían
beneficiadas. La emisora rescataría sus viejas memorias musicales, y nosotros
enriqueceríamos nuestra experiencia, nuestro conocimiento y, en
consecuencia, nuestro trabajo de grado.
En las figuras 96 y 97 se muestra, la fonoteca de la emisora de la Universidad

Pontificia Bolivariana.
En la figura 98 se aprecian los diferentes formatos de discos de audio analógico

pertenecientes a la emisora de la Universidad Pontificia Bolivariana, de
izquierda a derecha se ilustran los formatos de 45, 33 1/3 y 78 RMP.
268
Figura 96. Fonoteca de la emisora de la Universidad Pontificia Bolivariana. Colección de

cintas magnéticas.
Figura 97. Fonoteca de la emisora de la Universidad Pontificia Bolivariana. Colección de

discos.
269
Figura 98. Discos analógicos de audio de la emisora radio Bolivariana.
En la figura 99 se aprecian los diferentes formatos de carrete abierto de audio

analógico pertenecientes a la emisora de la Universidad Pontificia Bolivariana.
Figura 99. Carretes abiertos de audio analógico de la emisora radio Bolivariana.

270
Precisamente este trabajo de grado brindará apoyo permanente a la Emisora

una vez terminada la labor académica, pues, se considera que el trabajo de
grado es un texto rico en información teórica y práctica que tendrá gran
importancia para la emisora, pues, si se usa adecuadamente, será un manual
de restauración de audio que, además, presenta abundante información
técnica. En este aspecto se debe hacer énfasis porque, según el personal de la
emisora, hacía falta en la biblioteca de la misma emisora. Así pues, este libro
tendrá el honor de ser el primer texto de contenido técnico e ingenieril, de
obligada consulta, que reposará en los estantes de la biblioteca de la emisora
de la Universidad Pontificia Bolivariana.
Con lo expuesto en este trabajo y por las continuas asesorías en el campo de

la restauración de audio analógico por medios digitales y otros temas
relacionados con el audio y el video digital, la emisora de la Universidad
complementó los saberes relacionados con estas artes y brindó avances en el
proceso de transición del mundo analógico al digital, en el que se encuentra en
este momento.
Todas aquellas experiencias vividas en la emisora relacionadas con el mundo

del audio digital y, en particular, con la restauración de audio, motivó la
elaboración de este apartado, en el que, además de cosechar los frutos de
largos meses de investigación teórico-práctica, es un verdadero orgullo que
este trabajo, y el conocimiento desplegado sobre el tema, hayan servido como
orientación en tan importante proceso que es el de la recuperación de
invaluables fonogramas para beneficio de la universidad, comunidad
universitaria y todos aquellos radioescuchas de la emisora de la Universidad
Pontificia Bolivariana.
271
9.2. EXPERIENCIAS EN LA EMISORA DE LA UNIVERSIDAD PONTIFICIA

BOLIVARIANA.
Ubicados, como estamos, en la llamada era digital, la emisora comenzó a

adquirir música en formatos digitales. Estos formatos se pueden graficar,
aproximadamente, de la siguiente manera: 10.000 CDs, 5.000 MDs y 500
Laser Discs. Este último medio fue el encargado de crear la inquietud para
consultar por parte de la Emisora Radio Bolivariana, que expresó su interés por
trasladar la información tradicional en un formato más moderno y versátil
como es el DVD. Planteada esta necesidad, la labor académica de los
integrantes del trabajo de grado fue orientar, aclarar conceptos y compartir
criterios. La solución de esta necesidad radicó fundamentalmente en la
adquisición de un conversor análogo-digital de audio y video, dispositivo, hasta
el momento, desconocido por la emisora. Estudiando las características
técnicas de los llamados video láser y la disposición de equipos de
computación de alta gama, se sugirió la compra de un conversor externo
marca Datavideo, modelo DAC-100 que se ilustra a continuación. La compra
fue inmediata y efectiva. Hasta ahora, su uso ha sido muy frecuente, ya que
sus características técnicas cumplen las necesidades de audio y video
profesional. Su particularidad de ser externo lo hace portátil y puede ser
conectado a cualquier computador de la emisora, a diferencia de un modelo en
particular de tarjeta estática capturadora de audio y video.
272
Figura 100. Conversor de audio y video DAC-100

Fuente: vides Converters. Professional video: post production. [en linea]. s.l.: H&B
Photo-Video, 2005.
<http://www.bhphotovideo.com/bnh/controller/home?A=details&kw=DADAC100&is=R
EG&Q=&O=productlist&sku=259093>
Antes de comenzar con este proyecto la emisora había iniciado el proceso de

adquisición de programas de audio, programas que, consideraban, serían más
modernos y solucionaban las necesidades de la emisora. Por lo adelantado del
proceso, no se ingresó la experiencia ni los antecedentes de este trabajo
investigativo sobre los programas de audio especializados. Lo anterior no se
expone para inferir que la adquisición de estos programas haya sido incorrecta.
Lo que se pretende concluir es que la autoridad científica debe recaer en los
hombres que se han especializado en un campo del saber específico.
Como se mencionó anteriormente, la emisora cuenta con gran cantidad de

material analógico en condiciones de deterioro y otro en buen estado, lo que
hace del proceso de restauración digital una tarea de suma importancia para
sus intereses. Uno de los programas adquiridos por la emisora Radio
Bolivariana es un excelente editor gráfico de audio con herramientas básicas
273
de restauración, aunque, como lo expresamos anteriormente, existen otros

programas especializados para obtener óptimos resultados.
Además de la restauración, la emisora también estaba interesada en adquirir

un conocimiento más profundo sobre algunos temas técnicos del audio como
principios, formatos y aplicaciones, por eso adquiere mayor trascendencia el
presente trabajo.
Otro de los factores que se destaca es el hecho de que se hubieran

programado algunas conferencias sobre el contenido de este trabajo de grado,
en las que se desplegaron temas como: la historia del audio, los medios de
almacenamiento analógicos y sus degradaciones y la captura de señales de
audio analógico.
En las siguientes imágenes se evidencia el proceso desarrollado junto a la

emisora y su gran aceptación e interés por parte de esta.
274
Figura 101. Exposición introductoria a la restauración de audio.
Figura 102. Exposición de restauración de audio digital.

275
Figura 103. Exposición de tecnologías de audio digital.
Retornando al tema principal de la tesis, la restauración de audio, se encontró

que en la emisora hay muchas cintas magnéticas en perfectas condiciones,
otras presentan problemas menores como polvo y suciedad y unas cuantas
presentan pérdida de aglomerante o síndrome de Sticky Shed. Lo que permitió
asesorar a la emisora en el proceso de reparación de este tipo de degradación
con las indicaciones y aclaraciones sobre el procedimiento de horneado de
cintas magnéticas. Muchas de las cintas magnéticas están en buenas
condiciones, pero aun así, el objetivo de la emisora es llevar toda su fonoteca
analógica a medios digitales, con un previo tratamiento digital, pues las
directivas de la emisora conocen las consecuencias de un prolongado
almacenamiento de formatos analógicos, además de su conocimiento y
conciencia de las ventajas de los medios digitales.
276
En la figura 104 se evidencia el efecto de sticky shed en una cinta magnética

de audio analógico de carrete abierto perteneciente a la emisora Radio
Bolivariana.
Figura 104. Cinta magnética de audio con síndrome de sticky shed perteneciente a la
emisora radio Bolivariana.
Además de las cintas magnéticas en carrete abierto, la emisora también

cuenta con gran cantidad de discos de vinilo susceptibles de tratamientos de
restauración digital. Muchos de ellos en buenas condiciones, pero el
sentimiento y tendencia por la digitalización es generalizada para toda su
fonoteca.
277
Algunos de los discos, como es apenas lógico, tienen bastante polvo y algunas
suciedades superficiales; otros, presentan algunos rayones. Algunos discos
están en franco proceso de deformación por causa del almacenamiento
prolongado.
Para estas degradaciones menores, se brindaron orientaciones de limpieza,

pero lo que más llamó la atención fueron los sistemas limpiadores de discos
que incrementan la productividad del proceso de restauración, con unos
resultados óptimos. Igualmente, los reproductores ópticos de discos analógicos
también fueron considerados para la reproducción de los discos a digitalizar y,
así, optimizar los resultados de la restauración digital y obtener un sonido de
excepcional calidad.
278
10. CONCLUSIONES
• La restauración de audio no es una disciplina que se limita única y

exclusivamente a estudiar conceptos relacionados con la restauración de
los soportes físicos de almacenamiento y señal de audio, mediante el
tratamiento digital, pues, además, estudia detalladamente las
características de las ondas y el análisis de algunos conceptos referidos
al audio analógico y digital, con el fin de ilustrar más claramente la
naturaleza y los parámetros que definen una onda de audio y su
comportamiento, los que, a su vez, permiten identificar y percibir con
precisión las consecuencias de las degradaciones o ruidos en la música.
De esta manera se puede evaluar, con poco margen de error, las
acciones correctivas que deben tomarse durante el tratamiento digital,
en lo que se refiere a la aplicación de algoritmos matemáticos, efectos o
filtros para resaltar o corregir un sonido en particular.
• Restaurar audio no se reduce únicamente a eliminar los ruidos presentes

en una grabación, pues precisa de una serie de consideraciones
prácticas y técnicas de carácter ingenieril que no pueden asumirse
superficialmente, ya que de ellas dependen, en gran medida, los
resultados que se esperan porque determinan la viabilidad y
necesidades del proyecto de acuerdo con la magnitud de la restauración
que se ha de ejecutar.
• La aplicación del Procesamiento Digital de Señales (DSP) en problemas

relacionados con la restauración de audio, ha sido una área de
considerable crecimiento desde las primeras investigaciones en este
279
tema, a principios de 1970. Para 1980, los chips DSP ya eran

suficientemente poderosos como para ejecutar las complejas
operaciones requeridas por la restauración digital de audio en tiempo
real. Todo esto dio origen a los primeros sistemas comerciales de
restauración digital por parte de CEDAR Audio, en el Reino Unido y Sonic
Solutions, en Estados Unidos.
• Hasta hace algunos años, la producción digital de audio requería

poderosos motores computacionales que solamente estaban al alcance
de grandes empresas dedicadas a esta labor. No obstante, con el
advenimiento del CD y otros formatos digitales, el crecimiento de la
computación y la consecuente accesibilidad de esta tecnología por parte
del público en general, puso este proceso digital de audio al alcance de
todas las personas que cuenten con un computador equipado con un
conversor de sonido.
• Es importante establecer la diferencia entre edición digital de audio y

restauración digital de audio. El primero de estos términos consiste en
tomar una señal de audio y realizar un proceso cuyo objetivo es la
alteración total o parcial de la señal, en el que el resultado será un
sonido modificado pero no necesariamente restaurado. La restauración
digital de audio es un caso particular de la edición digital de audio, pero
con la connotación que le da su nombre. Restaurar es volver a poner en
el estado que antes tenía una obra de arte, es llevar a su estado original
una señal de audio. Esto quiere decir que restaurar implica obtener un
sonido exactamente igual o lo más parecido posible al que escuchó la
persona que estuvo presente en el momento de la grabación. Así, pues,
la restauración de audio no es un proceso que consiste en aplicar al
azar una cantidad desmesurada de filtros y efectos en la señal de audio.
280
• Una de las ventajas que proporciona el audio digital sobre el audio

analógico es que permite la experimentación y el ensayo, es decir,
manipular información digital es más fácil y más seguro ya que hace
posible la reversibilidad del proceso. Reversibilidad en el sentido de que
se pueden hacer copias con mayor facilidad y sin perder calidad de
audio en el proceso de duplicación. El audio analógico no posee esta
flexibilidad ya que el tratamiento físico puede ocasionar destrucción
permanente, lo que quiere decir que duplicar no es una solución, ya que
con cada copia la calidad del sonido va decayendo.
• El surgimiento de los programas de restauración digital de audio se dio,

en primera instancia, por causa de la implementación de los modelos
matemáticos para representar señales de audio, desarrollados por
ingenieros estudiosos de las matemáticas, pues fue con base en el
estudio de estos modelos como se generaron los diferentes algoritmos
de restauración de audio, presentes en estos programas que, por
métodos de predicciones probabilísticas aplicados a la representación
matemática de la señal de audio, son capaces de distinguir entre ruido y
la señal original. En algunos casos, aplicando tecnología de sustitución,
se logran reconstruir fragmentos perdidos de la señal. En segunda
instancia, y gracias al desarrollo de los computadores, se hicieron lo
suficientemente poderosos para solucionar, en tiempo real, las
ecuaciones y matrices que arrojan estos algoritmos durante el análisis y
reparación de la señal degradada.
• Más allá del conocimiento adquirido en este trabajo por la investigación

y búsqueda de información relacionada con la restauración de audio, es
evidente que los frutos más apreciados son los beneficios recibidos por
la comunidad universitaria, la naciente línea de formación en audio de la
Escuela de Ingeniería y, particularmente, por la emisora de la
Universidad Pontificia Bolivariana, con la que compartimos el
beneplácito de los logros obtenidos con este trabajo, un texto rico en
281
información técnica con reales soluciones a la problemática referida a la

degradación de medios de almacenamiento de audio analógico,
digitalización de audio analógico y posterior tratamiento digital para la
restauración.
• Quedan como resultados múltiples aspectos técnicos compartidos con la

emisora que, gracias a nuestra profunda afición a los temas referidos al
audio y por nuestra experiencia laboral en el medio del audio y video de
alta calidad, consideramos que son y serán de gran valor. También
manifestamos nuestro profundo agradecimiento a la emisora Radio
Bolivariana y a todo su personal, por la calidad humana y por compartir
con nosotros sus experiencias y conocimientos relacionados con el
maravilloso mundo de la radio.
• Así pues, esperamos que este aporte personal y nuestro trabajo de

grado hagan perdurar el camino que, conjuntamente con la emisora,
comenzamos a trazar por el mundo de la restauración del audio ya que
seguramente le traerá grandes beneficios en el en el futuro que se
avizora exitosamente.
282
BIBLIOGRAFIA
ADOBE. AUDITION [CD]. Ver. 1,5. s.l.: Adobe, 2005. 1 CD. Programa
informático
AES: Audio Engineering Society. [en línea]. New York: AES, 2005
<http://www.aes.org/> [consulta: 1 May. 2005]
AUDIO CODECS. Wikipedia: audio codecs. [en línea]. s.l.: Wikipedia, 2005
<http://en.wikipedia.org/wiki/Audio_codecs> [consulta: 19 Mar. 2005]
AUDIO DECKS. Audio converters: ADI-2. [en línea]. s.l.: RME, 2005.
<http://www.rme-audio.com/english/adi/adi2.htm>
AUDIO DECKS. DVD players: DVD-1910. [en linea]. s.l.: DENON, 2005.
<http://www.usa.denon.com/catalog/photo.asp?s=home&p=DVD-
1910&f=DVD1910%20Front.jpg&c=4> [consulta: 4 Jun. 2005]
AUDIO DECKS. DV-RA1000. [en línea]. s.l.: TASCAM, 2005.

<http://www.tascam.com/Products/dvra1000.html>
AUDIO DECKS. Performance audio: alesis [en línea]. s.l.: Performance audio,
2005. <http://www.performanceaudio.com/cgi/pages.cgi?buildPage=
item&ProductID=004017> [consulta: 11 May. 2005]
283
AUDIO DECKS. Products: DVD.618. [en línea]. s.l.: RCA, 2005.

<http://www.rcaaudiovideo.com/Cultures/en-US/ModelDetail.html?PCI=
Portable+DVD&ProductID=DRC618N> [consulta: 6 Jun. 2005]
AUDIO DECKS. Products: PCI audio. [en línea]. s.l.: MOTU, 2005.
<http://www.motu.com/products/motuaudio/896/body.html/en>
AUDIO DECKS. Professional audio: recorders & players. [en línea]. s.l.: Vann’s,
2005. <http://www.vanns.com/shop/servlet/item/features/523149324>
AUDIO DECKS. Sony: sony mastering. [en línea]. s.l.: Zzounds, 2005.
<http://www.zzounds.com/item--SNYPCMM1> [consulta: 16 May. 2005]
AUDIO FILES. Wikipedia: audio file format. [en línea]. s.l.: Wikipedia, 2005
<http://en.wikipedia.org/wiki/Audio_file_format> [consulta: 19 Mar. 2005]
AUDIO FORMATS. Wikipedia: list of audio formats [en línea]. s.l.: Wikipedia,
2005 <http://en.wikipedia.org/wiki/List_of_audio_formats>
AUDIO PRODUCTS. Products. [en línea]. s.l.: Avid Technology, inc, 2005.
http://www.m-audio.com/index.php?do=products.family
AUDIO PRODUCTS. Terratec producer: phase 26. [en línea]. s.l.: Terratec,
2005. <http://audioen.terratec.net/modules.php?op=modload&name
=News&file=article&sid=6> [consulta: 13 May. 2005]
284
AUDIO RESTORATION. [en línea]. s.p.i.

<http://www.lnlrecording.com/FAQ/audio_restoration.htm>
AUDIO RESTORATION. PINNACLE SYSTEMS: audio. [en línea]. s.l.: Pinnacle

systems, 2005. <http://www.pinnaclesys.com/ProductPage_n.asp?Product
_ID=1477&Langue_ID=6> [consulta: 8 Mar. 2005]
AUDIO RESTORATION. WAVES: restoration bundle. [en línea]. s.l.: Waves

Audio, 2005. <http://www.waves.com/content.asp?id=59>
BERGER, J, COIFMAN, R and GOLDBERG. M, J. Removing Noise from Music

Using Local Trigonometric Bases and Wavelet Packets. J. Audio Eng. Soc. Vol.
42, No. 10 (Oct. – Sep. 1994) p. 808–818.
BOLL. S, F. Suppression of Acoustic Noise in Speech Using Spectral

Subtraction. En: IEEE Trans. Acoustics, Speech, and Signal Processing. Vol.
ASSP- 27, No. 2 (Apr. – May. 1979) p. 113–120.
BROTHERS, Peter. Specbros: Video & Audio tape restoring since 1983. [en
línea]. s.l. BROTHERS, Peter, 2003 <http://www.specsbros.com/index.html>
BLU-RAY DISC. Blu-ray. [en línea]. s.l.: Blu-ray DiscAssociation, 2005

<http://www.blu-ray.com> [consulta: 25 May. 2005]
CARRETERO MONTERO, Alfonso. Sistemas de sonido: definiciones de sonido y

campos que lo estudian. [en línea]. s.l. ALFOCAMO WEB, 1999, actualizada 9
Sep. 2004 <http://www.terra.es/personal/alfocamo/Sonido.htm>
285
CILETTI, Eddie. If I Knew You Were Coming I’d Have Baked A Tape!: (A Recipe
for Tape Restoration). [en línea]. s.l. CILETTI, Eddie, 1998.
<http://www.tangible-technology.com/tape/baking1.html>
CONVERSORES DE AUDIO. Products: progression DAC model 4705. [en línea].

Jefferson: Sakura Systems, 2005.
<http://www.sakurasystems.com/products/47dac.html>
DAVIS, Don and DAVIS, Carolyn. Sound System Engineering. 2 ed. Portland:
Focal Press, 1997. 665p
Digital Audio Basics: historical background. [en linea]. s.p.i.
<http://www.cyberbee.com/audio.pdf> [consulta: 6 Mar. 2005]
DIGITAL AUDIO STORAGE. Wikipedia: digital audio. [en linea]. s.l.: Wikipedia,
2005 <http://en.wikipedia.org/wiki/Digital_audio>
DIGITAL DOMAIN. ARTICLES. [en línea] s.p.i.

<http://www.digido.com/portal/pmodule_id=11/pmdmode=fullscreen/pagead
der_page_id=18/> [consulta: Ene. 19 2005]
DOCTOR PROAUDIO. Conexiones a entradas balanceadas. [en línea]. s.l.:

Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas.htm>
DOCTOR PROAUDIO. Transporte de señal: balanceado y no balanceado. [en

línea]. s.l.: Doctor ProAudio, inc, 2001.
<http://www.doctorproaudio.com/doctor/temas.htm>
286
EL SONIDO. Velocidad de propagación del sonido en un gas. [en línea]. s.l. s.n,
2004.
<http://www.sc.ehu.es/sbweb/fisica/ondas/acustica/sonido/sonido.htm>
ELECTROACÚSTICA: digitalización de señales de audio. [en línea]. s.l.:

Wanadoo 2005. s.l.: Wanadoo, 2005.
<http://html.rincondelvago.com/electroacustica_digitalizacion-de-senales-de-
audio.html> [consulta: 23 Mar. 2005]
ELP Laser Turntable [en línea]. s.l.: WAUGH, Max, 2005.

ENHANCEDAUDIO: Audio restoration and enhancement software. [en línea].

York, EnhancedAudio, s.f. <http://www.enhancedaudio.com/index.htm>
EQUALIZER. Products: equalizer & accessories. [en línea]. s.l.: Behringer,

2005. <http://www.behringer.com/DEQ2496/index.cfm?lang=ENG> [consulta:
22 Abr. 2005]
ESQUEF A. A, Paulo. Model-Based Analysis of Noisy Musical Recordings with

Application to Audio Restoration. [en linea]. Helsinki: Helsinki University of
Technology, 2004. <http://lib.tkk.fi/Diss/2004/isbn9512269503/> [consulta: 6
Mar. 2005]
ESQUEL A, Paulo and BISCAINHO. L, W. A Double-Threshold-Based Approach

to Impulsive Noise Detection in Audio Signals. in Proc. X European Signal
Processing Conf., Tampere. Vol. 4 (Sep. – Oct. 2000) p. 2041-2044.
287
EVANS, Mick and EVANS, Dave. Audio decks. Mick’s audioworld [en línea]. s.l.:
EVANS, Mick and EVANS, Dave, 2004.
<http://www.arcticcorsair.f9.co.uk/audio/kit/dcc730.html> [consulta: 26 May.
2005]
FISICANET. El sonido. Ondas sonoras: el sonido y las ondas. [en línea]. s.p.i.
http://www.fisicanet.com.ar/fisica/f3ap04/apf3_25b_Ondas_Sonoras.
html> [consulta: 8 Mar. 2005]
FONOTRON. Restauración digital de sonido. [en línea]. Sevilla: s.n., s.f.

http://www.arrakis.es/~fonotron/dsr.html [consulta: Ene. 19 2005]
GARG, Hari Krishna. Digital signal processing algorithms. 1 ed. Bogota: CRC
Press, 1998. 672p
GODSILL, Simon and RAYNER, J.W. Digital Audio Restoration: A Statistical

Model Based approach. [en linea], Cambridge: University of Cambridge, 1998.
<http://www-sigproc.eng.cam.ac.uk/~sjg/springer>
[consulta: Ene. 20]
GODSILL, Simon and RAYNER, Peter. Digital Audio Restoration [en línea].
Cambridge: CAPPE,Olivier, 1997
<http://citeseer.ist.psu.edu/cachedpage/105169/1>
[consulta: Feb. 19 2005]
HANDBOOK FOR SOUND ENGINEERS. 3 ed. Portland: BALLOU, Glen, 2005.

1553p
HESS, Richard. Vignettes Media Audio Tape Restoration & Mastering. [en
línea]. Aurora: HESS, Richard, 2001
<http://www.richardhess.com/tape/contact.htm> [consulta: 7 Abr. 2005]
288
HINTZE, Mike. Consumer Audio Equipment. [en línea]. s.l. HINTZE, Mike,
2005. <http://mhintze.tripod.com/audio/default.htm>
IASA (International Association of sound and Audiovisual Archives). Technical

Committee Papers.The Safeguarding of the Audio Heritage: Ethics, Principles
and Preservation Strategy [en línea]. s.p.i. <http://www.iasa-
web.org/index.htm> [consulta: 20 Abr. 2005]
IEEE Virtual Museum. The beats goes on: How sounds are recorded and
played. [en línea]. s.l.: IEEE, 2005. <http://www.ieee-virtual-
museum.org/index.php> [consulta: 12 Abr. 2005]
INTRODUCCTION TO AUDIO RESTORATION. [en línea]. s.l.: CEDAR, 2005.

<http://www.cedar-audio.com/> [consulta: 3 Mar. 2005]
JORDÀ PUIG, Sergi. Conceptos avanzados de procesador digital de audio. [en

línea]. s.l.: Resonancias, 1997.
<http://www.ccapitalia.net/reso/articulos/index.htm?frame=http%3A//www.cc
apitalia.net/reso/articulos/articulos.htm> [consulta: 12 Mar. 2005]
JORDÀ PUIG, Sergi. Conceptos avanzados de procesador digital de audio. [en

línea]. s.l.: Resonancias, 1997.
JORDÀ PUIG, Sergi. El audio digital en el ordenador personal. [en línea]. s.l.:
Resonancias, 1997.
289
JORDÀ PUIG, Sergi. Principios del sonido digital. [en línea]. s.l.: Resonancias,
1997. <http://www.ccapitalia.net/reso/articulos/index.
htm?frame=http%3A//www.ccapitalia.net/reso/articulos/articulos.htm>
"KING, Gretchen.Magnetic Wire Recordings: A Manual Including Historical

Background, Approaches to Transfer and Storage, and Solutions
to Common Problems. [en línea]. Washington: University of Washington, 2003.
<http://depts.washington.edu/ethmusic/wire1.html>
[consulta: 10 Mar. 2005]"
KONOPKA, Mike. ThunderTone Audio: High Quality Audio Engineering Services.

[en linea]. Mount Prospect: KONOPKA, Mike, 2005
<http://www.mikekonopka.com/page1.html> [consulta: 29 Mar. 2005]
La clinica del disco. [en línea]. s.p.i. <http://jaye76.tripod.com/index.htm>
MANDANO, Enrique. Sistemas electrónicos digitales. 6 ed. Barcelona:

Marcombo, 1987. 704p
MATHWORKS. Matlab [CD]. Ver. 6. s.l.: Mathworks, 2000. 1 CD. Programa

informático
MICROGRAPHIA: The microscopy of vinyl records. [en línea]. s.p.i.

<http://www.micrographia.com/index.htm> [consulta: 10 Abr. 2005]
MILIÁN, Marc. Bu-ray Disc Vs HD-DVD. Blu-ray. [en línea]. s.l.: MILIÁN, Marc,
2005 <http://lam.e-gim.net/gimmaster/jcl/lam/Documentos/
contenido1.asp?id=201&ide=030&cod=030> [consulta: 25 May. 2005]
MIYARA, Federico. Acústica y Sistemas de Sonido. 4 ed. Bogota: deciBel, 2004.

319p
290
MORTON, David. The history of sound recording technology. [en línea].

s.l.:MORTON, David, 1998. <http://www.recording-history.org/> [consulta:
12 Mar. 2005]
NEWTON, Graham. Graham Newton's Audio-Restoration Web Site. [en línea].

s.l.: Newton, Graham, s.f. <http://audio-restoration.com/
index.php> [consulta: 20 Mar. 2005]
P.J WOLFE. P, J and y GODSILL. S, J. Efficient Alternatives to the Ephraim and

Malah Suppression Rule for Audio Signal Enhancement. En: EURASIP Journal
on Applied Signal Processing – Special Issue on Digital Audio for Multimedia
Communications. Vol. 2003, No. 10 (Sept. – Oct. 2003) p. 1043–1051.
PANASONIC. Blue-ray. [en línea]. s.l.: AV LAND LTD, 2005.

<http://www.avland.co.uk/panasonic/dmre700/dmre700lrg.jpg>
PENA GIMÉNEZ, Antonio. Sistemas de audio y video: procesos sobre la señal

de audio. [en línea]. Vigo: Universidad de Vigo, 2005.
<http://www.gpi.tsc.uvigo.es/%7Ecbarcena/Web-
SAV/sav0405_tema3_procesos.pdf> [consulta: 11 Abr. 2005]
PLASTIC REVOLVER. Vinyl audio restoration, transfer, archival. [en línea].

s.p.i. <http://www.plasticrevolver.com/index.html> [consulta: 6 Abr. 2005]
POOLER, Bob. Video Interchange: Vintage Audio - Video Transfer Conversion

Services [en línea]. Waldoboro: POOLER, Bob, 2005
<http://www.videointerchange.com/index.html> [consulta: 18 Mar. 2005]
PRESS RELASE: Nec HD DVD. [en línea]. s.l.: HD DVD Promotion Group, 2005.
<http://www.hddvdprg.com/press/nec.html> [consulta: 6 Jun. 2005]
291
PROAKIS, John and MANOLAKIS, Dimitris. 3 ed. Portland: Prentice Hall, 1995.
1016p
RESTAURACIÓN DE AUDIO. Proceso de señales y aplicaciones en la

restauración de registros sonoros. [en línea]. Oviedo: Universidad de Oviedo,
s.f. <http://coco.ccu.uniovi.es/brahms/sumario.htm> [consulta: 28 Feb. 2005]
RESTAURACIÓN DE AUDIO. SONIC: Sonic NoNOISE. [en línea]. Novato: Sonic

Solution, 2005.
<http://www.digidesign.com/products/details.cfm?product_id=3180>
RESTAURACIÓN DE AUDIO. SoundSoap Pro de Bias. [en línea]. s.l.: La oreja

digital, 2005.
<http://www.laorejadigital.com/default.php?echohtml=%2Fnoticia.php3%3Fid
noticia%3D1225> [consulta: 26 Abr. 2005]
RIFE. D, Douglas. Theory of Upsampled Digital Audio. [en línea]. s.l.: RIFE. D,
Douglas, 2002. <http://www.mlssa.com/pdf/Upsampling-theory-rev-2.pdf>
S. B. JEBARA. S, B, BENAZZA-BENYAHIA, A and KHELIFA. A, B. Reduction of

Musical Noise Generated by Spectral Subtraction by CombiningWavelet Packet
Transform and Wiener Filtering. Proc. X European Signal Processing Conf.,
Tampere. Vol. 2 (Sept. – Oct. 2000)
SAGE, Glenn. Dedicated to the preservation of early recorded sound. [en

línea]. Portland: SAGE, Glenn, 1996, updated June 2 2005.
<http://www.tinfoil.com/> [consulta: 2 Abr. Mar. 2005]
292
SCHOENHERR, Steve. Recoding Technology History. [en línea] s.p.i., revised in

27 January 2005. <http://history.acusd.edu/gen/recording/notes.html>
SCREENSOUND AUSTRALIA. National screen and sound archive: Preservation.

[en línea]. Canberra: ScreenSound Australia, 2000
<http://www.screensound.gov.au/ScreenSound/Screenso.nsf> [consulta: 16
Mar. 2005]
SONY. Sound Forge [CD]. Ver. 7. s.l.: Sony, 2004. 1 CD. Programa informático
Steinberg. Wavelab [CD]. Ver. lite. s.l.: Steinberg, 2005. 1 CD. Programa
informático
ST-LAURENT, Gilles. The Care and Handling of Recorded Sound Materials. [en
línea]. s.l.: National Library of Canada, 1996
<http://palimpsest.stanford.edu/byauth/st-laurent/care.html>
THE LIBRARY OF CONGRESS PRESERVATION: Cylinder, Disc and Tape Care in

a Nutshell. [en línea]. Washington: Library of congress, 2002.
<http://www.loc.gov/preserv/care/record.html> [consulta: 2 Abr. 2005]
THE VINYL ENGINE: The home of the turntable. [en línea]. s.l.: JaS, 2002
<http://www.vinylengine.com/> [consulta: 20 Mar. 2005]
TRANSFORMACIONES TIMBRICAS. [en línea]. s.p.i.

<http://www.euskalnet.net/manzano/apuntes/cuerpos/cuerpo_procesamiento.
htm> [consulta: 25 Abr. 2005]
TYPES OF NOISES SUCCESSFULLY REMOVED OR DIMINISHED. [en línea]. s.l.:

s.n, 1999. <http://lp2cd.com/restoration_types.htm> [consulta: 25 May.
2005]
293
UNESCO: United Nations Educational, Scientific and Cultural Organization.

Audiovisual archives: A practical reader. [en línea]. s.l.: UNESCO, 1997.
<http://www.unesco.org/webworld/ramp/html/r9704e/r9704e00.htm#Content
s> [consulta: 20 Mar. 2005]
VAN BOGART, John. Magnetic Tape Storage and Handling: A Guide for Libraries
and Archives. [en línea]. Washington: National Media Laboratory, 1995.
<http://www.clir.org/pubs/reports/pub54> [consulta: 1 Abr. 2005]
VAN DEN HUL. Connectors and Accessories. [en línea]. s.l.: A.J, van den Hul
B.V, 1997. <http://www.vandenhul.com/other/c-connec.htm>
VASEGHI S, V. and FRAYLING-CORK, R. En: J. Audio Eng. Soc. Cambridge.

Vol. 40, No. 10 (Oct. – Sep. 1992); p. 791-801. [consulta: 11 May. 2005]
VASEGHI S, V. and RAYNER. J, W. Detection and Suppression of Impulsive

Noise in Speech Communication Systems. Proc. IEEE Int. Conf. Acoustics,
Speech, and Signal Processing. Vol. 137, No. 1 (Feb. – Mar. 1990); p. 38-46.
VIDEOGAMES. Hardware: PlayStation2. [en línea]. s.l.: SONY, 2005.

<http://www.us.playstation.com/consoles.aspx?id=2/info/PlayStation2/default
.html#> [consulta: 6 Jun. 2005]
VIDEOGAMES. PS3: oficial PS3 pictures. [en línea]. s.l.: SONY, 2005.
<http://www.ps3land.com/ps3-pictures/picture53.php>
VIDEOGAMES. SEGA: saturn 2 [en línea]. s.l.: Vidgame, 2005.

<http://www.vidgame.net/SEGA/SATURN.html> [consulta: 31 May. 2005]
294
VIDEOGAMES. SONY: playstation [en línea]. s.l.: SONY, 2005.

<http://www.us.playstation.com/psp.aspx?id=overview>
431
ANEXO F
ANTEPROYECTO
432
Proyecto de trabajo de grado

La Restauración de Audio
Estudiante Gustavo Adolfo Valencia Zapata

Cédula 3.396.765 de envigado
e-mail tavobat@hotmail.com
Teléfono 265 70 17
Programa Ingeniería Electrónica
Universidad Universidad Pontificia Bolivariana
Estudiante Nicolás Ramírez Echeverri

Cédula 98.670.385 de Envigado
e-mail nicramec@netscape.net
Teléfono 266 76 13
Programa Ingeniería Eléctrica
Director José Ricardo Zapata

Cédula 71.375.690 de Medellín
e-mail jrzapata@upb.edu.co
Teléfono 2658798
Empresa UPB
Asesor Hernán Valencia

Cédula 8.281.231 de Medellín
e-mail hernanvalencia@hotmail.com
Teléfono 2356224
Empresa UPB
31/01/05
Ingeniería Eléctrica - Electrónica / Escuela de ingenierías
Universidad Pontificia Bolivariana
433
Memo de trabajo para el Comité: La Restauración de Audio
Primera revisión
Recibió: _____________________________________ Fecha: ______________

Lectura y asignación de evaluador en comité #__________ Fecha: ______________
Evaluación preliminar asignada a: ______________________________
Recomendación:
Reprobado: • Aplazado: • Aprobado: •
Comité #______ Firma Responsable________________________ Fecha: _____________
Comentarios:
Segunda revisión:
434
(1) INVOLUCRADOS
Gustavo Adolfo Valencia Zapata, estudiante de Ingeniería Electrónica

Nivel Académico: Actualmente cursando el 10º semestre.
Nicolás Ramírez Echeverri, estudiante de Ingeniería Eléctrica

Nivel Académico: Curso y aprobó todas las materias del Pensum.
Director: José Ricardo Zapata, Ingeniero de la Universidad Pontificia Bolivariana

Profesión: Ingeniero Electrónico
Lugar de Trabajo: Universidad Pontificia Bolivariana
Asesor: Hernán Valencia Gallón, Ingeniero de la Universidad Pontificia Bolivariana

Profesión: Ingeniero Eléctrico
Lugar de Trabajo: Universidad Pontificia Bolivariana
(2) MODALIDAD
“Monografía”
(3) TEMA DEL PROYECTO
Con las herramientas que ofrecen la electrónica y la informática en la actualidad y de

acuerdo a las posibilidades de nuestro medio, se pretende ofrecer un apoyo en el
planteamiento de soluciones y alternativas para la restauración del audio analógico con
daños y deterioro mediante un tratamiento digital. Con la búsqueda teórica y un desarrollo
de campo amplio, el proyecto pretende abarcar los aspectos necesarios para lograr un
proceso de restauración digital; siendo base fundamental la experimentación y
posteriormente análisis de los resultados para una concreta y real solución de los
problemas del audio analógico deteriorado en el medio de las telecomunicaciones y los
sistemas de sonido.
Teórico Aplicado Gestión

Tipo de Experimental De campo
Trabajo Búsq/Estudio Desarrollo (laboratorio)
% 35 20 10 35 10
Comunicacion Sistemas Circuitos Instrumentac Microprocesador Animaci

Áreas es y Señales Electrónico ión es ón
s y
multimed
ia
% 30 20 20 10 10 10
435
(4) ANTECEDENTES
Desde los inicios de las grabaciones de audio se han empleado los formatos analógicos de
almacenamiento. Ejemplos típicos de estos serian el disco de acetato, casetes, cintas de ½,
¾, ¼, etc. Aunque en la actualidad aun se debate si los medios de almacenamiento digital
permiten más fidelidad del sonido que los formatos analógicos, el audio analógico presenta
una gran desventaja que se encuentra en el deterioro de los medios de almacenamiento.
Muchos medios analógicos van perdiendo calidad con el pasar de los años debido a daños
en las cintas magnéticas causados por la temperatura, estiramiento o en el caso de vinilos el
polvo y otras suciedades que causan rayones y distorsión. En cintas magnéticas se
evidencia esto al ver como con el paso del tiempo, la humedad y la suciedad hacen perder
su calidad. La respuesta a estos inconvenientes se encuentra en la restauración de audio
mediante la digitalización y posterior tratamiento digital. Cualquier fuente de audio se
puede ver beneficiada por la aplicación de la reducción digital de ruido.
Por los acelerados cambios que han sufrido la televisión, radio, cine y demás medios
relacionados con el Audio y video, las técnicas, equipos y formatos de almacenamiento
han evolucionado en el campo de los medios audiovisuales; siendo un punto fundamental
la migración de materiales con formato analógico a formato de reproducción digital.
Con la aparición de las técnicas digitales y el procesamiento de señales, la restauración de
audio adoptó un tratamiento fuertemente digital dejando a un lado los pobres resultados de
técnicas simples de restauración análoga y enfocándose hacia el desarrollo de hardware y
software para una optimización y mejoramiento de este proceso.
En la actualidad es muy abundante el material de audio en formato analógico que se

encuentra en emisoras, universidades y hogares que aun no está en formato digital; un
adecuado tratamiento digital a este material permitiría recuperar mucha de esta
información.
Algunas empresas, relacionadas con el medio audiovisual, ofrecen diferentes alternativas

en software y hardware que contienen poderosas herramientas para procesos de audio y
video en los que se incluye la restauración de audio. A nivel nacional son diversas las
empresas que ofrecen servicios y productos audiovisuales en el área de Posproducción
siendo la digitalización y restauración de audio algunas de sus prestaciones.
En la Universidad Pontificia Bolivariana, tanto a nivel de pregrado como de postgrado el

tema del audio ha tenido un tratamiento muy general enfocándose principalmente en los
modelos matemáticos que describen el fenómeno del sonido y los conceptos y temas
asociados a este. En ningún caso se ha profundizado en un concepto en particular o se ha
trabajado un tema especializado que seria ir más allá de repetir una teoría a aplicarla.
Las siguientes son algunas tesis relacionadas con el tema del audio, que pueden servir de
soporte a este proyecto, trabajadas en la Universidad Pontificia Bolivariana:
436
• Audio digital. Carlos Eduardo Castañeda R. Juan José Rodríguez L.

• Conversión análogo-digital y digital-análoga. Luis Fernando Cadavid Marín.
Alberto León Hernández Cardona.
• Electrónica Musical. Juan Diego Correo Blair.
• Plataforma para procesamiento digital de señales de audio. Ricardo Antonio
García Ortega.
En la búsqueda bibliografía a nivel nacional no se han logrado identificar trabajos

relacionados con la restauración de audio analógico; concentrando nuestra búsqueda en las
diferentes Universidades del país.
Las siguientes son algunas de las empresas Colombianas más representativas en el tema de
posproducción y producción de audio y video; contando con equipos y software de edición
de gama profesional que brindan múltiples técnicas de tratamiento de audio y video
incluyendo la restauración de los mismos.
Empresa Area Website

RCN Audiovisual www.canalrcn.com
Caracol Audiovisual www.canalcaracol.com
Telemedellín Audiovisual www.telemedellin.com
VideoBase Posproducción www.videobase.net
Las siguientes son algunas de las empresas más representativas en el tema de la

Empresa Producto Descripción

Software Hardware
Sony Sound Forge Edición de Audio
Adobe Audition Edición de Audio
Steinberg Wavelab Recuperación de la calidad de Audio
Pinnacle Steinberg Clean Recuperación de la calidad de Audio
CEDAR Cedar para Tarjetas/conversores Restauración de Audio
Windows
SONIC NoNoise NoNoise Restauración de Audio
solutions
Canopus Utilidades Edición de video
Pinnacle Tarjetas de video Edición de Video
IberAlp Cube Tec Sistema Informático de Audio
IberAlp Conversores Convertidor AD y DA para audio
DataVideo Conversores Línea DAC
Promax Conversores Línea DA-MAX+
Canopus Tarjetas/conversores Edición de Video
437
(5) OBJETIVOS
Objetivo general:
Redactar un documento que permita conocer mediante bases teóricas y ejemplos los
procesos, métodos y elementos más significativos relacionados con el tratamiento digital
orientado a la restauración de audio.
Objetivos específicos:
• Describir el proceso de la restauración de audio desde su digitalización hasta su

tratamiento digital.
• Orientar al personal de la emisora de la Universidad Pontificia Bolivariana en el
proceso de restauración de audio.
• Describir el proceso de eliminación de las degradaciones presentes en las señales de
audio. (Ej: Declicking, etc…..)
• Explicar los fenómenos físicos que ocurren en los medios de almacenamiento de
audio analógico que hacen necesaria su restauración.
• Generar material de apoyo pedagógico a la nueva línea optativa en audio de
ingeniería.
• Llevar a la práctica con ejemplos el proceso de la restauración de audio.
(6) JUSTIFICACIÓN Y BENEFICIOS
Las motivaciones personales nacen de nuestra profunda afición a los temas referidos con el
Audio y sus avances tecnológicos y la posibilidad de contar con equipos de audio de alto
perfil profesional para desarrollar un beneficioso trabajo de campo. La restauración de
Audio por medios digitales es un tema que aun no se abordado en Trabajo de Grados en el
medio local.
El trabajo de grado servirá como material pedagógico a la línea optativa en audio de la
facultad de ingeniería; no siendo solo un beneficio educativo sino un apoyo tecnológico
social al contribuir con asesoramiento en la adquisición de nuevas tecnologías para la
restauración de audio, proceso que se encuentra activo actualmente en la emisora de la
Universidad Pontificia Bolivariana, además con el desarrollo del trabajo de grado se
apoyará la capacitación del personal de la emisora, elevando el nivel de calidad de esta y
proporcionando un mejor servicio de radiodifusión a la radioescucha.
Nuestro asesoramiento a la emisora de la Universidad Pontificia Bolivariana será de gran

utilidad debido a que en el proceso de adquisición de los materiales de hardware y software
no se ha hecho la investigación debida.
Cabe anotar que cuando la emisora se familiarice con dichos procesos no vera necesario
contratar los servicios de Tranfer a terceros.
438
(7) ALCANCES
Describir claramente el proceso necesario para la correcta restauración de audio Analógico,

así como mostrar los elementos (software y hardware) que participan en este proceso.
Un alcance fundamental será contribuir con la modernización de la emisora de la
Universidad Pontificia Bolivariana.
(8) TABLA DE CONTENIDOS
Capítulos Enfoque Materia Comentario

1. Introducción Teórico Introducción al trabajo de
grado
2. Conceptos de Teórico Física de Ondas Definiciones e introducción a
Sonido y Sistemas y Señales la restauración de Audio
Restauración
de Audio
3. Material de Teórico Investigación Medios de audio análogos
Audio Análogo Daños y deterioro de medios
analógicos de Audio.
4. Tratamiento al Teórico Investigación Descripción de los
medio físico de tratamientos “reconstructivos”
almacenamiento de de los medios físicos de
audio análogo. almacenamiento de audio
análogo previos a la
digitalización.
5. Captura de audio Teórico Microprocesadores Proceso de digitalización de la
analógico Práctico Sistemas y señales señal de audio analógica.
Instrumentación Conversores A/D. Criterios de
selección de los equipos
conversores.
6. Tratamiento digital de Teórico Sistemas y señales Procedimiento de restauración
la señal de audio para digital de Audio y ejemplos.
su restauración Mención de algoritmos de
restauración (DSP)
7. Material de audio Teórico Investigación Medios de almacenamiento
digital. digitales de audio
8. Grabación y Teórico Sistemas y señales Medios de reproducción digital
reproducción de la Microprocesadores de audio.
señal restaurada Investigación Conversión D/A
9. Conclusiones Teórico Resultados obtenidos
10. Bibliografía
Anexos Teórico Investigación Anexos relacionados con el
trabajo de grado
Experiencias del Teórico Relato de lo aprendido,
trabajo con la emisora Practico problemas encontrados y
de la Universidad soluciones planteadas en el
439
Pontificia Bolivariana trabajo con la emisora.
(9) PRESUPUESTO Y RECURSOS NECESARIOS
Tabla de recursos Participación (miles de pesos) Implica desembolso

Recursos Estudiant Servicio Préstamo Donación SI NO
presupuestados e s UPB (Nuevo) (Existente
)
Fotocopias y 300 300
Bibliografía.
Internet, llamadas y 180 180

fax larga distancia.
Transporte y estadía
en otras ciudades.
Servicios de 2000 200 1800

Cómputo
Materiales y 200 15000 200 15000

componentes
Hardware
Licencias Software 6500 6500
Alquiler de espacios 2000 2000

físicos
Trabajo Director (40 1400 1400

h @ 35k$/h
Especialista)
Trabajo Asesor (15 h 525 525

@ 35k$/h
Especialista)
Imprevisibles (10%) 100 50 150
SUBTOTALES (Por 2780 50 23500 1925 1030 27225

columna)
TOTALES 28255 28255

440
(10) FINANCIACIÓN
Gran parte de los recursos requeridos corren por cuenta de los estudiantes que hacen parte
de este proyecto. Durante el proceso de trabajo de grado se recibirá la ayuda de la Emisora
de la Universidad Pontificia Bolivariana y la empresa VideoBase en el préstamo de equipos
de Audio y video profesionales. Se contara con dos estudios de audio profesional con líneas
de radiodifusión y posproducción a disposición del proyecto.
(11) CRONOGRAMA Y OCUPACIÓN
Actividades MES Ocupació

n
Ener Febrero Marzo Abri Mayo Juni Julio Horas
o l o
1. Búsqueda de 250
Bibliografía
2. Formulación del 50
Proyecto
3. Familiarización de 150
equipos Análogos
y
Digitales de Audio
4. Digitalización de 80
Señales de Audio
5. Tratamiento de 300
Señales Digitales
de
Audio
6. Restauración de 100
Audio
7. Apoyo a la 125
Emisora
de la Universidad
8. Redacción del 300
Informe
9. Revisión del -
informe por
Jurados
Horas Totales 1355
Numero de 2 Horas promedio Integrante 677.5
graduados
441
(12) BIBLIOGRAFÍA
Libros
[1] Tratamiento Digital de Señales

Jhon G. Proakis
Prentice Hall
Biblioteca Universidad Pontificia Bolivariana
[2] Procesamiento de señales analógicas y digital

Ashok Albardar
Thomson 2002
Biblioteca Universidad de Antioquia
[3] Digital Audio Restoration: A Statistical Model Based approach

Simon J. Godsill.
http://www-sigproc.eng.cam.ac.uk/~sjg/springer/
[4] Digital signal Processing Algorithms

Hari Krishna Garg
CRC Press 1998
[5] Tesis
Audio Digital
Carlos Eduardo Castañeda
Juan Jose Rodriguez 1985
[6] Tesis
Electrónica Musical
Juan Diego Correa 1999
[7] Digital Signal Processing Principles algorithms and applications

Jhon G. Proakis, Dimitris Manolakis
Prentice may 1996
[8] Noise and other interfering signals

Ralph Morrison
442
[9] Handbook for Sound Engineers

Ballu Glen
Sams, 1991
Biblioteca Universidad Nacional de Colombia Seccional Medellín
[10] Sistemas de Comunicaciones

Haykin
Editorial Limusa
Colección Personal
[11] Sound System Engineering

Don Davis, Carolyn Davis
Sams, 1987
Biblioteca Universidad Nacional de Colombia Seccional Medellín
Sitios en Internet
[12] Introduction to Audio Restoration – The Concepts

www.cedar-audio.com
[13] Restauración Digital de Sonido.

http://www.arrakis.es/~fonotron/dsr.html
[14] Back to Analog

http://www.digido.com/portal/pmodule_id=11/pmdmode=fullscreen/pageadder_
page_id=37/
[15] Preparing tapes and files for mastering

http://www.digido.com/portal/pmodule_id=11/pmdmode
=fullscreen/pageadder_page_id=38
[16] Model-Bases Analysis of Noisy Musical Recordings with Applications to Audio

Restoration
http://lib.hut.fi/Diss/2004/isbn9512269503/isbn9512269503.pdf
[17] Audio Signal Processing

http://www.lectrosonics.com/wg/wgaud.pdf
[18] Audio tutorial

http://www.obsoleteelectronics.com/21065L_Audio_Tutorial.PDF
[19] Audio Terms

http://www.peavey.com/support/technotes/
443
[20] Software de edición y manipulación del audio digital

http://www.laorejadigital.com/default.php?echohtml
=%2Frevista%2Ftutorial%2Fesdi_
audio3%2Fdocu.php3%3F
[21] Cube Tec, Procesado de Señal

http://www.iberalp.es/Descripciones/cubetec/vpis.htm
[22] Transferring LPs to CDR: Some Advice

http://www.delback.co.uk/lp-cdr.htm#clean
[23] Audio Restoration

http://perso.wanadoo.fr/jlf/restoration.htm
[24] LEARN Datavideo Secrets

http://www.datavideo.us/
[25] Sistema informático de audio, multicanal, 24 bits y 192 kHz

http://www.iberalp.es/Productos/gama_de_productos.htm
[26] Convertidor AD y DA para audio

http://www.iberalp.es/Productos/gama_de_productos.htm
[27] Convertidores AD/DA

http://www.promax.com/products/
444
ACTA DE PROPIEDAD INTELECTUAL del Proyecto: La Restauración de Audio
1. Los derechos morales de autor corresponden al autor principal y a toda persona que, a
criterio de éste, haga aportes originales intelectuales en los avances y en el resultado final
del proyecto. Al director le asiste el derecho de mención.
El director y el graduando serán autor y coautor de todas las publicaciones nacionales e
internacionales que genere el proyecto. Estos a su vez determinarán cuales de los
colaboradores deben ser mencionados según sus aportes en el proyecto. Adicionalmente, en
cualquier tipo de divulgación que se haga del trabajo se dará crédito a La Universidad
Pontificia Bolivariana, Ingenierías Eléctrica y Electrónica, Grupo de investigación, etc...
2. Derechos patrimoniales:
Los derechos patrimoniales podrán pertenecer conjunta o separadamente a los creadores, a
la Universidad o a otras personas y organismos, dependiendo de la modalidad bajo la cual
el realizador ejecute la producción intelectual. Debe describirse claramente en que manera
o proporción se hará la repartición de los derechos industriales o de explotación en caso de
generarse estos.
En caso de obtener financiación por parte de alguna entidad, antes de iniciar cualquier
explotación comercial de la investigación se deberá suscribir un acuerdo entre las partes, a
saber: Universidad Pontificia Bolivariana, Entidad Financiadora, autor(es), en el cual se
determinan los derechos y obligaciones de las partes.
3. Causales de retiro. El retiro podrá ser voluntario o ser motivado por el incumplimiento de
las obligaciones de una de las partes, a criterio del director.
4. Costos: Se declara el costo estimado total, y cuánto de estos requiere desembolsos, y se

hace referencia a la “Tabla de recursos necesarios” para explicar la participación relativa de
los involucrados.
5. Constancias: Todos los partícipes han estudiado y aceptan el “Estatuto de propiedad

intelectual” de la Universidad Pontificia Bolivariana, el reglamento de elaboración de
trabajos de grado IEE y el proyecto del trabajo de grado; y se comprometen a cumplir los
deberes que estipulan en estos.
____________________________ ____________________________
Gustavo Adolfo Valencia Zapata Nicolás Ramírez Echeverri
Estudiante Estudiante
CC. 3.396.765 de Envigado CC. 98.670.385 de Envigado
____________________________ ____________________________
José Ricardo Zapata Hernán Valencia Gallón
Director Asesor
CC. 71.375.690 de Medellín CC. 8.281.231 de Medellín
295
ANEXO A
DISPOSITIVOS REPRODUCTORES Y/O GRABADORES DE AUDIO

ANALÓGICO
296
FONÓGRAFO
El fonógrafo fue creado por Thomas Alva Edison en 1877 y, entre sus inventos,
fue el que más orgullo le produjo. El sonido se grababa en un cilindro que
luego se hacía girar contra una aguja. Ésta subía y bajaba en los surcos del
cilindro, produciendo vibraciones que se amplificaban en una bocina cónica.
Debido al movimiento vertical de la aguja, este método de grabación se
denominó proceso de "Registro en profundidad".
El fonógrafo de Edison fue la primera máquina capaz de grabar y reproducir

sonidos. Se fabricaron diversos modelos pero todas sus características técnicas
eran iguales, sus variaciones estaban en el tipo de madera utilizada para la
construcción de su base, su forma física y la del embudo amplificador.
Figura 105. Fonógrafos.

297
AMBEROLA
El principio de funcionamiento de la amberola era básicamente el mismo del

fonógrafo. La diferencia entre uno y otro radicaba en el tipo de cilindro que
reproducían. El cilindro de la amberola, que se caracterizaba por su color azul,
estaba construido con un plástico llamado amberol, que debía rotar a mayor
velocidad y tenía mejor calidad de sonido. Desde el punto de vista
constructivo, este cilindro implicó dos variantes para a la amberola. La primera
de ellas estaba en el sistema de engranajes que debía tener una configuración
diferente para lograr que el cilindro girara a la velocidad adecuada. La otra era
que la aguja de la amberola debía ser más delgada para desplazarse por los
finos canales del nuevo cilindro.
La Edison Company fabricó un tipo de amberola que poseía diferentes tipos de

agujas y una pequeña palanca que, al desplazarla, cambiaba la relación de
engranajes del mecanismo de rotación. De esta manera se obtuvo una
máquina con capacidad para reproducir ambos tipos de cilindro. Esta máquina
siguió llamándose fonógrafo, la amberola sólo reproducía cilindros de amberol.
298
Figura 106. Amberola.

Fuente: The oficial homepage for Lisa and Mike. Antiques: Edison Amberola [en línea].
s.l.: Lisa and Mike, 2005
http://www.lisaandmike.com/PhonographEdisonAmberola.htm
Fuente: Phonophan. Antique Phonographs for Sale: The ghosts of phonograph past…
[en línea]. s.l.: Phonophan, 2005.
<http://www.phonophan.com/sold.html> [consulta: 26 May. 2005]
299
GRAMÓFONO
La creación del gramófono se le otorgó al inventor de origen alemán Emile

Berliner, en 1888. Su principal diferencia con el fonógrafo era que, en lugar de
utilizar cilindros como medio de grabación, usaba discos planos. Al igual que el
fonógrafo, reproducía sonido con una aguja cuyas vibraciones mecánicas se
amplificaban mediante una bocina cónica. El movimiento de la aguja sobre la
superficie del disco era lateral (de un lado a otro) y de afuera hacia adentro.
Inicialmente, la rotación del disco debía hacerse en forma manual, a través de
una manivela. Posteriormente, se dotaron con motores de muelle a los que
había que dar cuerda.
La popularidad del gramófono hizo que se fabricaran con distintas tipologías.

En Francia se construyó un modelo en el que la aguja se desplazaba por el
disco desde adentro hacia afuera, en sentido inverso al usual y con el disco
girando a 90 RPM. Esta máquina era capaz de producir un sonido de
excepcional calidad para la época. Los fabricantes suizos de cajas de música se
especializaron en la producción de pequeños gramófonos portátiles.
300
Figura 107. Gramófonos

Fuente: HOWE, Tom. CED Magic: CED in the History of Media Technology
[en línea]. Portland. HOWE, Tom, 2005.
<http://www.cedmagic.com/history/berliner-gramophone.html>
301
ALAMBRE
El grabador y reproductor de alambre fue el primer dispositivo dotado con las

condiciones mínimas para utilizar adecuadamente el principio de la grabación
magnética en el almacenamiento de sonidos. Sin embargo, su pobre respuesta
en frecuencia (70 a 6.000 Hz.) lo redujo a grabaciones de voz en dictáfonos y
telégrafos.
El aparato contaba con una perilla para el volumen, controles para seleccionar
entre modo de grabación o reproducción, botones de encendido y apagado,
una entrada para micrófono y un altavoz interno. Algunos modelos tenían
indicadores del nivel de volumen y de grabación, pero no eran muy exactos.
Figura 108. Grabadores y reproductores de alambre

Fuente: MORTON, David. The history of sound recording technology: Wire recorders
[en linea]. s.l.: MORTON, David, 2003.
<http://www.recording-history.org/HTML/morewire.htm>
302
CARRETE ABIERTO
Durante la era analógica, los grabadores de carrete abierto eran considerados

los sistemas de audio profesional por las características de su cinta, expuestas
anteriormente. Estas características permitieron, al equipo grabador y
reproductor de carrete abierto, contar con unas especificaciones técnicas que
sobrepasaban ampliamente todas las de sus homólogos de otros formatos.
Entre estas características sobresalen:
• Respuestas en frecuencia que podían ir desde 20 hasta 30.000 Hz, de

acuerdo con la velocidad de grabación y la calidad de la cinta.
• Diversidad de entradas y salidas: RCA, ¼” TRS, micrófonos y en
algunos modelos más recientes entradas y salidas XLR balanceadas.
• Capacidad de selección entre diversas velocidades de grabación:
desde 1 7/8 pps hasta 30 pps
• Algunos modelos poseían hasta 4 indicadores del nivel de grabación
independientes para cada una de las pistas de la cinta
• Capacidad para soportar carretes hasta de 10.5” de diámetro
• Supresores de ruido
• Bajos niveles de wow y flutter < a 0.05%, grabando a altas
velocidades.
• Conector para controles remoto alámbricos
• Posibilidad de operación a 50 ó 60 Hz. y a diferentes niveles de
voltaje.
303
Figura 109. Grabadores y reproductores de carrete abierto

Fuente: MIDI Classics. Open Reel Recorder: BR-20 Open Reel Recorder – B Stock [en
linea]. Weatogue. MIDI Classics, 2005.
<http://www.midi-classics.com/h/h22423.htm>
Fuente: ebaY Store. Vintage Electronics: Reel-to-reel tape recorders
[en línea]. s.l.: ebaY, 2005.
<http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&category=67814&item=578176534
5&rd=1> [consulta: 23 May. 2005]
304
TOCADISCOS
El disco fue la manera más popular de almacenar sonido en la era del audio
analógico, lo que produjo que el desarrollo y el mercado de los tocadiscos sean
tan amplios, incluso hoy en día se comercializan. Desde el punto de vista de su
construcción, todos los tocadiscos están diseñados de la misma manera: una
bandeja giratoria, un brazo con una aguja en un extremo, controles de
velocidad y salidas para los canales izq. y der. de audio que, por lo general,
deben ir a un amplificador. Las diferencias entre modelos están en los
materiales utilizados para construir el equipo, que pueden variar en calidad, la
capacidad para reproducir discos de diferentes tamaños y velocidades y en el
hecho de que algunos tienen sistemas antivibratorios y antideslizantes para
evitar que la aguja se mueva bruscamente por la superficie del disco.
Por lo general, las velocidades de reproducción de los tocadiscos pueden variar

entre 33 1/3 RPM o 45 RPM y los tamaños entre 7” ó 10”, ya que es lo más
corriente. Sin embargo, existen aún tocadiscos que, incluso, pueden reproducir
discos de 78 RPM y 33 1/3 RPM de 12”.
En esta categoría, pero en otro nivel, también están los tocadiscos ópticos o
láser, cuya fotografía se presenta a continuación. La diferencia de éste con el
tocadiscos convencional es que utiliza un rayo láser en lugar de una aguja para
leer los surcos del disco, que logra eliminar el contacto físico con el disco y, por
lo tanto, incrementa la calidad del sonido. Puede reproducir discos desde 30 a
50 RPM y de diámetros hasta 12”, posee una respuesta en frecuencia de 20 a
25.000 Hz.
(Para adquirir mayor información sobre este equipo, se sugiere la visita de la

página Web de ELP Laser Turntable, http://www.elpj.com/.)
305
Figura 110. Tocadiscos.

Fuente: ebaY Store. Vintage Electronics R-US: All Categories
7&tc=photo> [consulta: 15 May. 2005]
Fuente: Amazon. Electronics. Turntables & Accessories: Sony PSLX350H Stereo
Turntable System [en línea]. s.l.: Amazon, 2005.
Figura 111 Tocadiscos óptico o láser.

Fuente: ELP Laser Turntable [en línea]. s.l.: WAUGH, Max, 2005.
306
CARTUCHOS RCA
Este tipo cartucho no alcanzó la popularidad suficiente como para generar un

desarrollo pleno de sus equipos reproductores y grabadores. Por esta razón es
claro que existen muy pocos modelos y con características muy básicas de uso,
diseño y sonido. Además de los controles básicos de volumen, play, stop y
rewind (no tenía forward), el equipo estaba dotado de un altavoz, una entrada
para micrófono externo y una pequeña palanca que cambiaba la velocidad de
grabación del cartucho entre 3.75 pps o 1 7/8 pps. Utilizaba tecnología de
tubos de vacío y su cuerpo tenía la notable característica de estar construido
casi enteramente de plástico.
Figura 112. Grabador y reproductor de cartuchos RCA.

Fuente: ebaY Store. Vintage Electronics. Rell-to-reel tape recorders: other brands [en
línea]. s.l.: ebaY, 2005.
3&rd=1&ssPageName=WDVW> [consulta: 1 Jun. 2005]
307
SANYO MICRO PACK 35
Esta pequeña grabadora fue la primera forma de grabación portátil que tenía
como función esencial la grabación de voz o de periodista. Debido a esto, sus
características eran muy básicas y sus controles muy limitados, apenas
contaba con un control de volumen, un botón de grabación, un botón de
reproducción, un altavoz y un micrófono incorporado. Su tamaño compacto y
portátil la limitaba únicamente a fuentes de energía portátiles o baterías.
Figura 113. Sanyo Micro Pack 35.

Fuente: TEDESCHI, Enrico. Old radio digital world: Items for Sale, Miscellaneous items
for sale [en línea]. Brighton. TEDESCHI, Enrico, 2002.
<http://www.etedeschi.ndirect.co.uk/sale/miscellanea.htm>
308
CARTUCHO DE 4 PISTAS
El cartucho de 4 pistas fue un formato de poca duración y su aplicación se dio

de manera amplia en reproductores de automóviles. Se fabricaron algunos
modelos portátiles y de mesa, pero estos últimos no eran muy comunes.
Sus características eran aceptables, pero su escaso mercado no le permitió un

gran despliegue. Sus controles eran los básicos, su respuesta en frecuencia
podía ir desde 30 a 20.000 Hz. y apenas tenían salidas para sus canales
izquierdo y derecho o altavoces. Algunos modelos de mesa tenían control de
tono y entradas para micrófonos.
Figura 114. Grabadores y reproductores de cartuchos de 4 pistas.

Fuente: 8-track heaven. 4 track stuff: muntz porta four [en línea].
s.l.: 8-track heaven, 2005 <http://www.8trackheaven.com/4-track-pics.html>
309
CARTUCHO DE 8 PISTAS
El cartucho de 8 pistas fue una evolución del cartucho de 4 pistas, tanto en su

formato como en el equipo reproductor y grabador. Fue más popular que el
cartucho de 4 pistas, lo que propició un mayor desarrollo y más variedad de
equipos. Se encontraban equipos para automóviles, portátiles y de mesa,
incluso había modelos que también tenían tocadiscos. Entre sus características
se destacan:
• Circuitos supresores de ruido como el Dobly NR

• Indicadores de nivel de reproducción y grabación
• Control de nivel de reproducción y grabación independiente para
cada canal (izquierdo o derecho). En algunos modelos también
automático.
• Función de repetición de cinta un vez o indefinidamente.
• Entradas de ¼” TRS para micrófonos.
• Salidas de ¼” TRS para audífonos.
• Auto detención de la reproducción al terminar la cinta.
• Salidas y entradas RCA no balanceadas.
310
Aa) Ab) Ac)
Figura 115. Grabadores y reproductores de cartuchos de 8 pistas. a) Portátil, b) De

mesa, c) De automóvil.
Fuente: ebaY Store. Vintage Electronics R-US: All Categories
<http://stores.ebay.com/Vintage-Electronics-R-
US_W0QQcolZ4QQdirZ1QQdptZ0QQftidZ2QQpZ2QQtZkm>
Fuente: Dad's 8-Track Attack!. Dad's 8-Track Car Players! [en línea]. s.p.i.
<http://www.hooked.net/~danasam/car.html>
Fuente: Dad's 8-Track Attack!. Dad's 8-Track Portable Players! [en línea]. s.p.i.
<http://www.hooked.net/~danasam/port.html> [consulta: 25 May. 2005]
311
AUDIO CASETE COMPACTO
El casete de audio compacto fue el formato de cinta magnética más popular de

la historia, incluso hoy en día se fabrican modelos con características muy
aceptables. Existen grabadores/reproductores de todos los tipos posibles con
diversidad de características, de acuerdo con su aplicación y funcionalidad.
Entre las características de estos reproductores se pueden destacar:
• Respuesta en frecuencia de 30 a 13.000 Hz. para modelos de antaño, de

30 a 14.000 Hz. para modelos domésticos y de 20 a 18.000 Hz. para
modelos profesionales, según el tipo de cinta
• Niveles de wow y flutter de 0.15% en modelos de antaño y domésticos y
de 0.06% para profesionales.
• Sistemas supresores de ruido
• Selector del tipo de cinta: normal, cromo o metal.
• Entradas y salidas RCA no balanceadas (todos los modelos)
• Entradas y salidas para micrófonos y audífonos, respectivamente.
• Los modelos profesionales cuentan, además, con sistemas de búsqueda
de pistas, interfaces de comunicación con computadores y consolas de
audio profesional, entradas y salidas para conexión de varios equipos en
cascada y selector automático del tipo de cinta.
312
Figura 116. Grabadores y reproductores de casete de audio compacto.

Fuente: Peformance Audio. Products: Denon profesional DN-780R [en línea].
s.l.: Performance Audio, 2005.
<http://www.performanceaudio.com/cgi/pages.cgi?buildPage=item&ProductID=00511
9> [consulta: 15 May. 2005]
Fuente: ebaY Store. Consumer Electronics. Vintage Electronics: Cassette Decks.
4&rd=1&ssPageName=WDVW> [consulta: 15 May. 2005]
313
PLAYTAPE
El playtape 1200, como el de la figura que se presenta a continuación, fue uno

de los diversos modelos de playtape portátiles que se fabricaron. Tenían
básicamente las mismas características técnicas, sólo diferían en su forma.
Dada su característica de portátil, por lo general, la alimentación era de con

base en baterías, aunque algunos modelos tenían entradas para fuentes de
alimentación externas. Sus altavoces eran internos y tenían perillas para
control de volumen, selección de canales (1, 2 o estéreo). Algunos modelos
poseían control de tono. Únicamente contaban con una salida de ¼” TRS para
conectar un altavoz externo o unos audífonos. También se fabricaron playtapes
de mesa pero los modelos portátiles eran los que más se utilizaban en la
época.
314
Figura 117. Playtape.

Fuente: 8-track heaven. Playtape - the 2-track alternative [en línea].
s.l.: 8-track heaven, 2005 <http://www.8trackheaven.com/playtape.html>
Fuente: Dad's 8-Track Attack!. Dad's 8-Track Collectibles & Unique! [en línea]. s.p.i.
<http://www.hooked.net/~danasam/collect.html>
315
MICROCASETE
Por tratarse de un formato limitado para grabaciones de voz, sus

reproductores son muy simples en cuanto a sus controles, especificaciones
técnicas y sus interfaces de comunicación. La mayoría de estos dispositivos,
además de los botones corrientes de control, posee un pequeño altavoz, un
micrófono interno y una salida de ¼” TRS para audífonos. Algunos modelos
tienen un selector para variar la velocidad de grabación.
Su característica de portátil implica una alimentación con base en baterías,

aunque existen modelos con entradas para conexión a fuentes de alimentación
externas.
Figura 118. Grabadores y reproductroes de microcasete.

Fuente: Amazon. Electronics. Audio & Video. Portable Audio & Video: Sony M-670V
Microcassette Voice Recorder [en línea]. s.l.: Amazon, 2005.
Fuente: ebaY Store. Consumer Electronics. Portable Audio: Voice Recorders [en línea].
s.l.: ebaY, 2005.
<http://cgi.ebay.com/ws/eBayISAPI.dll?ViewItem&item=5781062514>
316
ELCASET
Grabador y reproductor desarrollado específicamente para el cartucho elcaset.

Todos los modelos eran de características técnicas similares y una de sus
principales innovaciones es que tenía tres cabezas de reproducción. Además de
los controles convencionales con los que cuenta cualquier reproductor de
cintas, en este equipo se pueden destacar:
• Botón de reducción de ruido Dolby NR

• Selector de tipo de cinta: TYPE I: Normal TYPE II: Metal TYPE III: Cromo
• Perilla de nivel de grabación para controlar la intensidad de la señal
proveniente del micrófono
• Medidores de nivel de grabación y reproducción
Entre sus especificaciones técnicas se puede destacar su respetable respuesta

en frecuencia de 25 a 22.000 Hz, su bajo nivel de wow y flutter en 0.04%, y su
distorsión armónica total de 0.8%. En cuanto a sus interfaces de conexión, el
dispositivo contaba con las siguientes entradas y salidas:
• 2 entradas para micrófonos

• 1 entrada RCA estéreo no balanceada
• 2 entradas ¼” TRS estéreo no balanceadas
• 2 salidas ¼” TRS estéreo no balanceadas
• 1 salida para audífonos
317
Figura 119. Grabador y reproductor Elcaset

Fuente: M, Hintze. Consumer Audio Equipment. The Elcaset. Elcaset Tape Decks
[en línea]. s.l.: M. Hintze, 2005.
<http://mhintze.tripod.com/audio/elcaset/decks.htm>
318
ANEXO B
CONVERSORES ANÁLOGO-DIGITAL Y DIGITAL-ANÁLOGO DE AUDIO

319
CONVERSORES MÓVILES
Audiophile USB
Figura 120. ADC/DAC móvil Audiophile USB.

<http://www.m-audio.com/products/en_us/AudiophileUSB-main.html>
Marca: M-AUDIO
Características técnicas básicas:
• Resolución digital: 24 bits

• Frecuencia de muestreo máxima: 96.000 HZ
• Salida analógica de audio: no balanceada RCA
• Entrada analógica de audio: balanceada ¼” TRS y no balanceada RCA
• Entrada y salida digital de audio: S/PDIF coaxial y MIDI
• Rango dinámico: 109 dB
• Respuesta en frecuencia: 20 – 20.000 Hz
• Interfaz digital: USB
• Plataforma: MAC - Windows
320
FireWire Audiophile
Figura 121. ADC/DAC móvil FireWire Audiophile.

<http://www.m-audio.com/products/en_us/FirewireAudiophile-main.html>
Marca: M-AUDIO

• Frecuencia de muestreo máxima : 96.000 HZ
• Entrada y salida analógica de audio: no balanceada RCA
• Interfaz digital: FireWire
321
FireWire Solo
Figura 122. ADC/DAC móvil FireWire Solo.

<http://www.m-audio.com/products/en_us/FireWireSolo-main.html>
Marca: M-AUDIO

• Entrada analógica de audio: no balanceada ¼” TRS
• Salida analógica de audio: balanceada ¼” TRS
322
Waveterminal U24
Figura 123. ADC/DAC móvil Waveterminal U24.

Fuente: Audio products. Guia de productos: tarjetas. [en línea]. s.l.: ESI, 2005.
<http://www.thomann.de/thoiw2_esi_waveterminal_u24_prodinfo.html?sn=43d0a519
0c077250eab81b97b514bff5>
Marca: ESI

• Frecuencia de muestreo: 32.000/44.100/48.000 HZ
• Entrada analógica de audio: no balanceada ¼” TRS
• Entrada y salida digital de audio: S/PDIF coaxial y óptica
323
PHASE 26 USB
Figura 124. ADC/DAC móvil PHASE 26 USB.

Fuente: Audio products. Terratec producer: phase 26. [en línea]. s.l.: Terratec, 2005.
<http://audioen.terratec.net/modules.php?op=modload&name=News&file=article&sid
=6> [consulta: 13 May. 2005]
Marca: Terratec

• Entrada y salida de analógica de audio: no balanceada RCA
• Entrada y salida digital de audio: S/PDIF coaxial, óptica y MIDI
324
PHASE 88 rack FireWire 751
Figura 125. ADC/DAC móvil PHASE 88 rack FireWire 751.

Fuente: Audio products. Terratec producer: phase 88 rack. [en línea]. s.l.: ESI, 2005.
<http://audioen.terratec.net/modules.php?op=modload&name=Sections&file=index&r
eq=viewarticle&artid=32>
Marca: Terratec

• Entrada y salida de analógica de audio: balanceada ¼” TRS y XLR
• Interfaz digital: tarjeta PCI o USB
325
MOTU 896HD
Figura 126. ADC/DAC móvil tipo rack MOTU 896HD.

Fuente: Audio decks. Products: PCI audio. [en linea]. s.l.: MOTU, 2005.
<http://www.motu.com/products/motuaudio/896/body.html/en>
Marca: MOTU

326
MOTU HD192
Figura 127. ADC/DAC móvil tipo rack MOTU HD192.

Fuente: Audio decks. Products: PCI audio. [en linea]. s.l.: MOTU, 2005.
<http://www.motu.com/products/pciaudio>
Marca: MOTU

• Entrada y salida de analógica de audio: balanceada XLR
• Interfaz digital: tarjeta PCI
327
ADI-2
Figura 128. ADC/DAC móvil ADI-2.

Fuente: Audio decks. Audio converters: ADI-2. [en linea]. s.l.: RME, 2005.
<http://www.rme-audio.com/english/adi/adi2.htm>
Marca: RME

• Entrada y salida digital de audio: S/PDIF coaxial y óptica
• Interfaz digital: tarjeta PCI
328
CONVERSORES ESTÁTICOS
Delta 1010LT
Figura 129. ADC/DAC estático Delta 1010LT.

<http://www.m-audio.com/products/en_us/Delta1010LT-main.html>
Marca: M-AUDIO

• Entrada y salida de analógica de audio: no balanceadas RCA y
balanceada XLR
• Rango dinámico: 101.5 dB
• Respuesta en frecuencia: 22.000 – 40.000 Hz
• Interfaz digital: PCI
329
Delta 44
Figura 130. ADC/DAC estático Delta 44.

<http://www.m-audio.com/products/en_us/Delta44-main.html>
Marca: M-AUDIO

• Entrada y salida de analógica de audio: no balanceadas RCA y
balanceada ¼” TRS
330
Audiophile 192
Figura 131. ADC/DAC estático Terratec phase 28.

<http://www.m-audio.com/products/en_us/Audiophile192-main.html>
Marca: M-AUDIO

• Entrada y salida de analógica de audio: balanceada ¼” TRS
331
Terratec Phase 28
Figura 132. ADC/DAC estático PHASE 28.

Fuente: Audio products. Terratec producer: phase 28. [en línea]. s.l.: Terratec, 2005.
<http://audioen.terratec.net/modules.php?op=modload&name=News&file=article&sid
=7>
Marca: Terratec

• Entrada y salida de analógica de audio: balanceada ¼” TRS
332
ANEXO C
DISPOSITIVOS REPRODUCTORES Y/O GRABADORES DE AUDIO

DIGITAL
333
ADAT. Grabador y reproductor
Figura 133. Grabador y reproductor ADAT.

Fuente: Audio decks. Performance audio: alesis [en linea]. s.l.: Performance audio,
2005.
Marca: ALESIS
Modelo: ADAT HD24XR

• Frecuencia de muestreo: 48.000/96.000 HZ
• Entrada y salida analógica de audio: balanceada de ¼” TRS
• Entrada y salida digital de audio: ADAT óptica y MIDI
• Compatibilidad: cintas ADAT
• Rango dinámico: ADC 130 dB y DAC 103 dB
• Interfaz de comunicación 10 Base-T Ethernet (RJ-45)
• 24 pistas a 24 bits/48.000 Hz ó 12 pistas a 24 bits/96.000 Hz
334
DAT. Grabador y reproductor
Figura 134. Grabador y reproductor DAT.

Fuente: MEROD, Jim. Audio decks. The stereo times: [en linea]. s.l.: The stereo times,
2000. <http://www.stereotimes.com/trans110600.shtm>
Marca: TASCAM
Modelo: DA-45HR "Powerhouse" 24-bit Digital Recorder
• Resolución digital: ADC 24 bits y DAC 20 bits

• Frecuencia de muestreo: 44.100/48.000 Hz
• Entrada y salida analógica de audio: balanceadas XLR y no balanceadas
RCA
• Entrada y salida digital de audio: S/PDIF
• Compatibilidad: cintas DAT
• Rango dinámico: ADC 130 dB y DAC 103 dB
335
DAT. Grabador y reproductor móvil
Figura 135. Grabador y reproductor móvil DAT.

Fuente: MEROD, Jim. Audio decks. The stereo times: [en linea]. s.l.: The stereo times,
2000. <http://www.stereotimes.com/trans110600.shtm>
Marca: TASCAM
Modelo: DAP1 Digital Audio Tape Recorder
• Resolución digital:16 bits lineal

RCA
• Entrada y salida digital de audio: S/PDIF
336
DAT. Grabador y reproductor portátil
Figura 136. Grabador y reproductor portátil DAT.

Fuente: Audio decks. Sony: sony mastering. [en linea]. s.l.: Zzounds, 2005.
<http://www.zzounds.com/item--SNYPCMM1>
Marca: SONY
Modelo: PCMM1 Professional Portable DAT Player and Recorder
• Resolución digital:16 bits lineal , 12 bits no-lineal

• Entrada y salida digital de audio: 7-pin conector ¼” TRS
337
DDS. Grabador y reproductor interno
Figura 137. Grabador y reproductor interno DDS.

Fuente: Audio decks. Electronics: DDS decks. [en linea]. s.l.: Amazon, 2005.
<http://www.amazon.com>
Marca: SONY
Modelo: Sony SDT-11000/BM 20/40 GB Capacity DDS-4 Internal Tape Drive
• Capacidad 20 GB sin compresión y 40 GB con compresión.

• Transferencia de datos: soporta 4.8 MB/s (comprimido) y 2.4 MB/s
(nativo)
• Compatibilidad: cintas DDS-4, DDS-3, DDS-2 y DDS-1
338
DDS. Grabador y reproductor externo
Figura 138. Grabador y reproductor externo DDS.

Fuente: Audio decks. Electronics: DDS decks. [en linea]. s.l.: Amazon, 2005.
<http://www.amazon.com>
Marca: SONY
Modelo: Sony Sony TSL-S11000/TB 320 GB 8 Cartridge DDS-4 External
Autoloader Tape
• Capacidad: 320 GB sin compresión y 160 GB con compresión.

• Transferencia de datos: soporta 4.8 MB/s (comprimido) y 2.4 MB/s
(nativo)
• Compatibilidad: cintas DDS-4, DDS-3, DDS-2 y DDS-1
339
DCC. Grabador y reproductor
Figura 139. Grabador y reproductor DCC.

Fuente: EVANS, Mick and EVANS, Dave. Audio decks. Mick’s audioworld [en linea]. s.l.:
EVANS, Mick and EVANS, Dave, 2004.
<http://www.arcticcorsair.f9.co.uk/audio/kit/dcc730.html>
Marca: PHILIPS
Modelo: DCC730 Didital Compact Cassette recorder
• Receptor de AM y FM
• Frecuencia de muestreo: 44.100/48.000 HZ
• Entrada y salida analógica de audio: no balanceadas RCA
• Entrada y salida digital de audio: coaxial acc. A IEC 958
• Compatibilidad: Casetes DCC
340
DCC. Reproductor portátil
Figura 140. Reproductor portátil DCC.

Fuente: GOUDSMIT, Jac. Audio decks. Philips [en linea]. s.l.: GOUDSMIT, Jac, 1998.
<http://home.swipnet.se/~w-59099/dcc/Dcc-mode.htm#DCC%20134>
Marca: PHILIPS
Modelo: DCC 134 - Portable Digital Compact Cassette player
• Resolución digital:18 y 16 bits DAC

• Salida analógica de audio: Audífono 1/8” Mini TRS
341
MD. Grabador y reproductor
Figura 141. Grabador y reproductor MD.

Fuente: Audio decks. Recorders: stereo master players and records. [en linea]. s.l.:
Zzounds, 2005. <http://www.zzounds.com/item--SNYMDSJE480>
Marca: SONY
Modelo: MDSJE480 MiniDisc Recorder Deck

• Entrada y salida digital de audio: S/PDIF óptica
• Compatibilidad: MD
342
MD. Grabador y reproductor portátil
Figura 142. Grabador y reproductor móvil MD.

Fuente: Audio decks. Professional audio: recorders & players. [en linea]. s.l.: H&B
Photo-Video, 2005.
<http://www.bhphotovideo.com/bnh/controller/home?O=productlist&A=details&Q=&s
ku=200797&is=REG>
Marca: HHB
Modelo: MDP-500 Portadisc Portable MD Field
• Resolución digital:16 bits

• Frecuencia de muestreo: 44.100HZ
• Frecuencia conversor: 32.000/48.000 Hz
• Entrada analógica de audio: balanceadas XLR MIC/LINE
• Salida de analógica de audio: Audífono ¼” TRS y no balanceadas RCA
343
MD. Grabador y reproductor portátil
Figura 143. Grabador y reproductor portátil MD.

Fuente: Audio decks. Professional audio: recorders & players. [en linea]. s.l.: Vann’s,
2005. <http://www.vanns.com/shop/servlet/item/features/523149324>
Marca: SONY
Modelo: MZNF520D
• Receptor de AM y FM
• Frecuencia de muestreo: 44.100HZ
• Entrada y salida digital de audio: USB
• Salida analógica de audio: Audífonos 1/8” Mini TRS
344
CD. Reproductor
Figura 144. Reproductor de CD.

Fuente: Audio decks. Performance audio: denon [en linea]. s.l.: Performance audio,
2005.
Marca: DENON
Modelo: Professional CD Player D-C680
• Frecuencia de muestreo del ADC: 32.000/44.100/48.000 HZ

• Resolución DAC: dual 18 bits lineal
RCA
• Salida digital de audio: S/PDIF Coaxial
• Compatibilidad: CD de audio
345
CD. Grabador y reproductor
Figura 145. Grabador y reproductor de CD.

Fuente: Audio decks. Performance audio: denon [en linea]. s.l.: Performance audio,
2005.
Marca: DENON
Modelo: Professional Dual CD Player and CD-R/RW Recorder DN-C550R
• Frecuencia de muestreo del ADC: 32.000/44.100/48.000 HZ

• Resolución DAC (CD drive): 24 bits
RCA
• Salida digital de audio: S/PDIF Coaxial y óptica
• Compatibilidad lectura y escritura: CD de audio, CD-R y CD-RW
• Rango dinámico: 98/88 dB (CD drive/CD-R drive)
346
CD+G. Reproductor
Figura 146. Sega Saturn.

Fuente: Videogames. SEGA: saturn 2 [en linea]. s.l.: Vidgame, 2005.
<http://www.vidgame.net/SEGA/SATURN.html>
Marca: SEGA
Modelo: Sega Saturn (MK-80000A)
• CPU: 2 x Hitachi SH2 @ 28.6 MHz

• RAM: 2 MB principal, 1.5 MB video
• Resolución: 352x224 a 704x480
• Colores: 16.7 millones (24 bit)
• Sonido: 32 PCM
• Salida de audio analógico: no balanceado RCA
• Salida de video analógico: compuesto/S-Video/RGB
• Compatibilidad lectura: CD+G
347
CD-i. Reproductor
Figura 147. CD-I.

Fuente: Videogames. Infoconsolas.com: philips CDI [en linea]. s.p.i.
<http://personal.telefonica.terra.es/web/mallorcadisco/infoconsolas/paginas/Philips/C
DI/CDI.htm>
Marca: PHILIPS
Modelo: CDI 450
• CPU: 68070 Philips 15 MHz

• RAM: 1 MB (aumentable a 2,5 MB con MPEG Cartridge, +1 MB RAM
+512 KB MPEG decodificador RAM)
• Resolución: 768x560
• Colores: 16.7 millones (24 bit)
• Sonido: 44.100 Hz
• Compatibilidad lectura: CD-i y CD+G
348
UMD. Reproductor
Figura 148. PlayStation portátil.

Fuente: Videogames. SONY: playstation [en linea]. s.l.: SONY, 2005.
<http://www.us.playstation.com/psp.aspx?id=overview>
Marca: SONY
Modelo: PSP-1001K
• Resolución: Pantalla LCD

• Colores: 16.7 millones
• Interfaz digital: USB 2.0
• Compatibilidad lectura: UMD
• Red inalámbrica: IEEE 802.b
• Compatibilidad de formatos de audio: ATRAC3, MP3
• Compatibilidad de formatos de video: MPEG-4
• Compatibilidad de formatos de imagen: JPEG
349
DD-CD. Grabador y reproductor
Figura 149. DD-CD RW.

Fuente: Audio decks. Suche: ergebnis [en linea]. s.l.: ZDNet, 2005.
<http://www.zdnet.de/enterprise/storage/0,39027626,10000406,00.htm>
Marca: SONY
Modelo: Internal ATAPI CRX200E
• Grabación sobre DD-CC 1.3GB

• Velocidad de grabación CD-R: 12x
• Velocidad de grabación CD-RW: 8x
• Velocidad de lectura CD-ROM: 32x
• Compatibilidad lectura y escritura: DD-CD, CD de audio, CD-R y CD-RW
350
MO. Grabador y reproductor externo
Figura 150. Grabador y reproductor externo MO.

Fuente: Audio decks. Storage: M/O [en linea]. s.l.: Promarktech, 2005.
<http://www.promarktech.com/storage/mo/sony/smo_s551.htm>
Marca: SONY
Modelo: SMO-S551 Magneto optical drive
• Velocidad de transferencia de datos: 5 MB/s

• Interfaz digital: SCSI 2
• Compatibilidad lectura y escritura: MO disc 1.3/2.6/4.1/4.8/5.2
351
SA. Grabador y reproductor portátil
Figura 151. Grabador y reproductor portátil SA.

Fuente: Audio decks. 1GB memory audio player from NHJ. [en linea]. s.l.: Dottocomu,
2004. <http://www.dottocomu.com/b/archives/000713.html>
Marca: NH Japan
Modelo: iOPS-F300 series
• Receptor de FM
• Grabador de MP3
• Capacidad: 128/256/512/1.024 MB
• Compatibilidad lectura y escritura: SA card
• Compatibilidad de formatos: MP3, WMA y Ogg Vorbis
• Compatibilidad de sistemas operativos: Windows 98SE/Me/2000/XP y
Mac OS 9.2 ó OSX.
352
SA. Reproductor portátil
Figura 152. Reproductor portátil SA.

Fuente: Audio decks. Sharp MP-A100/A200 MP3 player. [en linea]. s.l. s.n, 2005.
<http://breakingnewsblog.com/mp3players/index.php?category_name=news/&paged
=2>
Marca: SHARP
Modelo: MP-A 100/A200 MP3 player
• Receptor de FM
• Capacidad: 256/512 MB
• Compatibilidad lectura: SA card
• Compatibilidad de formatos: MP3, WMA
• Compatibilidad de sistemas operativos: Windows XP
353
DVD. Grabador y Reproductor
Figura 153. Grabador y reproductor de DVD.

Fuente: Audio decks. DV-RA1000. [en linea]. s.l.: TASCAM, 2005.
<http://www.tascam.com/Products/dvra1000.html>
Marca: TASCAM
Modelo: DV-RA1000 recorder

• Frecuencia de muestreo: 192.000 Hz
• Entrada y salida analógica de audio: balanceadas XLR, ¼” TRS y no
balanceadas RCA
• Compatibilidad lectura y escritura: CD de audio, CD-R, CD-RW, DVD-R,
DVD-RW, DVD+R y DVD+RW
354
DVD. Reproductor
Figura 154. Reproductor de DVD.

Fuente: Audio decks. DVD players: DVD-1910. [en linea]. s.l.: DENON, 2005.
1910&f=DVD1910%20Front.jpg&c=4>
Marca: DENON
Modelo: DVD-1910

• Entrada y salida digital de audio: S/PDIF óptico y coaxial
• Compatibilidad lectura: CD de audio, CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R y DVD+RW
355
DVD. Reproductor portátil
Figura 155. Reproductor portátil DVD.

Fuente: Audio decks. Products: DVD.618. [en linea]. s.l.: RCA, 2005.
<http://www.rcaaudiovideo.com/Cultures/en-
US/ModelDetail.html?PCI=Portable+DVD&ProductID=DRC618N>
Marca: RCA
Modelo: DVD.618
• A/V entrada/salida
• MultiSpeed Scan
DVD+R y DVD+RW
356
DVD. Reproductor
Figura 156. PlayStation2.

Fuente: Videogames. Hardware: PlayStation2. [en linea]. s.l.: SONY, 2005.
<http://www.us.playstation.com/consoles.aspx?id=2/info/PlayStation2/
default.html#>
Marca: SONY
Modelo: PlayStation2
• CPU: 128-bit 294.912 MHz

• Ancho de banda bus memoria: 3.2 GB por segundo
• Sonido: ADPCM
• Salidas de audio analógico: no balanceada RCA
• Salidas de audio digital: S/PDIF óptica
• Salida analógica de video: compuesto/S-video
DVD+R y DVD+RW
357
DVD. Grabador y reproductor externo
Figura 157. Grabador y reproductor externo.

Fuente: DVD drives. CD/DVD drivers: DVD burners. [en linea]. s.l.: SONY, 2005.
<http://www.tigerdirect.com/applications/SearchTools/item-
details.asp?EdpNo=1446930&Sku=S167-3470>
Marca: SONY
Modelo: DRX-710UPL External DVD Writer
• Velocidad de grabación DVD+R/DVD-R: 16x/8x

• Velocidad de grabación DVD+RW/DVD-RW: 4x/4x
• Velocidad de lectura DVD-ROM: 16x
• Compatibilidad lectura y escritura: CD de audio, CD-R, CD-RW, DVD-R,
DVD-RW, DVD+R y DVD+RW
358
SACD. Reproductor
Figura 158. Reproductor SACD.

Fuente: DVD drives. CD/DVD drivers: DVD burners. [en linea]. s.l.: DENON, 2005.
5910&f=DVD5910%20Front.jpg&c=4>
Marca: DENON
Modelo: DVD-5910

• Entrada y salida analógica de video:
compuesta/S-video/RGB/HDMI/DVI-D
• Interfaz digital: IEEE 1394
DVD+R, DVD+RW y SACD
359

• Respuesta en frecuencia: DVD (2 – 88.000 Hz)/SACD (2 – 100.000
Hz)/CD (2 – 20.000 Hz)
360
BD. Reproductor
Figura 159. PlayStation3.

Fuente: Videogames. PS3: oficial PS3 pictures. [en linea]. s.l.: SONY, 2005.
<http://www.ps3land.com/ps3-pictures/picture53.php>
Marca: SONY
Modelo: PlayStation3
• CPU: PowerPC-base Core 3.2 GHz

• Ancho de banda bus memoria: 22.4 GB por Segundo
• Resolución: 480i, 480p, 720p, 1080i,1080p
• Sonido: Dolby 5.1ch, DTS, LPCM
• Interfaz digital: USB, Bluetooth, Ethernet
• Salidas de audio digital: S/PDIF óptica
• Salida analógica de video: HDMI
• Compatibilidad lectura: CD de audio, CD-R, DVD-R, CD-RW, DVD+R,
DVD+RW, BD-ROM, BD-R, BD-RE
361
BD. Grabador y reproductor
Figura 160. Grabador y reproductor Blu-ray.

Fuente: Panasnic. Blue-ray. [en linea]. s.l.: AV LAND LTD, 2005.
<http://www.avland.co.uk/panasonic/dmre700/dmre700lrg.jpg>
Marca: Panasonic
Modelo: DMR-E700BD Blu-Ray Disc / DVD-R/RAM Recorder

• Entrada y salida analógica de video: compuesta/S-video/RGB
DVD+R, DVD+RW, DVD-RAM y Blu-ray Disc
• Compatibilidad de grabacion: CD-R, CD-RW, DVD-R, DVD-RW,
DVD+R, DVD+RW, DVD-RAM y Blu-ray Disc.
362
HD DVD. Reproductor
Figura 161. Grabador y reproductor HD DVD.

Fuente: Press relase: Nec HD DVD. [en linea]. s.l.: HD DVD Promotion Group, 2005.
<http://www.hddvdprg.com/press/nec.html> [consulta: 6 Jun. 2005]
Marca: NEC
Modelo: HD DVD Drive

DVD+R, DVD+RW, DVD-RAM y HD DVD
363
ANEXO D
FORMATOS DE COMPRESIÓN DE AUDIO CON PÉRDIDAS “LOSSY” Y

AUDIO MULTICANAL
364
COMPRESIÓN DE DATOS LOSSY
El método de compresión de datos lossy consiste en el hecho de que al

comprimir un archivo y luego descomprimir, se recupera el archivo pero no es,
necesariamente, fiel al original, aunque es suficientemente aproximado para
ser utilizado en algunas aplicaciones. Este tipo de compresión es usada
frecuentemente en Internet y en medios de comunicación y en aplicaciones de
telefonía. En este contexto estos métodos son llamados tradicionalmente como
codecs. Básicamente se tienen dos esquemas de compresión: codecs de
transformación y codecs predictivos.
En los codecs lossy de transformación, se toman muestras de imagen o sonido

cortados en pequeños segmentos, los cuales son cuantizados y transformados
en una nueva base de espacio. Los valores de cuantización son llamados
Entropía de código.
En los codecs lossy predictivos, datos de secuencias previas o subsecuencias

decodificadas, son usadas para predecir la muestra de sonido o frame de la
imagen actual. El error entre el dato predicho y el dato real, junto con
cualquier información extra necesaria para reproducir la predicción, son luego
cuantizados y codificados. En algunos sistemas las dos técnicas son
combinadas. Los codecs de transformación se usan para comprimir las señales
de error, generadas por la fase de predicción.
MP3. (MPEG-1 Audio Layer 3). Es un formato lossy de audio digital

comprimido con pérdidas, desarrollado por el Moving Picture Experts Group
(MPEG) para formar parte de la versión 1 (posteriormente ampliado en la
365
versión 2) del formato de video MPEG. Su nombre es el acrónimo de MPEG-1

Audio Layer 3.
Su característica principal es su relacion de compresión es aproximadamente,

11:1, lo que quiere decir, por ejemplo, que si un CD de música normal
contiene unas 13 canciones, en un CD con MP3, se tendrían 143. Tal reducción
de tamaño se realiza por eliminación de sonidos que el oído humano no puede
escuchar. Cuando se eliminan escalas de sonidos no audibles, se reduce la
cantidad de bytes necesarios en el archivo final. El MP3 tiene unas técnicas de
compresión digital diferentes al CD. Por ejemplo, en los archivos digitales de
CD, si dos sonidos simultáneos tienen la misma frecuencia de onda, se elimina
una de ellas. En cambio, en los MP3, hay otros parámetros que influyen, por
ejemplo, si hay un ruido fuerte, se eliminan los datos de los débiles, pues el
oído humano sólo escuchará el fuerte. Existen muchas versiones del codec
MP3. Cada una de ellas dictamina qué sonidos se han de eliminar y cuáles no.
Por este motivo, todas las versiones y configuraciones son distintas. El formato
MP3 se convirtió en el estándar utilizado para streaming (estrategia sobre
demanda para la distribución de contenido de multimedia a través de Internet)
de audio y compresión de audio de alta calidad, gracias a su capacidad para
ajustar la calidad de la compresión, que es proporcional al tamaño por segundo
(frecuencia de muestreo) y, por tanto, al tamaño final del archivo, que podría
llegar a ocupar 11 e incluso 15 veces menos que el archivo original sin
comprimir.
Ogg Vorbis. El funcionamiento de este formato de compresión es similar al

de los otros y también se utiliza para guardar y reproducir música digital. Lo
que diferencia a Ogg Vorbis del resto es que es gratuito, abierto y no está
patentado. Su principal atractivo es la reducción significativa que hace de un
archivo de audio sin restarle calidad. Así mismo, se distingue por su
366
versatilidad y por ocupar muy poco espacio. Su calidad es superior a la de los

codecs comerciales de última generación, como AAC y MP3.
WMA. (Windows Media Audio). Es la versión de Windows para comprimir

audio, es muy parecido al MP3, pero técnicamente inferior. No sólo reduce el
tamaño de archivos grandes sino que también se adapta a diferentes
velocidades de conexión, en caso de que se necesite reproducir en Internet en
tiempo real. Como estrategia comercial utiliza la inclusión de soporte en el
reproductor Windows Media Player, insertado en el sistema operativo Windows.
A diferencia del MP3, el formato posee una infraestructura para proteger el
Copyright (derechos de copia) y hacer más difícil el tráfico ilegal de música.
AAC. (Codificación Avanzada de Audio). Diseñado con el fin de reemplazar el

MP3, almacena más información en menos espacio y con mayor calidad. Se
trata de un formato de propiedad, pero es utilizado para múltiples aplicaciones
como el itunes (reproductor y organizador de música creado por Apple),
Winamp (reproductor y organizador de música para diferentes plataformas) y
es el formato de audio que utiliza Apple para los archivos de audio que
reproduce el IPOD.
VQF. (Transform-domain Weighted Interleave Vector Quantization). Es un

formato de compresión desarrollado por Yamaha con características muy
similares al MP3, pero con mayor compresión y mejor calidad del sonido.
Ofrece una relación de compresión de 18:1. Un archivo VQF es un 30%
aproximadamente más pequeño que un MP3.
367
OTROS FORMATOS
AIFF. (Audio Interchange File Format). Es un archivo de música para

computadora. Los datos de audio no son comprimidos, lo que los hace de un
gran tamaño, comparado con los formatos lossless y lossy. El formato fue
desarrollado por Apple Computer y Electronic Arts, y es principalmente usado
en computadores Macintosh y estaciones de trabajo Silicon Graphics. Es
medianamente conocido fuera de estos dos ambientes, pero más que el
formato AU. Es el archivo por excelencia con el propósito de restaurar audio en
ambiente Macintosh.
RA. (Real Audio). Es un formato ampliamente distribuido y usado, capaz de

reproducir sonido con fidelidad graduada, es decir, el usuario decide la calidad
del sonido para encontrar el equilibrio entre un archivo muy grande con alta
fidelidad y uno muy pequeño de baja fidelidad. Este formato es usado
habitualmente en medios de aplicación en Internet. Se usa con el RealOne
player.
RMF. (Rich Music Format). El Formato Musical Enriquecido, soportado por

Beatnik, es de muy alta calidad, fundamentalmente para descarga y
reproducción. Cada vez se hace más popular.
MIDI. El formato MIDI no se considera de audio digital, pues no almacena

muestras de un determinado sonido, lo que hace es una descripción musical
del mismo a través de un código de instrucciones del reproductor. Sólo
representa sonidos musicales, pero no los describe completamente, ya que
indica el instrumento en el que se tocan, la forma de tocarlo, pero el sonido
368
final que se reproduce depende, en gran parte, del dispositivo reproductor

MIDI.
AUDIO MULTICANAL
Es una manera de procesar audio, en la que el sonido se divide en canales que

se distribuyen a través de una serie de parlantes ubicados estratégicamente,
con el fin de percibir el sonido desde diferentes direcciones. Este fenómeno
produce la sensación de un sonido envolvente, mucho más profundo y, por lo
tanto, más real.
El audio multicanal está muy asociado al video y su principal aplicación se

presenta en las salas de cine y los teatros caseros (Home Theater). No
obstante, una nueva aplicación se está comenzando a desarrollar en el Super
Audio Compact Disk o SACD y el Audio DVD.
Algunos de estos sistemas de sonido multicanal, son: Dolby Digital, Dolby

Digital EX, DTS, DTS ES, SDDS, este último no tiene equivalente para sistemas
caseros.
Dolby Stereo. Desarrollada por laboratorios Dolby, fue la primera forma de

audio multicanal que, además de utilizar los canales, izquierdo y derecho, del
audio estéreo estándar, agrega dos canales adicionales: central y de
envolvente (surround) o de efectos, mediante procesos externos de
codificación sobre la señal. Este último, en combinación con el canal izquierdo
y con el derecho.
369
Dolby Digital. (Dolby 5.1 o AC-3). Este sistema de audio multicanal, también
creado por laboratorios Dolby, es una evolución del Dolby estéreo y se
presentó al público por primera vez en la exhibición de la película Batman
Returns, en el año 1992.
El sistema posee un sonido digital a 48.000 Hz y 16 bits, con 6 canales de audio

comprimidos a una relación 14:1:5 de rango completo (20 a 20.000 Hz) y otro
adicional para señales de baja frecuencia (3 a 120 Hz) conocido como 0.1, de ahí el 5.1.
Dolby EX. (Dolby Extended Sound). Es una variación evolutiva del sistema
Dolby Digital, que incorpora un canal de efectos adicional, mediante
codificación de la señal de audio, para un total de 6 canales reales y un canal
codificado.
DTS. (Digital Theater System). El sistema multicanal DTS es, en términos

generales, equivalente al sistema Dolby Digital, ya que también tiene 5.1
canales de audio y están distribuidos de la misma forma.
La diferencia fundamental entre estos sistemas radica en las características

que presenta la señal digital de audio. La del sistema DTS es a 48.000 Hz y 20
bits (contra los 16 bits de Dolby) y la relación de compresión 4:1 contra 14:1,
dando como resultado un sonido de mayor calidad
DTS ES. (DTS Extended Sound). Sistema idéntico a Dolby Digital EX, pero con
las características propias de DTS.
La primera película que utilizó esta norma fue Stars Wars Episode I.
370
SDDS. (Sony Dynamic Digital Sound). Este sistema ofrece 8 canales de rango
completo (20 a 20.000 Hz) y, como los otros sistemas, utiliza los canales
principales derecho e izquierdo y los de efectos. Su singularidad se encuentra
en la distribución de los altavoces ya que 6 de éstos se ubican detrás de la
pantalla, lo que permite un sonido más integrado con la imagen.
Para este sistema, Sony no proporciona información sobre el tipo y el nivel de

compresión, ni las características del sonido digital.
THX. (Tomlinson Holman Experiment). Etimológicamente este nombre se

desprende del nombre de la primera película de George Lúcas, llamada THX
1138.
THX no es un sistema de audio digital multicanal sino una serie de estándares

técnicos que establece y normaliza las características mínimas que debe poseer
una película o una sala de cine para garantizar una calidad excepcional, entre
ellas la calidad del audio.
En general, THX tiene en cuenta principalmente los aspectos relacionados con

el sonido y la acústica, además pauta ciertos aspectos sobre la imagen y la
comodidad de las salas.
Las características que tiene en cuenta la norma THX para certificar son:
• Calidad, color y ángulo de incidencia del proyector sobre la

pantalla
371
• Ruido generado dentro de la sala (aire acondicionado,

proyector, etc.) y ruido generado fuera de la sala (ruido
ambiental)
• Ángulos de visión y escucha de los espectadores
• Propiedades acústicas de la sala
• Sistema de sonido
Existe la norma THX para equipos de uso doméstico, para que un usuario
pueda comprar un conjunto de reproductor de DVD, decodificador
multicanal, amplificadores y altavoces homologados por THX.
372
ANEXO E
ALGORITMOS DE MODELACIÓN MATEMÁTICA DE SEÑALES DE AUDIO,

DETECCIÓN DE RUIDOS Y RESTAURACIÓN

registros sonoros. [en linea]. Oviedo: Universidad de Oviedo, s.f.
<http://coco.ccu.uniovi.es/brahms/sumario.htm> [consulta: 28 Feb. 2005]
373
MODELOS MATEMÁTICOS PARA DESCRIBIR SEÑALES DE AUDIO
Modelos AR
CONCEPTO
Los modelos AR (autoregresivos) para describir señales se incluyen en un

contexto más amplio de procesos aleatorios discretos, una de cuyas
realizaciones sería la señal discreta o serie temporal que se desea describir.
Sin embargo, para no complicar la notación, se hará uso de un abuso de
lenguaje, denominando con el mismo símbolo a un proceso aleatorio y a
cualquiera de sus realizaciones. Se dice que el proceso s(n) obedece a un
modelo auto-regresivo discreto de orden P si s(n) es la única solución
estacionaria de la ecuación de recurrencia siguiente:
donde P es el orden del modelo, a(k) sus coeficientes, e(n) un proceso

aleatorio centrado, estacionario de segundo orden, blanco y con varianza
constante σe2, que suele denominarse señal de excitación y N el tamaño del
bloque de señal cuyo modelo se desea establecer.
EL FILTRO AP Y MODELO DE PRODUCCIÓN DE HABLA
Una señal que puede ser razonablemente predecible en función de los valores
muestrales pasados, muestra un espectro de banda estrecha. Inversamente,
una señal no predecible, como un ruido blanco, exhibe un espectro de
frecuencias de banda ancha. Si se escribe
374
la señal s(n) se puede interpretar como la respuesta del filtro todo polos cuya
función de transferencia es:
a la señal de excitación e:
Se demuestra que la ecuación de recurrencia admite como solución una señal

única s(n) estacionaria de segundo orden si y solo si los polos de la función de
transferencia H(z) son de módulo estrictamente inferior a 1, es decir si
Se puede demostrar que la densidad espectral de potencia de un proceso AR

de orden P es de la forma:
Se puede ilustrar la utilidad de este modelo aplicándolo al establecimiento de

un modelo matemático básico para la producción de habla. Este proceso es un
ejemplo de un proceso que sirve para convertir una señal aleatoria, no
correlacionada, en otra señal fuertemente correlacionada que es el habla. El
habla se genera por inhalación de aire en los pulmones y exhalándolo
375
seguidamente a través de las cuerdas vocales y del tracto vocal. Para el

modelo, los pulmones se sustituyen por un generador de ruido aleatorio, las
cuerdas vocales por un generador de impulsos y el tracto vocal por un sistema
basado en un filtro lineal.
Dada la señal de habla, el problema básico de predicción lineal consiste en

determinar los coeficientes del filtro para deducir las propiedades espectrales.
PRIMERA FORMULACIÓN MATRICIAL
La ecuación de recurrencia fundamental se puede escribir en forma matricial

de formas diversas. Si se designa:
y
376
la señal bajo estudio s es la suma s0+s1, de la parte que se supone conocida

s0, las P primeras muestras mas la parte que se deduce a partir del modelo s1,
desde la muestra P+1 hasta finalizar el bloque de tamaño N y la recurrencia se
expresa como:
s = Ga + e
El problema de construir el modelo para una señal dada se traduce en estimar

los coeficientes a(k) de la ecuación de recurrencia una vez adoptado un valor
de P conveniente.
ESTIMACIÓN DEL VECTOR DE PARÁMETROS a
Suponiendo conocida la densidad de probabilidad pe de la sucesión de

excitación, también de nombre pe y teniendo en cuenta que dicha sucesión es
i.i.d., se puede determinar la probabilidad de obtener el vector s1 condicionada
a los valores conocidos de s0:
y en el caso de una excitación gaussiana con media 0,
donde se añade la necesidad de disponer de una hipótesis sobre el vector de

parámetros a. Para valores N>>P se puede admitir la aproximación
Teniendo en cuenta esta relación se puede estimar el vector a maximizando

P(s|a) respecto de a, obteniendo
377
proceso que equivale a la estimación de a mediante minimización de una

función de coste:
Se puede así describir la señal mediante la expresión
ILUSTRACIONES
Para ilustrar el algoritmo se considera una señal AR generada haciendo uso de

los coeficientes
Tomando una muestra de tamaño N=1000, se realiza la estimación de los

coeficientes mediante el algoritmo precedente (covarianza modificada). Resulta
que generan señales respectivamente cuyas 100 primeras muestras se

representan a continuación:
378
Figura 162. Señal AR.
Un procedimiento alternativo se basa en la estimación de las covarianzas R(k)

del proceso para establecer las denominadas ecuaciones normales o
ecuaciones de Yule-Walker.
Multiplicando ambos miembros de la ecuación de recurrencia por s*(n-k),

posteriormente la ecuación conjugada por e(n), usando el operador esperanza
matemática y teniendo en cuenta que
se obtienen las relaciones
y para n>P,
379
La matriz de la primera expresión es la matriz de covarianza de orden P+1 del

proceso s(n) que hermítica en el caso general y simétrica si el proceso s es
real, positiva y de Toeplitz.
Las ecuaciones de Yule-Walker suministran un procedimiento para estimar los

coeficientes del proceso AR conocida una muestra del mismo. En efecto, se
sustituyen las covarianzas por sus valores estimados,
y se resuelve el sistema lineal resultante para obtener las estimaciones a^.

Tomando la ilustración anterior, se obtiene la estimación
y la señal cuyas 100 primeras muestras se exhiben a continuación.
Figura 163. Estimación de la señal AR por la ecuación de Yule-Walker.

380
Finalmente, conviene resaltar que es necesario ponderar dos parámetros

fundamentales en estas formulaciones de los modelos AR. En primer lugar se
necesita para la señal en estudio una hipótesis de estacionariedad, que se
puede establecer si se consideran bloques de señal de longitudes entre 500 y
2000 muestras, con una tasa de muestreo de 44100 Hz. Para evitar los
consiguientes efectos de borde se hace uso de ventanas adecuadas como las
Hanning o Hamming.
Por otra parte se debe adoptar un valor para P. Para señales musicales de alta
complejidad se requiere un valor P>100, mientras que para señales más
simples puede ser suficiente tomar P=30.
381
Modelos Sinusodiales
Un modelo matemático adecuado para representar música, palabra o una

combinación de ambas señales está basado en el desarrollo de la señal en dos
componentes:
donde s(t) se denomina parte sinusoidal y r(t) parte residual.
La parte sinusoidal se escribe como la suma de un número finito I de parciales

sinusoidales cuyos parámetros de configuración son variables con el tiempo:
donde los factores ak son señales que cambian lentamente con el tiempo, es
decir, señales con un ancho de banda Ba de pequeña magnitud. Por su parte,
las señales Φk son localmente lineales, es decir, alrededor de t=t0,
con Φk (t0;t0)=0. Y de otra forma
La estimación de los parámetros del modelo sinusoidal se realiza en dos

etapas.
1. Se calcula el espectro para una ventana temporal y se realiza la estimación

de la posición de los puntos cuspidales de frecuencia correspondientes. Cada
382
punto cuspidal se considera un elemento de sinusoidal parcial cuyos

parámetros deben estimarse. El espectrograma puede ser un elemento auxiliar
relevante. Simultáneamente se determina la fase asociada con los diferentes
valores frecuenciales y en particular con los puntos cuspidales.
2. Los puntos cuspidales de las sucesivas ventanas de análisis se agrupan en

segmentos que representan las sinusoidales parciales que se buscan. Los
valores de frecuencia, magnitud y fase de los puntos cuspidales pueden
facilitar la agrupación mencionada.
Figura 164. Fase asociado a valores de frecuencia del modelo senosoidal.
El modelo discreto asociado se puede expresar en la forma siguiente:

383
Finalmente la parte residual debe recoger aquellos aspectos de la señal que no

pueden ser representados mediante sinusoidales parciales. Para esta
componente se puede adoptar un modelo estocástico que se describe como la
salida del un filtro dependiente del tiempo y configuración frecuencial
determinada como respuesta a un ruido blanco.
siendo w el ruido blanco y h la respuesta de impulso del filtro.

384
Marcos Bayesianos
La teoría de Bayes en el ámbito de la estimación de parámetros o de la

predicción del estado de un proceso hace uso de la información contenida en
las observaciones de la señal y de las probabilidades a priori asociadas con el
proceso.
Se considera un proceso aleatorio que depende de un parámetro θ que es un

vector aleatorio y se supone que está disponible y, un vector de observaciones
del proceso. De acuerdo con la regla de Bayes, la función de densidad de
probabilidad a posteriori del parámetro θ dadas las observaciones se puede
expresar como:
La estimación bayesiana del parámetro q se basa en la minimización de una

función de riesgo bayesiana.
donde C es una función de coste y θ^ designa la variable estimación de θ. Para

una observación dada y, fy(y) es constante por lo que la función de riesgo se
puede escribir como:
En particular, la estimación maximum a posteriori (MAP) se obtiene como el

vector que maximiza la función de densidad posterior fθ|y(θ|y). La
correspondiente función de coste es la denominada uniforme:
385
Figura 165. Función de coste para marcos bayesianos.
Efectuando la sustitución en la función de riesgo queda:
Es decir: El valor del parámetro que minimiza la función de riesgo maximiza la

función de densidad posterior:
386
MODELOS MATEMÁTICOS PARA DETECTAR CLICKS
Modelos AR por Bloques
Una señal de audio es generalmente una señal de larga duración, que no se

procesa habitualmente de una forma global. Por otra parte, estas señales
exhiben una elevada no estacionariedad. Por estas razones siempre se practica
una segmentación de la señal en bloques casi estacionarios, con auxilio de
ventanas de Hamming o de Haaning, de una longitud conveniente y con un
nivel de solapamiento adecuado.
El primer mecanismo para la detección de clicks que será objeto de examen

está basado la adopción de un modelo AR para los bloques de la señal no
degradada. Los clicks o ruidos impulsivos se consideran señales aditivas y su
modelo matemático debe reflejar esta consideración. Si se designa con x(k) a
la señal no degradada y con y(k) a la señal con ruido, se escribe:
donde i(k) es un índice cuyo valor es, para cada valor de k, 1 o 0, dependiendo
de que el ruido afecte o no a la muestra k, respectivamente. La señal v está
relacionada con la magnitud del defecto.
Teniendo en cuenta la hipótesis de estacionariedad de la parte de señal en

estudio, se supone para los segmentos no degradadados un modelo AR de
orden P:
387
siendo e(n) un ruido blanco de varianza σe2, que se denomina señal de

excitación o error de predicción.
La señal corrupta se procesa mediante el filtro de error o filtro inverso cuya

función de transferencia es:
proporcionando una señal de detección:
Sustituyendo el modelo adoptado para los ruidos impulsivos y el modelo AR

para la señal limpia x, queda:
La señal de detección eD(n) es débil para las muestras no degradadas, ya que

en este caso el modelo AR tiene buen ajuste y es de mayor magnitud cuando
encuentra defectos impulsivos, ya que en este caso el modelo AR no es el
adecuado. Para señales de audio con correlación alta, la varianza de eD(n) es el
orden de 100 veces mayor para una señal degradada comparándola con la
correspondiente a una señal limpia.
Así, la detección se efectúa comparando la magnitud de eD(n) con un umbral

dado por:
λ = Kσ 2 ( e D )
siendo σ2(eD) una estimación de la varianza de la señal de detección que

corresponde a la señal no corrupta y K un parámetro que se puede seleccionar
388
perceptualmente, cuya magnitud establece un compromiso entre la no

detección y la falsa detección. En general se consigna un valor de K idéntico
para todos los bloques de señal.
Desde el punto de vista metedológico, es posible detectar todas las muestras

degradadas de un bloque conjuntamente, considerando clicks todas las
muestras k para las que |eD(k)|>λ. Puesto que las degradaciones impulsivas
no afectan a muestras aisladas, se especifica una duración determinada para
aquellas y se atribuye la condición de muestras corruptas a un número fijo a la
izquierda y a la derecha de cada click encontrado.
Figura 166. Señal con ruidos impulsivos.
Figura 167. Señal de detección eD.

389
Figura 168. Localización de 37 clikcs con umbral λ=66.81.
Alternativamente, se puede detectar el impulso de mayor amplitud buscando el

valor de k para el que |eD(k)| sea máximo, con |eD(k)|>λ, consignando como
antes una duración fija en número de muestras para el defecto impulsivo
encontrado. Seguidamente, se suprime la señal en el tramo completo
degradado y se reitera el cálculo con otra muestra hasta alcanzar la condición
|eD(k)|< λ para todos los puntos del bloque de señal considerado.
La detección de un umbral eficiente presenta a priori dos problemas:
1. En primer lugar, es necesario obtener estimaciones de la varianza de la

señal de excitación que corresponde a la señal no degradada y para ello la
forma más sencilla es acudir a la señal degradada, lo que produce
estimaciones sesgadas evidentes en presencia de ruidos impulsivos.
2. Otra dificultad consiste en establecer de una forma conveniente la duración

de las degradaciones impulsivas, es decir, determinar el instante en el que
comienzan y el instante en el que finalizan. El procedimiento más simple
consiste en atribuir una duración fija a todas las degradaciones.
Respecto del primer problema, una opción consiste en adoptar como umbral la
cantidad:
390
que surge de la consideración de la señal de excitación como un ruido blanco

gaussiano estacionario. En efecto, para l variables aleatorias gaussianas
independientes X1, X2, ..., Xl centradas y con varianza σ2 se tiene:
Por otra parte, para estimar de una manera más sistemática la duración de las
degradaciones impulsivas, se puede hacer uso de dos umbrales: Un umbral de
detección λD, que puede especificarse tal como se ha especificado antes y un
umbral de localización λL, λL<λD que permite consignar como degradadas
algunas muestras contiguas a la detectada en primer lugar.
La sucesión de operaciones puede ser como sigue:
• En una primera etapa se detecta el impulso de mayor amplitud de

excitación entre todos los que integran el bloque:
• En la segunda etapa se consignan como degradadas todas las muestras

contiguas a k1 cuya amplitud de excitación sea superior a λL,
continuando la agregación de nuevas muestras hasta que se alcance a la
izquierda y a la derecha del paquete corrompido un número n prefijado
de muestras para las que |eD(k)|< λL.
• En una tercera etapa se atribuye valor cero a las muestras encontradas

como degradadas y se prosigue con la búsqueda de la muestra k2 que
391
exhiba la mayor amplitud de excitación. Así, hasta que |eD(k)|< λD para

todas las muestras del bloque.
Figura 169. Localización del defecto a partir de la muestra k=419, entre las muestras
417 y 428. Las líneas roja y verde identifican los umbrales de detección y localización,
respectivamente.
Una vez identificado este primer conjunto de paquetes de muestras con ruido
impulsivo, se realizan iteraciones sucesivas para determinar otros paquetes
con menor amplitud de excitación estimando de nuevo los umbrales λL y λD que
serán cada vez de magnitudes menores en cada iteración.
392
Técnicas Bayesianas
Es posible hacer uso de técnicas bayesianas que aprovecha informaciones a

priori acerca de la señal. Teniendo en cuenta el modelo y(k)=x(k)+i(k)v(k), el
planteamiento del problema de detección de clicks en un contexto bayesiano
consiste en estimar el vector i(k) que minimice alguna función de riesgo de
Bayes.
Para una estimación MAP, el problema equivale a buscar el vector i(k) que
maximiza la función de densidad posterior fy|i(y|i). Si se considera un bloque
de señal con N muestras, el modelo se puede describir en forma vectorial:
Aplicando el teorema de Bayes, la probabilidad de i condicionada al vector de

observaciones y se escribe como:
El denominador fy(y) es un coeficiente de escala que no interviene en el

proceso de maximización y P(i) debe reflejar informaciones previamente
conocidas acerca de la señal; por ejemplo, el porcentaje estimado de muestras
degradadas por ruido impulsivo. El problema se reduce así a calcular la función
de verosimilitud fy|i(y|i) y a maximizar la probabilidad a posteriori Pi|y(i|y).
Se supone que la señal no degradada está bien representada por un proceso

AR de orden P y el conjunto está modelado por el sistema
393
donde r(n)=i(n)v(n) agrupa los ruidos impulsivos.
Los elementos del vector y se reorganizan en dos segmentos: yc, que contiene
a los elementos de i para los que i(k)=0, luego elementos conocidos; yd, que
contiene a los elementos de y para los que i(k)=1, desconocidos. Se tiene:
donde xd contiene a las muestras de la señal que deben ser estimadas y rd es

un proceso gaussiano con media 0 y matriz de correlación R. La función de
verosimilitud se puede escribir de la siguiente forma:
siendo,
donde Ad y Ac son particiones de A acomodadas a los segmentos yd e yc,

respectivamente. La estimación del vector i consiste en determinar Pi|y(i|y)
para todas las 2N combinaciones posibles de aquél y seleccionar la combinación
que maximice la probabilidad a posteriori.
El esfuerzo computacional es considerable y es posible mejorar la situación

haciendo uso de un algoritmo secuencial que determina la función de
verosimilitud fy|i(y|i) de forma recursiva cada vez que se incorpora una
muestra nueva de y.
394
ALGORITMOS PARA RESTAURACIÓN DE SEÑALES CON CLICKS
Interpolación AR (Tecnología de modificación)
Se plantea el problema de estimar mediante interpolación los puntos de señal

colocados a 0 teniendo en cuenta los valores muestrales de los puntos de la
señal contenidos en el bloque de estacionariedad considerado que preceden y
también los que siguen al paquete eliminado. Una técnica eficiente consiste en
suponer que los diferentes bloques siguen el modelo AR de orden P, donde P
puede ser diferente en cada bloque. El algoritmo de interpolación basado en
esta suposición, se conoce con el nombre de LSAR (Least Squares
Autoregressive).
Se considera una señal con N muestras s(k) que admite un modelo AR de

orden P:
y se supone que parte de dichas muestras, un total de M comenzando en la

muestra m,
tienen valores desconocidos. Se propone estimar los valores de dichas

muestras haciendo uso de los valores de las restantes N-m y del modelo AR,
que se puede desarrollar matricialmente en la forma siguiente:
395
En forma compacta se puede escribir
Utilizando la función de coste F=eTe para minimizar el error en la forma

habitual, se observa que intervienen los valores muestrales desconocidos en
términos no lineales de le ecuación de minimización. Una solución sub-óptima
consiste en linealizar la ecuación asignando un valor 0 a las muestras perdidas
o indeterminadas. Esta operación elimina los términos de la ecuación
comprendidos entre las líneas de puntos, de manera que para resolver el
sistema que estima los coeficientes a se escribe
donde sc agrupa en un vector a todas las muestras conocidas.
Seguidamente es necesario proceder a la estimación de los valores que

corresponden a las muestras desconocidas. Para ello se extraen de la ecuación
matricial anterior las filas situadas entre las líneas de puntos:
396
Si se introduce la estimación del vector a, únicamente permanecen como

incógnitas los valores de las muestras desconocidas. El sistema se puede
componer separando las muestras conocidas y desconocidas:
siendo sd y sc vectores que contienen las muestras desconocidas y conocidas,

respectivamente y Ad y Ac matrices cuadradas extraídas de la matriz
fundamental de acuerdo con sus papeles respectivos. Estableciendo de nuevo
la condición de mínimo del funcional F=eTe, resulta finalmente
que es una estimación para los valores de las muestras perdidas.
Figura 170. Resultado de la interpolación (línea roja) de las muestras perdidas por un
defecto impulsivo entre las muestras 417 y 428.
397
Este método de interpolación tiene algunas limitaciones que se pueden resumir

como sigue:
1. Las señales de audio no son exactamente AR. En primer lugar es necesario

admitir la hipótesis de estacionariedad, al menos cuando se consideran bloques
de señal de tamaño 1024 o 2048. En segundo lugar, para señales de habla, la
excitación de la señal no es en general un ruido blanco, sino una sucesión de
impulsos casi periódicos. Finalmente, la parte casi estacionaria que
corresponde a los sonidos musicales posee generalmente un gran número de
componentes espectrales, y únicamente los segmentos que tienen frecuencia
fundamental muy elevada dan una excitación de la señal relativamente exenta
de estructuras periódicas.
2. El modelo AR de la señal necesita ser estimado a partir de datos con ruido,

de manera que la eventual presencia de ruidos impulsivos puede sesgar
significativamente el proceso de estimación.
Sin embargo, el método se revela eficaz y robusto en la práctica. La razón

esencial es la ganancia considerable obtenida en la señal después del filtrado
inverso practicado para la detección. Esta ganancia está motivada por la
precisión de los picos de la densidad espectral de la señal que se elabora con
ocasión de la detección y combinación de los paquetes de clicks.
398
Técnicas Bayesianas (Tecnología de modificación)
Si se hace uso de técnicas bayesianas para estimas las muestras afectadas por
ruidos impulsivos en la forma indicada anteriormente, es conocido que no es
necesario un proceso separado de interpolación, ya que en el transcurso del
proceso se combinan detección de los defectos (vector i) y estimación de la
señal limpia (vector xdMAP).
Sin embargo, es posible hacer uso de técnicas bayesianas con la única

finalidad de restaurar muestras perdidas en el curso de un proceso previo de
detección/anulación como el explicado en la sección modelos AR por bloques
Con el fin de establecer un modelo para un bloque de señal de tamaño N, se

considera un proceso aleatorio x, que se reorganiza en los segmentos xc, que
modela las muestras conocidas y xd, que modela las desconocidas. Haciendo
uso de matrices adecuadas se puede escribir
La función de densidad de probabilidad a posteriori del segmento desconocido

xd dado el segmento conocido xc se puede expresar como
siendo f la función de densidad de probabilidad asociada con el proceso

aleatorio x. Así,
399
La estimación maximum a posteriori (MAP) se obtiene como el vector que

maximiza la función de densidad posterior. Puesto que el denominador f(xc) es
un factor de escala que no interviene en el proceso,
Si x es un proceso aleatorio gaussiano con media 0 y covarianza Qxx,
y la función de densidad de probabilidad a posteriori del segmento desconocido

xd dado el segmento conocido xc se escribe
La estimación MAP se deduce igualando a cero la derivada respecto de xd de la

función de verosimilitud lnf(x|xc). Resulta
400
MODELOS MATEMÁTICOS PARA DETECTAR SCRATCHES
Técnicas Bayesianas: separación de señales
En el contexto de las técnicas bayesianas, se puede formular el problema de

supresión de los pulsos transitorios como un problema de separación de
señales, adoptando la hipótesis general de que se conoce la localización de los
citados pulsos, es decir se supone que se sabe distinguir entre bloques de
señal que contienen un pulso de aquellos que no están degradados por el
defecto citado.
Se considera en primer lugar el siguiente problema general: sean y1, y2

procesos AR, independientes y gaussianos, con parámetros A2, P2, σ2e1, A1, P1,
σ2e2, conocidos. Se suponen conocidas además las observaciones
sobre un bloque de muestras de tamaño N. Se plantea el problema de obtener

una estimación de y1, de forma que los dos procesos AR considerados queden
identificados individualmente. Las funciones de densidad de probabilidad
respectivas de los procesos y1, y2 son, respectivamente,
para j=1,2, limitadas a las Pj primeras muestras, j=1,2.
Para obtener una estimación y1MAP se recurre a la maximización de fy1|y(y1|y)

que, de acuerdo con el teorema de Bayes se puede escribir:
401
Además,
e ignorando el factor de escala fy(y),
Así la estimación MAP de y1 queda
Para realizar la supresión del pulso transitorio se adopta un modelo AR para la

señal y1 con P=40 (hasta 80) y otro para el pulso y2 con P=2 o 3, aplicando a
continuación el mecanismo de separación que se acaba de describir.
Sin embargo, los pulsos transitorios no obedecen a la hipótesis de

comportamiento gaussiano. Alternativamente, se puede suponer que la señal
de excitación tiene una varianza que es muy elevada en los momentos iniciales
del pulso, en correspondencia con la gran discontinuidad del defecto y una
varianza reducida el resto del tiempo. Si se designa con i a un vector binario
de longitud N cuyos valores 1 se aplican a las muestras de elevada varianza y
0 para las demás, la varianza de excitación en la muestra m está dada por:
402
donde se designa con subíndice 0 a la varianza de magnitud reducida y con 1 a

la varianza elevada. La matriz de covarianza para la excitación del pulso
transitorio es una matriz diagonal:
y la función de densidad de probabilidad para el pulso transitorio y2 resulta:
Siguiendo etapas análogas al caso directo de separación AR se tiene ahora la

estimación siguiente:
La estimación MAP de y1 de acuerdo con el algoritmo modificado implica

algunas consideraciones de orden práctico.
1. Los parámetros del modelo AR de la señal sin ruido se pueden obtener

haciendo uso del segmento no degradado inmediatamente anterior al pulso.
Para un bloque de 2000 muestras con arranque del pulso en la muestra M, se
hace uso de 1000 puntos precediendo al comienzo de la degradación. El orden
del proceso AR puede ser P=80.
2. Los parámetros correspondientes al modelo AR del pulso se pueden obtener

del segmento inmediatamente posterior a la discontinuidad de arranque del
pulso, partiendo de una versión limpia del mismo. Incluso, si es posible, se
403
obtienen a partir de un segmento de grabación en el que no exista sonido. Si

no se dispone de estimaciones adecuadas se utilizan los parámetros a2=[2,-1]
que conducen generalmente a magnitudes pequeñas de las diferencias
3. La estimación del vector i se realiza mediante un filtro inverso, de manera

semejante al procedimiento empleado para detectar ruidos impulsivos. Así, los
pulsos transitorios adquieren la consideración de clicks de gran amplitud. Para
distinguir entre clicks y pulsos, se requiere hacer uso de un umbral de mayor
magnitud para los defectos del segundo tipo. Para el bloque de 2000 puntos,
se deben seleccionar como de alta varianza un total de 50 a 100 puntos
muestrales desde el comienzo M del pulso.
4. La magnitud de la varianza σn02 se selecciona por el usuario, teniendo en

cuenta que si se utilizan valores muy grandes se puede interferir con el
contenido de baja frecuencia de la señal subyacente, mientras que si se
utilizan valores muy pequeños puede quedar una parte del pulso sin extraer.
Por otra parte para la varianza σn12>>σn02se adopta una cantidad
arbitrariamente grande. En el límite, los elementos de Λ-1, que se identifican
con 1/σn12 tienden a 0. Puesto que σn12 es muy grande y difícil de estimar, en la
práctica es conveniente optar por el caso límite.
5. Para el bloque antes considerado, el proceso de separación se realiza sobre

un total de 400 a 600 muestras comenzando 10 puntos antes de la muestra M,
fijando P muestras "correctas" precediendo a la muestra M-10.
6. El algoritmo directo para la estimación MAP de y1 implica el cálculo de la

inversa de una matriz de grandes dimensiones y posiblemente mal
condicionada. Un método más eficiente utiliza la técnica de filtros Kalman.
Adoptando las notaciones
404
las ecuaciones de estado se pueden escribir, respectivamente,
para i=1,2. El modelo se puede establecer en una forma más compacta

agrupando las dos señales:
siendo,
El algoritmo basado en el filtro de Kalman se resume así:

405
Tabla 8. Resumen del algoritmo de Kalman.
Inicialización
Cálculo Para n=1,2,...

Actualización
temporal:
Predicción
Actualización
de las
medidas:
corrección
donde Ci=E[xi(0)xi(0)T] son las matrices de covarianza para Pi muestras de los

procesos AR i=1,2.
Teniendo en cuenta que y=x1+x2, existe una redundancia en esta formulación

que puede ser aprovechada para simplificar el algoritmo.
406
Métodos espectrales de localización
Una tarea central en el proceso de eliminación de pulsos transitorios consiste

en la identificación de los bloques de señal que están contaminados por la
clase de degradación citada.
Teniendo en cuenta que los pulsos poseen una energía espectral significativa
en una banda espectral amplia, se puede calcular la transformada de Fourier
discreta en cada bloque y seleccionar los términos de dicha transformada que
quedan incluidos en la banda de frecuencias adoptada. El valor medio de los
valores absolutos de las componentes con frecuencia en la banda, para un
bloque con pulso transitorio, será superior a un umbral que deberá fijarse con
antelación.
Sea y la señal, Y su TFD, p y q los índices de las componentes de la

transformada que limitan la banda. Para un bloque determinado con N
muestras, el valor medio se escribe:
Los índices p y q se pueden adscribir a las frecuencias de 3 y 10 kHz,

respectivamente, que limitan una banda en la que evolucionan las frecuencias
de los pulsos. Realizando una normalización de la magnitud de los coeficientes
de Fourier, se contrasta µ con el umbral λ de valor 0.5.
Cuando el contenido espectral de altas frecuencias de la señal es importante,
se modifica el esquema anterior calculando la resultante µm de aplicar a µ un
filtro de mediana con una ventana de tamaño impar, por ejemplo v=5. Se
determina la diferencia
407
que se contrasta con un nuevo umbral λ. Se declaran corrompidos los bloques

de señal para los que
408
ALGORITMOS PARA LA RESTAURACIÓN DE SEÑALES CON SCRATCHES
Las muestras irrevocablemente distorsionadas por la parte inicial de cada pulso

deber ser eliminadas y reemplazadas por estimaciones determinadas por un
interpolador tipo LSAR, análogamente al proceso que se aplica cuando se
eliminan clicks.
Por otra parte, cuando se aplican técnicas bayesianas para suprimir pulsos
transitorios, es necesario en primer lugar realizar una tarea de localización de
los mismos a lo largo de la señal o, lo que es equivalente, identificar los
bloques degradados por pulsos de aquellos que no presentan la degradación
citada. Para ello, una vez aceptadas las hipótesis que permiten modelar los
bloques de señal como AR, se puede hacer uso de métodos análogos a los
utilizados para detectar la presencia de clicks. El coste computacional suele ser
elevado porque las matrices que es necesario invertir alcanzan un tamaño muy
grande pero es posible considerar un modelo estado-espacio para implementar
un filtro de Kalman que permita un algoritmo numérico de separación viable.
409
MODELOS MATEMÁTICOS PARA DEGRADACIONES GLOBALES
Método basado en la transformada wavelet continua
El problema de eliminación de ruido de fondo se puede abordar considerando

el modelo clásico
donde x es la señal subyacente cuyo modelo es determinista y w un ruido

blanco independiente de x y con varianza σ2. Los mecanismos de atenuación
espectral resuelven el problema de restauración pero tienen el problema de
que, al mismo tiempo, eliminan o atenúan singuaridades de la señal que
muchas veces representan rasgos de la misma no prescindibles.
La transformada wavelet continua genera coeficientes cuya magnitud está

determinada por la mezcla del ruido con la señal subyacente. El grado de
influencia de cada componente de la señal depende de la escala de
representación. En particular, los máximos locales de los coeficientes de la
transformada reciben aportaciones diferenciadas desde la señal x y el ruido w.
En general, siendo w un proceso aleatorio estacionario con media 0 se puede

definir su función de covarianza:
y su espectro de potencia:
410
Puesto que las wavelets poseen media 0, se cumple
y además,
de donde se deduce:
Así, desde el punto de vista estadístico, el ruido blanco exhibe una aportación
a la magnitud de los coeficientes CWT que crece de una forma explosiva
cuando a tiende a 0.
Por otra parte, si w es un ruido blanco gaussiano, a una escala determinada a

la función:
es también un proceso aleatorio gaussiano para el que se demuestra que la

densidad de máximos locales de la transformada wavelet continua es:
411
(n)
donde ψ es la derivada n-sima de ψ y λ una constante tal que 0.5<λ<1. La
densidad da es inversamente proporcional a la escala, de manera que cuando
se pasa de la escala a=2j a la escala a=2j+1, la cantidad de máximos locales
que corresponden a la transformada wavelet del ruido w pierde la mitad de sus
efectivos.
Para la señal subyacente x, en los puntos singulares cuya regularidad de

Lipschitz es positiva, las magnitudes de los máximos locales de la
transformada wavelet crecen o permanecen constantes cuando la escala crece.
Por otra parte, para el ruido blanco w, que presenta puntos con exponente de
Holder negativo, la magnitud de los máximos locales decrece en promedio
cuando la escala crece.
Tomando en consideración los comportamientos diferenciados de las líneas de

máximos locales que caracterizan las señales x y w, un mecanismo para
eliminar el ruido de fondo podría ser el siguiente:
1. Trazar las líneas de máximos locales de la transformada;

2. Clasificar las líneas como generadas por la señal subyacente x o por el ruido
w.
3. Eliminar las líneas de máximo asociadas con el ruido.
4. Recuperar la señal a partir de las líneas de máximo restantes.
412
Figura 171. Suma de señales senosoidales una exponencial que decae exhibiendo una
discontinuidad de ruido blanco.
La señal es una suma de una sinusoide, una exponencial que decae rápidamente y empieza en la
muestra 1501 (abscisa 46.97) exhibiendo una discontinuidad y un ruido blanco. La sinusoide deja
de existir en la muestra 3001 (abscisa 92.06) de un total de 4096, que corresponde a la abscisa 40π.
413
Figura 172. Máximos locales de la CWT.
La gráfica de líneas de máximo exhibe su diferente comportamiento de

acuerdo con los puntos de la señal que las generan. La situada más a la
derecha, se debe al efecto de borde; hacia la izquierda sigue un paquete de
líneas debido al ruido exento de señal; las líneas que terminan hacia la
ordenada 9, proceden del ruido de fondo; las que terminan en torno a 5, se
deben a la señal sinusoidal; la línea que desborda la gráfica por la parte
superior, está generada por la discontinuidad, en el punto 1531. Por último la
que apunta a la muestra 3001, se debe a la desaparición repentina de la señal
sinusoidal.
Más generalmente, cualquier método que facilite la determinación numérica del

escalograma modificado
conduce a una solución para la eliminación del ruido de fondo de la señal.

414
Matching Pursuit de S. Mallat y Z. Zhang
Sea H un espacio de Hilbert y:
un diccionario redundante de elementos de H tales que ||φγ||=1. Se designa

por V el subespacio vectorial engendrado por los vectores del diccionario, que
es un diccionario completo si V=H. Se plantea de nuevo el problema de
construir representaciones de señales s∈H mediante combinaciones lineales de
los elementos de Φ mediante operadores de la forma
no necesariamente lineales. Para introducir y motivar el mecanismo Matching

Pursuit, se considera un elemento Φ0 de H y se formula la proyección ortogonal
de la señal s sobre el mismo:
siendo el residuo R(s), ortogonal a Φ0.

415
Figura 173. Proyección ortogonal para Matching Pursuit.
Se cumple:
o bien
Para minimizar la norma del residuo, es necesario seleccionar Φ 0 de forma que

|<s, Φ 0>| sea máximo.
Generalmente, para espacios de dimensión infinita solo es posible seleccionar

φ0 de forma que |<s, Φ 0>| se acerca al máximo en el sentido siguiente:
donde α es una coeficiente de optimalidad tal que 0< α ≤1 y Γα⊆Γ. La

construcción de Γα depende del diccionario F, pero si está indexado por un
conjunto continuo Γ, habitualmente Γα es una malla que permite la
discretización de Γ.
416
El mecanismo Matching Pursuit prosigue con la búsqueda del elemento del

diccionario Φ para el que la proyección de R(s) minimiza R2(s)
El algoritmo Matching Pursuit
El algoritmo Matching Pursuit se desarrolla a partir de R0(s)=s. Si se supone

conocido el residuo Rk(s), se elige φγ∈Φ de forma que
y se calcula Rk+1(s) de forma que
siendo Rk+1(s) ortogonal a φk. Así,
En estas condiciones, se puede obtener una descomposición de la señal s como

combinación lineal de n elementos del diccionario sumando miembro a
miembro las n versiones de las ecuaciones precedentes obtenidas para
k=0,1,...,n-1:
Se tiene:
417
de donde,
y se puede probar que la convergencia es exponencial cuando H es de

dimensión finita. Por el contrario, cuando H es de dimensión infinita, la
convergencia es muy lenta.
Desde el punto de vista práctico, suponiendo que H es de dimensión finita, el

algoritmo Matching Pursuit comienza con el cálculo y almacenamiento de todos
los productos escalares:
Como ya se ha adelantado, el algoritmo progresa de forma inductiva. Si se

conocen las cantidades:
entre ellas se debe seleccionar φn tal que:
lo que permite determinar:

418
o mejor:
Puesto que se conocen los valores <Rn(s), φn> y <Rn(s), φγ> solo es necesario
calcular los productos <φn, φγ>. Si se designa por I el número de operaciones
necesarias para este último cálculo y por Z el número medio de cantidades no
nulas así obtenidas, para un número de P iteraciones del algoritmo Matching
Pursuit, el coste computacional del proceso será del orden de O(PIZ).
El número de iteraciones adecuado, se obtiene en cada caso mediante la

comparación de la energía de la señal ||s||2 con las sumas:
419
Búsqueda de bases (Basis Pursuit)
El problema que se propone es el de aproximar una señal de longitud finita N

mediante combinaciones lineales de los elementos de un diccionario
redundante G, también de tamaño finito P>N:
En particular, se buscan bases, no necesariamente ortogonales de forma que
siendo {φγ0, φγ,..., φγN-1} la mejor base en el sentido de que la norma l1 de los
coeficientes sea mínima:
Este problema se puede así formular en los siguientes términos: Determinar un

conjunto de N coeficientes αk de forma que
para n=0,1,...,N-1, de manera que se satisfaga la condición de mínimo

precedente. En forma matricial,
con la condición Ga=b.

420
En virtud de la no diferenciabilidad de la norma l, se tiene un problema de

programación no lineal que, sin embargo, se puede transformar en otro de
programación lineal eventualmente de gran magnitud por el tamaño de los
vectores y matrices implicados.
El proceso así definido se denomina persecución de bases (Basis Pursuit).

421
ALGORITMOS PARA LA RESTAURACIÓN DE SEÑALES CON

DEGRADACIONES GLOBALES
Algoritmo de atenuación espectral (Tecnología de modificación)
El algoritmo de atenuación espectral para eliminar el ruido de fondo se

describe esquemáticamente en la gráfica que sigue:
Figura 174. Algoritmo de atenuación espectral.
En primer lugar, la señal de audio se subdivide en bloques de 1024 0 2048

muestras, aplicando una ventana de Hamming o de Hanning (ventaneado
previo) para determinar la transformada de Fourier discreta Y del bloque. Se
admite un solapamiento del 25 o del 50%. Seguidamente se aplica al espectro
obtenido la función f obteniendo una nueva versión del espectro X, del que se
determina la transformada inversa con ayuda de un ventaneado posterior. Ya
en el dominio temporal, se hace uso de una función de compensación en razón
de la pérdida de ganancia por efecto del ventaneado. Todas estas operaciones
se realizan en cada bloque, de forma que finalmente se debe insertar el
422
resultado en el emplazamiento conveniente, de forma análoga a como se hace

en la práctica de la STFT estándar.
La aproximación más directa para construir una regla de supresión consiste en

sustraer la magnitud del espectro del ruido de la magnitud del espectro de la
señal:
Otras reglas de supresión implican los espectros de potencia respectivos:
Los parámetros a y b se ajustan para controlar la cantidad de ruido que se

desea reducir y el nivel del ruido residual.
Una de las funciones de atenuación más utilizadas es la que se basa en el filtro

de Wiener, que posee la propiedad de que minimiza el error cuadrático medio
de reconstrucción en el dominio tiempo:
siendo SX el espectro de potencia de la señal y SD el espectro de potencia del

ruido.
La segunda de estas cantidades, el espectro de potencia del ruido, se puede

estimar a partir de segmentos de la señal que no tengan contenido musical o
de habla. Por otra parte, si SY es el espectro de potencia de la señal
degradada,
423
Si se admite la aproximación
se deduce una estimación para el espectro de potencia de la señal:
Así, la expresión de la función de atenuación sería la siguiente:
Una vez obtenida la estimación de |X^(n,m)| se puede escribir:
La permanencia de la fase de la señal degradada está motivada por el hecho

de que la fase es de una relevancia menor para la calidad del sonido.
El uso de los métodos de atenuación espectral, tal como han sido ilustrados
mediante el derivado del filtro de Wiener, tienen el inconveniente de
introducen varios artefactos en el ruido residual, el más molesto de los cuales
es el denominado 'ruido musical', que se debe a la clase de estimación
utilizada para SX. La formulación conduce a una sobre-estimación de SX cuando
|Y(n,m)| es demasiado alta y a una subestimación cuando |Y(n,m)| es
demasiada baja. En efecto, cada bloque siempre tendrá componentes
424
espectrales debidos al ruido de dicho bloque cuya potencia será superior que la
potencia estimada para el ruido SD. La generación de ruido musical se hace
evidente cuando se realiza el proceso sobre una señal y=0+d, de manera que
SX=0. Este inconveniente es compartido con las metodologías de umbral
basadas en la transformada wavelet discreta.
Una técnica de supresión que elimina el ruido musical se basa en la regla de

Ephraim y Malah, que en 1984 publicaron un estimador de amplitud espectral
que minimiza el error cuadrático medio bajo la suposición de que los
coeficientes de Fourier de la señal original pueden ser modelados como
variables aleatorias gaussianas, de media cero y estadísticamente
independientes. Para el caso de ruido aditivo blanco gaussiano de media cero
la regla de supresión resultante se escribe:
donde I0 e I1 son las funciones de Bessel modificadas de orden 0 y orden 1,

respectivamente y:
El coeficiente ξ (n,m) es la razón de las varianzas de los coeficientes de Fourier

de la señal subyacente y del ruido. Puesto que ambos tipos de coeficientes son
gaussianos por hipótesis, ξ (n,m) se interpreta como un SNR a priori, siendo
el SNR a posteriori porque está relacionado con la señal degradada y en lugar

de estarlo con la señal subyacente x.
425
En ocasiones se hace uso de una versión simplificada de la regla de supresión

de Ephraim y Malah:
La regla de supresión de Wiener se puede escribir en función de ψ (m):
Finalmente, existen muchas propuestas para eliminar ruidos de banda ancha

basados en wavelets. La más elemental consiste en considerar el modelo
donde, por ejemplo, d puede ser un ruido blanco gaussiano independiente de

x. Una vez calculados los coeficientes de la DWT de la señal y, se aplica sobre
ellos una transformación no lineal, que puede ser de naturaleza muy diversa.
Por ejemplo, los coeficientes que corresponden a una o varias escalas que
están por debajo de un umbral determinado se igualan a 0 (hard tresholding):
donde los índices i,m indican la escala y la posición temporal, respectivamente.

Otra posibilidad es hacer uso de un soft tresholding:
426
Se puede, en fin, combinar la selección de umbrales con algoritmos derivados

de las reglas de supresión de Wiener o de Ephraim y Malah
Algoritmo mediante Matching Pursuit (Tecnología de Sustitución)
Sea y la señal observada de manera que
siendo s la señal restaurada y Z el ruido. Para restaurar la señal se aplica el

proceso MP declarando eventualmente coherentes a los elementos del
diccionario Γ seleccionados por el proceso. Para k≥0 se dice que φk es una
estructura coherente si se cumple
Si M es el menor número natural tal que
entonces RM(y) no admite nuevas descomposiciones y la estimación de la señal

s se escribe:
427
428
Algoritmo mediante Basis Pursuit (Tecnología de Sustitución)
Sea y una señal observada que se descompone en dos sumandos
siendo s la señal restaurada y R la señal identificada como ruido. Para aplicar

el método Basis Pursuit, el modelo adecuado es el de una representación
aproximada:
donde
es una base de cardinal m no necesariamente ortonormada y R(m) representana

una señal residual que se identifica con el ruido.
El mecanismo de restauración con Basis Pursuit consiste un encontrar

soluciones para el problema:
La solución a este problema es una función a(λ) y proporciona una

descomposición:
donde,
429
El valor de λ se puede tomar:
siendo p la cardinalidad del diccionario.
El problema de optimización se puede escribir como uno de programación

cuadrática con restricciones de positividad:
Así,
sujeto a
Se demuestra que este problema es equivalente a
con las condiciones

430
Para resolver esta versión del problema, se puede hacer uso de un algoritmo
de punto interior.
445
ANEXO A
PAPER PUBLICABLE
446
La Restauración de Audio
Gustavo Adolfo Valencia Zapata
Nicolás Ramírez Echeverri
parecido al original (originalidad y fidelidad), y el desarrollo de

Abstract-- The restoration of audio is a discipline that embraces
topics that makes articulations between the physics and the audio. mecanismos que permitan escucharlo con una calidad tal cual fue
To understand the audio restoration process clearly it is necessary, grabado. Estos dos aspectos han generado, dentro de la ciencia
initially, to approach some concepts of the waves theory in order to que es el audio, múltiples disciplinas, entre ellas la restauración
identify the parameters associated with some characteristics of the del audio. Esta disciplina se viene aplicando empíricamente
musical perception. desde la aparición del primer mecanismo para registrar sonidos:
The process of audio restoration has gone by many stages and,
el fonógrafo.
along the history, diverse mechanisms have been created to
counteract the noise of the analogical recordings and to improve the La era digital le abrió al audio las puertas de la eternidad, la
quality of the recorded sound. However, it had never been so near fidelidad y la limpieza mediante su digitalización y tratamiento
the perfection as now, in a time where the digital audio, the digital digital, procedimientos que permiten, a través de una sucesión de
formats and the computers, with their programs of digital audio elementos perfectamente sincronizados, tomar una caduca señal
restoration, provide powerful tools to finish with the limitations of analógica y convertirla en una saludable señal digital mediante
analogical audio. It is clear that this perfection would not be
su restauración.
possible if a series of corrective actions are not taken, before
digitalization is done, on the analogical means and if the geniuses
La restauración digital de audio es un procedimiento complejo
that developed the restoration algorithms, present in digital audio que implica considerar unas medidas, tanto desde el punto de
restoration programs, had not existed. vista físico como digital, antes y después del tratamiento, con el
fin de obtener un resultado óptimo y duradero.
Desde lo físico, las consideraciones que deben asumirse
La restauración de audio es una disciplina que abarca tópicos que permiten una identificación del medio que se va a restaurar, sus
hace articulaciones entre la física y el audio. Para entender características técnicas y constructivas, así como la posibilidad
claramente el proceso de restauración de audio es necesario, de ejecutar sobre él una restauración física. La cual, si el medio
inicialmente, abordar conceptualmente la teoría ondulatoria para lo permite, debe ser llevada a cabo con sumo cuidado, ya que del
identificar los parámetros asociados con algunas características de excelente mecanismo de esta etapa dependen la eficiencia del
la percepción musical. tratamiento digital y, obviamente, sus resultados.
El proceso de la restauración de audio ha pasado por muchas En lo que respecta a lo digital, las consideraciones están
etapas y, a lo largo de la historia, se han creado diversos enmarcados dentro de lo técnico, ya que implican la
mecanismos para contrarrestar el ruido de las grabaciones identificación de parámetros que influyen directamente en la
analógicas y mejorar la calidad del sonido grabado. Sin embargo, calidad del audio digitalizado y la correcta selección de los
nunca se había estado tan cerca de la perfección como ahora, en una dispositivos de captura que, de acuerdo con las necesidades,
época en la que el audio digital, los formatos digitales y la pueden presentar características constructivas y especificaciones
computación, con sus programas de restauración digital de audio, técnicas muy diferentes. También en este nivel, se encuentra el
proveen de poderosas e ilimitadas herramientas para terminar
proceso de restauración digital a cargo de los programas de
definitivamente con las imperfecciones del audio analógico. Es claro
que esta perfección no sería posible si no se toman una serie de edición gráfica de audio, que son los encargados, por medio de
acciones correctivas, previas a la digitalización, sobre los medios poderosos algoritmos matemáticos que utilizan predicciones
analógicos y si la humanidad no hubiera contado con los grandes probabilísticas, de detectar los ruidos indeseados y reconstruir la
genios que han desarrollado los modelos matemáticos en los que señal de audio original. Además, tiene la posibilidad de agregar
descansan todos los algoritmos de restauración de señales presentes efectos con el fin de optimizar y enriquecer el sonido.
en los programas de restauración digital de audio.
Index Terms—Restauración de audio, audio analógico, audio digital,
formatos analógicos, formatos digitales, degradaciones, algoritmos II. FORMATOS ANALÓGICOS DE AUDIO
de restauración, ruidos, conversores de audio, programas de edición
grafica de audio, resolución digital, frecuencia de muestreado, Un formato, como su mismo nombre lo indica, puede
estructuras, tratamiento digital de audio, click, hiss, thumps, concebirse como la manera mediante la cual los datos son
scratches, crackles, distorsión, hum, Radio Bolivariana. organizados sistemáticamente para su procesamiento,
reproducción y transmisión. Los datos son, principalmente,
I. INTRODUCCION imágenes, sonidos, e información alfanumérica. Para cada
clase de dato existen diferentes formatos en los que se
D esde finales de 1800, época en la que comenzó una nueva
era en el mundo musical, la investigación referida al tema
del audio se ha centrado principalmente en dos aspectos: el
pueden organizar dichos datos. Estos formatos pueden ser
de dos clases: el formato analógico y el formato digital. A
desarrollo de métodos que permitan registrar el sonido lo más
447
continuación se mencionan en forma cronológica los
diferentes formatos de audio analógico.
• Cilindro de cera de Edison. 1877, su reproductor
es el fonógrafo.
• Disco de 78 RPM. 1887, su reproductor es el
gramófono.
• Alambre. 1920 aprox, su reproductor recibe el
mismo nombre.
• Cinta de carrete a carrete o de carrete abierto.
1934, su reproductor recibe el mismo nombre.
• Disco de vinilo. 1945, su reproductor es conocido
como tocadisco.
• Cartucho de 4 pistas. 1956, su reproductor es Fig. 1. Imagen del síndrome de Sticky Shed.
conocido como tocadisco.
• Cartucho RCA o RCA sound tape cartridge. 1958, disco e impidiendo su correcta reproducción. Otro tipo de
su reproductor recibe el mismo nombre. degradaciones, son las de naturaleza química que consiste
• Sanyo micro pack 35. 1960, su reproductor recibe en la descomposición del material base de los discos.
el mismo nombre.
• Cartucho de 8 pistas. 1960 aprox, su reproductor
recibe el mismo nombre. Dependiendo del nivel de estas degradaciones tanto en
• Casete de audio compacto. 1963, su reproductor cintas magnéticas como en discos, existen tratamientos
recibe el mismo nombre. físicos correctivos que logran recuperar en un alto
• Playtape. 1966, su reproductor recibe el mismo porcentaje la calidad sonora original del medio de
nombre. almacenamiento analógico de audio. Estos procedimientos
• Microcasete. 1970 aprox, su reproductor recibe el requieren de mucha técnica y cuidado y son referidos a
mismo nombre. especialistas y textos relacionados con la restauración de
audio.
• Elcaset. 1976, su reproductor recibe el mismo
Cuando se pretende realizar una restauración digital de
nombre.
audio sobre viejos fonogramas es necesario efectuar
correctamente la anterior etapa, asegurando la máxima
III. DAEGRADACIONES Y RUIDOS
calidad posible del medio analógico de almacenamiento,
A. Degradaciones físicas de los medios de almacenamiento de pues un formato con excesivas degradaciones impedirá un
audio analógico tratamiento digital exitoso. Sin embargo, es imposible
lograr una restauración física completa sobre el medio,
Cuando las cintas magnéticas de audio se exponen a siendo inherente a el una gran variedad de ruidos y
condiciones de humedad y temperatura inadecuadas, las elementos espurios causados por las degradaciones y fallas
distintas capas que las componen sufren procesos de en los equipos reproductores.
contracción y expansión, como podemos advertir en la
siguiente gráfica. Estas variaciones producen daños en la B. Ruidos o degradaciones en la señal de audio
superficie magnética, incluso, irreparables: pueden romper
el aglomerante y hacer que las partículas metálicas se El ruido, mezclado con una señal acústica destinada a ser
desprendan de su base plástica. Se trata de un fenómeno percibida por el hombre, constituye, generalmente, una
descrito en la literatura especializada como flaking off. parte subjetiva de la misma que transporta información no
Otra consecuencia del incorrecto almacenamiento en útil y que perturba la forma de onda de manera que
ambientes de alta humedad es el síndrome de Sticky Shed, modifica su significado, interfiriendo así la comunicación
que consiste en la caída del aglomerante que fija las de la parte útil. La parte útil transporta la información
partículas magnéticas a la base de la cinta. La degradación deseada y el ruido transporta información sobre los
causada por el síndrome de Sticky She, puede ser corregida elementos que han servido para generar la señal, grabarla y
por procesos de horneado donde se restablece la calidad transmitirla. El objetivo es implementar procesos de
del medio. En la Fig. 1. se aprecia el efecto causado por el separación de la señal útil del ruido, los que básicamente
síndrome de Sticky Shed a una cinta de carrete abierto. pueden ser contenidos por dos tipos: en el primer modelo,
En discos analógicos de audio, las degradaciones más se puede precisar la parte de la señal que se considera
comunes son la presencia de polvo y suciedades que ruido, procediendo a su eliminación. La señal restante será
generalmente causan rayones en la superficie del disco. la restaurada. En el segundo modelo, se puede precisar la
Las altas temperaturas alteran la estructura, deformando el parte de la señal que es de interés, música o palabra. Se
448
elimina la señal que no es de interés y queda la señal reproducción, se puede concluir, entonces, que son muy
restaurada. diferentes la sucesión de operaciones y el conjunto de
Los tipos de degradación, comúnmente asociados con dispositivos que es preciso poner en juego para la captura
viejas grabaciones, pueden ser clasificados en de señales de audio analógico.
perturbaciones localizables y globales. Por ejemplo, La captura de audio analógico se puede dividir en dos
impulsos cortos de ruido (clicks, crackles, y pops) como tipos generales, dependiendo de las posibilidades de los
también en baja frecuencia, pulsos largos, (thumps) son equipos reproductores. Cuando el equipo reproductor
localizables que afectan ciertas muestras en forma de posee salidas eléctricas de audio analógico la captura es del
impulsos, mientras continuas distorsiones de fondo o tipo limpio; cuando el equipo reproductor no posee
interferencias como el ruido de la banda ancha (hiss), (buzz salidas eléctricas de audio analógico la captura es del tipo
y hum), distorsión, distorsión armónica son usualmente sucio. Así, por ejemplo, para registros soportados en
clasificados como perturbaciones globales alterando todas cilindros de cera, se necesita capturar el sonido con ayuda
las muestras de la señal de audio. Otros ejemplos de de micrófonos. Esta etapa requiere una planificación
perturbaciones de audio incluyen las distorsiones no cuidadosa (posiblemente varios micrófonos dispuestos en
líneales (clipping), ruido de superficie y modulación rápida posiciones estratégicas) donde se filtran aquellas señales
o lenta en frecuencia, (wow y flutter), causadas por la sonoras, ajenas a la normal reproducción del registro.
alteración en la velocidad de reproducción del medio En el caso de soportes más modernos, como LP y
analógico de audio. casetes, se puede prescindir de la captura mediante
micrófono.
Tanto en la captura como en el tratamiento digital de
IV. TRATAMIENTO DIGITAL DE SEÑALES DE AUDIO PARA audio con fines de restauración es importante contar con
equipos de alto perfil que beneficien el proceso y no
SU RESTAURACION generen perdidas de información o alteren
perjudicialmente la señal de audio analógico capturada. En
la Fig. 2. Se esboza el proceso para la captura y tratamiento
A. Captura de la señal de audio analógico. digital de señales de audio, finalizando con el
Para comenzar un proceso de restauración y grabación almacenamiento del la señal modificada en un formato
digital de audio es necesario preparar una serie de digital de audio. En la Fig. 3. se ilustra el proceso de
dispositivos que cooperen en la captura de la señal. reproducción de la señal digital modificada, donde a través
Buscando con ello almacenarla en el disco duro de un del dispositivo llamado conversor análogo-digital y digital-
computador, donde la señal puede ser sometida a procesos análogo se logra migrar del mundo analógico al digital y
de restauración digital. De acuerdo con la edad de los viceversa.
registros de audio o fonogramas y los equipos de
Señal de audio Señal de audio

Señal analógica
digital digital modificada
de audio con
degradaciones 1010110 11 1010 0
0101001 0101101
0011110 000110 0
1100001 0100101
Medio de
ADC
almacenamiento
Computador digital
Fig. 2. Proceso de captura de señales de audio analógico
Señal de audio
Señal analógica
digital modificada
de audio sin
degradaciones
11 10100
0101101
00 0 110 0
0100101
Convensor D/A Amplificador Parlantes
Fig. 3. Proceso de reproducción de la señal de audio digital restaurada.

449
Al igual que en la etapa de restauración física de los líneal de vectores extraídos de un diccionario apropiado,
formatos analógicos, el fundamental precisar atención en la que se elige de acuerdo con la naturaleza de la señal.
correcta elección de los dispositivos que permiten realizar Las tecnologías de modificaciones diseñan modelos
los procesos de captura y tratamiento digital. matemáticos de la señal, que representan de manera precisa
la parte no degradada. Una vez detectado el segmento
B. Tratamiento digital para la restauración de audio degradado de la señal, es posible eliminarlo y sustituirlo
por otro que se cimentará en el modelo matemático.
La posibilidad de modificar las propiedades de una señal
Aquella parte de señal que no se identifica como
capturada a través de tratamiento digital es abundante,
degradación o ruido, se conserva en su estado original.
donde la aplicación de efectos sobre la señal logra realzar y
mejorar sus características emotivas en el caso de pretender Las técnicas de sustitución consisten en sustituir la señal
una restauración o en otros casos de crear nuevos e de audio por una combinación líneal, de señales
innovadores sonidos. Sin embargo el objetivo es conocer elementales extraídas de un diccionario adaptado a cada
las tecnologías de restauración de audio. Las tecnologías tipo de ruido. En el proceso se fijan límites de tolerancia
de restauración que se exponen están basadas en Procesos para la calidad de la representación, y el residuo
Digitales de Señales (DSP). Se dispone de dos áreas (fragmentos de la señal) que no es posible incluir en ella es
metodológicas que agrupan tecnologías con orientaciones precisamente el ruido que debe ser eliminado. En la Fig. 4.
diferentes. La primera se fundamenta en modificaciones se ilustra el tratamiento digital para la remoción de clicks
locales o globales de la señal de audio; la segunda se basa en una señal de audio a través de un programa
en la sustitución de la señal de audio por una combinación especializado en la edición grafica de audio.
Señal de audio
con clicks
Señal de audio
restaurada
Fig. 4. Detección y eliminación de clicks presentes en una señal de audio a través de tratamiento digital de audio.
450
V. CONCLUSIONES analógico, digitalización de audio analógico y posterior
tratamiento digital para la restauración.
La restauración de audio no es una disciplina que se

limita única y exclusivamente a estudiar conceptos REFERENCIAS
relacionados con la restauración de los soportes físicos de
almacenamiento y señal de audio, mediante el tratamiento [1]. AES: Audio Engineering Society. [en línea]. New York: AES, 2005
digital, pues, además, estudia detalladamente las <http://www.aes.org/> [consulta: 1 May. 2005].
[2]. AUDIO FORMATS. Wikipedia: list of audio formats [en línea]. s.l.:
características de las ondas y el análisis de algunos Wikipedia, 2005
conceptos referidos al audio analógico y digital, con el fin <http://en.wikipedia.org/wiki/List_of_audio_formats>
de ilustrar más claramente la naturaleza y los parámetros consulta: 17 Mar. 2005].
[3]. AUDIO RESTORATION. [en línea]. s.p.i.
que definen una onda de audio y su comportamiento, los <http://www.lnlrecording.com/FAQ/audio_restoration.htm>
que, a su vez, permiten identificar y percibir con precisión [consulta: 6 Mar. 2005].
las consecuencias de las degradaciones o ruidos en la [4]. AUDIO RESTORATION. WAVES: restoration bundle. [en línea].
s.l.: Waves Audio, 2005.
música. De esta manera se puede evaluar, con poco margen <http://www.waves.com/content.asp?id=59>
de error, las acciones correctivas que deben tomarse [consulta: 5 Mar. 2005].
[5]. BOLL. S, F. Suppression of Acoustic Noise in Speech Using Spectral
durante el tratamiento digital, en lo que se refiere a la Subtraction. En: IEEE Trans. Acoustics, Speech, and Signal
aplicación de algoritmos matemáticos, efectos o filtros Processing. Vol. ASSP- 27, No. 2 (Apr. – May. 1979) p. 113–120.
para resaltar o corregir un sonido en particular. [6]. CILETTI, Eddie. If I Knew You Were Coming I’d Have Baked A
Tape!: (A Recipe for Tape Restoration). [en línea]. s.l. CILETTI,
Eddie, 1998. <http://www.tangible-
La aplicación del Procesamiento Digital de Señales technology.com/tape/baking1.html>
(DSP) en problemas relacionados con la restauración de [consulta: 4 Abr. 2005].
[7]. ESQUEF A. A, Paulo. Model-Based Analysis of Noisy Musical
audio, ha sido una área de considerable crecimiento desde Recordings with Application to Audio Restoration. [en línea].
las primeras investigaciones en este tema, a principios de Helsinki: Helsinki University of Technology, 2004.
<http://lib.tkk.fi/Diss/2004/isbn9512269503/> [consulta: 6 Mar.
1970. Para 1980, los chips DSP ya eran suficientemente 2005].
poderosos como para ejecutar las complejas operaciones [8]. GODSILL, Simon and RAYNER, J.W. Digital Audio Restoration: A
requeridas por la restauración digital de audio en tiempo Statistical Model Based approach. [en línea], Cambridge: University
of Cambridge, 1998. <http://www-
real. Todo esto dio origen a los primeros sistemas sigproc.eng.cam.ac.uk/~sjg/springer>
comerciales de restauración digital por parte de CEDAR [consulta: Ene. 20].
Audio, en el Reino Unido y Sonic Solutions, en Estados [9]. HANDBOOK FOR SOUND ENGINEERS. 3 ed. Portland:
BALLOU, Glen, 2005. 1553p.
Unidos [10]. IEEE VIRTUAL MUSEUM. The beats goes on: How sounds are
recorded and played. [en línea]. s.l.: IEEE, 2005. <http://www.ieee-
virtual-museum.org/index.php> [consulta: 12 Abr. 2005].
Una de las ventajas que proporciona el audio digital [11]. CEDAR. Introducction to Audio restoration. [en línea]. s.l.: CEDAR,
sobre el audio analógico es que permite la experimentación 2005. <http://www.cedar-audio.com/> [consulta: 3 Mar. 2005].
y el ensayo, es decir, manipular información digital es más [12]. JORDÀ PUIG, Sergi. Conceptos avanzados de procesador digital de
audio. [en línea]. s.l.: Resonancias, 1997.
fácil y más seguro ya que hace posible la reversibilidad del <http://www.ccapitalia.net/reso/articulos/index.htm?frame=http%3A//
proceso. Reversibilidad en el sentido de que se pueden www.ccapitalia.net/reso/articulos/articulos.htm> [consulta: 12 Mar.
hacer copias con mayor facilidad y sin perder calidad de 2005].
[13]. VASEGHI S, V. and RAYNER. J, W. Detection and Suppression of
audio en el proceso de duplicación. El audio analógico no Impulsive Noise in Speech Communication Systems. Proc. IEEE Int.
posee esta flexibilidad ya que el tratamiento físico puede Conf. Acoustics, Speech, and Signal Processing. Vol. 137, No. 1 (Feb.
– Mar. 1990); p. 38-46.
ocasionar destrucción permanente, lo que quiere decir que
duplicar no es una solución, ya que con cada copia la
calidad del sonido va decayendo
Más allá del conocimiento adquirido en este trabajo por

la investigación y búsqueda de información relacionada
con la restauración de audio, es evidente que los frutos
más apreciados son los beneficios recibidos por la
comunidad universitaria, la naciente línea de formación en
audio de la Escuela de Ingeniería y, particularmente, por la
emisora de la Universidad Pontificia Bolivariana, con la
que compartimos el beneplácito de los logros obtenidos
con este trabajo, un texto rico en información técnica con
reales soluciones a la problemática referida a la
degradación de medios de almacenamiento de audio

Restauracion de Audio - Universidad Pontificia Bolivariana

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Restauracion de Audio - Universidad Pontificia Bolivariana

Cargado por

Copyright:

Formatos disponibles

LA RESTAURACIÓN DE AUDIO

GUSTAVO ADOLFO VALENCIA ZAPATA

UNIVERSIDAD PONTIFICIA BOLIVARIANA

GUSTAVO ADOLFO VALENCIA ZAPATA

Trabajo de grado para optar al título de Ingeniero Electrónico e Ingeniero

UNIVERSIDAD PONTIFICIA BOLIVARIANA

Medellín, 19 de julio de 2005

A quienes les debo todo.

Gustavo Adolfo Valencia Zapata

Nicolás Ramírez Echeverri

El miedo y la ignorancia degradan nuestra mente, engendran oscuridad. La

Agradecemos a nuestras familias, guías y participes de nuestros logros y a

José Ricardo Zapata, nuestro director.

Aglomerante: en una cinta magnética, se refiere al componente que

Ancho de banda: diferencia entre las frecuencias máxima y mínima que

Audiophile: individuo que tiene un alto interés en el audio de alta calidad.

Bit: digito binario.

Buffer: porción de memoria aislada, presente en varios dispositivos

Codecs: abreviatura de Compresor-Decompresor. Describe una especificación

Codificación de fuente: tiene como objetivo comprimir la información

Codificación entrópica: codificación sin perdida de información e

Codigo ASCII: American Standard Code for Information Interchange (Código

Declorización: fenómeno químico que ocurre cuando el PVC se descompone

Disco óptico: disco circular y plano usualmente construido en policarbonato y

Dither: ruido de bajo nivel (típicamente equivalente a un error menor que un

Dolby: sistema de reducción de ruido complementario utilizado en el registro

Ecualización: acción de corregir o compensar la respuesta en frecuencia de

Extensión: en informática, es el grupo de letras (generalmente tres) que

Ferrita: material cerámico ferromagnético, compuesto por hierro, boro y

Ficheros: un archivo o fichero informático es una entidad lógica compuesta

Firmware: o Programación en Firme, es un bloque de instrucciones de

Formato de propiedad: formato con derechos de autor o Copyright.

Frame: muestra temporal de una pista de audio.

Front side bus: canal de información de un procesador con los otros

Goma Laca: material que se obtiene a partir de un líquido que segrega el

Hardware: se denomina hardware o soporte físico al conjunto de elementos

Inteligible: que puede ser entendido. Que se oye clara y distintamente.

Interfaz: conexión de un dispositivo electrónico con el exterior.

Java: lenguaje de programación expresamente diseñado para usarse en el

Latencia: tiempo que transcurre entre el inicio y el final de una acción. En

LCD: visor de cristal liquido de muy bajo consumo.

Lenguaje C: es un lenguaje de programación creado en 1969 por Ken

Mapear: localizar y representar gráficamente la distribución relativa de las

Material ignífugo: material resistente al fuego.

Metadata: la literatura especializada define los Metadata o Meta Tags, como

Mylar: material construido a base de poliéster desarrollado por la compañía

PC: (Personal Computer). Término genérico utilizado para referirse a

Plug-ins: un plug-in (o plugin) es un programa de computador que interactúa

Se utilizan como una forma de expansión programas de forma modular, de

Pro Tools: plataforma computacional para producción y edición digital de

Rack: armazón modular metálico de ancho estándar sobre cuyos rieles

Rango dinamico: diferencia en dB entre los niveles máximo y mínimo de una

SATA (Serial ATA): interface de transmision de información de mayor

SCSI (Small Computer System Interface): interface para transmisión de

Síndrome de sticky shed: fenómeno químico que ocurre, debido a la

Síndrome de vinegar: nombre que recibe el síndrome de sticky shed en las

Sintetizador: instrumento musical electrónico diseñado para producir sonido

Sistemas Embebidos: computador de propósito especial que esta

Software: es la parte lógica del computador, esto es, el conjunto de

Subarmónicos: es un tono que dispone de una relación interválica --respecto

Surfactante: los surfactantes o tensoactivos son sustancias que disminuyen la

Sustancia antifúngica: sustancia que evita el crecimiento y la proliferación

Ticks: impulsos de corta duración y baja amplitud. Normalmente relacionados

TFT (Thin film transistor): o transistor de capa fina. Es un tipo especial de