Está en la página 1de 169

Портативный цифровой стереофонический диктофон

Sistema de redacción, análisis y


limpieza de ruidos de las señales
articulatorias

STC-H203M

ГНОМ 2М
STC-H285

SIS 7
Руководство по эксплуатации
ЦВАУ 467669,008РЭ

Manual del usuario


ÍNDICE

LICENCIA DE OTORGAMIENTO DE UTILIZACIÓN DEL PROGRAMA SIS 7.0.1 ............1


INTRODUCCIÓN ..........................................................................................................................2
1. DESTINACIÓN DEL SISTEMA ............................................................................................3
2. REQUERIMIENTOS DEL SISTEMA.....................................................................................5
3. INSTALACIÓN Y CONFIGURACIÓN DEL SISTEMA ......................................................5
3.1 Instalación de la placa de introducción – deducción del sonido ................5
3.2 Instalación del programa SIS ..................................................................................5
3.3 Configuración de la calidad de la transmisión del color ...............................6
3.4 Aparatos configurados de introducción – deducción del sonido ...............7
4. ACCESO AL SISTEMA..........................................................................................................8
4.1 Instalación de la configuración..............................................................................8
4.2 Elección del idioma de diálogo ..............................................................................8
4.3 Elección del tamaño de la letra a utilizarse en el diálogo.............................9
4.4 Elección del tamaño y estilo de las teclas ..........................................................9
4.5 El menú principal, panel de herramientas y teclas «hot»............................10
4.6 Trabajo con el menú estándar del tipo «Fuente-receptor» ........................14
5. TRABAJO CON LAS VENTANAS .....................................................................................16
5.1 Creación de una ventana nueva...........................................................................16
5.2 El menú contextual de la ventana activa ..........................................................17
5.3 Paso de una ventana a otra...................................................................................18
5.3.1 Paso a otra ventana con ayuda del “ratón” ..........................................................18
5.3.2 Paso a otra ventana con ayuda del menú.............................................................18
5.3.3 Paso a otra ventana con ayuda de la lista de ventanas ....................................18
5.4 Adición del comentario textual en la ventana ................................................19
5.5 Adición del campo del texto de marca..............................................................20
5.6 Conexión entre ventanas.......................................................................................21
5.7 Traslado de las ventanas y cambio de sus dimensiones.............................21
5.8 Traslado del menú, que tapa la ventana...........................................................22
5.9 Obtención de la información sobre la ventana, cambio de parámetros
de la presentación de los datos en la ventana ...............................................22
5.9.1 Obtención de la información operativa sobre los ejes de oordenadas .....22
5.9.2 Obtención de la información detallada sobre la ventana activa ...................22
5.9.3 Obtención de información sobre la señal activa en la ventana .....................24
5.9.4 Cambio de los parámetros de muestreo de datos en la ventana activa .....24
5.9.5 Lista de segmentos. Cambio de color y nombre de un
segmento ya creado ....................................................................................................25
5.9.6 Cambio del color del fondo ......................................................................................26
5.9.7 Resaltación individual del fragmento en la ventana .........................................26
5.10 Copia de la ventana en el portapapeles ....................................................... 26
6. LECTURA DE LOS ARCHIVOS DE DATOS DEL DISCO DEL PC .............................. 27
6.1 Lectura del fonograma del disco del PC .......................................................... 27
6.2 Lectura de los archivos de texto ........................................................................ 30
6.2.1 El encabezamiento de los archivos de texto....................................................... 30
6.2.2 Lectura de los archivos de texto sin los encabezamientos............................ 32
7. INTRODUCCIÓN DE LA SEÑAL DESDE EL ADC ........................................................ 34
7.1 El menú de los parámetros .................................................................................. 35
7.2 Oscilógrafo digital................................................................................................... 36
7.3 El habla visualizada de la señal introducida ................................................... 37
8. COMO ESCUCHAR EL FONOGRAMA .......................................................................... 38
9. CONSERVACION DE LOS DATOS ................................................................................. 40
9.1 Grabar en el disco un segmento de datos ...................................................... 40
9.2 Guardar en el disco el fragmento de los datos en formato de texto...... 41
9.3 Guardar el estado en curso del proceso de trabajo ..................................... 41
10. DESPLAZAMIENTO Y EL CAMBIO DE ESCALA DE LOS DATOS EN EL BOX DE
LA VENTANA ............................................................................................................................. 42
10.1 Definiciones: ......................................................................................................... 42
10.2 El control del desplazamiento horizontal de los datos en el box........ 42
10.3 El control de la escala horizontal en el box................................................ 43
10.4 Establecimiento de las coordenadas del box por los límites del
fragmento seleccionado.................................................................................................... 44
10.5 El control de la escala vertical en el box y el desplazamiento
por la vertical ......................................................................................................... 44
10.6 El régimen «Lupa»................................................................................................ 46
10.7 La redacción de la señal..................................................................................... 48
10.8 Opciones de visualización ................................................................................. 49
11. OPERACIONES CON LOS CURSORES, LAS MARCAS TEMPORALES Y
PERMANENTES PARA SELECCIONAR LOS FRAGMENTOS DE DATOS ......................... 51
11.1 Llamadas, desplazamiento y eliminación del cursor vertical ................ 51
11.2 Las marcas temporales...................................................................................... 52
11.3 Las marcas permanentes .................................................................................. 52
11.4 Lista de marcas .................................................................................................... 53
11.5 Cursor horizontal y las marcas horizontales temporales....................... 55
11.6 Cómo guardar las marcas en un archivo junto con los datos............... 56
12. FORMACIÓN DE LA SEÑAL DE VERIFICACIÓN .................................................... 57
13. REDACCIÓN DE DATOS.............................................................................................. 58
13.1 Elección del segmento – fuente de datos y del
fragmento – fuente de datos ............................................................................ 58
13.2 Normalización de la señal .................................................................................59
13.3 Operaciones con constantes.............................................................................60
13.4 Transformación lineal de la señal ...................................................................61
13.5 Eliminación de la señal .......................................................................................62
13.6 Adición del fragmento al final del segmento ..............................................62
13.7 Inserción del fragmento del segmento corriente en otro
segmento .................................................................................................................63
13.8 Copia de datos ......................................................................................................64
13.9 Desplazamiento de señales ..............................................................................65
13.10 Utilización del menú de contexto ...................................................................65
13.11 Desplazamiento del segmento corriente......................................................66
13.12 Nivelación de datos .............................................................................................66
13.13 Mezcla de segmentos .........................................................................................67
13.14 Recorte (clipping) .................................................................................................69
13.15 División (cambio) de la frecuencia de discretización................................69
13.16 Reversión ................................................................................................................72
13.17 Inversión .................................................................................................................72
13.18 Obtención de la señal, corregida según el ritmo de reproducción,
pero con la misma altitud del tono principal ...............................................72
13.19 Modulación.............................................................................................................73
13.20 Transformación de la precisión del oscilograma .......................................74
13.21 Operaciones mono / estéreo con las señales .............................................74
13.22 Trabajo con el canal de tiempo de servicio .................................................75
14. FILTRACIÓN ....................................................................................................................76
14.1 Igualización adaptativa de frecuencia ..........................................................76
14.1.1. Particularidades del trabajo .................................................................................76
14.1.2. Descripción de parámetros ..................................................................................77
14.2 Ruido de banda ancha (sustracción adaptativa de frecuencia) ............78
14.2.1 Particularidades del trabajo .........................................................................................79
14.2.2. Descripción de los parámetros ..................................................................................81
14.3 Filtración del ruido fijo de banda ancha......................................................84
14.3.1 Breve descripción del funcionamiento de algoritmos ..........................................84
14.3.2 Recomendaciones de ajuste de parámetros del filtro
de ruido fijo de banda ancha ......................................................................................84
14.4 Interferencias tonales y regulares: filtración adaptiva .............................85
14.4.1 Particularidades del método ........................................................................................85
14.4.2 Parámetros de filtración adaptativa de ruidos regulares ....................................87
14.5 Filtración de interferencias impulsivas..........................................................89
14.6 Filtración dinámica ..............................................................................................91
14.7 Filtración de las interferencias estéreo .........................................................92
14.7.1 Menú de opciones del filtro adaptativo para las interferencias estéreo .... 92
14.7.2 Recomendaciones sobre el uso de la filtración de las interferencias estéreo
........................................................................................................................................................... 94
14.8 Filtración de la señal con la ayuda de los módulos conectados de
DirectX 95
14.8.1 Módulo Sound Сleaner .................................................................................................. 95
14.8.2 Otros módulos de DirectX............................................................................................ 96
14.9 Ecualizador paramétrico ................................................................................... 97
14.9.1 Órganos de mando del ecualizador ......................................................................... 98
14.9.2 Panel de herramientas del ecualizador .................................................................... 98
14.9.3 Ventana de diálogo «Opciones complementarias» ............................................ 100
14.9.4 Cambio de la escala de la imagen ........................................................................... 101
14.9.5 Regulación de la característica de la frecuencia del filtro ............................... 102
14.9.6 Régimen «Goma» .......................................................................................................... 102
14.9.7 Regulación adicional de la característica de frecuencia ................................... 102
14.9.8 Regímenes de trabajo del ecualizador.................................................................. 103
14.9.9 La filtración de la señal estéreo ............................................................................... 104
15. ANÁLISIS DE LAS SEÑALES DE VOZ....................................................................... 105
15.1 Recepción de las imágenes tridimensionales de los macizos de los
espectrogramas, kepstrogramas, de los coeficientes de correlación
automática, correlación particular, de los coeficientes de pronosticación lineal
y de la respuesta de frecuencia del transmisor LPC ............................................. 106
15.1.1. Manejo de la escala de la tercera dimensión en el box ............................ 106
15.1.2. Preinstalación de la escala de la tercera dimensión .................................. 107
15.1.3. Cambio de los márgenes de la imagen ........................................................ 108
15.1.4. Cambio del brillo y contraste de la representación ................................... 108
15.1.5. Normalización de la voz vista ........................................................................... 108
15.1.6. Como volver a dibujar en otra forma de representación ......................... 109
15.2 Las ventanas de suspensión ......................................................................... 109
15.2.1 Argumentación teorética del uso de las ventanas ............................................. 109
15.2.2 Descripción de las cinco ventanas principales .................................................... 111
15.2.3 Ventana de los períodos iguales............................................................................. 112
15.2.4 Recomendaciones para la elección del tipo de ventana .................................. 113
15.3 Cálculo del espectrograma dinámico.......................................................... 114
Fijación de los parámetros ...................................................................................................... 114
15.4 Cálculo de la función de periodicidad
(del cepstrograma dinámico) .......................................................................... 117
15.5 Cálculo de las características dinámicas del modelo regresivo
automático de la señal de voz........................................................................ 120
15.6 Análisis espectral en la base de la predicción lineal de voz (obtención
de la imagen de la respuesta particular del transmisor LPC)............... 122
15.7 Cálculo energético (Declinación Cuadrada Promedio) ...........................125
15.8 Cálculo de la frecuencia del cruce del cero ...............................................125
15.9 Obtención del promedio ...............................................................................125
15.10 Cálculo de las características del tono fundamental ..............................126
15.10.1 Generalidades ..............................................................................................................126
15.10.2 Método LLK ...................................................................................................................126
15.10.3 Proceso de separación del tono principal ...........................................................129
15.10.4 Método espectral ........................................................................................................130
15.10.5 Comparación de locutores .......................................................................................131
15.10.6 Control de la justeza del cálculo del tono principal ........................................132
15.10.7 Corrección del tono principal para la imagen del espectro...........................133
15.11 Cálculo del espectro momentáneo de Furie ..............................................133
15.12 Cálculo del espectro medio de Furie............................................................134
15.3 Análisis de formante .........................................................................................136
15.13.1 Cálculo de formantes ................................................................................................136
15.13.2 Corrección de formantes bajo las imágenes de los espectrogramas........138
15.14 Calculación de histogramas............................................................................139
15.15 Comparación de histogramas y calculación de sus parámetros.........140
15.16 Investigación de las fonogramas con el módulo EdiTracker................142
16. MANUAL DEL EXPERTO ACÚSTICO PARA EL ANÁLISIS
DE LAS NEGOCIACIONES DE AVIACIÓN ...............................................................143
16.1 Introducción de los datos sacados de las grabadoras
automáticas del bordo al ordenador.............................................................143
16.2 Trabajo con señales que contienen marcas del tiempo .......................144
16.2.1 Decodificar las marcas.................................................................................................145
16.2.2 Crear las marcas ............................................................................................................145
16.2.3 Interpolar en el intervalo.............................................................................................146
16.2.4 Cambiar la frecuencia de discretización ...............................................................147
16.2.5 Trasladar las marcas ....................................................................................................148
16.2.6 Revisar las marcas del tiempo ...................................................................................148
16.2.7 Eliminar el canal de servicio.......................................................................................148
16.3 Descripción del principio de decodificación de las marcas del
régimen msrp-64-2(en el canal de servicio) .............................................149
17. PRUEBA DE LA TARJETA DE ENTRADA/SALIDA
CON LA AYUDA DEL PROGRAMA SIS ....................................................................150
17.1 Prueba del canal de entrada ..........................................................................151
17.2 Prueba del canal de salida...............................................................................153
17.3 Prueba pasante del canal de entrada/salida ............................................154
18. UTILIZACIÓN DE LOS MÓDULOS CONECTADOS................................................156
DICCIONARIO DE TÉRMINOS ...............................................................................................158
LICENCIA DE OTORGAMIENTO DE UTILIZACIÓN DEL PROGRAMA SIS 7.0.1

Este programa de acuerdo con las establecidas normas internacionales y rusas


sobre los derechos del autor, solo en una computadora.

En caso de trasladarce el programa de una computadora a otra, es necesario


eliminar el programa del discoduro de la primera computadora

Las copias del programa pueden ser trasladadas del disco duro de la computadora,
donde el programa ha sido instalado a modulos de almecenamiento de informacion,
exclusivamente con el objetivo de archivarlos en caso de averia del disco duro de la
computadora.

En el caso de violación de los derechos del autor expuestos en esta licencia, Speech
Technology Center ejecutará el derecho de anulación de sus obligaciones de de
otorgar las: garantías, consultas, instalaciones de las siguientes versiones de software
en las condiciones priveligiadas y también podrá tomar otras medidas para la defensa
de sus derechos de autor en concordancia con la ley del derecho de autor para los
productos de software.

Consulta a todas las preguntas relacionadas con los programas y aparatos


relizados por Speech Technology Center, al igual que a todas las preguntas que
tubiesen que ver con capacitación y entrenamiento en Speech Technology Center
pueden ser obtenidas por la siguiente dirección:

196084 San Petersburgo, buzón 515


Speech Technology Center S.A
Tel.: (812) 325-88-48
Fax: (812) 327-92-97
e-mail: service @speechpro.com

web: http://www.speechpro.ru

1
INTRODUCCIÓN
El sistema ofrecido por Speech Technology Center S.A. está destinado al análisis de
las señales de voz, a la limpieza de ruidos y a la automatización de la ejecución de las
pruebas criminalísticas de los fonogramas en todas las etapas. El sistema dado es
también el medio universal potente para la realización de los trabajos vinculados con:
la limpieza de ruidos, el aumento de la Inteligibilidad y el mejoramiento de la calidad
de las grabaciones del habla. Concede al operador las posibilidades únicas de
entrada/salida, de redacción, de análisis, de visualización y de procesamiento de las
señales de voz y otras señales de baja frecuencia.

El software SIS permite al experto poseedor de un nivel suficiente de capacitación


ejecutar operaciones auxiliares de redacción del fonograma digital:

• en las etapas de la prueba auditiva y psicolingüística,


• en la etapa de la prueba pericial instrumental - todas las operaciones de la
medida paramétrica y la comparación de los modelos del habla;
• en la etapa de la comprobación de la veracidad de los materiales presentados,
• en la etapa de la prueba pericial visual y combinada lingvo-instrumental – la
obtención de las imágenes exigidas de las representaciones paramétricas de las
muestras de las señales escogidas en la pantalla de la computadora.
El experto tiene la posibilidad de documentar sus acciones y obtener las
ilustraciones gráficas necesarias y los datos numéricos en la pantalla del ordenador y
imprimidos sobre el papel, para su utilización en la conclusión pericial.

En el caso de que SIS estubiese incluido como parte del Complejo de Software y
hardware Ikar-Lab entonces en la lista de los artículos suministrados estará también
la herramienta de alta precisión de entrada/ salida de las señales de voz, que permite:

• transformar las señales análogas a la forma digital,


• introducir las señales en la memoria operativa y grabarlas en el disco duro del PC
sin deterioración y con la conservación de todas las características, esenciales
para la prueba pericial,
• transformar las señales digitales a la forma análoga,
• escuchar las señales procesadas y los tests, compuestos de ellas, en cualquier
etapa de la prueba, estableciendo los parámetros requeridos de los convertidores
digitales-análogos y análogo-digitales.
Debemos indicar que el software SIS está destinado para los usuarios capacitados
que poseen los conocimientos especiales en el campo de los métodos del
procesamiento de las señales, de la lingüística y de la metodología de la prueba
pericial criminalística.

2
1 DESTINACIÓN DEL SISTEMA
Sistema SIS permite:

• transformar las señales análogas a la forma digital y realizar su introducción/


deducción a y de la computadora a través de la tarjeta de sonido de 16-bits o
24-bits;
• Hacer la grabación de la señal de voz introducida al disco duro o en el RAM en
tiempo real. El volumen del espacio virtual es de 2000 MB;
• realizar el control de la calidad de la grabación de audio y la definición de la clase
de desfiguraciones y interferencias que existen;
• redactar la señal digital de la voz introducida al ordenador (computadora),
incluyendo:
o la colocación de las marcas de los límites de las partes de la señal,
o el cambio de las amplitudes y de la duración de las partes de la señal,
o la reglamentación de la señal,
o la composición de los fonogramas de test de los distintos fragmentos de las
señales introducidas,
o la eliminación de las partes ruidosas,
o la anulación de la señal en las pausas;
• escuchar los fonogramas formados de test con el fin de establecer y anotar los
contenidos de las grabaciones del sonido;
• hacer la limpieza del ruido de la señal, utilizando:
o filtración adaptiva de las interferencias armónicas de banda angosta,
cuasifijas por la amplitud y la fase,
o filtración adaptiva de las interferencias armónicas de banda angosta,
cuasifijas solamente por la amplitud,
o filtración adaptiva de las interferencias de banda ancha,
o disminisión de las interferencias de impulso,
o filtración por el ecualizador (igualador) paramétrico;
• analizar los fragmentos eligidos de las señales logrando la medicion y la
visualización en la pantalla de las siguientes características paramétricas:
o la duración de las diferentes partes de la señal;
o la amplitud de las diferentes partes de la señal;
o el Fourier-espectro instantáneo amplitudinal del fragmento escogido;
o el Fourier-espectro medio amplitudinal del trozo escogido de la señal;
o la función de la frecuencia del tono básico de la parte de la señal;
o las características dinámicas de la parte de la señal con las imágenes
cuasitridimensionales del tipo de «habla visible» en las coordenadas
tiempo/número del coeficiente paramétrico/amplitud para:
¾ los coeficientes de la amplitud del espectro de la potencia,

3
¾ los kepstros materiales,
¾ la funcíon de autocorrelación,
¾ los coeficientes de la predicción lineal,
¾ los coeficientes de la correlación de frecuencia,
¾ la respuesta de frecuencia del transmisor «KLP»,
¾ las características dinámicas medias de la señal,
¾ las características estadísticas de las curvas de frecuencia del tono
básico;
• realizar la comparación de las características paramétricas medias de las señales
de voz y la obtención de la medida de la semejanza de algunas muestras de las
señales, comparando:
o los espectros medios de las muestras de las señales,
o las características estadísticas de las curvas del tono básico de las muestras
de las señales,
o los espectros instantáneos de los fragmentos básicos eligidos de las señales,
o las características medias de kepstros, los coeficientes de la autocorrelación,
la predicción lineal, la autocorrelación privada, de las estructuras formantes
en las partes básicas de fonogramas;
• realizar la visualización para despues obtener la imagen en el archivo o la copia
de las imágenes sobre el papel para:
o los oscilogramas,
o los espectrogramas dinámicos (sonogramas, o las imágenes del habla
visible),
o kepstrogramas dinámicos (las funciones de la periodicidad de la señal),
o autocorrelogramas dinámicos,
o las curvas del tono básico,
o las trayectorias formantes para realizar un análisis visual u subvectivo y
también para:
¾ la toma de la decisión, acerca de la coincidencia o no coincidencia de
las muestras del señal,
¾ la determinación de las particularidades específicas de la señal,
¾ la determinación de las características personales del locutor,
¾ la confirmación objetiva de la presencia de los fenómenos fonéticos y
prosódicos en la señal , señalados en el etapa de la prueba lingüístic1a
de auditor.
• realizar la corrección del tono básico sobre la imagen de kepstro y la corrección
de formantes sobre la imagen del espectrograma.

4
2 REQUERIMIENTOS DEL SISTEMA.

El software y el hardware ofrecidos están destinados para en el trabajo en IBM PC -


el ordenador personal compatible, que cumpla con las siguientes exigencias mínimas:

• procesador Intel Pentium;


• frecuencia de compás nunca más bajo de 300 MHz;
• RAM no menos de 512 MB;
• videoadaptador y monitor SVGA (la resolución no menos de 1024*768, la paleta
de color 32 bits);
• OS MS Windows 2000 o XP;
• tarjeta de introducción/deducción del sonido (STС-H216, STС-H246 o tarjeta de
sonido integrada);
• audifonos;
• teclado, ratón;
memoria libre en el disco duro para el almacenamiento de los archivos sonoros (el
volumen recomendado – no menos de 10 GB).

3 INSTALACIÓN Y CONFIGURACIÓN DEL SISTEMA

3.1 Instalación de la placa de introducción – deducción del sonido


Los aparatos de introducción-deducción del sonido en el programa SIS se instalan
y configuran según la documentación técnica suministrada.

3.2 Instalación del programa SIS


Para la instalación del programa SIS y Sound Cleaner hace falta poner en marcha el
archivo Setup.exe del catálogo SIS_SETUP en CD distributivo.

Si en el ordenador ya está instalada una de las versiones del programa SIS, el


usuario recibirá la propuesta de desinstalarla.
Después de la terminación del proceso de desinstalación es necesario nuevamente
poner en marcha el archivo Setup.exe y seguir las instrucciones del programa de
instalación, para continuar la instalación presione el botón «Next».
Durante la aparición en la pantalla del texto “acuerdo de licencia”,se necesita
aceptarlo («I accept»). A continuación, en el proceso de instalación al usuario se le
pedirá eligir la idioma básico de trabajo del programa (inglés, aleman, ruso o chino) y
el catálogo para la instalación (automáticamete: C:\Program Files\Speech Technology
Center\SIS).

5
Atención!
Si en su computador ya ha sido instalada la versión 4 y 5 del programa Sound
Cleaner, se recomienda instalar la versión ofrecida junto con el programa SIS en un
catálogo diferente al de las versiones 4 y 5.

En caso de que en el computador se encuentre intalada una versión igual a la


suministrada junto con el programa SIS, las dos versiones no van a funcionar en un
mismo computador. En este caso es necesario volver a registrar Sound Clear
estableciendo un codigo de registración obtenido del distributivo mas completo.

Para la instalación del programa Sound Clear se debe oprimir el boton “Setup” en la
ventana de diálogo y luego seguir las instrucciones.

Durante la aparición en la pantalla del mensaje sobre la instalación del driver de la


llave de defensa electrónica “HASP”, es necesario asegurarse de que el mecanismo de
la defensa está instalado en la ranura (puerto) correspondiente del PC, y solamente
después de esto presionar «OK».

Al terminar la instalación, el programa informará sobre la terminación exitosa del


proceso.

Para la salida del régimen de la instalación presione el botón «Finish».

3.3 Configuración de la calidad de la transmisión del color


Hace falta tomar en consideración que el programa SIS exige para su trabajo la
instalación de la paleta de color completa en la pantalla de visualización. La instalación
de la paleta se realiza del modo siguiente:

ƒ Haga clik en el botón derecho del ratón en cualquier lugar libre del escritorio de
su computador. En el menú de contexto escoja el punto “Propiedades”.
ƒ En la ventana de “Propiedades: Pantalla” pase a la sección “Ajustes”.
ƒ Luego en el menú que se abre “Paleta de color” escoja el régimen «True Color
(32 bits)».
Si la pantalla de visualización se encuentra en otro régimen, durante la ejecutación
del programa aparecerá un mensaje indicando que el programa será inmediatamente
descargado ( mirar Dib.1).

Dibujo 1. Mensaje de error

6
3.4 Aparatos configurados de introducción – deducción del sonido
Durante la carga del programa se usan las configuraciones fijadas en el archivo de
configuración sis_60.ini, que se encuentra en el mismo catálogo que el archivo
SIS_70.exe. El contenido automático del archivo para la tarjeta STC_H216 se encuentra
más abajo:

[SETTINGS]

YMS_DISK = C
SOUND_CARD = STC-H216

CARD_NUM=1

[SOUND CARD]

BIT24_MODE = 0

El sistema SIS para su funcionamiento crea el fichero de memoria virtual con la


dimensión de 2000 Mb en uno de los discos – sobre aquel, cuyo nombre está
registrado en la sección [SETTINGS] en la línea «YMS_DISK =«. Según las
configuraciones automáticas es el disco «C». Si en este disco no hay suficientemente
espacio libre, hace falta indicar otro disco accesible para la grabación y la lectura.
Durante la ejecución, el programa comprueba, si existe el suficiente espacio libre en el
disco C y de ser necesario, pide escoger otro disco.

En la línea SOUND_CARD = se fija el tipo de la tarjeta de sonido utilizada. Según las


configuraciones automáticas la tarjeta de sonido es STС-H246 de 24-bits.

Si se usa la tarjeta de sonido STС-H216 de 16-bits, entonces la línea será de la


siguiente manera: SOUND_СARD = STC-H216.

Si se usa la tarjeta de sonido integrada, la línea debe faltar.

En los parámetros de la tarjeta de sonido se indica también, si está admisible para


el trabajo en el régimen de 24-bits. Según las configuraciones automáticas es
inadmisible. (BIT24_MODE = 0).

Y para las tarjetas STC H246 – es admisible (BIT24_MODE = 24)

Nota

1. Se recomienda también eligir la tarjeta de sonido indicada como el mecanismo


básico de grabación/reproducción del sonido (en el OS Windows 2000: Inicio->
Ajustes-> Panel de control-> Sonido y multimedia> sección Audio) o en la ventana
Propiedades: sonido – Aparatos de sonido y audio para el sistema MS Windows XP)
Panel de control)
2. El programa suministrado para la tarjeta producida por Speech Technology Center,
trabaja solamente con esta tarjeta. El programa suministrado para otras tarjetas (con
la llave “HASP”), trabaja solamente con la herramienta básica de
grabación/reproducción del sonido.

7
4 ACCESO AL SISTEMA

4.1 Instalación de la configuración


Durante la ejecución del programa desde el archivo «Sis.cfg» la configuración del
sistema se carga automáticamente. El archivo de configuración guarda todos los
parámetros introducidos por el usuario.

Si el usuario desea utilizar distintas variantes de configuración, entonces tiene que


cada vez guardar dicha configuración bajo un nuevo nombre (para eso vaya a menú
Opciones-> Guardar la configuración). Posteriormente la configuración necesaria
puede ser cargada, usando el menú Opciones-> Leer la configuración (Dib.2).

Dibujo.2 Menú Opciones

4.2 Elección del idioma de diálogo


El idioma de diálogo con el que va a trabajar se guarda en el archivo de la
configuración y se carga junto con él. Puede hacer la elección en la ventana escoja el
idioma (Dib. 3) entre los idiomas ruso, inglés, aleman y chino. El cambio total del
idioma se da de manera instantánea. Luego su elección podrá ser cambiada en
cualquier momento por medio del menú Opciones-> Cambio del idioma de la
interfaz(Dib. 2).

Dibujo 3. Elección del idioma de la interfaz

El idioma de diálogo (interfaz) no debe confundirce con el idioma de escritura. El


cambio de idioma de escritura( de letra) se realiza con la ayuda de las herramientas
estandares del Windows.

8
4.3 Elección del tamaño de la letra a utilizarse en el diálogo
Según la dimensión y la resolución de la pantalla del monitor las ventanas de
diálogo que surgen y el menú pueden o no caber en la pantalla, o ser demasiado
pequeñas. Se puede cambiar su dimensión (tanto de las ventanas, así como de la letra
en la ventana) por medio del menú Opciones-> Tamaño de la letra. En la pantalla
surge una ventana de diálogo que permite la elección entre dos puntos(ver Dibujo 4) :

ƒ «Pequeño»,
ƒ «Regular».
La elección no influye en la dimensión de la letra del menú principal (Cambiar la
letra es posible por los medios de Windows), pero cambia la dimensión de la letra de
las ventanas de diálogo. La dimensión de la ventana es proporcional a la dimensión de
la letra utilizada.

Dibujo 4. Elección del tamaño de la letra


La letra «Pequeña» se recomienda para la resolución de la pantalla de 1024*768
pixeles, y la letra «Regular» - para 1280*1024 y más.

4.4 Elección del tamaño y estilo de las teclas


Se puede cambiar la dimensión y el estilo de las teclas (botones) utilizados en las
ventanas del programa, con la ayuda del menú Opciones-> Tamaño de las teclas (ver
Dibujo 2). En la pantalla surge una ventana de diálogo, que permite escoger la
dimensión y el estilo de las teclas. La dimensión de las teclas (ver Dibujo 5) se elige
entre dos puntos:

ƒ «Pequeño»,
ƒ «Regular».

Dibujo 5. Elección del tamaño y estilo de los botones.

«Pequeño» se recomienda para la resolución de la pantalla de 1024*768 pixeles, y


« Regular» - para 1280*1024 y más. El estilo de los botones puede ser « Plástico» o
«Metálico».

9
4.5 El menú principal, panel de herramientas y teclas «hot»
Después de la carga del sistema en la pantalla aparece la ventana principal del
programa (Dibujo 6).

Dibujo 6. La ventana principal del programa

En la parte superior de la ventana se encuentre el menú principal del usuario y


panel de herramientas con las siguientes teclas (botones):

Panel «Archivo»

crear una ventana nueva

abrir el archivo (la lectura del fonograma del disco)

guardar el fragmento

copiar la imagen en el bufer de cambio

Panel «Intervalo de procesamiento de datos»

procesar (reproducir) todos los datos

procesar (reproducir) los datos iluminados

10
procesar (reproducir) los datos entre las marcas temporales

procesar (reproducir) los datos visibles en la ventana

procesar (reproducir) los datos seleccionados

Panel «Sonido»

comenzar la reproducción

detener la reproducción

mostrar el oscilograma (datos) en el punto de la reproducción

cerrar el ciclo de la reproducción


detención de la reproducción, después de la cual la reproducción puede
ser recomenzada solamente desde el inicio
introducir la señal desde el ADC (Analog-to-digital converter,análogo-
digital convertidor)
Panel «Programas Exteriores»
seleccionar el módulo Sound Cleaner conectado para el procesamiento
de la señal
seleccionar EdiTracker

seleccionar plag-ines Direct X

Panel «Información»

seleccionar el diálogo con la información sobre la ventana

seleccionar la lista de los segmentos en la ventana corriente (activa)

seleccionar la lista de las marcas en la ventana corriente (activa)

seleccionar la lista de las ventanas

Panel «Demostración»

cambio de la escala lineal a la escala logarítmica y visiversa

mostrar todos los datos del segmento

mostrar los datos iluminados (si existen)

mostrar entre las marcas temporales (si existen)

autoescalación por la vertical

11
Panel «Redacción»

añadir los datos (al fin del segmento-receptor)

copiar los datos

insertar los datos

trasladar el segmento a otra ventana

eliminar los datos

interrumpir la ejecución de la operación

El aspecto exterior del panel de las herramientas puede ser cambiado(configurado)


por el usuario. Para esto hace falta abrir la ventana del diálogo “ajuste del panel de
herramientas”, colocar el cursor en el panel de herramientas y hacer clik dos veces en
el botón izquierdo del ratón. Para cada panel se abre su propia ventana.

En el dibujo 7 se muestra la ventana del ajuste para el panel «Intervalo del


procesamiento de datos».

Dibujo 7. La Ventana de configuración (ajuste) del panel de herramientas

En la parte derecha de la ventana está situada la lista de los botones, que se


representan en el panel de las herramientas, en la parte izquierda de la ventana – se
enlistan los botones, que pueden ser aumentados en panel de las herramientas. Según
las configuraciones automáticas todos los botones accesibles son representados en el
panel de las herramientas, por eso la lista en la parte izquierda de la ventana se
encuentra vacía.

Para quitar el botón del panel de las herramientas, seleccionelo con el ratón en la
lista de la derecha y presione «<Quitar». Para devolver el botón al panel de las
herramientas, es necesario seleccionarlo con el ratón en la lista de la izquierda y
presionar «Añadir->».

Para cambiar el orden de la representación de los botones en el panel de las


herramientas use «Arriba» y «Abajo». La posición superior en la lista corresponde a la
posición extrema izquierda del botón en el panel de las herramientas.

12
Para regresar a la visualización automatica, presione «Quitar».

Para cerrar la ventana del ajuste presionen «Cerrar».


Las operaciones claves en el programa pueden también ser ejecutadas con la ayuda
de las teclas «hot»:

Ctrl/O Abrir el archivo


Ctrl/R Introducción de la señal con ayuda del ADC
Ctrl /T Test de la introducción/deducción
Ctrl/Shift/D Quitar todas las ventanas
Ctrl/D Quitar la ventana corriente(activa)
Ctrl/V Visibles en la ventana (selección del diapasón de
procesamiento)
Ctrl/A Todos los datos (selección del diapasón del tratamiento)
F2 Guardar el fragmento
F3 Abrir el archivo
F5 Cambiar la escala de la representación de datos
(lineal/logarítmico)
F6 Escuchar toda la señal
Shift/F6 Escuchar la parte de la señal entre las marcas temporales
Сtrl/F6 Escuchar la parte de la señal, visible en la ventana
Alt/F6 Escuchar la parte de la señal, visible en la ventana y de
adelante
Home Escuchar otra vez
Espacio Pausa
Esc Salida (interrupción) del ciclo de la operación
F7 Información sobre la ventana corriente (activa)
<5> La autoescala de las señales en la ventana
en el teclado digital
Сtrl/<5> La autoescala de la señal superior en la ventana
en el teclado digital
F8 Reflejar en el box de la ventana los datos completos («todos
los datos»)
Shift/F8 Representar en el box de la ventana los datos «entre las
marcas temporales»
Сtrl/F8 Representar en el box de la ventana los datos «iluminados»
F11 Llevar la escala de los ejes en las ventanas interrelacionadas a
la escala del eje X de la ventana corriente (activa)
Ctrl /Q «FFT» el espectro medio de la señal
Ctrl /2 División de la señal estereo a dos mono
Ctrl/ M Normalización de los datos (la longitud del filtro)
En ciertos regímenes de trabajo del sistema algunas de las teclas «hot» pueden ser
bloquedas con el fin de prevenir la ciclación.

13
En algunas versiones del programa SIS (empezando desde la 7.0.1) se encuentra
realizada la función Undo(Anular) – Anulación de la última operación en la señal
reservando la oportunidad de retomar la operación. Esta función se realiza a través del
menú Datos ► Undo (Anular) para la mayoria de las operaciones de redacción de
datos. La cantidad de pasos a realizarse durante la anulación se encuentra limitada por
el volúmen de espacio del disco dejado por el usuario.

4.6 Trabajo con el menú estándar del tipo «Fuente-receptor»


Durante la ejecución de muchas operaciones de procesamiento y análisis de los
datos, se usa el menú estándar, que aparece durante la entrada al área con el nombre
de la operación (dibujo 3).

Dibujo 8. El menú del tipo «Fuente-receptor» para la operación «Espectrograma»

Como el encabezamiento, el menú dado tiene el nombre de la operación a ejecutar


y contiene ocho campos (áreas) activos: cuatro campos para la elección del tipo del
fragmento de datos procesado, el campo «OPCIONES» para la elección de los
parámetros necesarios y tres campos (áreas) para la creación y la selección de la
ventana-receptor. Ante todo, es necesario entrar en el campo «OPCIONES», después de
que en la pantalla surge un menú con el mismo nombre para la redacción de los
significados de los parámetros necesarios para la realización de esta operación.
Después de la corrección de los parámetros es necesario nuevamente volver al menú
con el nombre de la operación escogida, presionando el botón «Sí».

La condición necesaria para la ejecución de cualquier operación es la presencia de


la ventana-receptor. La ventana puede ser creada o eligida de las existentes. Para esto
en la parte inferior del menú hay dos campos (áreas): «Crear la ventana-receptor» y
«Seleccionar la ventana-receptor».

14
Crear y seleccionar ventana-receptor tambien es posible con la ayuda del área con
la imagen de la flecha en la parte superior de la ventana: presionando este campo, el
nombre de la ventana-receptor cambiará en concordancia con la lista de las ventanas
ya existentes (útiles por el tipo) y una nueva ventana (no creada). Las ventanas
existentes aparecen en el campo, que sigue la flecha, con su nombre corto (un
símbolo), y el nuevo - con la raya. Sin embargo de este modo es posible escoger
solamente las cinco primeras ventanas útiles.

Luego para empezar la ejecución de la operación requerida, es necesario


“presionar” (con la ayuda del cursor del ratón o con la tecla Enter) en uno de las áreas
de selección de fuente de datos. Durante esto tomando en cuenta en que área
presiono el usuario, van a ser procesados:
Utilizando el campo «Escoger la ventana-receptor» se puede escoger “ventana-
receptor” de las ventanas que ya existen en el sistema. Después de entrar en esta área
en la pantalla surge una lista de las ventanas. Para escoger una, es necesario en la
columna «Actividad» poner el cursor en la línea que contiene el nombre de la ventana
necesaria.

Luego para empezar la ejecución de la operación requerida, es necesario


“presionar” (con la ayuda del cursor del ratón o con la tecla Enter) en uno de las áreas
de selección de fuente de datos. Durante esto tomando en cuenta en que área
presiono el usuario, van a ser procesados:
«Todos los datos» - todo el segmento en la ventana corriente,

«Iluminados» - la parte del segmento corriente (activo) que esta comprendida en el


intervalo iluminado entre las marcas constantes,

«Entre las marcas temporales» - la parte del segmento corriente (activo) que esta
comprendido en el intervalo entre las marcas temporales, las cuales serán dos.

«Vistos en la ventana» - la parte del segmento corriente (activo) representada en el


box de datos.

Inmediatamente después de presionar uno de los cuatro campos (áreas), la


ventana-receptor tomará el estado de corriente (activa), después de esto se realizará el
proceso de los cálculos, y el resultado se reflejará en la ventana-receptor. Si la ventana
– receptor no fuese elegida, el sistema creará automaticamente una ventana sin
datos(vacía, pero la instalará según su parecer (el limite izquierdo y derecho serán
iguales al de la ventana - fuente).

15
5 TRABAJO CON LAS VENTANAS
En el sistema no hay datos de usuario, a los que no se los pueda ver. Para la
presentación de números y texto se usa el menú, para presentar los datos gráficos y el
texto sirven las ventanas. Con el término ventana en este sistema se denomina un
cuadrángulo en la pantalla con una imagen gráfica dentro y los datos, que se ubican
sólo en está ventana. Si la ventana se cancela (borra), todos los datos, que al mismo
tiempo no esten presentados en otra ventana. Las ventanas se pueden sobreponer,
transferir, cambiar de tamaño y forma, desplazar hacia arriba. Para iniciar el trabajo
con los datos hay que leerlos del disco o del convertidor análogo-digital (ADC), en este
caso el sistema previamente crea una ventana.

5.1 Creación de una ventana nueva


Para ejecutar operaciones con las ventanas sirve el menú Ventanas.

Para crear una ventana hay que utilizar la opción del menú Ventanas->Abrir nueva
ventana o hacer click el botón .

Ejecutando la entrada, el análisis de la señal o cualquier operación que hace surgir


el menú tipo «Fuente-Receptor», el sistema,de ser necesario por si mismo creará
nuevas ventanas. En dicho caso el tamaño y la ubicación de nueva ventana el sistema
la escojerá a su parecer. Si esto no le conviene al usuario, éste puede crear una
ventana por sí mismo mediante la opción «Crear una ventana-receptor». En este
momento en la pantalla aparecerá un marco de lineas puntedas, que indica los límites
de la futura ventana. El cursor del ratón en este caso desaparece. Manipulando el ratón
o presionando las teclas “flechas” del teclado, se puede trasladar el marco de la
ventana. Moviendo el ratón con el botón izquierdo apretado o mediante las teclas
flechas con la tecla <Shift> presionada, se puede cambiar la forma y el tamaño del
marco, con todo eso se cambiará de posición sólo el ángulo derecho de abajo,
mientras que el izquierdo de arriba quedará fijo. Hay tamanos mínimos de la ventana
por la horizontal y por la vertical, los cuales impiden hacerla más puequeña. Una vez
presionada la tecla <Enter> o el botón derecho del ratón dentro del cuadrángulo,
limitado con dicho marco, aparecerá una ventana nueva. Después de crear esta nueva
ventana el menú desaparecido se restablecerá.

Cada ventana creada recibe un nombre corto (un símbolo en cada uno de los
cuatro ángulos) y es de tipo «UNIVERSAL»(UNI), es decir abierto (accessible) para
introducir cualquiera información.

El programa permite mantener simultáneamente abiertas cualquier número de


ventanas, sin embargo, a partir del 108 los nombres cortos de las ventanas (que
contienen un símbolo) volverán a repetirse, y como resultado tales operaciones como
la búsqueda y el enlace de las ventanas serán dificultadas. Por lo tanto no se
recomienda utilizar más de 108 ventanas simultáneamente.

16
La nueva ventana siempre se presenta encima de las demás. Pero se hace corriente
(activa) es decir se usa para entrada-salida a y de todas las operaciones con un
operando (en ella se introduce el sonido del ADC, los archivos del disco, aquí se
redacta la señal, de aquí se toman los datos iniciales para el habla visualizada en la
pantalla y etc.).

Además, en caso de que en la ventana existiece ya un box de datos el nombre


completo de la ventana seriá representado ocupando el ancho total de la ventana, es
decir el nombre de cada semgento de datos. El nombre de cada segmento va
representado con el mismo color que sus datos; en la ventana activa – sobre el fondo
negro, en la pasiva – sobre el fondo gris.

5.2 El menú contextual de la ventana activa


Al presionar el botón derecho del ratón en cualquier parte del área de trabajo de la
ventana activa aparecerá el menú contextual, que permite facilitar el acceso a ciertos
comandos (opciones) (Dibujo 9).

Dibujo 9. El menú contextual de la ventana activa

El menú contextual contiene las opciones de las secciones del menú principal
Demostración y Ventanas y las opciones de las operaciones de copia y
inserción(pegado) del fragmento. Además, según el tipo de datos en la ventana, el
menú puede contener las opciones de cambio del color de fondo y del tipo de
presentación de datos y de haber las marcas constantes – la opción «Iluminar».

17
Si los datos en la ventana son resultado del análisis, entonces estará accesible la
opción «Recalculo», la que permite repitir las operaciones calculatorias con los
parámetros nuevos.

5.3 Paso de una ventana a otra

5.3.1 Paso a otra ventana con ayuda del “ratón”


Para pasar lo más pronto posible a otra ventana, es decir hacerla corriente (activa),
hay que acercar el cursor del ratón a cualquier lugar visible de esa ventana y presionar
el botón izquierdo del ratón. En este caso cualquier menú secundario, que en ese
momento estubiese en la pantalla, desaparece, la ventana se desplaza hacia arriba y se
convierte en activa, y el menú desaparecido que en cierto tiempo desapareció vuelve a
mostrarse en la pantalla.

Es necesario recordar, que si el usuario ha cambiado los datos en algún campo


(área) textual del menú y todavía no ha salido de este campo, los datos nuevos son
temporales, todavía no están introducidos en la memoria y después de que otra
ventana llegue a ser activa, se eliminarán (se restablecen los datos precedentes).

5.3.2 Paso a otra ventana con ayuda del menú


Por medio del menú Ventanas->Activar la anterior se puede pasar a la ventana
anterior, por medio del menú Ventanas->Activar la siguiente – pasar a la siguiente. En
este caso la ventana siguiente se considera la más inferior, y la anterior se considera la
segunda desde arriba.

5.3.3 Paso a otra ventana con ayuda de la lista de ventanas


Por medio del menú Ventanas->Lista de ventanas se puede hacer surgir la lista de
todas las ventanas que estubiesen abiertas en ese momento en el programa (Dibujo
10).

Dibujo 10. Lista de ventanas

18
La primera columna contiene el indicador de la ventana activa, la segunda columna
– los nombres de las ventanas y los segmentos con el índice de selectividad de la
ventana, la tercera - tipo(clase) de la ventana.

Para pasar de una a otra columna en una línea se utiliza las teclas <Tab>-
<Shift>/<Tab> o el cursor del ratón; para moverse en la columna – utilise las teclas
flechas del teclado o hágalo por medio del ratón. La elección de la línea necesaria en la
primera columna se realiza mediante la tecla “Espacio,que se encuentra en el tecaldo
entre las teclas Alt”, o por medio del botón izquierdo del ratón – el indicador de la
ventana activa va a pasar a este campo (área).

El desplazamiento en la lista se realiza mediante las teclas <PgUp/PgDn> o las


teclas flechas del teclado, o por medio del ratón arrastrando la barra de
desplazamiento ubicada en la parte derecha de la ventana.

Al presionar el botón «Mover al centro» la ventana activa se desplazará al centro de


la ventana principal del programa.

La salida de la lista – mediante el botón «Sí» (guardando las modificaciones) o


mediante el botón «Cancelar» (sin guardar las modificaciones). Después de salir de la
lista presionando el botón «Sí» , la ventana seleccionada va a ser activada.

5.4 Adición del comentario textual en la ventana


Para agregar a la ventana una línea con texto (comentario), hay que utilizar la
opción del menú Ventanas->Agregar comentario o hacer uso del menú contextual de
la ventana. Despues de esto, el sistema pregunta al usuario a dónde desea agregar la
línea – arriba o abajo del box de datos, y al recibir la respuesta, el sistema vuelve a
dibujar la ventana agregando una línea textual vacía. Para entrar en el espacio de esta
línea, hay que acercar el cursor del ratón a este espacio y presionar el botón izquierdo.
En este momento en la línea va a aparecer el cursor parpadeante.

La línea del comentario puede contener 256 símbolos como máximo.

La salida desde la redacción se realiza mediante la tecla <Enter>, o por medio del
botón del ratón, cuando el cursor no se encuentra dentro del espacio de comentario.
A cada ventana se puede agregar varias líneas, sin embargo, si la dimensión
vertical de la ventana resulta insuficiente para la representación de todas las líneas,
parte de las líneas dejan de aparecer. A medida que se reducen las dimensiones de la
ventana, las primeras en desaparecer resultan las que están abajo (primero – encima
de los datos del box, luego – debajo de los datos). Si las dimensiones de la ventana
vuelven a aumentarse, las líneas aparecerán nuevamente.

Para borrar la línea del comentario de la ventana hay que entrar en el espacio del
comentario y presionar la combinación de las teclas <Ctrl>/<Delete>.

19
5.5 Adición del campo del texto de marca
En el sistema SIS cada marca vertical constante puede ser dotada con el texto que
comprende hasta 40 símbolos. Este texto se lo puede introducir o ver en el menú
Marcas->Lista de las marcas, pero a veces esto no es cómodo. A fin de que los
nombres (texto) de las marcas se presenten directamente debajo de la señal, hay que
utilizar la opción Agregar el campo de los textos de las marcas del menú Ventanas o
del menú contextual de la ventana. En este caso debajo del box de los datos aparece
un visualizador de textos de las marcas, que tiene forma de un campo(área) cuadrado
grande (normalmente de color negro). Si el visualizador no aparece, hay que aumentar
el tamaño vertical de la ventana. Durante un intento reiterado de agregar el
visualizador el sistema genera un mensaje «El objeto requerido ya existe en la ventana.
El segundo está prohibido», y la demanda (orden) quedará ignorada.

El texto de la marca se lo puede agregar mediante el menú contextual. Para esto


hay que acercar el cursor del ratón hacia la marca constante vertical y cuando el cursor
tome el aspecto , presionar el botón derecho del ratón. En el menú contextual que
acaba de surgir hay que elegir la opción «Texto de marca». Debajo del box de los
datos aparecerá el campo de textos de las marcas (si éste no había sido creado antes)
y se abrirá una ventana en que se introducirá el nombre (texto) de la marca.

En el visualizador con la apariencia de lineas verticales se representan las marcas


constantes, que están en el box de los datos. Si la marca está dotada con el texto, éste
se sitúa encima de la marca de abajo hacia arriba, de izquierda a derecha. En este caso
de cada línea obligatoriamente queda al menos un pequeño trazo en la parte inferior
del visualizador. Si el texto no cabe en una línea vertical, se presentará en varias
líneas. Si las marcas se sitúan demasiado cerca, los textos de diferentes marcas
pueden sobreponerse. A fin de que los textos en la medida de lo posible se presenten
máximamente completos sin cubrirse uno al otro, hay que ampliar los límites verticales
del campo de los textos de las marcas y aumentar la escala de la imagen.

El visualizador se vuelve a dibujar cada vez que se cambie el tamaño horizontal del
box de datos y además cuando se cancela o se inserta los fragmentos.

El texto de cualquiera marca y la altura del área del visualizador pueden ser
modificados sin salir al menú principal. Para cambiar el texto de la marca hay que
acercar el cursor del ratón a la línea vertical correspondiente (más – menos 5 pixeles)
en el visualizador de los textos de las marcas y cuando el cursor tome el aspecto ,
presionar el botón derecho del ratón. En la pantalla en el lugar del cursor aparecerá el
menú contextual, que contiene las opciones «Texto de la marca», «Copiar» y
«Cancelar». Para redactar el texto de la marca hay que seleccionar la opción «Texto de
la marca». Para copiar la marca utilice «Copiar». Para borrar la marca sirve la opción
«Cancelar».

20
Para el cambio de altura del área hay que presionar el botón derecho del ratón
dentro del sector del visualizador y en el menú contextual que aparecesca seleccione
la opción «Altura del campo (área)». Luego se introducirá el parámetro de la altura del
área. Éste debe ser número par (de cualquier modo SIS lo redondeará) y estar en el
diapasón de 4 a 42 (según la cantidad de los símbolos).

Los nuevos parámetros entrarán en vigor al presionar el botón «Sí» y serán


ignorados al presionar el botón «Cancelar».

La opción «Introducir la marca» permite introducir la marca constante, a la que


antes había sido aplicada la opción « Copiar».

La opción «Cerrar el campo (área) » sirve para borrar el visualizador de textos de


las marcas de la ventana. Los textos en este caso no se eliminarán.

5.6 Conexión entre ventanas


Entre las diferentes ventanas se puede establecer un enlace. En este caso las
operaciones con los cursores y las marcas para estas ventanas se ejecutarán
simultáneamente. Para establecer o cancelar un enlace de la ventana corriente (activa)
con las demás, hay que seleccionar la opción Enlace de la ventana con las demás del
menú Ventanas-> o del menú contextual y corregir la línea de enlace. En esta línea
dejando espacio entre uno y otro se introducen los nombres cortos de todas las
ventanas, que se pretenden enlazar. El nombre corto comprende un símbolo, que está
indicado en cada uno de los cuatro ángulos de la ventana, además los símbolos del
registro alto y bajo se distinguen ('A' y 'a' – son nombres distintos). Para romper el
enlace con una de las ventanas hay que eliminar su nombre de la línea de enlace. El
nombre de la ventana corriente (activa) no es preciso introducir en la linea de enlace.
Después de haber introducido en la línea de enlace los nombres cortos de todas las
ventanas, que se pretende enlazar, hay que presionar el botón «Sí». El enlace entre las
ventanas se establecerá de inmediato.

Si el enlace por algún u otro motivo no puede ser establecido, en la pantalla


aparecerá un aviso « El enlace no está establecido». En este caso se debe comprobar la
la escritura de los nombres(errores ortográficos) de las ventanas en la línea de enlace.

Una vez establecido el enlace, todas las operaciones con las marcas y con el cursor
en una ventana serán duplicadas en todas las ventanas con las que fue establecido
dicho enlace.

Al presionar la tecla «caliente» <F11> la escala horizontal de la imagen en todas


las ventanas será adaptado a la escala de datos en la ventana corriente (activa). A fin
de que la escala horizontal y los límites del box de los datos en todas las ventanas
enlazadas se sincronicen automáticamente, en el menú Opciones->Opciones
complementarias se seleccionará la opción «Sincronizar las ventanas enlazadas».

5.7 Traslado de las ventanas y cambio de sus dimensiones


El desplazamiento de las ventanas y la modificación de sus parámetros se realiza
con los medios estándar del Windows.

21
5.8 Traslado del menú, que tapa la ventana
A veces ocurre que el box del menú corriente tapa la imagen en la ventana activa o
en otra parte de la pantalla. En este caso, si el menú no ocupa toda la pantalla, éste
puede ser desplazado. Para hacerlo hay que acercar el cursor del ratón al marco del
menú corriente (activo), presionar el botón izquierdo y mantenerlo presionado sin
soltar. En los limites del menú aparecerá el marco punteado. No se puede cambiar su
tamaño, pero moviendo el ratón con el botón izquierdo presionado se lo puede
desplazar a cualquier lugar de la pantalla. Apenas el usuario deje de presionar el botón
izquierdo del ratón, el menú se acomodará en su lugar nuevo. La anchura y la altura
del marco del menú son iguales a la anchura y la altura de un símbolo textual
respectivamente. El espacio accesible para los desplazamientos es toda la ventana SIS,
a excepción de la línea superior (menú radical) y la línea inferior (línea de avisos).

5.9 Obtención de la información sobre la ventana, cambio de parámetros


de la presentación de los datos en la ventana

5.9.1 Obtención de la información operativa sobre los ejes de oordenadas


Existe un método simple y eficaz para obtener la información sobre los ejes de
coordenadas del box de los datos en la ventana. Si el usuario se ha olvidado qué se
traza (indica) en los ejes de coordenadas en esta ventana, puede acercar el cursor del
ratón hacia la escala del eje, presionar el botón izquierdo y mantenerlo presionado. En
este momento la escala del eje horizontal desaparece, y en su lugar aparecerá la
información sobre aquel eje indicado por el usuario. La información tiene el siguiente
aspecto: significado físico de las cantidades, unidades de medición, valor de una
división (si no es igual a 1), tipo de escala. Por ejemplo, «tiempo, sec., lin.», «
frecuencia, Hz, Bark» o «tiempo, cuentas, por 0.0001 sec., lin.». El tipo de escala puede
ser:

ƒ Lin.: escala lineal,


ƒ Log: escala logarítmica,
ƒ Bark: escala Bark (sólo para frecuencia, trozo-lineal de hasta 1200 Hz, despues
será logarítmica).

5.9.2 Obtención de la información detallada sobre la ventana activa


Para obtener la información detallada sobre la ventana (ver Dibujo 11), hay que
utilizar la tecla <F7>. En la pantalla aparece el menú de la información sobre la
ventana activa. El encabezamiento del menú es el nombre de la ventana. Si en este
momento se hace click con el ratón sobre otra ventana, el menú desaparece, la
ventana activada se presentará por encima de las demás, luego de lo cual el menú
vuelve a aparecer, pero con la información acerca de la nueva ventana activa. En el
menú hay las siguientes áreas:

«Tipo» – contiene nombre del tipo de ventana.

«Eje X:» – contiene información sobre el eje horizontal (Vease el sub-punto anterior
(5.9.1). Este sector puede ser activo para algunos tipos de ventanas.

22
«Eje Y:» - contiene información sobre el eje vertical (Vease el sub-punto anterior
(5.9.1). Este sector puede ser activo para algunos tipos de ventanas.
«Eje Z:» - contiene información sobre el tercer eje (Vease el sub-punto anterior
(5.9.1). No se utiliza para los datos bidimensionales.
Los sectores «Eje X:» y «Eje Y:» pueden ser activos. Al presionar sobre el sector se
presentará una de las listas de las opciones:

Escala: «Lineal», « Logarítmica «, «Bark» – para Y-eje del espectrograma y de la


frecuencia de intersección del cero y además para X-eje del espectro FFT.

«Tiempo», «Frecuencia» – para el eje-Y del cepstrum, de la autocorrelación y


tambien del tono principal.

Dibujo 11. Información sobre la ventana activa


«Modo de representación gráfica de los datos» – Es el área activa que al ser
presionada permite la aparición del menú de “elección de modo de representación
gráfica de los datos en el box”.
«Сору» – los datos más recientes se representan encima de los anteriores de modo
no transparente.

«OR» - los datos más recientes se representan encima de los anteriores con
composición de los colores según el método lógico OR (bit-to-bit composición 0 y 1 -
1; 0 y 0 - 0; 1 y 0 - 1, 1 y 1 - 1).

23
«XOR» - los datos más recientes se representan encima de los anteriores con
composición de los colores según el método exclusivo XOR (bit-to-bit composición 0 y
1 - 1; 0 y 0 - 0; 1 y 0 - 1; 1 y 1 - 0).

«Dibujar ejes - Sí» – el área exclusivamente informativa.

«Lista de segmentos» – el encabezamiento para el submenú representado más


abajo, que contiene la lista de segmentos. Cada línea corresponde a un segmento. En
ésta hay dos campos (áreas), uno de los cuales contiene el nombre del segmento y el
otro – su tipo. El color del texto corresponde al color del segmento. El nombre del
segmento puede ser corregido del mismo modo que el texto ordinario.

«Memoria libre (Мб): XXXX» – área informativa, donde está indicado el volumen de
memoria virtual desocupada en el sistema SIS en Megabytes. Todos los datos de todos
las señales se guardan en la memoria virtual y si está totalmente ocupada, el análisis
de las señales y la filtración resultan imposibles.

«Sí» – es el área para salir guardando todas las modificaciones.


«Cancelar» - es el área para salir sin guardar las modificaciones.

5.9.3 Obtención de información sobre la señal activa en la ventana


En la línea de estado(régimen del programa, en la esquina baja derecha de su
ventana principal) se muestra la información sobre el formato de la señal activa (la
primera en en la lista): tipo de codificación, mono o estéreo, munero de bits y
frecuencia de discretización.
Si en una ventana se encuentran mostradas algunas señales, para obtener la
información sobre alguna de ellas hay que presionar el botón derecho del ratón. Al
realizar esto el nombre se trasladará hacia el primer lugar en la lista, y en la llínea de
estado se mostrará la información sobre la señal.

En caso de que en el área contenedora de la información sobre la señal se presione


la tecla derecha del ratón entonces en la línea de estado se muestra la ruta completa a
el archivo, contenedor de esta señal.

5.9.4 Cambio de los parámetros de muestreo de datos en la ventana activa


Para cambiar la escala de los datos en la ventana activa hay que acercar el cursor
del ratón el eje requerido y presionar el botón derecho del ratón Luego en el menú
contextual que aparece hay que seleccionar la escala exigida:

ƒ Lineal,
ƒ Logarítmica o
ƒ Escala Bark.
Para comodidad del usuario en el menú contextual se presenta también la
información sobre el eje corriente: significado físico de valor, unidades de medición,
tipo de escala.

24
La tecla <F5> permite cambiar la escala de la representación por el eje vertical
(lineal – en Decibelios “dB”) de manera más rapida y eficaz. Como información
adicional: La magnitud de la señal en decibelios es igual al logaritmo decimal del valor
de la señal multiplicado por 20 (para los valores negativos se toma el módulo).

5.9.5 Lista de segmentos. Cambio de color y nombre de un segmento ya creado


Para cambiar el nombre y el color del segmento existente se puede utilizar la
opción del menú Demostración->Lista de segmentos (o el menú contextual ->Lista
de segmentos). En la pantalla aparecerá la ventana « Lista de segmentos» (Dibujo 12).

Dibujo 12. Lista de segmentos


La ventana contiene dos sub-menús: la lista de colores de los segmentos y la lista
de los segmentos mismos. En la lista de colores cada línea corresponde a un color y
está representada de este mismo color. En la lista de segmentos cada segmento ocupa
una línea: nombre, tipo, frecuencia de muestreo (discretización) del segmento y el
campo (área) para cambiar el color, marcado con letra «С». El nombre del segmento
puede ser corregido del mismo modo que la línea textual ordinaria hasta 12 símbolos.
Si el segmento es un “estereo segmento”, pues inmediatamente después del tipo del
segmento se indicará la letra «S». Si el segundo canal sirve de acceso, pues
inmediatamente después del tipo del segmento se indicará la letra «I».
La lista contiene información sobre todos (hasta 255) los segmentos de la ventana
activa. Sin salir de este menú, cambiar la ventana activa presionando el ratón, el menú
desaparece pero vuelve a aparecer, pero esta vez con la lista de segmentos de la nueva
ventana activa.

25
Para cambiar el color del segmento, hay que seleccionar el color deseado en el
menú de selección de colores (trasladar a la línea necesaria el símbolo de selección).
Luego hay que entrar en el submenú derecho y en la línea correspondiente al
segmento deseado hacer clic con el «ratón» sobre el campo «С». El color del nombre
del segmento y el campo (área) «С» en seguida va a teñirse del color elegido.
Inmediatamente después de salir del menú “Lista de segmentos” (al presionar el botón
«Sí») en la ventana activa van a representarse los nuevos nombres y colores de los
segmentos.
Para los segmentos de «habla visualizada» el color elegido se aplicarán sólo en
modo de dibujar con desviación a la derecha o con desviación hacia arriba.

5.9.6 Cambio del color del fondo


Para los datos bidimensionales se puede elegir el color del fondo en el box. Para
lograrlo hay que utilizar la opción «Color del fondo» del menú contextual de la
ventana.

5.9.7 Resaltación individual del fragmento en la ventana


En el programa SIS existe la posibilidad individual para cada ventana de grabación
de los parámetros de resaltación de los fragmentos. Si el usuario escogió para una
ventana el proceso «entre las marcas temporales(MT)» y para otra el procesamiento
«Los iluminados», entonces su elección se guardará (grabará) para cada una de las
ventanas por separado mientras que el mismo usuario no desida lo contrario.
La indicación del tipo de fragmento procesado y sus cambios se realiza por medio
del botón de la ventana contenedora de la señal. Al presionar la tecla izquierda del
ratón , aparece una sucesión de botones, los cuales determinan el tipo de fragmento:
- Todos los datos (todo el segmento de datos);
- Los datos iluminados;

- Los datos comprendidos entre las marcas temporales(MT);

- Los datos vistos en la ventana;

- Los datos seleccionados.

La elección de un nuevo tipo de datos o la confirmación del anterior se realiza


presionando la tecla izquierda del ratón en el botón correspondiente. Al realizar esto
en la ventana contenedora de la señal el botón cambia según sea la elección.

5.10 Copia de la ventana en el portapapeles

El botón permite copiar la representación de la ventana corriente (activa) en el


portapapeles. En caso necesario se puede hacer la inversión del color negro al copiar.
Para lograrlo hay que seleccionar la opción «Invertir el color negro durante la copia de
la ventana al portafolio» en el menu Opciones->Opciones complementarias.

26
6 LECTURA DE LOS ARCHIVOS DE DATOS DEL DISCO DEL PC
El sistema SIS permite leer del disco los datos de diferentes tipos, grabados por el
mismo sistema SIS (*.DAT, incluso por las versiones anteriores), o mediante los
dispositivos que soportan el formato *.WAV estandartizado para MS WINDOWS.

La extensión del archivo no tiene importancia, ya que los archivos en cuestión


contienen no solo los datos guardados, sino la información necesaria de ellos. Por
ejemplo, si Usted guarda un espectrograma en el archivo con la extensión *.DAT,
cuando lo vuelva a abrir, éste de todos modos será leído como un espectrograma y no
como oscilograma. Sin embargo, para facilitar la busqueda de los archivos se
recomienda utilizar las extensiones estándar de los archivos, indicadas más abajo.
Además, la opción Los datos->Leer archivo del disco, permite abrir cualquier archivo
sin formato o no identificado como oscilograma (mono, 16 bit).

6.1 Lectura del fonograma del disco del PC


Para leer un archivo acústico del disco del PC se utiliza la opción Datos ->Abrir
archivo del disco (así mismo se utilizan las teclas «calientes, hot» <F3> y CTRL-O o el
botón ). En la pantalla aparecerá una ventana estándar de la apertura de un archivo.

Es de notar, que si un archivo fue grabado con el mismo sistema SIS o mediante los
dispositivos que soportan el formato *.WAV estandartizado para MS WINDOWS, antes
de introducirlos, se comprobará la compatibilidad del tipo de los datos a introducir con
el tipo de la ventana en la que se pretende introducir los datos. Si en un archivo está
indicado, por ejemplo, que los datos de archivo representan el espectro Fourier,
quiere decir que estos serán introducidos como un espectro Fourier, sin tomar en
cuenta los deseos del usuario e independientemente de la extensión de este archivo.

Para los archivos con la extensión.DAT hay la posibilidad de leer sólo alguna parte
del archivo. Para activar esta opción en la ventana de apertura de un archivo es
necesario quitar la “banderita” del área «Leer archivo íntegramente». Una vez elegida
esta opción cada vez que se abra un archivo .DAT va a aparecer la ventana «Archivos
grandes», en la que se debe indicar el principio de la lectura y longitud del intervalo
para lectura (en segundos – Dibujo 13):

Dibujo 13. Archivos grandes


Para excluir la opción de lectura de sólo una parte del archivo en la ventana de
diálogo es necesario poner una “banderita” en «Leer archivo completamente.

27
Si un archivo tiene la extensión «ALW» (A-law waveform), el sistema propone al
usuario leerlo como 8-bit en el formato A-law. La frecuencia de discretización es de
8 кHz.

Si un archivo tiene extensión «SND», el sistema propone al usuario leerlo como 8-


bit en formato de la Ley Mu. La frecuencia de discretización es de 8 кHz.

Si un archivo tiene extensión «VOX» (waveform in Covox format), el sistema


propone al usuario leerlo como 8-bit en el formato ADPCM. La frecuencia de
discretización es de 8 кHz.

Además, la opción Los datos ->Abrir archivo permite al usuario abrir cualquier
archivo sin formato o de formato no identificado como oscilograma (mono, 16 bit,
PCM).

Dibujo 14. Frecuencia de discretización

Como se muestra arriba en la ventana, la frecuencia de discretización puede ser


cualquiera.

El archivo introducido, inmediatamente aparece representado en la ventana


corriente (activa) en los ejes digitalizados. En un caso estándar, un oscilograma queda
representado en los ejes «tiempo (sec) – puntos». Por voluntad del usuario se puede
pasar al régimen de la representación de la señal en los ejes «tiempo (sec) – decibelios
dB». Para lograrlo se puede utilizar el menú Demostración->Lineal/escala en
decibelios dB o presionar la tecla <F5>.
Para la lectura de los archivos de audio comprimidos en el formato */*.wav/*
(RIFF), asi como tambien para la lectura de los archivos en los formatos mp3, avi,
mpeg, etc, el programa utiliza el mecanismo de filtros DirectShow, es decir utiliza los
filtros instalados en el sistema operativo DirectShow, para construir en base a ellos una
rúbrica para la lectura de los archivos.

“Speech Technology Center” no suministra junto con el programa los filtros


DirectShow y no se responsabiliza en caso de un trabajo incorrecto de estos. La
instalación y correcta configuración de los filtros recae totalmente sobre el servicio de
administración y soporte del comprador.

El paquete de filtros se puede encontar en Internet de manera gratuita(por ejemplo


-Lite Mega Codec pack). Por lo general en la documentación complementaria del
paquete se indica su contenido y aplicaciones.

En caso de que al intentar abrir dicho archivo el programa muestre el diálogo(mirar


Dibujo 14), querra decir que el programa no logró abrir el archivo a través del filtro
DirectShow y propone abrirlo como un archivo de formato desconocido.

28
En una ventana pueden estar representadas varias señales. En este caso los
distintos segmentos serán representados con colores diferentes, los nombres de los
segmentos se presentan en la parte superior de la ventana del mismo color que el
segmento correspondiente (Dibujo 15).

El canal derecho de los estereo-segmentos se representa con el mismo color que el


izquierdo, pero un poco más claro (por ejemplo, el izquierdo – azul-claro, el derecho
– azul-oscuro).

Dibujo 15. La ventana con varios segmentos, representados con distintos colores

La opción de reproducción de los archivos de sonido antes de su introducción en el


programa de la versión básica no va prevista.
Lista de las extensiones estándar de los archivos

«SPE» - espectrograma,
«CEP» - cepstrum,
«LPС» - CPL (coeficiente de predicción lineal),
«PCR» – correlación particular,
«AUС» - autocorrelación,
«DAT» - oscilograma,
«ENE» - energía,
«ZFR» - frecuencia de intersección con cero,
«SPA» – espectro medio de Fourie (de amplitudes),
«PIT» – tono principal,
«CEA» - cepstrum medio (''A' - accumulated),
«LPA» - CPL medio,
«PСA» - coeficiente medio de la correlación particular,
«ACA» – autocorrelación media.

29
Independientemente del régimen en el que se encontrase el menu de ingreso a los
archivos, el usuario puede según su deseo borrar cualquier archivo , por ejemplo, para
liberar lugar en el disco. Para esto hay que hacer click en el botón derecho del ratón en
el nombre del archivo y presionar en la tecla <Delete> ( o escoger la opción Eliminar).
El sistema pedirá confirmar la eliminación del archivo, después de lo cual el archivo
sera enviado al basurero.

6.2 Lectura de los archivos de texto


El sistema SIS permite leer los archivos textuales, contenidos en los oscilogramas,
el tono principal y los espectros Fourie, creados tanto por el sistema SIS, como con la
ayuda de otros sistemas.

Los archivos textuales, creados por el SIS, tienen prefijo de formato, y por eso
desde el punto de vista del usuario, su lectura no se diferencia de la lectura de otros
archivos.

6.2.1 El encabezamiento de los archivos de texto


Si el usuario crea un archivo textual por sí mismo, le será posible introducir al
principio de este archivo un título (encabezamiento). Este encabezamiento comprende
tres o cuatro líneas:

• Primera línea - STCautoidentification Text segment


• Segunda línea - Spectrum / Waveform / Pitch, donde:
«Spectrum» corresponde al espectro de Fourie (FFT espectro),
«Waveform» – corresponde al oscilograma,
«Pitch» – al tono principal.
• Tercera línea - X,Y
”F=%%%%%%”
”S=%%%%%%”
Donde “X,Y” – Significa que de aqui en adelante en cada linea se indicarán dos
cifras, una de las cuales se denominará abscisa (X), denominando a la otra como
ordenada (Y).
Si la tercera línea contiene «X,Y», luego en cada línea siguiente deben estar
indicadas dos cifras, una de las cuales será abscisa (X), y otra - ordenada (Y).
Recordamos que las abscisas con anticipación deben ser ordemadas segun su valor de
menor a mayor y que el espacio entre ellas debe ser constante (tener un valor
constante).
Ejemplo:
STCautoidentification Text segment
Waveform
X,Y
0 523

30
6.25e-005 459
0.000125 463
0.0001875 527
0.00025 602
0.0003125 536
Si la tercera línea del archivo contiene «F=%%%%%%» esto significa, que la
frecuencia de muestreo (discretización de la señal en Hz) está considerándose. Por
ejemplo, «F=11025».

Luego en la línea cuatro obligatoriamente debe estar inscrito: Y, y después en cada


línea – una cifra (valor de la señal en el punto siguiente). El primer valor de Y
corresponde al valor de la abscisa igual a 0.

Ejemplo:
STCautoidentification Text segment
Waveform
F=11025
Y
-87
-78
-88
-97
-111
Si la tercera línea contiene «S=%%%%%%», esto significa que está inscrito el intervalo
entre abscisas (X), por ejemplo, «S=10.7666». El primer valor de la abscisa equivale a
cero.

Luego en la cuarta línea obligatoriamente debe estar inscrito: Y, y luego en cada


línea – una cifra (valor de la señal en el punto siguiente). El intervalo para cada tipo de
la señal debe estar representado en las unidades estándar, es decir para un señal de
tipo «Spectrum» en Hz, y para un señal de tipo «Waveform» – en segundos, etc.

Ejemplo:
STCautoidentification Text segment
Spectrum
S=10.7666
Y
34.1674
59.8291
85.2392
96.8834
104.305

31
6.2.2 Lectura de los archivos de texto sin los encabezamientos
El usuario puede abrir en el SIS los archivos de texto, en los cuales en una de sus
columnas están inscritas las cifras – los valores de la señal con un intervalo constante,
o en dos de sus columnas – los valores de la abscisa y la ordenada.

Este archivo debe tener la extensión «*.TXT». Entonces, cuando el usuario intente
leerlo aparecerá en la pantalla la pregunta “El tipo de archivo pero fué determinado
como archivo de texto. Está Ud. de acuerdo?».

En caso de que el usuario responda “No”, empesará el ingreso del archivo con
formato binario MIC 16 bits.

Si el usuario responde «Sí», comenzará la introducción de los parámetros de la


señal. Primero aparecerá la ventana de dialogo, que está representada en la Dibujo 16.

Dibujo 16. La ventana de la elección del tipo de segmento

Dibujo 17. Ventana de elección del formato de datos

Debajo de la línea ”Las tres primeras” se muestran las tres primeras líneas del
archivo que se pretende leer, a fin de que el usuario pueda verificar su elección. De
cada línea se apuntan solo hasta 30 símbolos.

32
Al escoger con la ayuda del ratón uno de los últimos cuatro campos (áreas), el
usuario puede cancelar la operación o elegir el tipo del segmento (oscilograma, el tono
principal o el espectro FFT). L a cancelación de la operación provocará el ingreso del
archivo con formato binario, MIC 16 bits. En caso contrario aparecerá la ventana que
permitirác la elección del formato de archivo”,

Debajo de la línea «Las tres primeras» sin lugar a dudas se muestran las tres
primeras líneas del archivo que se pretende leer, ésto para que el ususario pueda
verificar en que formato se encuentran grabadas las cifras en el archivo. De cada línea
se muestran solo hasta 30 símbolos.

La elección del formato «X,Y» significa que en cada línea estarán inscritas dos
cifras, la primera de las cuales se interpreta como coordenada, la segunda – como el
valor de la señal. Las coordenadas(las abscissas) deben ir cambiando con un intervalo
constante. De lo contrario, el SIS automaticamente calculará el intervalo promedio y lo
utilizará como intervalo constante para el segmento introducido.
“Y” significa que en cada línea está inscrita una cifra – el valor de la señal en un
punto dado.

«Cancel,Cancelar» – al presionar este botón la operación será cancelada


completamente y el ingreso de los datos no tendrá lugar.

Al presionar el botón “OK” en la pantalla aparece la siguiente ventana:

Dibujo 18. La ventana para seleccionar los valores de la frecuencia de


discretización y el paso (intervalo).

Es necesario ingresar uno de los parámetros (valores) - La frecuencia de muestreo


(discretización) o el intervalo. Si en el área “Frecuencia” se ingresa un valor distinto de
cero “0”, el intervalo será calculado por SIS mediante la frecuencia de discretización
(muestreo). En caso de que el área “Frecuencia” no se introduzca ningun valor o el
valor introducido sea igual a cero, el sistema SIS utilizará el valor de intervalo
ingresado. Además en caso de que los dos espacios “Frecuencia” y “intervalo” esten
vacíos o contengan un valor igual a cero, el intervalo será calculado con la ayuda de la
frecuencia de discretización igual a 11025 Hz.

Al presionar el botón «ОК» empiezarán a introducirse las cifras – hasta que se


termine el archivo o hasta que se encuentren cien errores del formato o hasta que la
memoria virtual del SIS se cargue totalmente.

33
7 INTRODUCCIÓN DE LA SEÑAL DESDE EL ADC
Durante el proceso de introducción de la señal desde el ADC, es decir con ayuda
del micrófono, magnetófono y etc. a través de una placa(tarjeta) de sonido, no es
necesario tratar de sincronizar el comienzo de la señal acústica con la ejecución de la
opción Los datos -> Introducir la señal desde el ADC (o con la presión del botón de
grabación). El usuario en primer lugar se encontrará en el régimen de ajuste de los
parámetros de la introducción y luego en el régimen de ajuste del oscilógrafo digital.
Sólo despés de que el usuario haya elegido los parámetros deseados y haya
regulado(ajustado) el nivel de la señal, podrá empezar la introducción para esto debera
presionar la tecla “Espacio, Barra Espaciadora”.

El estándar multimedio presupone exclusivamente la regulación del nivel de


grabación a través del mezclador. En el proceso de introducción, Usted puede abrir la
ventana del mezclador y ajustar (regular) el volumen de la señal introducida mediante
un slider vertical,tambien puede utilizar para la regulación del volumen los botones
”flecha arriba”, “flecha abajo” apreciados en la ventana del programa SIS.

La señal de audio en el programa puede ser presentada en dos formatos – 16-bits


entero (int16) y cifra de 32-bits con un punto flotante (float). Los diapasones de los
valores:

• para el formato int16: desde - 32768 hasta +32767;


• para el formato float: desde -1038 hasta +1038.
Al introducir la señal mediante el ADC con la precisión de 24 bit, el programa
recibe de la tarjeta de sonido un entero de 24-bits , lo convierte en la cifra con un
punto flotante (float) y lo divide para 256 (es decir lo regula al límite de 32767). De
este modo, aún cuando se introduce la señal de 24-bits, su amplitud no va a
sobrepasar 32767, pero la precisión de la malla de bits se aumentará 256 veces. Esta
solución, garantiza un uso bastante cómodo de ámbos tipos de señales en la misma
ventana.
Al mismo tiempo teoricamente la amplitud de float- señal puede muchas veces
superar la amplitud de la señal en el formato int16.

En el programa SIS no se prohibe el trabajo con el float- señal, cuya amplitud


supera 32767, pero está previsto una reserva décupla de amplitud, que está limitada
por un valor igual a 320000. Esta reserva está prevista para el caso, cuando en algún
tipo de proceso (filtración, por ejemplo) la señal sobrepase el límite de 32767. En este
caso el resultado no será añadido y la señal útil no va a ser deformada. Para no perder
la calidad de la señal después de un procesamiento semejante, durante su audio –
reproducción, se recomienda normalizar la señal regulando (ajustando) los límites
inferiores a 32767.

34
Nota

El programa SIS no prohibe generar la señal con una amplitud que supere 32767. Sin
embargo, no se recomienda operar con tales señales, porque no pueden ser
reproducidas correctamente por la tarjeta de sonido.
Durante la salida del float- señal a la tarjeta de 24-bits, su valor se multiplica por
256 y se convierte en un entero. De este modo, si la amplitud de la señal supera
32767, surge el desbordamiento, y la señal (sonido) será añadida. Es decir como se
citó anteriormente, las señales con amplitud que superan los 32767, no pueden ser
reproducidas correctamente en el programa aún con la ayuda de la tarjeta de sonido
de 24-bits.

7.1 El menú de los parámetros


Para introducir el sonido desde el ADC, es necesario seleccionar la opción del menú
Los datos ->Introducir la señal desde el ADC (Ctrl-R), o utilizar el botón en la barra
de herramientos. En la pantalla aparece una ventana (Dibujo 19), en la que se debe
indicar la frecuencia de discretización y el formato de la introducción de la señal
(mono, estereo, mono mix) y bit- capacidad de la señal que se introduce.

Dibujo 19. La ventana para seleccionar los parámetros


de la introducción del sonido.

Se considera a la frecuencia de discretización de 11 025 Hz como estandar. De ser


necesario el usuario puede cambiar este parámetro a un entero arbitrario dentro de un
intervalo de [4001 - 192000].

Las opciones «Mono/ Estéreo /Mono mix» permiten elegir el régimen de


introducción:
«Mono» – mono - introducción (la grabación se realiza sólo por el canal
izquierdo),
«Estéreo» – estéreo- introducción,
«Mono mix» – la señal se introduce como estéreo desde dos canales – los
canales se mezclan (se suman) directamente durante el proceso de introducción
(entrada de señales).

35
La precisión de la señal que se introduce (16 o 24 bit) determina el modo de
conservación de los datos introducidos dentro del programa. Independientemente de
la capacidad de su tarjeta la señal puede guardarse como un entero de 16-bits o en el
formato con un punto flotante (24-bits).

Debajo del selector de la precisión de la señal que se introduce, está situada una
línea informativa, que representa la capacidad (bits) máxima de la señal que se
introduce, la cual puede soportar la tarjeta de sonido utilizada.

El programa rebiza, si la tarjeta soporta los datos de 24-bits, solamente cuando en


el archivo sis_70.ini falta la siguiente línea:

[SOUND CARD]

BIT24_MODE = 0

En caso del suministro del programa para trabajar con las placas (tarjetas) de otros
productores esta línea se incluye en el archivo de configuración sis_70.ini del
distributivo.

La opción «Sin reproducción» sirve para detener la reproducción del sonido durante
el proceso de introducción. En este caso Usted puede estimar el nivel de la señal
introducida mediante el gráfico del oscilograma.

Trás determinar los parámetros necesarios y presionando el botón «Aceptar», el


usuario convierte el sistema en el régimen del oscilógrafo digital: en la ventana se
empiza a mostrar la señal introducida en el régimen de ajuste y el programa espera la
orden para empezar la grabación. La amplificación de la señal introducida se puede
regular presionando las teclas «flecha abajo» y «flecha arriba».

Presionando la opción «Cancel» se regresa al menú anterior (ventana) dejando de


introducir la señal desde el ADC..

7.2 Oscilógrafo digital


En el momento de entrar en el régimen del oscilógrafo digital el sistema crea una
ventana nueva, que se sitúa arriba en la parte izquierda de la pantalla, por encima de
todas las ventanas abiertas.
En el régimen del oscilógrafo digital en la ventana corriente (activa) aparece el box,
en que comienza a representarse el señal que se introduce.

Mientras el señal no se está grabando en la memoria, se dibuja de color amarillo.


Durante la grabación en la memoria (en el disco) el color de la señal se convierte en
azul.

La grabación de la señal comienza al presionar la tecla «espacio, tecla


espaciadora». La segunda presión de la tecla «Espacio» termina el proceso de
grabación. Con la siguiente presión de la tecla «Espacio» el usuario puede reanudar el
proceso de grabación. La salida del régimen del oscilógrafo digital se realiza mediante
la tecla <Esc>. Al mismo tiempo el sistema atribuye a la ventana con la señal, el
nombre de tipo NONAMEn, donde [n] - cifras arábigas (1,2…).

36
Nota

El control del proceso de introducción del sonido es posible sólo en la ventana activa.
Por eso trás ajustar el nivel de la señal en la ventana del mezclador hay que activar la
ventana de introducción del sonido, haciendo con el cursor un click sobre ella.
Para la escala de la señal en el régimen del oscilógrafo digital son ascesibles las
teclas siguientes:

<Home> - duplicar la escala vertical (los datos se muestran más grandes),


<End> - reducir la escala vertical al la mitad ,
<PgUp> - desplazar el área visible 20% hacia arriba,
<PgDn> - desplazar el área visible 20% hacia abajo.

7.3 El habla visualizada de la señal introducida


Al presionar la tecla <F4> durante el proceso de introducción de la señal desde el
ADC, debajo de la ventana del oscilograma de la señal introducida se abrirá una
ventana con el habla visualizada de dicha señal.

En esta ventana continua y sincronizadamente con el oscilograma se va dibujando


el espectro de la señal introducida. El espectro se calcula con los siguientes
parámetros: sistema de Gauss, cantidad de puntos según la frecuencia de
discretización:

ƒ 2048 – para las frecuencias de discretización inferiores o iguales a 32000 Hz;


ƒ 4096 - para las frecuencias desde 32000 hasta 64000 Hz;
ƒ 8192 - para las frecuencias desde 64000 hasta 128000 Hz;
ƒ 16384 - para las frecuencias desde 128000 hasta 200000 Hz.
Para establecer la escala de la señal en la ventana con el habla visualizada se
utilizan las siguientes teclas:

ƒ <Home> - duplicar la escala vertical (los datos se muestran más grandes),


ƒ <End> - reducir a la mitad escala vertical,
ƒ <PgUp> - aumentar la escala de la tercera dimención (hacer la representación
más contrastante),
ƒ <PgDn> - reducir la escala de la tercera dimención (hacer la representación
menos contrastante),
ƒ <F5> - Trasladarse a la escala en decibelios o volver a la escala lineal.
La tecla <TAB> sirve para trasladarse a la ventana de la señal inicial (oscilograma).

La presión de la tecla <Esc> en la ventana activa del habla visualizada sirve para
detener la representación. Al mismo tiempo la señal que se introduce sigue
representándose en la ventana con el oscilograma. Interrumpir/reanudar la
introducción de la señal se puede mediante la tecla <Espacio>. Para salir del régimen
de la introducción de la señal mediante el ADC precione la tecla <ESC>.

37
8 COMO ESCUCHAR EL FONOGRAMA
Para escuchar el fonograma es necesario que se encuentre en la ventana corriente
(superior). Además, si en la ventana corriente el segmento corriente (superior) es de
tipo «habla visualizada» y el oscilograma inicial del que fué calculado dicho segmento,
todavía no estubiese cancelado y siguiese sin modificaciones, el sistema por sí mismo
encontrará el oscilograma inicial y comenzará su reproducción. Durante el proceso de
reproducción el cursor se mueve en la ventana con el «habla visualizada», indicando la
posición actual de la reproducción. Al presionar la tecla «barra espaciadora» la
reproducción del sonido y el movimiento del cursor simultáneamente se detienen. Las
posibles acciones del usuario en esta situación están explicadas detalladamente en
ap. 8.3. Luego se puede presionar la tecla <Insert> y en la posición corriente del
cursor se pondrá una marca permanente. Con la segunda presión de la tecla «barra
espaciadora» la reproducción va a reanudarse.

Para escuchar se puede entrar en el menú Habla-> y presionar sobre una de las
casillas para elegir el tipo del fragmento a reproducir. Según la casilla seleccionada se
escuchará uno de los fragmentos del segmento corriente (activo) de la ventana
corriente (activa) (o del segmento-fuente en caso del «habla visualizada»). Al escoger
el tipo “Todos segmentos en la ventana” se irán reproduciendo todos los segmentos en
la ventana activa, empezando desde el superior (su nombre siempre está más a la
izquierda de los demás). Entre la reproducción de uno y otro segmento el sistema
hace una pausa, cuya duración se determina en el menú Habla ->Opciones.

Al escoger el tipo «Seleccionados» se irán reproduciendo todos los segmentos


seleccionados en esta ventana. Para la reproducción del fragmento se puede utilizar
también las teclas «calientes» y varias combinaciones de teclas:

F6 – todo el segmento en la ventana;


Shift/F6 – el habla entre las marcas temporales;

Сtrl/F6 – el habla, visualizada en la ventana;

Alt/F6 – el habla, visualizada en la ventana y luego hasta el final.


Al recibir la orden de escuchar el sistema pasa al régimen de escucha, la salida del
cual se realiza SOLAMENTE por medio de la tecla ESC, o presionando el botón
«Detener» en la barra de herramientos. Otras acciones del usuario, excepto la presión
sobre las teclas de dirección del régimen de escucha, se ignoran por el sistema.

Si está presionado el botón «Reproducción continua» , el fragmento vuelve a


reproducirse inmediatamente desde el principio. Si el botón «Reproducción continua»
no está presionado, la reproducción se detiene al terminar el fragmento (para los
fragmentos cortos esto es mucho más cómodo). Para repetir la reproducción del
fragmento es necesario volver a presionar la tecla <Home>. Para regresar al régimen
de reproducción continua hay que presionar la tecla <barra espaciadora>.

Es de notar, que durante el régimen de pausa en la reproducción cada presión de la


tecla <Home> lleva el sistema al régimen de reproducción con detención al final del

38
fragmento, mientras que cualquier presión de la tecla <barra espaciadora> - lleva al
régimen de la reproducción continua (repetición de ciclo) del sonido.

En el menú Habla ->Opciones se puede modificar la frecuencia de reproducción de


la señal. Al hacerlo, la señal será reproducida con la frecuencia nueva mientras que el
usuario no pase a otra ventana o a otro segmento, o para no retornar al valor inicial de
la frecuencia. Para anular la frecuencia hay que volver al menú Reproducción -
>Opciones y salir de él mediante la tecla <Esc> o por medio del botón «Cancel».

Al escuchar los datos frecuentemente resulta incómodo representar en el box


todos los datos del segmento, sobre todo, si su duración es más de un minuto. En este
caso, al escuchar, el usuario deja de ver los datos que se están reproduciendo en el
ese momento apenas el cursor alcance el bordo del box de datos (o hasta que entre
en el box). Para ver los los datos que se están reproduciendo, hay que suspender la
escucha, presionando la tecla <barra espaciadora> o el botón «Pausa» en la barra
de herramientos, y luego presionar la tecla F9. En este momento en el box de los datos
aparecerá el fragmento de los datos con duración de 5 sec. (automaticamente), al
mismo tiempo el punto de suspensión y el cursor que la indica estarán justamente en
el centro del box. Si, como suele pasar, el cursor ya a pasado el lugar que interesa al
usuario, se lo puede llevar a la posición necesaria utilizando las teclas <flecha
izquierda>, <flecha derecha>. Para reanudar la escucha basta presionar la tecla
<barra espaciadora>. La escucha va a reanudarse desde la posición corriente (actual)
del cursor.

Sin salir de este régimen “de escucha” (en la pausa), el usuario puede poner una
marca, presionando la tecla <Insert>. Se puede también suspender la escucha, marcar
con precisión el fragmento necesario, inscribir las marcas y reanudar la escucha
mediante la opción «Vistas en la ventana y adelante».

Por medio del menú Opciones->Opciones complementarias, se puede cambiar la


anchura del área visible durante el proceso de escucha trás detener la reproducción y
presionando la tecla <F9>. En caso de no ser cambiado, este parámetro es igual a 5
sec. (2.5 sec. a la izquierda y 2.5 sec. a la derecha del cursor) y puede variarse en un
intervalo de: 0.1 - 100 sec.

Además, en la parte derecha de cada ventana existe el botón control de la


velocidad de reproducción. Al navegar en este por medio del cursor del ratón aparece
un contexto de “pista” con la orientación del botón y la magnitud (entre paréntesis)
del coeficiente de modificación de la velocidad de reproducción.

Al presionar la tecla izquierda del ratón en el botón el coeficiente toma el valor 1.0,
es decir la velocidad de reproducción es igual a la original. Si se mantiene presionada
la tecla y se mueve a la derecha el valor llega hasta 3.0(es decir la velocidad de
reproducción aumenta tres veces) y si mover el cursor a la izquierda el valor llega
hasta 0,33 (velocidad de reproducción se reduce tres veces).

Al soltar la tecla el valor del coeficiente va a afectar a la velocidad de reproducción


de todas las señales en la ventana dada, mientras que el ususario no realice otro
cambio.

39
9 CONSERVACION DE LOS DATOS

9.1 Grabar en el disco un segmento de datos


El segmento con los datos de cualquier tipo, y del mismo modo cualquiera de sus
fragmentos, puede ser guardado. Al guargar el fragmento de datos se puede de la
misma manera guardar las líneas de comentarios y las marcas constantes con
inscritos. Para guardar el segmento de los datos con las marcas y los comentarios, hay
que utilizar el menú Los datos->Guardar el fragmento, y entre los tipos de fragmento
tratados seleccionar «Todos los datos».

Hay que tener en cuenta, que las marcas y los comentarios (como toda información
auxiliar) se guarda sólo en caso de que para la grabación de datos hubiese sido
indicado el formato *.DAT.

Al escoger en el menu el comando Guardar los datos, entoces:


- si fue cargado un archivo de formato *DAT, se guardará todo el segmento de
datos en el formato *.DAT con los comentarios y marcas;

- si se cargó el archivo con el formato *.WAV, se guardará todo el segmento de


datos sin las marcas y comentarios;

- si se cargó otro archivo de audio, se abrirá el menú Guardar como.

En una ventana puede haber varios segmentos, pero siempre será guardado el
superior (el segmento activo). En el nombre de la ventana, el nombre del segmento
activo va primero (el mas izquierdo). Se puede hacer activo cualquier otro segmento de
la ventana .
Para guardar todo el segmento de los datos sin la información complementaria
(marcas, comentarios), es necesario entrar en el menú Los datos->Guardar el
segmento. En la pantalla va a aparecer la ventana estándar, en la cual es necesario
escribir el nombre y el tipo de archivo, además seleccionar el catálogo para guardar los
datos.

Al elegir la opción Guardar como en el menu de datos, en la pantalla aparecerá el


menú mediante el cual se puede escoger el catálogo para guardar los datos, dar
nombre y tipo al archivo, determinar el tipo del fragmento guardado (de los datos
procesados), asi como tambien indicar si se debe guardar las marcas y
comentarios(esta área esta activa solo en caso de existir marcas o comentarios en la
señal.

Los tipos de archivo mostrados en la ventana a guardarse corresponden al tipo de


los datos guardados(mirar 6.1).

Debajo del área Ahora Usted esta procesando se muestra el tipo de archivo, el cual
será guardado. Según el deseo el tipo de los fragmentos guardados puede ser
cambiado con la ayuda de uno de los botónes, ubicados debajo. Para guardar el
segmento de datos es necesario escoger Todos los datos.

40
Hay que tener en cuenta que al guardar las marcas se guardan sólo las marcas
relacionadas con el fragmento guardado(se encuentran en dentro del fragmento en sus
límites).

9.2 Guardar en el disco el fragmento de los datos en formato de texto


En formato textual o de texto pueden ser guardados datos bidimensionales –
oscilograma, el tono principal, espectro, gistograma y etc.

Guardar los datos en formato textual se puede en la ventana extandar de grabación


de segmento o fragmento de datos visto anteriormente, escogiendo como extención
del archivo “txt”.

Además, para guardar los datos en formato textual está prevista la opción del
menú principal Los datos ->Exportación de texto.

Las operaciones realizadas con este menú corresponden a lo anteriormente


descrito en el punto 9.1

Recordamos que cada archivo textual se guarda en el formato, explicado en el


punto 6.2 Encabezamiento de los archivos de texto.

9.3 Guardar el estado en curso del proceso de trabajo


En el programa SIS esta soportado la opción de conservación(grabación) del estado
del proceso de trabajo en curso (seción actual), brindando la posibilidad de retomarlo
segun lo desee el usuario.

Si el usuario tiene abiertas algunas ventanas con diferentes modos de vizualización


o ventanas vacias, tiene la posibilidad de guardar dicho estado de proceso de
investigación en curso (Seción actual), considerando todas las configuraciones
utilizando el punto Guardar el estado en curso(Seción actual) en el menú Datos.

Continuar la utilización con las configuraciones guardadas se puede a través del


punto Cargar el estado (seción) guardado(a) en el menú Datos.

41
10 DESPLAZAMIENTO Y EL CAMBIO DE ESCALA DE LOS DATOS EN EL BOX
DE LA VENTANA
Apenas aparezca en la ventana el box de los datos, en él se muestran las
herramientas de control de la escala de datos. Estas son la barra horizontal de
desplazamiento (scrollbar), los botones de la escala horizontal y vertical, y para los
datos tridimensionales – el botón de escala de la tercera dimensión.

10.1 Definiciones:
Segmento - Nosotros llamamos segmento a una parte de los datos, asociados en
un grupo, pero sin relación inmediata con otros datos. Por ejemplo, los datos leidos de
un archivo del disco forman un segmento. Al terminar la introducción del sonido a
través del ADC todos los datos leidos forman un segmento. Para cada nuevo segmento
en la ventana se utiliza su propio color (mientras bastan los colores visualmente
distinguibles).

Un fragmento - Nosotros denominamos fragmento a una parte de los datos,


destacados de alguna manera del segmento, pero sin perder las relaciones con otros
datos. Puede ser, por ejemplo, parte de un segmento, limitada por las marcas
temporales, o parte de un segmento, que pertenece a los intervalos iluminados entre
las marcas, o parte de un segmento, visible en el box de los datos.

10.2 El control del desplazamiento horizontal de los datos en el box


Después de leer los datos desde el disco, la anchura del box de datos en segundos
se establece según la que está indicada en el menú Ventanas->Opciones. Esta anchura
(si no se cambian son 5 sec. automáticos ) en caso general no es igual a la duración de
la señal, y en el box de los datos puede ser representado un fragmento que no tiene
nada que ver con aquel que pretende ver el usuario. En caso general las coordenadas
del box pueden ser dadas de tal manera, que en el box no se verán los datos. En el
programa están previstos tres modos de desplazar los datos por la horizontal:

1) Entrar en el menú Demostración->Сambio de longitud/posición del box y


consignar (numéricamente) nuevos límites del box en segundos. En este caso pueden
cambiarse tanto la anchura, como la posición del box. Si después de dicha operación, a
pesar de lo esperado, los datos del box desaparecen, hay que utilizar el menú
Demostración ->Todos los datos, y si esto tampoco sirve – hay que verificar las
coordenadas de los límites superior e inferior del box (el menú Demostración -
>Cambio de altura/ posición del box ).

2-3). Utilizar una barra horizontal de desplazamiento (scrollbar). La barra


horizontal de desplazamiento (scrollbar) en el sistema SIS se parece en sus funciones
a la barra estándar del Windows, pero tiene varias particularidades. La barra horizontal
de desplazamiento (scrollbar) se sitúa en la parte inferior del box de los datos. Al
presionar los botones y , situados en los límites de la barra, las coordenadas
universales (segundos) de ámbos bordes del box de los datos se alteran en 3/4 de la
anchura corriente (actual) del box, y los datos en el box vuelven a dibujarse.

42
En el menú Opciones->Opciones complementarias («Desplazamiento de los datos
visibles») el usuario puede cambiar el valor de desplazamiento del área visible al
presionar la flecha de la barra de desplazamiento. El desplazamiento siempre se
consigna dentro de la anchura del área visible y adquiere los valores desde 0.001
hasta 1.0.

En la parte central de la barra de desplazamiento se sitúa un marker de color negro


, que permite suavemente desplazar los datos por la horizontal.

Si los límites del box por la horizontal no salen de los límites de los datos, la
anchura total del área media corresponde a la longitud total de los datos, y el marker
de color negro corresponde a la anchura del box y a su posición respecto a los datos.
Después de presionar con el ratón sobre cualquier punto de la parte media, los límites
del box se cambiarán de manera que el límite izquierdo del área negra se encontrará
en este punto. Es decir, para ver el principio de los datos hay que presionar con el
ratón en el punto más izquierdo de la parte media y etc. Si los límites del box por la
horizontal salen de los límites de los datos, el límite izquierdo de la parte media de la
barra de desplazamiento corresponde al mínimum del límite izquierdo del box y límite
izquierdo de los datos, y el límite derecho corresponde al máximum del límite derecho
del box y el límite derecho de los datos. Va a aparecer también una raya horizontal en
la mitad de la altura del marker, que indica el área donde faltan los datos.

10.3 El control de la escala horizontal en el box


El primer método de cambio de la escala en el box se explica en el apartado 10.2.
El segundo método supone el uso del ratón y el botón de control de la escala
horizontal. Este botón está situado a la izquierda por debajo del box de los datos y
sobre el botón, está representada una flecha horizontal de doble sentido: . Mediante
este botón se puede tanto ensanchar, como estrechar el box. Al presionar el botón, un
poco más arriba va a aparecer un cuadrángulo, la parte izquierda del cual está pintada
de color negro. El cursor del ratón será encerrado en este cuadrángulo.

Al presionar <Esc>, el cuadrángulo desaparece sin cambios en la representación


de la señal.

Al presionar el ratón en el límite entre el área negra y el área gris, la escala no va a


cambiarse.
Si al momento de presionar el ratón , el cursor del mismo estuvíera más a la
izquierda que el borde de los colores, la anchura del box (en segundos) va a reducirse
tantas veces, cuan menor sea la distancia desde el borde izquierdo del área negra
hasta el cursor en relación a toda la longitud del área negra.

Si al momento de presionar el ratón, el cursor del mismo estuvíera más a la


derecha que el borde de los colores, la anchura del box (en segundos) va a aumentarse
tantas veces, cuan mayor sea la distancia desde borde izquierdo del área negra hasta
el cursor en relación a toda la longitud del área negra.

De este modo, sin entrar en el menú, se puede aumentar la anchura del box 3
veces y reducirla 15 veces.

43
El tercer método para cambiar la escala horizontal – por medio de la rueda del
ratón. Para hacerlo hay que acercar el cursor del ratón al eje horizontal. Cuando el
cursor se convierta en una flecha horizontal de doble sentido, girando la rueda del
ratón se puede cambiar la escala horizontal de la representación de los datos en el
box.

10.4 Establecimiento de las coordenadas del box por los límites del
fragmento seleccionado
Mediante el menú se puede establecer los límites del box de los datos de tal
manera, que en el box se presentará enteramente el fragmento seleccionado. Mediante
el menú Demostración se puede representar en el box:

1) «Todos los datos» – el segmento corriente (superior) desde el primero hasta el


último punto. Lo mismo se puede hacer mediante la tecla <F8>.

2) «Entre las marcas temporales» – el fragmento de la señal (para todos los


segmentos), limitado por las marcas temporales. Para aplicar esta opción, es necesario
poner con anticipación en la ventana de los datos dos marcas temporales. Para
demostrar el fragmento de la señal entre las marcas temporales se puede utilizar
también una combinación de las teclas <Shift/F8>.

3) «Desde el principio hasta las marcas temporales» - el fragmento de la señal


(para todos los segmentos) desde el principio del segmento corriente hasta la marca
temporal izquierda. Se puede utilizar esta opción en caso de que el usuario hubíese
puesto con anticipación al menos una marca temporal en la ventana (no se puede
poner más de dos).

4) «Desde las marcas temporales hasta el final» - el fragmento de la señal (para


todos los segmentos) desde la marca temporal derecha hasta el final del segmento
corriente. Se puede utilizar esta opción solamente si el usuario hubíese colocado con
anteoridad por lo menos una marca temporal en la ventana (no se puede poner más de
dos).
5) «Iluminados» – el sector iluminado entre las marcas. La misma función tiene la
combinación de las teclas <Сtrl/F8>.

10.5 El control de la escala vertical en el box y el desplazamiento


por la vertical
Para cambiar rápidamente la escala por la vertical, es necesario utilizar el botón de
control de la escala vertical . Este botón está situado a la derecha del box de los
datos. Mediante este botón se puede tanto aumentar, como reducir la escala vertical
en el box de los datos. Al presionar el botón, un poco más a la izquierda va a aparecer
un cuadrángulo, la parte inferior del cual está pintada de color negro. El cursor del
ratón será encerrado en este cuadrángulo.

Al presionar <Esc>, el cuadrángulo desaparece sin cambios en la representación


de la señal.

44
Al presionar en el límite entre el área negra y el área gris, la escala no cambiará.

Si al momento de presionar el ratón, el cursor del mismo estuvíera más abajo del
borde de los colores, los valores de las coordenadas físicas de los bordes superior e
inferior del box van a reducirse tantas veces, cuan menor sea la distancia desde el
borde inferior del área negra hasta el cursor en relación a toda la longitud del área
negra.

Si al momento de presionar el ratón, el cursor sel mismo estuvíera más arriba del
borde de los colores, los valores de las coordenadas físicas de los bordes superior e
inferior del box van a aumentarse tantas veces, cuan mayor sea la distancia desde el
borde inferior del área negra hasta el cursor en relación a toda la longitud del área
negra.

Existe también otro método para cambiar la escala vertical – por medio de la rueda
del ratón. Para hacerlo hay que acercar el cursor del ratón al eje vertical. Cuando el
cursor se convierta en una flecha vertical de doble sentido, girando la rueda del ratón
se puede cambiar la escala vertical de la representación de los datos en el box.

Para cambiar los valores de las coordenadas físicas de los bordes superior e
inferior del box, se puede utilizar el botón del desplazamiento vertical. Este botón está
situado en cada ventana a la derecha del box y esta representado por un cuadrado: .
Haciendo un clic con el ratón sobre este botón el cursor del ratón desaparece y se
presenta un cuadrángulo punteado, cuyos bordes coinciden con los bordes del box, y
directamente en el medio está una línea horizontal punteada. Desplazando el ratón por
la vertical, el cuadrángulo se desplazará también por la vertical. Los nuevos límites del
cuadrángulo después del desplazamiento van a corresponder a las nuevas
coordenadas físicas de los bordes del box. Si en el proceso de desplazamiento una de
las líneas horizontales del cuadrángulo sale de los límites de la ventana, esta línea deja
de representarse.

Para cambiar las dimensiones del cuadrángulo, hay que mantener presionado el
botón izquierdo del ratón. Entonces al desplazarse el ratón hacia «arriba» el
cuadrángulo se baja, “hacia abajo”– más arriba, ”a la izquierda” – más estrecho, “a la
derecha” – más ancho. De todas maneras el ángulo superior izquierdo permanece
inmóvil. Las dimensiones del cuadrángulo se las puede reducir sólo hasta dos pixeles
por la horizontal y por la vertical, y aumentar – sólo hasta las dimensiones del box por
la horizontal y hasta dos veces las dimensiones del box por la vertical . Para salir del
régimen, es necesario presionar el segundo o el tercer botón del ratón, en este caso
las coordenadas físicas del box independientemente de la escala vienen a
corresponder a las coordinadas del cuadrángulo, y el box vuelve a dibujarse. Si
presionamos la tecla <Esc>, la salida del régimen se realiza sin cambios algunos en el
box.

45
Para cambiar en el box de los datos la escala/desplazamiento por la vertical, se
puede entrar en el menú Demostración->Cambio de altura/posición del box y corregir
los valores de los bordes superior e inferior del box en coordenadas físicas (segundos,
cuentas, Hz, es decir en las mismas coordenadas dadas en el momento de corrección
en el box por la vertical).

Para cambiar la escala del box por la vertical, se puede utilizar la opción del menú
Demostración->Autoescala. En este caso la escala del box será cambiada de tal
manera que los valores de los bordes superior e inferior del box automáticamente
llegan a ser iguales a la amplitud máxima y mínima de la señal en el oscilograma. El
mismo efecto se puede alcanzar al presionar la tecla <5> (está rodeada con las teclas
flechas).

10.6 El régimen «Lupa»


Para examinar detalladamente cualquier sector del box de los datos en el sistema
está previsto el régimen «Lupa». Para utilizarlo hay que entrar en el menú
Demostración->Lupa.
Si la ventana corriente (activa) contiene los datos tridimensionales (espectrograma,
cepstrum y etc.), antes de entrar en el régimen «Lupa», se recomienda marcar el
fragmento de la señal que le intereza al usuario con una o dos marcas temporales.

Nota
El régimen «Lupa» no se utiliza para representaciones «de grandes volúmenes»
(demostración de los datos mediante axonometría, desviación a la derecha/hacia
arriba).
Al entrar en el menú Demostración->Lupa de la ventana de los datos
tridimensionales en la pantalla aparece la ventana nueva, en la que está representado
el corte espectral, que corresponde a la posición de la marca temporal. Mediante las
teclas flechas puede desplazarse por el segmento hacia la derecha y hacia la izquierda.
Con solo presionar una vez en las teclas indicadas el cursor se mueve a una distancia
equivalente al tamaño de un cuadro. En este caso en la ventana «Lupa» estarán
representados los cortes espectrales, que corresponden a la posición del cursor. Al
presionar la tecla «+» que está en el teclado complementario en la ventana «Lupa» se
presentará el corte anterior. En una misma ventana simultáneamente pueden ser
representados con distintos colores solo 4 cortes como máximo. El desplazamiento de
los cortes complementarios respecto al primer corte (en milisegundos) se utiliza como
el nombre de cada corte.

Cuando la ventana corriente (activa) contiene los datos bidimensionales


(oscilograma, por ejemplo), no es necesario destacar el sector con las marcas. Al entrar
en el menú Demostración->Lupa en la ventana corriente aparece un marco punteado,
cuyo tamaño se puede cambiar mediante el ratón o las teclas flechas en el teclado (del
mismo modo que el cambio de las dimensiones de la ventana, explicado en ap. 5.1).

Al determinar el tamaño del marco, hay que presionar el botón derecho del ratón.
En este momento en la pantalla se abre una ventana nueva, en la que se presentará un

46
sector del segmento (o segmentos), que se mostró en el marco. Todos los segmentos
mostrados en el marco, indepedendientemente de su cantidad, se presentarán en la
ventana-lupa. Para los estéreo-segmentos se presentarán ambos canales (el derecho –
de color más oscuro). Mediante las teclas flechas del teclado se puede desplazarse por
el segmento en todas direcciones( hacia la derecha, izquierda, arriba y hacia abajo.

Trabajando en el régimen «Lupa» el cursor del ratón está encerrado en la ventana-


lupa y el uso del menú principal resulta imposible. Por eso durante el trabajo en este
régimen está previsto un conjunto de teclas «calientes, hot». Mediante estas teclas se
puede ejecutar las siguientes funciones:

Tecla Función
← El cuadro se desplaza a un cuarto (1/4) de la anchura (o a un corte del
«habla visualizada») hacia la izquierda
<Ctrl> + ← El cuadro se desplaza a 3/4 de la anchura hacia la izquierda (para el
«habla visualizada» no se utiliza).
→ El cuadro se desplaza a un cuarto (1/4) de la anchura (o a un corte del
«habla visualizada») hacia la derecha
<Ctrl> + → El cuadro se desplaza a 3/4 de la anchura a la derecha (para el «habla
visualizada» no se utiliza).
<Shift> + ← La anchura de un cuadro se reduce dos veces (a la mitad) a costa del
desplazamiento del borde derecho (para el «habla visualizada» no se
utiliza)
<Shift>+ → La anchura de un cuadro se aumenta dos veces( se duplica) a costa del
desplazamiento del borde derecho (para el «habla visualizada» no se
utiliza)
↑ El cuadro se desplaza a 1/10 de la altura hacia arriba
↓ El cuadro se desplaza a 1/10 de la altura hacia abajo
<PgUp> El cuadro se desplaza a 1/2 de la altura hacia arriba
<PgDn> El cuadro se desplaza a 1/2 de la altura hacia abajo
<Home> El cuadro se hace simétrico con respecto al punto “cero” por la vertical
<F6> La escucha de un fragmento
<5> Autoescala de la señal por la vertical (el borde superior del box se
en el teclado igualará al valor máximo de las señales en esta ventana, el borde
digital inferior del box se igualará al valor mínimo de las señales en esta
ventana)
<F5> Cambio de escala de representación de los datos (lineal/logarítmica)
<+> Sólo para el «habla visualizada»:
en el teclado En la ventana de lupa se añade un corte más, que precede en la señal
digital al corte, indicado por el cursor en la ventana-fuente (no más que un
total de cuatro cortes). Para los cortes previos como nombre se utiliza
su desplazamiento en milisegundos con respecto al último corte,
indicado por el cursor en la ventana-fuente.

47
Tecla Función
<- > Sólo para el «habla visualizada»:
en el teclado De la venta-lupa se elimina un corte añadido.
digital
<Insert> Poner una marca permanente en la ventana-fuente.
<ESC> Salida del régimen «Lupa»
Para el «habla visualizada»:
<F9> - Guardar la ventana de lupa junto con todos los datos dentro de
ésta después de salir del régimen «Lupa».
Para los oscilogramas y etc.:
- Salir del régimen «Lupa»y al salir representar en la ventana
inicial la parte visible de la señal de la ventana-lupa.
En la línea de avisos (en la parte inferior de la pantalla) se representa la
información sobre las teclas «calientes» más usadas.

En la ventana-lupa, tanto como en cualquier otra, existen los botones activos que
se puede utilizar sin restricciones. Por ejemplo, si durante la representación de los
datos bidimensionales (oscilogramas, tono principal) se presiona con el ratón sobre el
botón «Donador de cursores» , acercar el cursor punteado que aparece al lugar
necesario y se pone una marca permanente (al presionar la tecla <Insert>), entonces la
marca permanente va a aparecer no sólo en la ventana-lupa, sino en la ventana-fuente
también. En las ventanas con los datos bidimensionales la marca se pone en el punto,
que corresponde a la posición media de la ventana-lupa corriente (activa). Para el
«habla visualizada» la marca indica el corte corriente (actual).

En el menú Opciones hay un punto Opciones complementarias. Por medio de ésta


opción, el usuario puede cambiar el desplazamiento del área visible en el régimen
«Lupa», que ocurre al presionar las teclas <flecha a la izquierda> y <flecha a la
derecha>. En automático este desplazamiento es igual a 0.25 de la anchura del área
visible.

10.7 La redacción de la señal


Este sistema permite al usuario cambiar los valores de amplitud de la señal. Con
este objetivo en el régimen «Lupa» hay una función de redacción de la señal.

Atención!
Las modificaciones ejecutadas con la señal durante la redacción en el régimen «Lupa»,
no se pueden anular. Por eso, para evitar una pérdida de datos, se recomienda guardar
el archivo inicial en el disco o copiar el segmento que se redacta en otra ventana.

Para utilizar la función de la redacción de la señal hay que abrir la señal en la


ventana-lupa y presionar el botón derecho del ratón. Aparecerá el menú contextual en
el cual hay que optar por el régimen de redacción: «Dibujo» o «Borrado».

En el régimen «Dibujar» al presionar el botón izquierdo del ratón en la ventana-


lupa se ejecuta la corrección de la señal mediante el principio de interpolación lineal.

48
En el régimen «Borrar» al presionar el botón izquierdo del ratón en la ventana-lupa
se ejecuta el borrado de la señal – el valor de amplitud se reduce a cero.

Durante la redacción el oscilograma y el tono principal deben estar representados


en la escala lineal (por el eje vertical), mientras que los espectros y otras señales
pueden estar representados en la escala de decibelios “dB”, con todo eso el valor de la
señal en un punto se representa encima del box de datos tanto en aspecto regular,
como en decibelios.

Para salir del régimen de redacción es necesario sacar el menú contextual y quitar
el “visto” en la casilla del régimen seleccionado.

La salida del régimen «Lupa» se realiza mediante la tecla <ESC>.

10.8 Opciones de visualización


En el menú “Opciones” hay un punto “Opciones complementarias”, mediante el cual
el usuario puede cambiar los siguientes parámetros:

• el desplazamiento del área visible al presionar en la flecha de la barra horizontal


de desplazamiento de datos en cualquier ventana. En automático este
desplazamiento es igual a 0.75 de la anchura del área visible. El siempre se
asigna en cuotas de la anchura del área visible y puede adquirir valores
comprendidos en el intervalo [0.001 - 1.0].
• el desplazamiento del área visible en el régimen «Lupa» al presionar las teclas
<flecha a la izquierda> y <flecha a la derecha>. En automático este
desplazamiento es igual a 0.25 de la anchura del área visible.
• la anchura del área visible al presionar la tecla <F9> después de que se ha
parado la reproducción en el régimen de “la escucha del sonido”. En automático
este parámetro es igual a 5 sec. (se representa 2.5 sec. hacia la izquierda y 2.5
sec. hacia la derecha del punto de “parada”) y puede alterarse dentro de los
límites del intervalo (0.1 - 100)sec.
• La cantidad de las marcas horizontales. En automático la cantidad de las
marcas es igual a 5 pudiendo variar desde 2 hasta 5.
• la anchura de la numeración es constante. En este régimen las numeraciones
estrechas del eje vertical se van ampliando de tal manera que la anchura de la
numeración resulta igual para todas las ventanas. Será así hasta que las
inscripciones cerca de los trazos de graduación no sobrepasen 5 símbolos,
tomando en cuenta a un punto decimal. Luego la anchura de la digitalización
(numeración) volverá a crecer.
• desplazar los datos hacia “cero” al copiar. Durante el proceso de copiado de los
datos de una ventana a la otra estos se desplazan hacia un cero. Al borrar los
datos del principio del segmento los demás datos en este caso también se
desplazan hacia un “cero”. Si este punto no está seleccionado, la coordenada del
principio de los datos no se altera.

49
• la visualización de la reproducción del sonido. Durante la reproducción en la
ventana junto con los datos corre (se mueve) el cursor, indicando el punto de
reproducción.
• cambiar los límites del box al introducir los datos. Durante cada lectura de un
archivo en el box de datos, se lleva a cabo la autoescala por la vertical según los
datos que se acaba de leer, independientemente de los valores de los datos
introducidos anteriormente. Si este punto no está seleccionado, la autoescala
se lleva a cabo sólo durante la lectura del primer archivo.
• dibujar los datos de modo “intransparente”. Se utiliza el régimen COPY durante
el proceso de dibujo, y los segmentos, situados por encima, tapan los
segmentos, situados por debajo. Si el punto no está seleccionado, se utiliza el
régimen OR, y en caso de pocos segmentos estos se transparentan entre si.
• introducir una área de texto en el Habla Visualizada. Cada vez que se crea el
Habla Visualizada (espectrograma, cepstrum, autocorrelación…)
simultáneamente será creado un campo de comentario por encima del box de
datos, que luego será utilizado para indicar la posición de las marcas
temporales: verticales y horizontales.
• Establecer la copia continua de los datos iluminados. Después de copiar los
datos iluminados el diálogo Copiar inmediatamente volvera a aparecer. Por
cuanto el área iluminada entre las marcas permanentes puede ser cambiada
presionando 2 veces el botón derecho del ratón, sin salir del diálogo, este
régimen permite optimizar el trabajo con los datos.
• invertir el color negro al copiar la ventana en el portapapeles. Esta opción puede
resultar útil si más tarde fuese necesario imprimir la representación.
• utilizar horas y minutos para digitalizar (mumerar) el tiempo.
• sincronizar las ventanas enlazadas. Si esta opción está seleccionada, la escala
horizontal de la representación de datos en las ventanas enlazadas será
sincronizada automáticamente con la escala horizontal en la ventana activa.
• guardar la configuración al salir del programa. Cada vez antes de salir del
programa la configuración corriente será guardada automáticamente (Vease
4.1.). Este régimen se utiliza en automático (por omisión).

50
11 OPERACIONES CON LOS CURSORES, LAS MARCAS TEMPORALES Y
PERMANENTES PARA SELECCIONAR LOS FRAGMENTOS DE DATOS

11.1 Llamadas, desplazamiento y eliminación del cursor vertical


Además de las señales y resultados de cálculos, en el box pueden encontrarse los
objetos para seleccionar y destacar los puntos y sectores de la señal. Estos son el
cursor vertical, las marcas temporales y permanentes (acerca de las operaciones con el
cursor horizontal vease ap. 11.5). El cursor sirve para destacar un punto en la señal y
para operar “manipular” con las marcas. En la ventana corriente (activa) no puede
haber más de un cursor. Para llamar el cursor con hayuda del ratón hay que acercar el
indicador del ratón hacia un pictograma ‘Donador de cursores» , situado en el
ángulo superior derecho de la ventana corriente (activa), y presionar el botón izquierdo
o hacer doble clic con el botón izquierdo del ratón. El indicador del ratón va a
desaparecer, y en medio del box аparecerá una línea punteada vertical de color
amarillo – el cursor. Esta línea va a seguir los movimientos del ratón por la horizontal.
Por encima del box de datos aparecerá una línea de comentario, en la que se verá
representado el valor de abscisa, que corresponde a la posición corriente (actual) del
cursor. Trás aparecer esta línea el box de datos se reducirá y volverá a dibujarse.

Algunos datos, por ejemplo, el habla visualizada pueden tardar mucho tiempo en
volver a dibujarse. Para evitar los excesivos re-dibujos, hay que entrar en el menú
Opciones->Opciones complementarias y seleccionar la opción Insertar el área de texto
en el Habla visualizada. Entonces una línea vacía de comentario siempre será creada
junto al habla visualizada, y los excesivos re-dibujos para trabajar con el cursor no
serán necesarios.
La salida del régimen se realiza presionando el botón medio o derecho del ratón o
tambien por medio de la tecla <Esc>. En este caso en la pantalla aparece el cursor
estándar (indicador) del ratón y el cursor (línea punteada vertical de color amarillo) en
el box va a desaparecer.

Para llamar al cursor a través del teclado, hay que seleccionar la opción del menú
Marcas->Poner el cursor/marca. En el medio del box аparecerá una línea punteada
vertical de color amarillo – el cursor. En el ángulo superior izquierdo de la ventana se
verá representado el valor de abscisa, que corresponde a la posición corriente (actual)
del cursor.

La salida del régimen se realiza mediante la tecla <Esc>. Además en la pantalla


aparece el cursor estándar(indicador) del ratón, y el cursor en el box va a desaparecer.

51
11.2 Las marcas temporales
Las marcas temporales se utilizan para resaltar los puntos y los sectores en la
señal. En un box simultáneamente no pueden colocarse más de dos marcas
temporales. Para poner una marca temporal, hay que presionar en «Donador de
cursores» (o hacer el doble clic con el botón izquierdo del ratón), luego acercar el
cursor a la posición necesaria y presionar el botón izquierdo del ratón o una
combinación de las teclas <Ctrl>/<Insert>. Al mismo tiempo en la línea de las
coordenadas se presentará el valor de abscisa en el lugar en el cual una marca
temporal se coloca. Luego, después de una coma, de modo sincrónico con el
movimiento del cursor, será representada la posición del cursor en el segmento
corriente (superior). La segunda marca se coloca análogamente, sus coordenadas
también se representan en la línea de coordenadas. Si en la ventana ya están colocadas
dos marcas temporales, la más vieja va a desaparecer. Al presionar las teclas
<Ctrl>/<Delete> la marca temporal que está más cercana al cursor será eliminada.

A partir de la versión 6.2.1, en el sistema SIS apareció el nuevo método de trabajo


con las marcas temporales. Si en el menú Opciones->Opciones complementarias está
seleccionada la opción «Resaltar la señal comprendida entre las marcas temporales»,
entonces una marca temporal se coloca mediante un clic del botón izquierdo del ratón.
La segunda marca se coloca análogamente. Si en la ventana ya están colocadas dos
marcas temporales, la más vieja va a desaparecer. El sector de la señal entre dos
marcas temporales se resalta (pinta) de color amarillo.

Para destacar el sector de la señal se puede tambien presionar el botón izquierdo


del ratón y manteniéndolo presionado desplazar el cursor en la dirección necesaria. En
el curso de su movimiento el sector seleccionado va a quedar de color amarillo. Para
terminar la selección hay que soltar el botón izquierdo. Los límites izquierdo y derecho
del sector seleccionado corresponden a las posiciones de las marcas temporales.

La posición de los límites del sector seleccionado (resaltado) se puede cambiar. Al


encontrarse justo en el límite del sector, el cursor adquiere el aspecto de una flecha de
doble sentido (derecho-izquierdo). Después de presionar el botón izquierdo del ratón
el límite se captura y se desplaza en la dirección necesaria.

Haciendo un clic con el ratón en otro lugar de la señal será colocada otra marca
temporal, y los límites de selección van a cambiar.

Para anular la selección hay que presionar <ESC>. En este caso ambas marcas
temporales serán eliminadas.

11.3 Las marcas permanentes


Las marcas permanentes se utilizan para resaltar los puntos y los sectores en la
señal. El sistema permite colocar hasta 500 marcas permanentes. Para poner una
marca permanente, hay que presionar en el «Donador de cursores» (hacer el doble clic
con el botón izquierdo del ratón), luego acercar el cursor a la posición necesaria y
presionar la tecla <Insert>.

52
Al presionar la tecla <Delete> la marca permanente que está más cercana al
cursor será eliminada. Para eliminar simultáneamente todas las marcas hay que entrar
en el menú Мarcas->Eliminar todas las marcas.

A partir de la versión 6.2.1, en el sistema SIS apareció el nuevo método de trabajo


con las marcas permanentes. Si en el menú Opciones->Opciones complementarias
está seleccionada la opción «Resaltarr la señal comprendida entre las marcas
temporales», se puede poner una marca permanente sin utilizar el «Donador de
cursores». Hay que acercar el indicador del ratón hasta la posición necesaria y
presionar la tecla <Insert>.

Cualquier sector entre dos marcas permanentes se puede resaltar a través de


iluminación. Para hacerlo, hay que acercar el cursor a cualquier lugar del sector
necesario, presionar el botón medio o derecho del ratón y en el menú contextual que
aparece seleccionar la opción «Iluminar». Al mismo tiempo el marco superior del box
situado por encima de este sector será resaltado de color amarillo. Para quitar la
iluminación hay que acercar el cursor a cualquier lugar del sector iluminado, presionar
el botón derecho del ratón y en el menú contextual que aparece seleccionar la opción
«Iluminar».

11.4 Lista de marcas


Todas las marcas permanentes que hay en la ventana se quedan apuntadas en una
lista. Esta lista se la puede examinar, al entrar en el menú Мarcas ->Lista de marcas.
En la pantalla va a aparecer un menú complementario que contiene una lista de marcas
(Dibujo 20).

Dibujo 20. Lista de marcas

53
La lista contiene la siguiente información:

ƒ el número ordinal de la marca,


ƒ coordenada de la marca en el eje de abscisas,
ƒ indicador de iluminación del sector desde la marca corriente (actual) hasta la
siguiente,
ƒ inscripción (nota) (para cada marca se puede introducir un comentario),
ƒ longitud del sector entre una marca dada y la siguiente,
ƒ indicador de la visibilidad de la marca en el box de datos.
Además de una lista de marcas, en el menú hay las casillas adicionales, que
permiten seleccionar y eliminar las marcas, y en el caso de existir algun sector
iluminado habrá información sobre las coordenadas del inicio del sector, del final y de
su longitud total. Además, los límites del área iluminada se señalan con símbolos
especiales: s – marca de inicio, h – todas las marcas entre la primera y la última, f –
marca el final del fragmento iluminado. Estos signos se colocan entre la coordenada de
la marca y su inscripción.

Si una marca se encuentra dentro del box de datos (y no fuera de sus límites),
entonces en la última posición de la línea se muestra un indicador de la visibilidad de
la marca (V). Al presionar sobre éste con el ratón (o mediante la tecla <Enter>), el
sector de la señal desde la marca corriente hasta la siguiente se presentará en el box
de datos.

Para seleccionar la marca en la lista hay que indicar con la ayuda del ratón o con el
teclado la marca necesaria y presionar la tecla <Espacio>. Al mismo tiempo en la
casilla correspondiente va a aparecer una señal «v».

Además, existe un botón «Imprimir la lista de marcas». Al presionar en este botón


el programa guarda la lista de marcas en un archivo de texto. Se supone, que el
usuario puede tener ganas de arreglar su aspecto antes de imprimir. Aparece una
ventana de diálogo (Dibujo 21).

Dibujo 21. Diálogo para guardar una lista de marcas

54
Este diálogo contiene un consejo de cómo se puede transformar el archivo
guardado en una tabla mediante MS Word. Además, al poner un visto en la casilla
«Guardar sólo las seleccionadas», se puede evitar el problema de guardar las marcas
innecesarias. Al presionar el botón «Sí» aparece un diálogo estándar de Windows
«Guardar como…», que permite poner el nombre e indicar el catálogo para guardar
este archivo.

11.5 Cursor horizontal y las marcas horizontales temporales


Para determinar el valor de la señal en cualquier posición con más precisión que lo
que permite hacer la digitalización (numeración) del eje vertical, se utiliza el cursor
horizontal. Para llamar al cursor horizontal hay que acercar el indicador del ratón hacia
un pictograma ‘Donador de cursores» en la ventana necesaria (el botón se
encuentra en el ángulo superior derecho de cada ventana) y presionar el botón medio
o derecho del ratón. El cursor del ratón desaparece, y en su lugar en la ventana va a
aparecer una línea horizontal amarilla, que va a seguir todos los desplazamientos
verticales del ratón dentro de los límites del box de datos. Simultáneamente tales
cursores horizontales van a aparecer en todas las ventanas enlazadas. El valor de una
coordenada vertical, que corresponde al nivel del cursor horizontal, está representado
en la línea de comentario directamente encima del box de datos. Si antes de la
aparición del cursor en la ventana no había ninguna línea conveniente, ésta será
creada, y todos los datos volverán a dibujarse. Una línea conveniente podría ser, por
ejemplo, una línea vacía, situada encima del box de datos. El valor se calcula en las
unidades de medición corrientes (cuentas, segundos, Hz y etc.)
El habla visualizada (espectrograma, cepstrum y etc.) pueden tardar mucho tiempo
en volver a dibujarse al insertar una línea vacía. Para evitarlo, hay que entrar en el
menú Opciones->Opciones complementarias y seleccionar la opción Insertar el campo
textual en el Habla visualizada. Entonces una línea vacía para comentario siempre será
creada junto al habla visualizada.

Al presionar el botón izquierdo del ratón en la posición del cursor va a aparecer


una marca horizontal temporal, y luego su valor será continuamente representado en
la línea del comentario a la derecha del valor, que corresponde al cursor. Al volver a
presionar el botón izquierdo del ratón aparece una segunda marca horizontal
temporal. Las marcas van a aparecer hasta que no cese su cantidad total. En el menú
Opciones -> “Opciones complementarias” en la casilla «Cantidad de las marcas
horizontales» se puede indicar su cantidad total (desde 2 hasta 5). Las siguientes
presiones del botón hacen que una de las marcas (la más cercana) se sustituya por una
nueva, y las demás se guardan. Los valores de las marcas siempre se representan en la
línea del comentario a la derecha del valor del cursor en el orden de acrecentamiento.
Simultáneamente las marcas horizontales temporales se ponen en todas las ventanas
enlazadas, pero sus valores se representan solamente si en estas ventanas ya hay
líneas de comentario convinientes. En las ventanas enlazadas las líneas vacías no se
crean.

55
Al presionar el botón derecho del ratón o la tecla <Esc> el cursor horizontal
desaparece y vuelve a aparecer el cursor regular (indicador) del ratón. En este caso la
línea de comentario y los valores de las marcas temporales comprendidas en en la
misma quedan fijas en la ventana.

11.6 Cómo guardar las marcas en un archivo junto con los datos
Para guardar las marcas verticales permanentes junto con los datos es necesario
hacer lo siguiente. Al guardar el fragmento de los datos (Vease ap. 9.1) en la ventana
de diálogo en donde se pone el nombre del archivo de salida (archivo definitivo) hay
que seleccionar el formato de datos *.DAT y marcar una señal (banderita) en la casilla
«Guardar las marcas».

En este caso todas las marcas verticales, que se encuentran dentro de los límites
del fragmento que se guarda, serán guardados junto con los textos correspondientes.
Luego estas marcas se cargarán junto con los datos automáticamente.

56
12 FORMACIÓN DE LA SEÑAL DE VERIFICACIÓN
En este sistema esta prevista la posibilidad de formar las señales de verificacion de
varios tipos con los diferentes parametros ( amplitud, período, frecuencia). Con este
fin hay que entrar en el menú Datos->Formar la señal de prueba.. De esta manera en
la pantalla aparece el menú (Dibujo 22).

Dibujo 22. El menú de formación de una test- señal(señal de prueba)


Por medio de este menú el usuario puede:

ƒ elegir tipo de la señal: el seno, el cuadrángulo, sierra, impulso-delta, ruido


blanco;
ƒ establecer los parámetros de la señal: amplitud, período (frecuencia);
ƒ establecer la frecuencia de discretización;
ƒ establecer la duración de la señal en segundos.
ƒ establecer tipo (mono o estéreo) de la señal que se pretende formar.
ƒ establecer la precisión (16 o 24 bit) de la señal que se pretende formar.
Trás elegir tipo de la señal y sus parámetros, presione el botón «Sí». Todos las
señales, cuya amplitud no es igual a cero, serán mezclados durante el proceso de
generación. Luego en la ventana corriente será dibujado la señal formada.

57
13 REDACCIÓN DE DATOS
Para redactar los datos es necesario mediante el teclado o el ratón entrar en el
menú Redacción. En el menú que se abrirá será representada la lista de operaciones
accesibles para el usuario.

El punto «Ahora está procesando» en la parte superior del menú sirve para la
elección del tipo del fragmento que está procesando. La elección actual está indicada
en la línea situada debabajo.

13.1 Elección del segmento – fuente de datos y del fragmento – fuente de


datos
La fuente de datos que comprende en si la señal a redactarse siempre es el
segmento actual (superior) de la ventana actual (superior). Si en la ventana hay varios
segmentos y el usuario quiere trabajar con un segmento distinto del superior (el
primero en el nombre de la ventana), él puede activar cualquier otro segmento
mediante tres procedimientos.

1) Llevar el cursor del ratón al nombre del segmento necesario en el nombre de la


ventana actual y apretar el botón medio o derecho del ratón. El segmento se hará
actual y el nombre de la ventana se cambiará.
2) Llevar el cursor del ratón al símbolo 'flecha hacia la derecha' a la derecha del
nombre de la ventana actual y apretar el botón medio o derecho del ratón.
Después de esto el segmento inferior de la ventana se hará superior y el orden del
resto no se cambiará.

3) Entrar en el menú Datos->Activar el segmento siguiente y activar de este modo


el segmento siguiente segun el orden establecido. Análogamente el punto Datos-
>Activar el segmento anterior, permite activar el segmento anterior (el más inferior).

El usuario puede no redactar el segmento entero, sino que al contrario puede elegir
de éste un fragmento para redactar mediante uno u otro procedimiento. En el menú
Redacción en la segunda línea desde arriba siempre está indicado con que fragmento
va a trabajar ahora. Para cambiarlo es necesario entrar en el área «Ahora está
procesando» y en la lista que va a aparecer elegir el tipo necesario del fragmento para
trabajar:

1) «Todos los datos» – va a procesarse todo el segmento corriente (actual) de la


ventana corriente (actual),

2) «Iluminados» – va a procesarse la parte del segmento actual que se encuentra


comprendido en el intervalo iluminado entre las marcas constantes,

3) «Entre las marcas temporales» – va a procesarse la parte del segmento actual


que se encuentra comprendido en el intervalo entre dos marcas temporales,

4) «Visibles en la ventana» – va a procesarse la parte del segmento actual que se


encuentra reflejada en el box de datos,

58
5) «Seleccionados» – van a procesarse las partes del segmento actual que están
comprendidas en los intevalos seleccionados entre las marcas ( la selección se realiza
en el menú Demostración->Lista de marcas).

Cambiar el tipo del fragmento también se puede con la ayuda de los botones del
panel de herramientas. La selección del tipo de fragmento prosesado se muestra en el
panel de instrumentos. Esto permite llevar un control del prosesamiento del
fragmento.

13.2 Normalización de la señal


Como normalización se comprende multiplicación por una constante y
desplazamiento de la señal en cada punto de tal manera que el máximo de la amplitud
de la señal se iguale a uno dado, o de tal manera que todos los valores de la señal se
encuentren en un intervalo dado. La normalización puede ser usada:

ƒ antes de la escucha – para llevar la señal a la rejilla de bits del transformador


digital-análogo (D/A) o para aumentar la intensidad (volumen),
ƒ antes de la filtración – para reducir error de redondeamiento.
Para realizar la normalización es necesario entrar en el menú Redacción ->
Normalización. En la pantalla va a abrirse el menú complementario (Dibujo 23).
En el presente menú es necesario determinar los parametros para el régimen de
normalización:

ƒ Elegir el tipo de normalización: «Según la amplitud» o «En el intervalo»,


asimismo hay que indicar las cifras necesarias en las casillas «Nivel del máximo
(amplitud)» y «Nivel del mínimo». Si el procesamiento de normalización se hace
según la amplitud, el valor de la última casilla no se usa. Los valores siempre se
indican en las mismas unidades, en las cuales se realiza la numeración del eje
vertical en la ventana actual (es decir suele ser en cuentas (puntos)).
ƒ Establecer el tipo de fragmento que se va a procesar. En la parte superior del
menú hay una opsión «Ahora Usted procesa», que al ser escogida, activa la lista
utilizada para elegir el tipo del fragmento a ser procesado. El trabajo con esta
opsión es análogo al descrito en el p. 13.1. El tipo de fragmento dado se
muestra se refleja en la línea situada más abajo. El tipo de fragmento puede ser
elegido también mediante los pictogramas:

- todos los datos (es decir todo el segmento de datos);

- iluminados;

- entre marcas temporales;

- visibles en la ventana;

- seleccionados.

59
Dibujo 23. Menú de procedimientos de la normalización de la señal

En el caso de las señales estereofónicas, ambos canales se cambian


proporcionalmente en el proceso de normalización.

Después de apretar el boton «Aceptar» la normalización va a realizarse y la ventana


actual se dibujará de nuevo.

13.3 Operaciones con constantes


Para realizar las operaciones con constantes, es necesario entrar en el menú
Redacción->Operaciones con constantes. En la pantalla va a aparecer el menú
(Dibujo 24). Los campos superiores sirven para elegir el tipo del fragmento para
procesar. El trabajo con estos campos es completamente análogo al descrito en el
punto anterior.

Dibujo 24. Menú de operaciones con constantes (mono señal)

Después hay submenú de elección de operación que contiene 4 alternativas:

60
« + » – sumar con una constante,
« - » – restar una constante de la señal,
« * » – multiplicación por una constante,
« / » – división para una constante.
Hace falta elegir una de las operaciones e introducir el valor necesario de la
constante en la casilla que se ubica a la derecha de la palabra «Señal», debajo de la
palabra «Constante».

Después para las señales “mono” se muestra una raya horizontal punteada y para
las señales estereofónicas hay una opsión «Está procesando 'Ambos canales'«.
Mediante el ratón o el teclado se pueden cambiar el texto o el régimen de
procesamiento. Son accesibles tres regímenes:

ƒ Ambos canales,
ƒ Canal derecho,
ƒ Canal izquierdo.
Después de apretar el botón «Aceptar» la operación será realizada, y la ventana
actual se volvera a didujar.

Procesando las señales de 16 clases hay que tener en cuenta lo siguiente. Si el


valor de la constante se da de tal manera que el resultado de operación en uno de los
puntos de la señal puede salir del intervalo (-32767,32767), en la línea de mensajes
aparecerá el texto ”Relleno”. La operación está cancelada», y la operación no será
realizada. Esta observación no tiene relación con las señales de 24 bits. Sobre
trasformación de precisión de las señales mire p. 13.19.

13.4 Transformación lineal de la señal


Para realizar la transformación lineal de la señal es necesario entrar en el menú
Redacción->Transformación lineal. En la pantalla aparecerá el menú de determinación
de parámetros de la operación (Dibujo 25).

Dibujo 25. Menú del procedimiento de transformación lineal de la señal


61
Los campos superiores sirven para elegir el tipo del fragmento a ser procesado. El
trabajo con estos campos es completamente análogo al descrito en el p. 13.19.

Como transformación lineal se comprende multiplicación de la señal por una


función lineal determinada por dos valores – en el borde izquierdo y en el derecho. Es
necesario en las casillas «Multiplicador en el borde izquierdo:» y «Multiplicador en el
borde derecho:» establecer estos valores. Después de apretar el botón «Aceptar» la
operación será realizada y la ventana actual se dibujará de nuevo.

Al procesar las señales de 16 clases hay que tener en cuenta lo siguiente. Si el valor
de la constante de da de tal manera que el resultado de operación en uno de los
puntos de la señal pueda salir del intervalo (-32767,32767), en la línea de mensajes
aparecerá el texto «Relleno. La operación está cancelada», y la operación no será
realizada. Esta observación no tiene relación con las señales de 24 bits. Sobre
trasformación de precisión de las señales mire p. 13.19.

13.5 Eliminación de la señal


Para realizar la eliminación es necesario entrar en el menú Redacción->Eliminar.
Con esto en la pantalla va a aparecer el aviso de que el fragmento elegido será
eliminado. Usted debe confirmar su intención de eliminar el fragmento apretando el
botón « Aceptar» o cancelar la operación apretando el botón «Cancelar». Si en la
ventana están presentes marcas constantes, le van a ofrecer elegir la opción
«Desplazar las marcas».

Con apretar el botón «Aceptar» el fragmento o el segmento actual entero serán


eliminados inmediatamente y la ventana se cambiará. Con esto, si se elimina el
fragmento, todos los datos siguientes serán desplazados al intervalo que corresponde
al fragmento eliminado. Con esto la posición de marcas temporales no se cambiará y
de esta manera estas marcas van a limitar otro espacio de datos del segmento actual.
Las marcas constantes se desplazan junto con la señal si durante la eliminación se
elige la opción «Desplazar las marcas». En caso contrario, es decir si la opción
«Desplazar las marcas» no se elige, la posición de las marcas constantes no se
cambiará.

13.6 Adición del fragmento al final del segmento


Para realizar la adición es necesario entrar en el menú Redacción->Adicionar.
Como resultado de esta operación el fragmento destacado (resaltado) del segmento
actual de la ventana actual se agrega al final del segmento actual de otra ventana. En
automático la ventana actual siempre es superior y la ventana–receptor es la segunda
desde arriba, si ésta es de tipo conveniente o universal (todas las ventanas vacías son
de tipo universal).
Después de entrar en la opsión «Adicionar» en la pantalla va a aparecer el menú de
elección de la ventana-receptor (Dibujo 26).

Las opsiones superiores sirven para elegir el tipo del fragmento a procesar. El
trabajo con estas opsiones es completamente análogo al descrito en el p. 13.2.

62
Dibujo 26. Menú del procedimiento de adición de la señal

Después en el menú están situada un área informativa «La ventana-receptor ahora»


y dos opsiones para ejecutar. Mediante la opsión «Crear la ventana-receptor» se puede
crear la ventana-receptor. Después de crear la nueva ventana, la ventana-fuente será
movida hacia arriba y nuevamente se hará actual y la nueva ventana se hará la segunda
desde arriba. Mediante la opsión «Elegir la ventana-receptor» se puede elegir la
ventana-receptor entre las ventanas que hay en el sistema. Después de escoger dicha
opsión en la pantalla va a aparecer la lista de ventanas.

Para elegir una de ellas hay que en la columna «Actividad» establecer el indicador
en la línea que contiene el nombre de la ventana necesaria. Si la ventana elegida es de
tipo “no conveniente”, por ejemplo, si ésta contiene espectros, pero el usuario opera
con el fragmento de fonograma, el resultado de elección será anulado y en la línea de
avisos aparecerá el mensaje correspondiente. Después de apretar el botón «Aceptar» la
operación se realizará y la ventana-receptor se dibujará de nuevo. El obstáculo en
realizar esta operación puede ser sólo el tipo no convencional de la ventana-receptor.
Al adicionar la señal estereofónica a la señal mono, los datos de los canales
derecho e izquierdo se mezclan. Al adicionar la señal mono a la señal estereofónica se
en ambos canales se agregan los mismos datos.

13.7 Inserción del fragmento del segmento corriente en otro segmento


Para realizar inserción (de fragmento) de datos de un segmento en otro es
necesario entrar en el menú Redacción->Insertar. En la pantalla va a aparecer el menú
de elección de la ventana-receptor, las utilización de dicha ventana ya fué descrita en
el punto 13.6.

Después de elegir la ventana-receptor hay que apretar «Aceptar». En la pantalla va


a aparecer «Elección de lugar de recepción» (Dibujo 27).

En ella hay cinco opsiones para la elección del lugar dentro del segmento actual de
la ventana-receptor, en el cual hay que insertar el fragmento seleccionado. estas
opsiones son:

63
1) «Antes de la marca temporal» (si en la ventana-receptor hay dos marcas
temporales, los datos serán insertados antes de la marca izquierda);

2) «Antes de los iluminados»;

3) «Después de los iluminados»;

4) «Al inicio de la señal»;

5) «Antes de la primera marca».

Dibujo 27. Ventana de elección del lugar de recepción


Hay que establecer el indicador (mediante las flechas o el ratón) al campo
necesario y apretar el boton «Aceptar». Después de esto la inserción se realizará si en
la ventana-receptor hay un segmento-receptor del mismo tipo que el segmento-
fuente. Realizada la inserción en segmento-receptor, los datos no se eliminan del
segmento-fuente. Además de esto todos los datos ubicados después del punto de
inserción serán desplazados hacia la derecha (en dirección de las abscisas mayores)
para que con esto aparezca un lugar, suficiente para la inserción, no obstante la
posición de marcas temporales y constantes no cambia, de esta manera estas marcas
van a limitar otros datos del segmento-receptor (por lo menos para los que están
situados a la derecha del punto de inserción).

Si a la señal mono se agrega la señal estereofónica, los datos de los canales


derecho e izquierdo se mezclan. Si a la señal estereofónica se agrega la señal mono, a
ambos canales se agregan los mismos datos.

13.8 Copia de datos


Para realizar la copia de datos es necesario entrar en el menú Redacción ->Copiar.
En la pantalla va a aparecer el menú de elección de la ventana-receptor, las acciones
que se pueden realizar con esta ventana ya están descritas en el punto 13.6.
Independientemente del fragmento que ha sido copiado, los datos después de
terminar la operación forman un segmento único del mismo tipo que el segmento-
fuente. Todas las marcas constantes se copian junto con los datos de tal manera que
en el nuevo segmento están ubicados con respecto a los datos del mismo modo que
en el viejo (anterior).

64
Si no hay otras órdenes, los fragmentos de oscilogramas de el tono principal se
copian con un desplazamiento hacia cero (es decir el limite izquierdo de cada
resultado de copia es igual a 0). No obstante se lo puede cambiar entrando en el menú
Opciones->Opciones complementarias y quitando un banderín en «Desplazar los
datos hacia cero durante la copia». En este caso los límites horizontales de los
fragmentos no van a cambiarse durante la copia. Para facilitar el trabajo futuro con los
segmentos dispersados por tiempo, use el botón <F8> (para mostrar el segmento
superior completo).

13.9 Desplazamiento de señales


Para realizar el desplazamiento de la señal desde una ventana a la otra es necesario
entrar en el menú Redacción->Desplazar. En la pantalla va a aparecer el menú de
elección de la ventana-receptor, las acciones realizables con esta ventana ya están
descritas en el punto 13.6. En este menú no existenlas opsiones de elección de tipo de
fragmento a procesar, porque el desplazamiento de fragmentos no se realiza con esta
operación. Se desplazan sólo los segmentos de datos, con esto los datos no se copian
sino «se atribuyen» a otra ventana y después de lo cual se vuelven a dibujar ambas
ventanas. Esto economiza el tiempo de manera significativa cuando se procesan
segmentos largos. La ventana-receptor después del traslado se hace actual.

13.10 Utilización del menú de contexto


Además de la acciones antes descritas, en el programa SIS se brinda la posibilidad
de copia, corte, eliminación e insertación de fragmentos a través del menú de
contexto.

Por ejemplo, el copiado(cortado) seguido por la insertación puede ser realizado de


la siguiente manera:

– se resalta un fragmento de la señal;

– después de presionar sobre el con la tecla derecha del ratón en el contexto

menú se escoge la orden copiar(cortar);

– en la ventana a la cual es necesario copiar el fragmento resaltado, con la

ayuda de la tecla derecha del ratón se llama al menú de contexto, en el cual

se elige el comando(orden) insertar;

– En la ventana de díalogo se escoge el lugar de inserción (mirar dibujo 26) y


se da la confirmación para la realización de la operación.

La señal se resalta con ayuda de las marcas temporales y se muestra en el centro


de la ventana. El tamaño de la escala de muestreo cambia de tal manera que el
fragmento insertado ocupe el 50% de la longitud de la ventana.

65
13.11 Desplazamiento del segmento corriente
Para realizar el desplazamiento del segmento corriente (actual, en curso) es
necesario poner en la ventana activa dos marcas temporales para así lograr que la
distancia entre ellas sea exactamente igual al valor del desplazamiento deseado y
después de esto entrar en el campo Redacción->Desplazamiento de segmento.
Después de esto en la pantalla va a aparecer la ventana con dos opsiones :
«Desplazamiento hacia la izquierda» y «Desplazamiento hacia la derecha». Es necesario
apretar(elegir) uno de ellas según su deseo después de lo cual el segmento va a
desplazarse a la distancia determinada y la ventana actual se dibujará de nuevo.

13.12 Nivelación de datos


La nivelación(aliniamiento, allanamiento) de los datos es posible para los espectros
medianos e instantáneos de Furier, cesptrum mediano, autocorrelación mediana,
correlación mediana particular, correlaciones de transformación lineal medianas. Para
la nivelación de datos es necesario entrar en el menú Redacción-> Nivelación de datos.

Entonces en la pantalla va a aparecer el menú de determinación de parámetros de


la operación (Dibujo 28).

Las opciones superiores sirven para elegir el tipo del fragmento a procesar. El
trabajo con estas opciones es completamente análogo al descrito en el p. 13.1 y 13.2.

Dibujo 28. Menú de procesamiento «Nivelacón de datos»

66
Después en el menú hay una opción «Crear un segmento nuevo» con ayuda de la
cual se puede elegir o cancelar la creación de un segmento nuevo: para el caso cuando
sea elegido el régimen de creación de un segmento nuevo, el espectro nivelado será
dibujado en la misma ventana en la cual se encuentra la senal a procesarse pero se
dibujara con otro color; si el régimen recién indicado está cancelado, en la ventan
actual será dibujado sólo el espectro alisado (nivelado) y no habrá ningón otro.

Luego en el menú hay la opción «Promedio geométrico», con ayuda del cual se
puede convertir la nivelación desde el espacio lineal a logarítmico. Si este régimen está
elegido ([v]), antes de la nivelación los datos van a exprezarse en forma logarítmica y
después de la nivelación, al resultado será aplicada la operación inversa. Para usar este
régimen, mire que los datos no contengan valores negativos.
El submenú ubicado abajo permite elegir la longitud necesaria para la ventana de
nivelación comprendida entre las ofrecidas. La longitud de la ventana está indicada
tanto en puntos, como en hertzios (Hz). La nivelación con la longitud mínima de la
ventana casi no cambia el espectro, la nivelación con la longitud máxima de la ventana
lo convierte aproximadamente en un polinomio de segundo grado. La aproximación se
realiza por el criterio de « los cuadrados mínimos» mediante el método del polinomio
aproximador.

El cálculo empieza al apretar el botón «Aceptar». El espectro nivelado o su


fragmento será dibujado en la ventana actual pero con otro color.

13.13 Mezcla de segmentos


La mezcla puede resultar necesaria en el caso de formación de efectos acústicos o
formación de señales de verificación (por ejemplo, la señal articulatoria con la
interferencia de determinado tipo). Durante la mezcla se produce la suma de los
puntos correspondientes a la primera y segunda señal con la grabación de los
resultados obtenidos. Se puede mezclar señales que están situadas en una misma
ventana. Para realizar la mezcla de las señales es necesario cargar las señales con las
que queremos trabajar en la ventana actual y entrar en el menú Redacción->Mezcla.
Entonces en la pantalla va a aparecer el menú complementario (Dibujo 29).

67
Dibujo 29. Menú de procesamiento «Mezcla»

Con ayuda de este menú el usuario puede:

ƒ elegir el fragmento con que va a trabajar: todos los datos, los datos iluminados,
datos conprendidos entre las marcas temporales, datos visibles en la ventana,
los datos seleccionados;
ƒ determinar el segmento-resultado: actual o nuevo. Si como resultado se elige el
segmento actual, entoces en el lugar del segmento actual será dibujado el
segmento-resultado de la mezcla; si como resultado se elige un segmento
nuevo, entonces el segmento-resultado de la mezcla se dibujará con otro color
por encima de las señales que se mezclan;
ƒ determinar la longitud del segmento-resultado: ésta puede ser determinada
como igual a la longitud del segmento actual o al intervalo de mezcla (por
ejemplo, entre las marcas temporales);
ƒ determinar los pesos deseables a cada una de las señales: en el menú hay una
tabla que contiene todas las señales a mezclar, y frente a cada una de ellas el
usuario introduce el peso necesario mediante el teclado;
ƒ introducir el nombre del resultado.
Después de establecer todos los parámetros es necesario apretar el botón
«Aceptar» y la mezcla será realizada después de lo cual, la ventana actual se dibujará
de nuevo.

68
13.14 Recorte (clipping)
Esta operación se aplica más frecuentemente para supresión parcial de
inteferencias de impulsos extendidos (en los casos cuando se observan paquetes de
impulsos, cada uno de los cuales tiene una duración larga).

Para realizar la operación de clipping (recorte) es necesario entrar en el menú


Redacción->Clipping (recorte). Entonces en la pantalla va a aparecer el menú que
permite la determinación de los parámetros de la operación (mire Dibujo 30).

Dibujo 30. Menú del procedimiento «Clipping»

Las opsiones superiores sirven para elegir el tipo del fragmento a procesar. El
trabajo con estas opsiones es completamente análogo al descrito en el p. 13.2.
Después se ubica la opsion que permite elegir el tipo necesario de clipping:
«Según la amplitud» o «En un intervalo», tambien permite establecer el nivel de
máximo y mínimo.
Después de apretar «Aceptar» la operación será realizada y la ventana actual se
dibujará nuevamente.

13.15 División (cambio) de la frecuencia de discretización


La división de la frecuencia de discretización se usa habitualmente para aumentar
resolución espectral en la esfera de frecuencias bajas. Lo cual es necesario para
verificar si el fonograma no a sido regrabado y si en el no existen datos
pegados(adicionados). En una señal verbal habitual con la frecuencia de discretización,
por ejemplo, de 10000 Hz, se puede con ayuda de la operación Análisis->
Transformación rápida de Furier, espectro mediano (promedio) de potencia ver dos
picos espectrales separados, si entre ellos hay no menos que 10 Hz (dimensión del
cuadro - 2048 puntos, ventana de Henn). Con bajar la frecuencia de discretización
aproximadamente en 80 veces (hasta 125 Hz), se puede dividir los picos, que
comprenden entre ellos una distancia de 0.12 Hz. Esta resolución es suficiente para
ver cómo se duplica y se rompe el pico de frecuencia de la red (50 Hz).

69
El cambio de la frecuencia de discretización se usa cuando la señal fue mal
grabada. Para algunas frecuencias escogidas es un procedimiento largo, pero a veces
es necesario realizarlo.

Para obtener de la señal original la señal corregida según la frecuencia de


discretización es necesario entrar en el menú Redacción->Frecuencia de
discretización.
Entonces en la pantalla va a aparecer el menú intermedio que contenga sólo dos
puntos «Dividir para un entero» y «Establecer cualquier ». Al tener un valor grande del
divisor, el primer punto es más preferible porque provoca un procedimiento que
trabaja más rápido . La elección del segundo punto permite establecer lcualquier
frecuencia de discretización, la cual puede ser menor o mayor que la original. Pero este
proceso lleva más tiempo que el anterior.

Después de elegir el punto «Dividir para un entero» en la pantalla aparece el menú


«Frecuencia de discretización». Es un menú estandartizado del tipo «Fuente-receptor»,
y el trabajo con éste fué descrito en el p. 4.5. Pero si en las opciones está prohibido
crear un segmento nuevo, el usuario puede elegir para procesar solamente «Todos los
datos».
Apretando la opsión «OPCIONES», se puede entrar en el menú «OPCIONES»
específico para esta operación (Dibujo 31).

Dibujo 31. Menú «OPCIONES» de procedimiento


«Frecuencia de discretización» (dividir en entero)

«Frecuencia de discretización « – el valor de la frecuencia de discretización de la


señal actual (corriente).

«Divisor» – hace referencia al valor comprendido en el intervalo (desde 2 hasta 102)


el cual se representará en Hertzios (Hz) en la casilla «nueva frecuencia de
discretización» . Es imprescindible recordar que rango espectral de la señal se
encuentra entre 0 Hz y la mitad de la frecuencia de discretización. En el proceso de
división de frecuencia todo el espectro en el rango desde la mitad de la frecuencia de
discretización nueva hasta la mitad de la vieja será suprimido automáticamente en más
que 72 dB. No obstante la parte del resto del espectro que contenga alta frecuencia
(10%) se encontrará en la zona transitoria y se alterará un poco. Por eso en el área
informativa « Ancho de banda « se indica la frecuencia máxima que no a sido alterada.

70
«Crear un segmento nuevo» – si este banderín está colocado se creará un nuevo
segmento. En caso contrario los datos van a grabarse en el segmento original y su
longitud va a reducirse.

Al determinar los parámetros necesarios apriete el botón «Aceptar», después de


eso la operación será realizada y la ventana con el resultado se dibujará de nuevo. La
realización de la operación puede ser interrumpida apretando el botón <ESC> sólo en
el caso que se cree un segmento nuevo.

Al elegir el punto «Establecer cualquier» en la pantalla también va a aparecer el


menú de tipo estandar «Frecuencia de discretización», el trabajo con este menu se
describe en el punto. 4.5. Al apretar en el boton «OPCIONES», se puede entrar en el
menú «OPCIONES» específico para esta operación (Dibujo 32).

Dibujo 32. Menú «OPCIONES» del procedimiento


«Frecuencia de discretización» (establecer cualquier)

«Frecuencia de discretización» – el valor de frecuencia de discretización de la señal


actual.

«Nueva frecuencia de discretización» – el valor de nueva frecuencia de


discretización en los límites [4001 - 192000]. Se puede establecer cualquier valor en
los límites indicados, pero hay que tener en cuenta que en la lista de segmentos el
valor de la frecuencia se refleja con precisión hasta un número entero determinado.

El submenú de elección «Transformación rápida» o «Precisión alta». Después de


elegir «Transformación rápida» Usted provocará un procesamiento 4 veces más rápido,
pero la supresión de la señal fuera de los límites del ancho de banda será de 55 dB,
mientras que al elegir «Precisión superior» – más que 75 dB.

«Crear un segmento nuevo» – si este banderín está colocado, se creará un nuevo


segmento. En caso contrario los datos van a grabarse en el segmento original y su
longitud va a reducirse o a aumentarse.

Al determinar los parámetros necesarios apriete el botón «Aceptar», después de


eso la operación será realizada y la ventana con el resultado se dibujará de nuevo. La
realización de la operación puede ser interrumpida apretando el boton <ESC> sólo en
un caso que se cree un segmento nuevo.

71
13.16 Reversión
Para realizar la reversión es necesario entrar en el menú Redacción->Reversión.
Después de esto la operación será realizada inmediatamente y la ventana actual se
dibujará de nuevo.

La operación «Reversión» consiste en el cambio de orden de la investigación de los


datos del fonograma dentro de un intervalo determinado al inverso. Es decir si el
usuario manda hacer reversión en la parte de la señal, por ejemplo, en el intervalo de 1
segundo hasta 2, en el que se encuentran los valores del macizo de datos desde el
10000 hasta el 20000,y de esta manera después de que se ejecuten los comandos se
cambian de lugares dentro del macizo los valores de 10000 y de 20000, de 10001 y
de19999, etc.

Es necesario notar que si entre marcas están seleccionados varios intervalos


consecutivamente, en el proceso de tratamiento de datos seleccionados ellos se
comprenden por la operación «Reversión» como un intervalo entero y el cambio de
valores se realiza por todo este intervalo grande y no por cada uno de los intervalos
pequeños que lo componen.

13.17 Inversión
Para realizar inversión es necesario entrar en el menú Redacción->Inversión. Para
los oscilogramas y las señales de tono principal y de energía, esta operación consiste
en que todos los valores de la señal dentro del intervalo determinado cambian su signo
al inverso (es decir se multiplican por (-1)). Para el espectro de Furier en el proceso de
inversión cada valor de la señal dentro del intervalo determinado se sustituye por uno
dividido para el valor original.

Esta operación no se aplica al «habla visible».

13.18 Obtención de la señal, corregida según el ritmo de reproducción,


pero con la misma altitud del tono principal
Se recomienda usar esta función sólo para el habla y además tendría que ser de
baja frecuencia en comparación con la frecuencia de discretización. En todo caso no se
recomienda disminuir la velocidad de la voz femenina alta – cantada, grabada con la
frecuencia de discretización de 8 kHz. Para obtener de la señal original la señal
corregida según el ritmo es necesario entrar en el menú Redacción->Corrección del
ritmo. Entonces en la pantalla va a aparecer el menú «Corrección del ritmo». Este menú
es estandartizado del tipo «Fuente-receptor» y el rabajo con él se describe en el punto
4.5. Al apretar el menú «OPCIONES», se puede entrar en el menú «OPCIONES»
especifico para esta operación y corregir los valores de parámentros (Dibujo 33).

«Coeficiente de disminución de la velocidad». Se puede establecer cualquier


número comprendido dentro del diapasón [0.33..3]. El valor va a mantenerse con error
relativo de 10-14 (si está elegido el parámetro «Precisión del ritmo» – mire más abajo).

72
Dibujo 33. Menú «OPCIONES» del procedimiento «Corrección del ritmo»

Nota

Es necesario tomar en cuenta que disminuyéndose la velocidad del ruido blanco en


3 veces, él se convierte en tonal y la voz se hace «borracha».

«Período» – el supuesto período de tono principal en segundos. Si este parámetro


se aumenta, el contorno de la señal de salida se hace serriforme y aparecen sonidos
específicos; si se reduce aparecen chasquidos.

El submenú de elección «Precisión del ritmo « o «Calidad de la señal». Para


conservar la calidad original de la señal de salida no se puede multiplicar o eliminar
algunas partes del habla. Con elegir el punto «Calidad de la señal» se guardarán tales
partes. Pero al guardarlas el coeficiente de corrección del ritmo dado se realiza sin
presición (aproximadamente con precisión de hasta 0.01). Con elegir el punto
«Precisión del ritmo», SIS va a mantener el valor preciso del coeficiente de corrección
del ritmo aún en perjuicio de la calidad. Es necesario notar que la corrección del ritmo
se desvía del dado porque tambien las partes para multiplicar (o eliminar) tienen
longitud distinta. Con elegir el punto «Calidad de la señal», este efecto va a corregirse.

Al determinar los parámetros necesarios apriete el botón «Aceptar», después de


esto la operación será realizada y la ventana actual se dibujará de nuevo.

13.19 Modulación
Al régimen de modulación se acude mediante el menú Redacción->Modulación y
representa multiplicación por puntos de dos señales con normalización flotante del
resultado. Para este procedimiento se puede usar oscilogramas grabados en el
régimen «mono», de 16 bits o 24 bits que tengan la frecuencia de discretización igual.
Con esto representación interior en el SIS del número de 24 bits es de 32 bits, de las
cuales 24 son mantisa y 8 - orden.

Después de la elección de este régimen en la pantalla va a aparecer el diálogo


«Usted está modulando el segmento superior con el segundo desde arriba», con dos
botones «Aceptar» y «Cancelar».

Para realizar la operación apriete el botón «Aceptar».

73
13.20 Transformación de la precisión del oscilograma
La operación «Transformación de la precisión» se usa para obtención de la señal de
precisión necesaria y es aplicable sólo a los ocsilogramas (mono o estéreo).

Esta función permite transformar la señal de 16 bits a la de 24 bits y la de 24 bits -


en la de 16 bits. Por ejemplo, para la señal de baja calidad no es necesaria la precisión
de 24 bits mientras que ésta exige 2 veces más lugar en el disco. Por el contrario, para
las operaciones delicadas de análisis se exige la precisión de 24 bits aún en el caso de
que la señal de entrada tenga la precisión de 16 clases. El trabajo con la señal de 24
bits permite no cuidarse del relleno de la red de bits y de la pérdida de precisión.

Si cuando se transforma la señal a la de 16 bits se observa superación del nivel,


entonces la señal se clipa(recorta) al máximo/mínimo de la red de bits.

Para la realización de la transformación de la señal es necesario entrar en el menú


Redacción->Transformación de precisión. Al llamar a la operación el sistema mismo
detecta la precisión del segmento superior y ofrece transformarla en otra (porque
transformar en la misma no tiene sentido). En la pantalla va a aparecer la ventana de
diálogo, representada en el Dibujo 34.

Dibujo 34. Menú de procedimiento «Transformación de la precisión»

Si está colocado el banderín «Crear un segmento nuevo», va a ser creado un


segmento nuevo. En otro caso los datos van a grabarse en el segmento original pero
con otro color.

13.21 Operaciones mono / estéreo con las señales


Como complemento a las operaciones de la redacción, las cuales transforman las
señales estereofónicas (copia, eliminación, normalización, filtración, etc.) en el sistema
de SIS están previstas las siguientes posibilidades:

ƒ dividir el segmento estéreo en dos segmentos mono;


ƒ cambiar de lugar los canales en el segmento estéreo,
ƒ unir dos señales mono en un segmento estereofónico (es posible sólo para dos
señales mono de clases y de frecuencias de discretización iguales).
Para realizar estas operaciones es necesario entrar en el menú Redacción ->
Operaciones mono/estéreo y en la lista que va a abrirse elegir la operación deseable.

74
Operación de union de dos señales mono puede resultar de duración larga en caso
de que empiezen desde puntos distintos según el tiempo, porque la parte de datos de
la señal que empieza más temprano será eliminada.

Las operaciones restantes son simples y no exigen más comentarios.

13.22 Trabajo con el canal de tiempo de servicio


Mire el p. 17

75
14 FILTRACIÓN
El programa SIS permite realizar la filtración de señales. Para esto hay que entrar
en el menú Filtración. Entonces aparecerá el menú de elección del tipo de filtración:

Filtración adaptativa

Igualización de frecuencia
Ruido de banda ancha
Interferencias tonales y regulares
Interferencias estéreo
----------------------------------
Ruido fijo de banda ancha
Filtración de interferencias IMPULSIVAS
Igualización dinámica de nivel
Las opciones del menú Filtración se eligen por el usuario en dependencia del
carácter de las interferencias que hay en la señal que está siendo procesada.

14.1 Igualización adaptativa de frecuencia

14.1.1 Particularidades del trabajo


Algoritmos de igualización adaptativa del espectro permiten suprimir los
componentes potentes del espectro y así desenmascarar la señal verbal y aumentar su
legibilidad. Además se reduce considerablemente la fatiga del operador.
Simultáneamente la igualización adaptiva refuerza los componentes espectrales
débiles de la señal, asegurando «igualización» del canal que también favorece la
revelación de la señal verbal. No obstante durante la igualización del espectro
simultáneamente se refuerzan los componentes de interferencia de ruido de banda
ancha que desconforta la percepción de la señal.
Una de las particularidades de filtración a base de igualización adaptativa del
espectro es la aparición de «susurro» y «chasquidos» en la señal final los cuales
aparecen a causa de aumentación de nivel del ruido de banda ancha en la señal
original y desenmascarado de sus lanzamientos separados. La reducción de diapasón
de reforzamiento provoca la reducción de tales sonidos pero simultáneamente provoca
tambien el debilitamiento de la señal útil y por esto la interferencia suprimida
(residual) suena más claro (fuerte). Por eso para subrayar (recuperar) la señal útil es
necesario establecer un compromiso entre el grado amplificación del ruido, del habla y
la interferencia suprimida. Los ruidos desenmascarados pueden ser «enmascarados»
de nuevo gracias a la disminución de la profundidad de supresión. Además se puede
lograr la supresión parcial del ruido desenmascarado mediante la reducción de banda
de la señal o mediante la amplificación de la esfera (espacio) que contenga más
información del espectro de la señal con la ayuda del filtro de corrección de timbre.

76
14.1.2 Descripción de parámetros
Para realizar la operación de igualización adaptativa de frecuencia es necesario
elegir el punto del menú Redución de ruido->Igualización de la frecuencia. En la
pantalla va a aparecer el menu estándar del tipo «Fuente-receptor», como trabajar col
el menu se describe en el p. 4.5. Apretando el campo «OPCIONES», se puede entrar en
el menu «OPCIONES» específico para esta operación y corregir los valores de
parámetros (Dibujo 35).

Dibujo 35. Menú del procedimiento «Igualización de la frecuencia»


Abajo se indica la descripción de todos los parámetros usados.

«La constante temporal del filtro, seg.» - 1 ... 1000 segundos – determina el
tiempo de ajuste del filtro de corrección para los cambios de espectro de la señal. El
valor recomendado es 3..4; para las interferencias no fijas y para la música 1..2.

«La amplificación máxima para una frecuencia, dB» - 10..40 dB – Limita la


amplificacion de componentes débiles (del habla y del ruido) del espectro de la señal.
Los valores recomendados son 20..30.

«El coeficiente de amplificacón, dB» - 0..10 dB – Determina la amplitud de la señal


en la salida del filtro. El valor recomendado esta en el intervalo 3...9. Se lo elige de
oído.

«REGULACIONES ESTANDARES» – al apretar este campo Usted provoca que los


valores de todos los parámetros se cambien a los estándares. Se recomienda utilizar si
en el resultado de las manipulaciones con los parámetros el método dejó de funcionar.

«Supresión de armónicas» – al ejecutar se realiza la supresión adicional de


armónicas potentes de las interferencias. No influye en las armónicas débiles y medias.

«Dimensión de cuadro (puntos)» – 16, 32...2048 – determina resolución espectral,


el número de bandas espectrales y la longitud del bloque de datos que se procesa.

77
Para una cantidad grande de interferencias de banda estrecha (impulsos periódicos,
etc.) se recomienda 1024-2048.

«Variante del método»:

ƒ Inversión
ƒ Contraste
La variante del método «Inversión» suprime las interferencias fuertes de armónica y
la variante «Contraste» al revés subraya (resalta) los máximos de frecuencia en el habla
(en ausencia de las interferencias armónicas).

Los parámetros de corrección del timbre:

«Corrección del timbre» – activa/desactiva el filtro de corrección del timbre.


«Timbre inverso» – si el banderín está colocado, se establece el filtro adicional al
filtro de corrección de timbre, es decir el que deja pasar a la señal por fuera del ancho
de banda del filtro de corrección de timbre. Permite oír qué parte de la señal se ubica
fuera de la banda del filtro.

«Frecuencia inferior, Hz» - 100..700 Hz – determina el límite inferior del ancho de


banda del filtro. El valor recomendado - 200 Hz. En el caso de bullicio intensivo con
frecuencias bajas es útil elevar la frecuencia inferior.

«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite del ancho de


banda del filtro. El valor recomendado - 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor.

«Reforzamiento de Frecuencia baja, dB» -24..+24 dB – refuerza la señal de salida


en la zona de frecuencias bajas.

«Reforzamiento de Frecuencia alta, dB» -24..+24 dB – refuerza o debilita la señal


de salida en la zona de altas frecuencias. Para obtener más confortabilidad la zona de
frecuencias altas la suelen debilitar (-10, -20 dB), pero trabajando con algunas señales
al contrario su reforzamiento ayuda a hacerla más legible.

14.2 Ruido de banda ancha (sustracción adaptativa de frecuencia)


En la filtración adaptativa de ruido de banda ancha están incluidos los regímenes
siguientes de tratamiento:

1. Tratamiento de habla,
2. Tratamiento de la música,
3. Eliminación del ruido en las pausas.
Simultáneamente en cada régimen se puede adicionalmente utilizar o no los
regímenes de corrección del timbre y supresión de las armónicas, asimismo que el
régimen de separación de fondo.

78
El destino principal del algoritmo de filtración adaptativa del ruido de banda ancha
es la aumentación de confortabilidad de percepción de la señal verbal útil con
presencia de ruido aditivo de banda ancha. Según su sonido los ruidos de esta
modalidad corresponden a bullicio, susurro, zumbido, fragor (aire acondicionado, mar,
viento, calle). Los ruidos de esta variedad no pueden ser eliminados mediante los
métodos de filtración adaptiva unicanal, igualización del espectro o ecualización
porque el espectro de la interferencia es disperso.

La filtración adaptativa del ruido de banda ancha permite suprimir el ruido tanto
en las pausas del habla como en los momentos de habla activo. Con esto la legibilidad
no se mejora pero se reduce considerablemente la fatiga durante audición.
Simultáneamente el algoritmo de filtración de ruido de banda ancha permite suprimir
los componentes de interferencia de banda estrecha y esto hace el método bastante
universal.

Separación adaptativa de fondo está destinada a desenmascarar el ambiente


acústico de fondo del habla.

14.2.1 Particularidades del trabajo


El régimen «Tratamiento de habla» está destinado para la separación de la señal
verbal del fondo de interferencias no fijas de banda ancha y periódicas, que están
vinculadas con interferencias eléctricas industriales o vibraciones mecánicas, ruidos de
habitaciones y calle, interferencias de canales de comunicación o aparatos de
grabación. Permite desenmascarar la señal verbal con relación Señal/Ruido hasta -5..-
10 dB.

El régimen «Procesamiento de la música» está destinado para la separación de la


señal musical del ruido no fijo de banda ancha.

El régimen «Eliminación del ruido en las pausas» se distingue del régimen


«Procesamiento del habla» sólo por lo que en las partes del habla activa la señal
original se deja sin cambiar.

El régimen «Extraer el fondo en vez de la señal» (en las opciones amplificadas) está
destinado para separación de ambiente acústico de fondo (es decir el resultado será lo
que habitualmente se suprime).

El régimen «Supresión de las armónicas» (en las opciones ampliadas) está


destinado para la supresión adicional de interferencias potentes de banda estrecha a
30-40 dB y puede ser utilizado independientemente (con una profundidad de
supresión 0 dB).

El régimen «Corrección de timbre» está destinado para brindar el sonido


«confortable» del habla, a suprimir las interferencias potentes en las zonas de espectro
de Frecuencia baja y frecuencia alta, nivelación del canal de características de amplitud
y frecuencia o aparatos de grabación, amplificar las señales verbales débiles después
de filtrarlas en una banda de espectro más informativa.

79
El régimen «El filtro de corrección de timbre» permite «separar» la zona más
informativa del espectro de la señal suprimiendo la señal en las zonas de frecuencia
alta o baja, donde la interferencia supera la señal útil.

Es lo más fácil controlar el nivel de supresión utilizando la regulación


estandartizada «intensidad de supresión», la cual simultáneamente cambia los valores
de todos los parámetros restantyes del método. El número que se indicia significa el
número de pluralidad de parámetros, y el grado de supresión de ruido crece (aumenta)
junto con él.

La aumentación del número provoca la mayor supresión de ruidos y parcialmente


de habla, pero los resultados de esta supresión se distinguen de oído, por eso los
valores de los parámetros deben elegirse a gusto del usuario.

Una de las particularidades de la filtración basadas en la sustracción adaptativa


espectral es la aparición de unas «campanillas», «chasquidos», «murmullos» en la señal
obtenida, los que aparecen como resultado de la reducción del nivel de ruido de la
señal original y de los desenmascaramientos de sus irrupciones separadas. El aumento
de grado de supresión del ruido provoca la desaparición de estos sonidos, pero
simultáneamente también origina la supresión de la señal útil. Por eso para la
separación de la señal útil es necesario establecer un compromiso entre el grado de
supresión de ruido y alteración (deformació) del habla. Los ruidos desenmascarados
pueden volver a ser «enmascarados» mediante la reducción de profundidad de
supresión. Además se puede lograr la supresión parcial de «campanillas» mediante el
aumento de valores de los parámetros de Aplanamiento (nivelación) («nivelación del
espectro» y «Aplanamiento (nivelación) según el tiempo» en las opsiones de elección
de parámetros de Aplanamiento (nivelación)).

La específica del uso de la sustracción adaptativa espectral en las condiciones de


relaciones (razones) pequeñas de Señal/Ruido (menos de 0 dB) es la alteración de
sonido y supresión de la señal útil. Un medio de reacción posible a este efecto es el
reforzamiento de la zona más informativa del espectro de la señal-resultado con
ayuda del filtro de corrección de timbre.

Por fin durante el ajuste del régimen de sustracción adaptativa espectral hay que
tener en cuenta una particularidad más – el cambio significativo del sonido de fondo
cuando se suprime el ruido (por ejemplo, el fragor exprimido del automóvil pasante
puede sonar como «murmullo» ). Para utilizar la propiedad de oído «orientarse» en los
sonidos conocidos es necesario reducir el diapasón de supresión hasta un valor
comprendido en el intervalo 25-15 dB, lo que provocará el aumento del fondo y
aparición del ambiente acústico conocido. Después de esto, aumentando el diapasón,
se puede lograr el compromiso deseable entre el grado de supresión de ruido y el de la
señal útil.

Durante el trabajo puede ser usada la combinación de algoritmos de sustracción


adaptativa espectral y de corrección de timbre (con ayuda de las opsiones
activar/desactivar).

80
Además los algoritmos «Aplanamiento del espectro» y «Aplanamiento según el
tiempo» ejecutan adicionalmente la corrección de timbre, igualando el espectro y con
esto elevando aquella parte del espectro, donde la señal es débil.

Con razones pequeñas de señal /ruido la señal útil filtrada puede resultar débil.
Para aumentar su amplitud puede ser conveniente la amplificación adicional
determinada por el parámetro «Amplificación máxima para una frecuencia, dB».

Los parámetros se eligen de oído. Debbajo está descrita la influencia de cada uno
de los parámetros y están indicados los valores recomendados.

14.2.2 Descripción de los parámetros


Al entrar en el menú Filtración ->Ruido de banda ancha en la pantalla aparecerá el
menú estándar del tipo «Fuente-receptor», el trabajo con el cual se describe en el p.
4.5. Apretando el boton «OPCIONES», se puede entrar en el menú «OPCIONES»
específico para esta operación y corregir los valores de los parámetros (Dibujo 36).

Dibujo 36. Menú «OPCIONES» de procedimientos «Ruido de banda ancha»

Este menú permite al usuario controlar el tratamiento de la señal, estableciendo los


siguientes parámetros:
«Variante del método» – permite determinar el método de tratamiento en
dependencia del tipo de señal:
«Tratamiento de habla»,
«Tratamiento de música»,
«Eliminación del ruido en las pausas».
«Intensidad de supresión» – permite elegir uno de los 10 grados de supresión del
ruido (desde el débil, 1 hasta el fuerte, 10). A medida que aumenta el valor de este
parámetro, el grado de supresión del ruido aumenta con monotonía. El parámetro
puede tomar el valor «Desactivar». La desactivación es necesaria para entrar en el
submenú «Opciones avanzadas». En caso contrario, cuando haga el intento de entrar
en este menú, en la parte inferior de la pantalla aparecerá el mensaje «Desactive
primero las REGULACIONES ESTANDARES para recibir el acceso a las avanzadas «, y el
acceso será bloqueado.
81
«Corrección de timbre» – activa/desactiva el filtro de corrección de timbre.

«Frecuencia inferior, Hz» - 100..700 Hz – determina el límite inferior del ancho de


banda del filtro. El valor recomendado - 200 Hz. En el caso de ruido intensivo con
frecuencias bajas es útil elevar la frecuencia inferior.

«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
se banda de filtro. El valor recomendado - 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor.

«Amplificación de la Frecuencia Inferior, dB» -24..+24 dB – amplifica la señal de


salida en la zona de frecuencias bajas, si fuese necesario dar a la señal un timbre más
natural.

«Amplificación de la Frecuencia Superior, dB « -24..+24 dB – refuerza o debilita la


señal de salida en la zona de altas frecuencias. Para obtener más confortabilidad,por lo
general la zona de frecuencias altas la suelen debilitar (-10, -20 dB), pero trabajando
con algunas señales, su amplificación ayuda a hacerlas más legibles.

«Opciones avanzadas» – permite llamar el menú de opciones avanzadas (Dibujo


37).

Atención!

El submenú de opciones avanzadas se hace accesible sólo en el caso de que esté


desactivado el parámetro «Intensidad de supresión».

Dibujo 37. El submenú «Opciones avanzadas» del procedimiento


«Ruido de banda ancha»

Este submenú se usa en los casos cuando las opciones estándares resultan
insuficientes y contiene las siguientes áreas:

82
«La constante temporal de filtro, seg.» - 1 ... 1000 segundos – determina el
tiempo de ajuste de filtro de corrección a los cambios de espectro de la señal. El valor
recomendado es 3..4; para las interferencias no fijas es 1..2.

«Extraer el fondo en vez de la señal» – la activación de esta opción hace que el


resultado del procesamiento no sea la señal limpia (útil), sino el ruido que se elimina si
la opción está desactivada. En algunos casos es útil usarla para la apreciación del ruido
contra el cual se lucha.

«Dimensión de cuadro (puntos)» – 16, 32...2048 – determina resolución espectral,


el número de bandas espectrales y la longitud del bloque de datos que se procesa. A
medida que aumenta la dimensión del cuadro, aumenta también y el número de
sonidos diferentes que se mezclan en un cuadro, y las bandas espectrales libres del
habla desaparecen. Para la sustracción espectral se recomienda fijar los valores
128..2048.

El parámetro «Supresión [1-40]» controla el grado de supresión del ruido y


parcialmente de la señal verbal. A medida que aumenta el valor del parámetro el grado
de supresión aumenta tambien.

«Contraste [10-100]» – controla el contraste (ostensión) de traspaso desde la zona


de supresión hasta la zona pasante (ancho de banda) de cada componente espectral de
la señal. Su aumentación provoca el aumento de amplitud de la señal verbal y el
aumento de ostensión de sonido del ruido restante. El valor recomendado es 80.
«Profundidad de supresión, dB» - 1..24 – Determina la supresión máxima (sin
tomar en cuenta la corrección de timbre) de componentes espectrales de la señal
durante el tratamiento (procesamiento). Si el valor del parámetro es demasiado grande,
en la señal de salida aparecerá el ruido «musical». Cuando la supresión es 0 dB la señal
de salida es igual a la señal de entrada (si no está activada la supresión de armónicas).

«Supresión de armónicas» – cuando la opción está activada pasa la supresión


reforzada de armónicas potentes de bandas estrechas.

«Precisión alta» – la activación de esta opción mejora la calidad de funcionamiento


del filtro y aumenta la velocidad de ajuste según el ruido mediante la reducción de la
velocidad del procesamiento aproximadamente dos veces.

«Aplanamiento de espectro» - 0..9 – reduce si es necesario el ruido musical


restante mediante el Aplanamiento del espectro de la señal según la frecuencia.
Provoca alguna reducción de amplitud de la señal útil.

«Aplanamiento según el tiempo» - 0..5 –si es necesario reduce el ruido musical


restante mediante el Aplanamiento del espectro de la señal en el tiempo. Provoca
alguna reducción de la amplitud y los frentes de la señal útil.

83
14.3 Filtración del ruido fijo de banda ancha

14.3.1 Breve descripción del funcionamiento de algoritmos


Los algoritmos ofrecidos de separación de ruidos de bandas anchas están basados
en el empleo de distintas variantes del método de sustracción espectral. El
funcionamiento de este algoritmo se distingue del algoritmo de sustracción adaptiva
de frecuencia, descrita en el p. 14.2, sólo en que el espectro de ruido no se aprecia
adaptivamente, sino se calcula una vez antes del inicio de la filtración. Así el algoritmo
es aplicable sólo para ruidos estándares, pero con esto está libre de ruido de
adaptación.

El usuario debe destacar con marcas temporales la parte de ruido limpio que será
utilizado como patrón.

Si el ruido es fijo o cercano a fijo (ruido de disco, calle, auditorio), tal algoritmo es
a menudo más preferible que el adaptivo. Esto está vinculado con el que la apreciación
adaptiva del ruido de fondo puede ser imprecisa , además, ella misma produce el
ruido. Este ruido que se llama el ruido de adaptación se percibe por el oído del hombre
y empeora la confortabilidad de audición, y en casos difíciles aún la legibilidad de la
señal verbal.

Si se usa el régimen «manual» de determinación del espectro promedio del ruido es


posible cuando el usuario indica al programa la parte que contiene el ruido «con parte
de reserva “sisa”», es decir sin destacar los límites precisos («Determinación
automática de modelo del ruido»).

14.3.2 Recomendaciones de ajuste de parámetros del filtro de ruido fijo de banda


ancha
Al entrar al menú Redución de ruido ->Ruido fijo de banda ancha en la pantalla va
a aparecer el menú estándar del tipo «Fuente-receptor», el trabajo con el cual se
describe en el p. 4.5. Apretando la opsión «OPCIONES», se puede entrar en el menú
«OPCIONES» específico para esta operación y corregir los valores de los parámetros
(Dibujo 38).

Dibujo 38. Menú «OPCIONES» del procedimiento «Ruido fijo de banda ancha»

84
«Variante del método» – permite determinar el método del procedimiento
dependiendo del tipo de la señal:

«Procedimiento mediante un modelo de ruido»,


«Determinación automática del modelo de ruido».
Ambos métodos realizan la limpieza del ruido, pero en el primero, hay que
seleccionar de forma precisa la parte del ruido a través de las marcas temporales y en
el segundo, la parte destacada(seleccionada) puede contener también la señal útil (es
decir se elige «con sisa»).

«Intensidad de supresión» – permite elegir uno de los10 grados de supresión del


ruido (desde el débil, 1 hasta el fuerte, 10). A medida que aumenta el valor de este
parámetro, el grado de supresión de ruido aumenta con monotonía. El parámetro
puede tomar la opsión «Desactivar». La desactivación es necesaria para entrar en el
submenú «Opciones avanzadas». En caso contrario al tratar de entrar en este menú, en
la parte inferior de la pantalla aparecerá el mensaje «Desactive primero las
REGULACIONES ESTANDARES para recibir el acceso a las avanzadas «, y el acceso será
bloqueado.
«Corrección de timbre» – activa/desactiva el filtro de corrección de timbre.

«Frecuencia inferior, Hz» - 100..700 Hz – determina el límite inferior del ancho de


banda del filtro. El valor recomendado - 200 Hz. En el caso de rumor (ruido sordo)
intensivo con frecuencias bajas es útil elevar la frecuencia inferior.

«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
de banda del filtro. El valor recomendado - 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor.

«Amplificación de la Frecuencia Inferior, dB» -24..+24 dB – amplifica la señal de


salida en la zona de frecuencias bajas si hay que dar a la señal un timbre más natural.

« Amplificación de la Frecuencia Superior, dB « -24..+24 dB – amplifica o debilita la


señal de salida en la zona de altas frecuencias. Para obtener más confortabilidad la
zona de frecuencias altas por lo general la suelen debilitar (+10, +20 dB), pero
trabajando con algunas señales, su amplificación ayuda a hacerla más legible.

«Opciones avanzadas – permite llamar el submenú de opciones avanzadas que es


idéntico al menú análogo del procedimiento de filtración «Ruido de banda ancha».

14.4 Interferencias tonales y regulares: filtración adaptiva

14.4.1 Particularidades del método


La filtración adaptativa de la señal según Widrow permite eliminar de la señal tanto
interferencias fijas de banda estrecha, como interferencias que tienen el carácter
regular (sonidos de automóvil pasante o ruido de agua cayente).

85
El régimen de filtración adaptativa unicanal de interferencias trabaja con señales-
mono y está destinado a la supresión de interferencias periódicas y cercanas a ellas
(vibraciones, interferencias producidas por los cables de la red, ruidos de aparatos
domésticos, música lenta, automóvil, etc.). Este régimen se utiliza para
desenmascaramiento de la señal verbal (mediante la supresión de interferencia tonal
de 20..40 dB), y en algunos casos también para supresión del rumor de una sala
grande.

En el régimen hay cuatro realizaciones de algoritmo: espectral, temporal, supresión


de eco y supresión de armónicas.

El método temporal tiene una velocidad de convergencia mucho mayor, pero con la
misma cantidad de coeficientes exige la potencia calculadora mayor.

La principal diferencia de estos métodos de limpieza de ruido con relación a otros


consiste en que para algunas interferencias, la señal verbal se conserva mejor que
durante el uso de otros métodos. Esto se logra gracias a que el filtro está orientado a
la compensación (sustracción) de interferencia y no a la multiplicación de componentes
de interferencias por 0. En este caso, con una adaptación buena no se daña la señal
útil.
Al mismo tiempo la esfera de aplicación del método tiene restricciones. Así con
ayuda de compensación adaptativa de interferencias para la señal mono pueden ser
suprimidas sólo las armónicas con fase relativamente estable. El régimen para la señal
estereofónica es efectivo sólo en los casos cuando la correlación de la interferencia en
el canal principal(básico) y en el de reserva se cambia relativamente lento.

Variante de método «Supresión de eco» está destinada a la debilitación de


reverberaciones y eco.

Variante del método «Supresión de armónicas» tiene alta velocidad de


calculaciones y alta velocidad de ajuste a la composición espectral de interferencia que
se cambia, no obstante junto con las armónicas en las frecuencias correspondientes
suprime también y la señal útil. A diferencia de los regímenes temporal y espectral,
este régimen permite suprimir las interferencias armónicas de origen mecánico.

Los parámetros principales que determinan el grado de supresión del ruido son el
número de los coeficientes del filtro Ni y la detención. Para los régimes mono y estereo
estos parametros son dados de diferente forma.

El tiempo de detención es racional establecer no menos que el valor de N/2. El


aumento del número de coeficientes lleva a la posibilidad de supresión de la mayor
cantidad de picos espectrales de interferencia (en interferencias periódicas los picos de
espectro siguen uno a otro con un intervalo igual a la frecuencia del período principal).
Así para 50 Hz de interferencia es necesario determinar un valor entre 512-2048
coeficientes. Para que el algoritmo no estropee la señal verbal útil, la
detención(retardo) debe ser no menos que 25 mseg. (250 cuentas(lineas, puntos) en la
frecuencia de 10000 Hz).

86
El tiempo de ajuste del filtro se determina por medio del valor del parámetro de la
velocidad. Para las interferencias no fijas la velocidad se determina en el diapasón
16..29, para las interferencias que cambian lentamente – en el diapasón 2..15.

A veces la interferencia periódica se suprime en un grado insuficiente. En este caso


es racional procesar muevamente un archivo anteriormente ya procesado.

Para mejorar la escucha la señal a veces es necesario usar el filtro de corrección de


timbre.

14.4.2 Parámetros de filtración adaptativa de ruidos regulares


Al entrar en el menú Redución de ruido ->Interferencias tonales y regulares en la
pantalla va a aparecer el menú estándar del tipo «Fuente-receptor», trabajo con el cual
se describe en el p. 4.5. Apretando la opsión «OPCIONES», se puede entrar en el menú
«OPCIONES» específico para esta operación y corregir los valores de los parámetros
(Dibujo 39).

Dibujo 39. Menú «OPCIONES» del procedimiento «Interferencias tonales y regulares»


(Parámetro «Dimensión de cuadro (puntos)» en las opciones del filtro)

Los valores de los parámetros se eligen por el usuario de oído. Debajo está descrita
la influencia de cada uno de los parámetros y están indicados los valores
recomendados.

«Dimensión de cuadro (puntos)» –se cambia en los límites comprendidos en el


intervalo 16-2048. Determina el número de bandas espectrales y la longitud del
bloque de datos que se procesa. Los valores recomendados estan comprendidos en el
intervalo 256 .. 2048.

87
«REGULACIONES ESTANDARTIZADAS» – al apretar esta opsión los valores de todos
los parámetros se cambian a los estandartizados y el menú se dibuja de nuevo.

«Variante del método»:

ƒ Espectral,
ƒ De tiempo,
ƒ Supresión de eco,
ƒ Supresión de armónicas.
«Retardo» – se cambia en los límites 0..1024 – Se recomienda establecer un valor
mayor que 250, pero menor que la cantidad de coeficientes (dimensión del cuadro).
Con un retardo menor que 0.02 seg. (200 cuentas(puntos) con la frecuencia de
discretización igual a 10000 Hz) se empeora la calidad de la señal verbal procesada.

«Adaptación (Sí/No)» – activa/desactiva el ajuste de los coeficientes del filtro. Si la


adaptación es desactivada la filtración se realiza con los valores de los coeficientes
iniciales. En el caso que los coeficientes no hayan sido ajustados con anterioridad,
guardados, y además si la adaptación estubiese desactivada, la señal resultante (de
salida) será igual a la de la entrada. Es necesario elegir la parte que no contiene si es
posible la señal útil, activar la adaptación y el régimen «Guardar los coeficientes», y
después de la filtración desactivar la adaptación y procesar toda la señal con los
coeficientes guardados (fijos). Con esto si las características de interferencia son
estables o si su fuente no se mueve en el espacio, la interferencia será eliminada
(debilitada) y el habla será conservada.
«Guardar los coeficientes» - con activar este régimen después de la filtración de
datos se conservan (guardan) los valores de los coeficientes y pueden ser utilizados
para la siguiente filtración con la adaptación desactivada. En caso contrario después
del procesamiento los coeficientes se anularán.

«Salida del segundo canal» – Al ser activada envia al segmento de salida no la señal
útil sino el ruido que se a extraido(limpiado de la señal). Es útil para comprovar si el
algoritmo no a eliminado también la señal útil junto con el ruido.

«Velocidad de adaptación» - 2..30 – Determina el tiempo de ajuste (convergencia)


del filtro a los cambios del espectro de interferencia. La velocidad recomendada esta
en el intervalo (10-15). Para las interferencias que cambian rápidamente esl intervalo
es (20-25). Durante las velocidades altas se empeora la calidad de la señal verbal
procesada.
«Límite de adaptación» – 0..32000 (cuentas “puntos”) – determina la amplitud de la
señal del oscilograma, superación de la cual provoca el ajuste de los coeficientes del
filtro. Asegura la conservación del valor de los coeficientes del filtro durante el
procesamiento de las señales que contengan amplitud pequeña, por ejemplo, en las
pausas de la interferencia.

«Contraste de frecuencias altas» - si es activado realiza la elevación fuerte de las


frecuencias altas, lo que a veces provoca el mejoramiento de la legibilidad.

88
«Corrección del timbre» – activa/desactiva el filtro de corrección del timbre.

«Frecuencia inferior, Hz» - 100..700 Hz – Determina el límite inferior del ancho de


banda del filtro. El valor recomendado es 200 Hz. En el caso de rumor(ruido sordo)
intensivo con frecuencias bajas es útil elevar la frecuencia inferior.

«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
de banda del filtro. El valor recomendado es 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor(cantidad, magnitud).

«Amplificación de la Frecuencia Inferior, dB» -24..+24 dB – amplifica la señal de


salida en la zona de frecuencias bajas si fuese necesario dar a la señal un timbre más
natural.

«Amplificación de la Frecuencia Superior, dB « -24..+24 dB – amplifica o debilita la


señal de salida en la zona de altas frecuencias. Para obtener mayor confortabilidad, la
zona de frecuencias altas la suelen debilitar (+10, +20 dB), pero al trabajar con
algunas señales, su amplificación ayuda a hacerla más legible.

Al establecer los parámetros necesarios apriete el botón «Aceptar». En el menú


estándar que aparece apriete el tipo de fragmento que se procesa y la filtración
empezará. La filtración puede ser interrumpida mediante la presión del botón <ESC>.
En este caso una parte de datos queda sin su procesamiento. Al terminar la filtración el
segmento filtrado será dibujado en la ventana actual(activa) por encima del segmento
que se procesa.

14.5 Filtración de interferencias impulsivas


El algoritmo permite eliminar chasquidos y «arena» de discos viejos, interferencias
impulsivas de radioéter, golpes en los lugares cerrados, etc. Como resultado se reduce
la fatiga durante la escucha y con la eliminación de los chasquidos potentes se mejora
la legibilidad ( porque después del un potente chasquido el hombre durante unas
décimas partes de segundo no percibe el habla que sigue).

La filtración de interferencias impulsivas está basada en la sustitución de partes


impulsivas de la señal por los valores interpolados o alisados (nivelados). La señal en
las partes donde los impulsos no han sido encontrados no se altera. La condición para
la efectividad de la filtración es la elección correcta de los parámetros de
procesamiento.

Para realizar la filtración hay que entrar en el menú Redución de ruido (Filtración) -
>Filtración de las interferencias IMPULSIVAS. En la pantalla va a aparecer el menú
estándar, el trabajo con la ventana se describe en el p. 4.5.

Para cambiar los ajustes de la filtración entre en el menú «OPCIONES» (Dibujo 40).

89
Dibujo 40. Menú «OPCIONES» de procedimiento
«Filtración de interferencias IMPULSIVAS»

En el menú «OPCIONES» de filtración de interferencias de impulso hay las


siguientes regulaciones:

«REGULACIONES ESTANDARES» – al apretar esta opción a todos los parámetros se


les atribuyen los valores establecidos automaticamente.

«Anchura del impulso [1-5]» – se encarga de encontrar y de localizar impulsos, en


dependencia de su duración. Se determina en unidades convencionales. Con la
reducción del parámetro se detectan mejor los impulsos más cortos y débiles, los
largos se detectan peor. Con el aumento– al revés. el valor automático en el sistema es
3.
«Límite de detectación[1-10]» - responde por la revelación y localización de los
impulsos, en dependencia de su energía. El valor que se determina en las unidades
convencionales sin otras órdenes(en automático) es igual a 6. Al disminuir el
parámetro la detectación de los impulsos más débiles es, pero se puede deteriorar la
señal útil. El habla humana también tiene la naturaleza impulsiva y así se puede
comenzar a suprimir durante un valor pequeño del parámetro.Al tener valores grandes
los impulsos débiles van a ignorarse.

«Contraste [-9,9]» – De igual manera que el límite de detección, responde por la


detectación y localización de impulsos, en dependencia de su energía. El valor que se
determina en las unidades convencionales en automático es igual a 0. El aumento del
contraste provoca la detección de la mayor cantidad de impulsos. El contraste extiende
la escala de energía de impulsos y así influye a la apreciación de anchura del impulso.

«Velocidad de Procesamiento [1,2,4]» – determina el compromiso entre la velocidad


y la calidad del procesamiento. Al tener un intervalo de desplazamiento grande la
velocidad proporcionalmente aumenta debido a una pérdida de calidad. En automático
es igual a 1.

«Variante del método» – permite elegir uno de los tres métodos del procesamiento
de la señal:

90
ƒ «Interpolación de impulsos» – en la zona de detectación de los impulsos
la señal se restablece mediante la interpolación.
ƒ «Aplanamiento(nivelación) de impulsos» – los impulsos detectados se
alisan. Es efectivo sólo cuando no se procede la interpolación de
impulsos.
ƒ «Detector de impulsos» – sirve no para obtener la señal limpia sino para
la apreciación de los parámetros de filtración. En la salida da la función
de detectación la cual es igual a 32000 en todas partes donde no se ha
encontrado el impulso y igual a 0 en todas las partes donde el impulso se
encuentra con probabilidad 1.
Para ejecutar el proceso de filtración hay que apretar la opción que corresponde al
tipo de fragmento para procesar. El fragmento filtrado va a ser colocado o en la
ventana-receptor o si no hay receptor – en la ventana actual(activa) por encima del
fragmento que se procesa.

Además el usuario siempre puede corregir los impulsos aislados manualmente,


utilizando la redacción de la señal por puntos, descrita en p. 10.6.

14.6 Filtración dinámica


Los métodos de filtración dinámica están destinados para aumentar la legibilidad
en las condiciones de grandes saltos de nivel de señal, presencia de golpes (impulsos
de duración grande).

Para realizar la filtración dinámica hay que entrar en el menú Filtración -


>Igualización dinámica del nivel. En la pantalla va a aparecer el menú estándar del tipo
«Fuente-receptor», trabajo con el cual se describe en el p. 4.5.

Apretando el área «OPCIONES», el usuario puede elegir uno de los cuatro métodos
siguientes:

ƒ «Regulación Automática de la amplificación»


ƒ «Compresor»
ƒ «Limitador»
ƒ «Eliminación del ruido en las pausas»
Los dos primeros métodos aprietan el diapasón dinámico de la señal, lo que
debilita las interferencias impulsivas e igualiza los niveles para locutores que hablan
con intensidad diferente. « Regulación Automática de la Amplificación» y «Compresor»
ejecutan una función pero de maneras distintas.

«Limitador» está destinado a debilitar tanto impulsos potentes con larga duración y
como el ruido débil de fondo.

«Eliminación de ruido en pausas» – el método está destinado a suprimir el ruido de


fondo en las pausas.

91
Después de la elección de cualquiera de estas variantes en la pantalla va a aparecer
la ventana común para todos los métodos –determinación del límite – nivel en caso de
desbiación del límite por parte de la amplitud promedio empezará el procesamiento de
la señal.

Para los métodos « Regulación Automática de la amplificación «, «Compresor» y


«Limitador» la señal que estese sobre el límite será debilitada. Para el método
«Eliminación del ruido en las pausas» la señal que estese debajo del límite será
debilitada. En automático el límite es igual a 2000.

14.7 Filtración de las interferencias estéreo


Dicha operación procesa según el método de Widrow la señal estéreo, en un canal
de la cual se contiene la señal con ruido y otro en el cual – ruido sin señal. El ruido en
ambos canales debe ser correlado. El canal 'señal+ruido' debe ser dibujado con el
color más claro (canal izquierdo).

Si se suprime el ruido de una fuente inmóvil, la señal y el ruido pueden encontrarse


en ambos canales, pero debe estar presente la parte donde ambos canales no
contienen la señal útil (sino sólo el ruido de la fuente que se suprime). La efectividad
de supresión con una acústica normal en este caso se comprende en el intervalo 12-25
dB.

14.7.1 Menú de opciones del filtro adaptativo para las interferencias estéreo
Al entrar en el menú Filtración ->Interferencias estéreo en la pantalla va a aparecer
el menú estándar del tipo «Fuente-receptor», trabajo con el cual se describe en el p.
4.5. Los parámetros del método como siempre están descritos en el menú «OPCIONES»
(Dibujo 41).

Dibujo 41. Menú «OPCIONES» de procesos


«Compensación de la interferencia estéreo»

92
El menú contiene las siguientes opciones:

«REGULACIONES ESTANDARES» – al apretar esta opción los valores de todos los


parámetros se cambian a los estándares y el menú se dibuja de nuevo.

«Dimensión del cuadro (puntos)» –-[16-2048] – determina el número de


coeficientes del filtro. Teoréticamente el número necesario de coeficientes de filtro
debe corresponder al tiempo de reverberación en la habitación (lugar cerrado), donde
la grabación se ha hecho. Realmente el aumento de la dimensión del cuadro disminuye
significativamente la velocidad de procesamiento y no siempre es efectiva porque la
interferencia eliminada antes de la grabación está sometida a las alteraciones no
lineales.

«Adaptación (Sí/No)» – permite previamente ajustar los coeficientes del filtro,


después desactivar la adaptación y procesar la señal utilizando los parámetros fijados
del filtro. Suele utilizarse para la supresión de las fuentes inmóviles del sonido cuando
el sistema se ajusta a la fuente en la pausa del habla y después la exprime (extrae) de
toda la señal.

«Guardar coeficientes» - permite realizar la adaptación previa de los coeficientes


para después usarlos desde el primer instante de la grabación.
«Salida del segundo canal» – si el banderín está colocado, en la salida del filtro
aparecerá la señal filtrada, caso contrario- la diferencia entre la señal de entrada y la
filtrada.
«Retardo (cuentas)» –establece el valor de desplazamiento de la señal de entrada
con respecto al ruido de entrada (canal izquierdo con respecto al derecho). Para la
señal estéreo acústica el valor del retardo debe ser igual a 0.
«Variante del método» – permite elegir uno de los siguientes métodos de
procesamiento:

Espectral – la búsqueda y supresión de interferencia se realiza en el proceso de


comparación de los espectros de las señales .
De tiempo – la búsqueda y supresión de interferencia se realiza en el proceso de
comparación de las señales originales. El método temporal (de tiempo) tiene la
velocidad más alta de convergencia pero con la misma cantidad de coeficientes
exige más potencia calculadora.
Determinación del retardo – no procesa la señal sino aprecia y expone el valor
del parámetro «Retardo (cuentas)».
Espacial – permite sacar la señal útil si entra en ambos canales cofásicamente.
Eso sucede cuando el locutor se ubica simétricamente respecto a ambos
micrófonos (retardo - 0). La posición asimétrica puede ser tomada en
consideración mediante la introducción del retardo diferente de cero.

93
«Velocidad de adaptación» - [2-30]– determina la velocidad de adaptación. Con el
valor demasiado grande de este coeficiente el filtro sale fuera de los límites de
estabilidad. Con el valor demasiado pequeño el filtro va a suprimir las interferencias
mal.

«Límite de adaptación [0-32000]» –– determina la amplitud de la señal del


oscilograma (en cuentas), superación de la cual provoca el ajuste de coeficientes de
filtro. Asegura la conservación del valor de los coeficientes del filtro durante el
procedimiento de las señales de la amplitud pequeña, por ejemplo, en las pausas de la
interferencia.

«Corrección del timbre» – activa/desactiva el filtro de corrección del timbre.

«Frecuencia inferior, Hz» - 100..700 Hz – determina el límite inferior del ancho de


banda del filtro. El valor recomendado - 200 Hz. En el caso de rumor(ruido sordo)
intensivo con frecuencias bajas es útil elevar la frecuencia inferior.

«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
de banda del filtro. El valor recomendado - 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor.

«Amplificación de la Frecuencia Inferior, dB» -24..+24 dB – amplifica la señal de


salida en la zona de las frecuencias bajas si hay que proporcionar a la señal un timbre
más natural.

«Amplificación de la Frecuencia Superior, dB « -24..+24 dB – amplifica o debilita la


señal de salida en la zona de las frecuencias altas. Para obtener más confortabilidad la
zona de las frecuencias altas la suelen debilitar (+10, +20 dB), pero al trabajar con
algunas señales, su amplificación ayuda a hacerla más legible.

«Aceptar» – Permite la ejecución de la filtración adaptiva.

«Cancelar» – cancela la operación.

14.7.2 Recomendaciones sobre el uso de la filtración de las interferencias estéreo


Para procesar el segmento estereofónico que contiene la señal y el ruido, activo la
ventana en la que se encuentra el segmento necesario. Después entrando al menú
«OPCIONES» determine los parámetros de filtración (mire p.14.7.1). Al determinar los
parámetros necesarios apriete el botón «Aceptar».

Al regresar al menú «Fuente-receptor» elija el tipo de fragmento para procesar. Si


las interferencias son fijas durante todo el fonograma es recomendable indicar «Todos
los datos». Después de esto va a empezar la filtración adaptativa del fragmento
elegido del fonograma. La filtración puede ser interrumpida mediante el apretamiento
del botón <ESC>.

La supresión del sonido desde la fuente inmóvil suele realizarse en dos etapas.
Primero se activan los regímenes «Adaptación» y «Guardar coeficientes» y se procesa la
parte de la señal que principalmente contiene el ruido de la fuente fija,
obligatoriamente sin la señal útil. Después se elimina el banderín «Adaptación» y se
procesa toda la señal.
94
14.8 Filtración de la señal con la ayuda de los módulos conectados de
DirectX

14.8.1 Módulo Sound Сleaner


En el programa SIS hay la posibilidad de utilizar el módulo de procesamiento de la
señal Sound Сleaner. Esta posibilidad se realiza sólo en el caso de que en el ordenador
del usuario ya esté instalado el programa informático Sound Cleaner (es deseable que
no sea menor que 6.3) y DirectX (no menor que 9.0).

Antes de ejecutar el módulo desde el programa SIS se recomienda ejecutarlo fuera


y ponerlo en el régimen DX-plug-in.

La ejecución del módulo se realiza con apretar el botón en el panel de


herramientas de la ventana principal. Entonces en la pantalla va a aparecer el menú
que contenga tres puntos:

«Ajuste». Esta opción está destinada para el ajuste de parámetros del filtro del
módulo Sound Cleaner para el procesamiento de la señal actual. Con esto los datos
pasan del programa SIS a Sound Cleaner, se procesan allí y de nuevo pasan a SIS para
la reproducción. Al elegir este punto el usuario entra en Sound Сleaner y puede con
ayuda de los medios accesibles y audiocontrol constante ajustar el filtro de
purificación del ruido. Al lograr un resultado satisfactorio (lo que se verifica durante la
escucha), hay que regresar al programa SIS, apretar el botón <ESC> y elegir el punto
siguiente.

«Procesamiento». Al elegir este punto en la pantalla va a aparecer el menú estándar


del tipo «Fuente-receptor», trabajo con el cual se describe en el p. 4.5. Apretando el
punto «OPCIONES», se ejecuta la ventana de diálogo de la elección de los regímenes
del procesamiento que contiene los siguientes puntos:

ƒ Procesamiento sin sonido(audio)


ƒ En el régimen de redacción
Si está marcado el punto “Procesamiento sin sonido”, la filtración de la señal va a
realizarse sin reproducción simultánea lo que aumentará significadamente la velocidad
de procesamiento.
Si está marcado el punto “En el régimen de redacción”, la señal original va a
reemplazarse durante el proceso por el resultado de la filtración.

Correspondientemente, si estas opciones no están activadas, los datos se procesan


en Sound Cleaner en el tiempo real, después pasan a SIS y se graban como un
segmento nuevo.

«Un consejo de amigo». Saldrá el siguiente mensaje: « Le recomendamos a Usted


cargar (ejecutar) Sound Cleaner previamente y ponerlo en el régimen DX-plug-in.
Usted debe tener Direct X 9 o más (mira el disco distributivo, directx9.0
(dxsetup.exe))»

95
Al cargar Sound Cleaner previamente permitirá excluir intermitencias posibles al
ejecutar Sound Cleaner durante el trabajo en el programa de SIS.

Hay que tener en cuenta que Sound Сleaner de la versión 6.02 y menos no podrá
procesar señales de 24bits, por eso se recomienda instalar la versión 6.03.

El trabajo con los filtros del programa Sound Cleaner está descrito en el manual del
mismo “Sound Cleaner”.

14.8.2 Otros módulos de DirectX


El programa permite trabajar con cualquiera de los módulos de DirectX, instalado
en el sistema. La llamada (ejecución) de filtros exteriores se realiza apretando el botón

en el panel de herramientas. Va a abrirse la ventana del tipo mostrado en el


dibujo 42.

Dibujo 42. Ventana de filtros exteriores

La ventana contiene el panel de herramientas y la lista de los filtros.

Botón Función
Ajuste. Permite escuchar la señal después del procesamiento sin
conservarla.
Procesamiento. Procesa la señal y la conserva (guarda) en la ventana
de SIS.
Stop. Para la escucha o el procesamiento.

Agregar. Permite agregar los filtros a la lista.

Sin sonido. El procesamiento de la señal sin reproducción.


Redacción de la original. Después del procesamiento, la señal original
será reemplazada por la procesada en la ventana de la señal.
La agregación del filtro a la lista se realiza apretando el botón en el panel de
herramientas. En el menú que aparece hay que elegir el filtro necesario. Para incluir el
filtro en el procesamiento hay que cerca de su nombre en la lista poner un signo V. Los
filtros no marcados con el signo V no participan en el procesamiento.

96
Los filtros durante el procesamiento van a ser utilizados en el mismo orden que
estan en la lista.

La ventana de ajuste de parámetros de filtro se ejecuta mediante un doble clic del


ratón en el nombre del filtro.

Para eliminar el filtro de la lista hay que elegir su nombre en la lista con el botón
izquierdo del ratón y manteniéndolo apretar el botón <Delete> en el teclado.

El trabajo con los filtros del DirectX es posible en dos regímenes: el régimen de
ajuste y el régimen de procesamiento.
El régimen de ajuste está destinado a la escucha previa de la señal procesada y
audiocontrol de los parámetros del procesamiento. Al apretar el botón «Ajuste» se
se ejecuta el procesamiento de la señal obtenida del programa SIS y la reproducción de
la señal procesada. en este caso no se guarda el resultado de filtración en la ventana
de SIS. Al lograr el resultado satisfactorio se puede pasar al régimen de procesamiento.

El régimen de procesamiento se ejecuta apretando el botón «Procesamiento»


en el panel de herramientas. Con esto va a empezar la filtración de la señal obtenida
del programa SIS,el traslado de la señal procesada al SIS y la grabación de la señal
obtenida como un segmento nuevo.
Si está apretado el botón «Sin sonido», la filtración de la señal va a realizarse
sin la reproducción simultánea, lo que va a aumentar la velocidad del procesamiento
considerablemente.
Si está apretado el botón «Redacción de la original», la señal original va a
reemplazarse en el (procesamiento) por el resultado de la filtración.

14.9 Ecualizador paramétrico


La función de este proceso es la presentación y la corrección del espectro de la
señal acústica y se logra principalmente con ayuda de la filtración inversa y el
contraste del filtro. Además de los regímenes de funcionamiento semiautomático y
automático es posible usar el ajuste manual de los canales del filtro para el
procesamiento más delicado de la señal. El Ecualizador paramétrico se usa para
suprimir en la señal acústica los componentes fijos que se ubican de manera libre,
asimismo que para otros casos de debilitamiento o amplificación de la amplitud en
bandas espectrales separadas. Los ejemplos de tales señales pueden ser fonogramas
que contienen interferencias fijas, tales como interferencias de la red, ruidos de
mecanismos, motores, etc.

Para ejecutar el ecualizador en el menú Filtración hay que elegir el punto


ecualizador: Crear.

En la línea del título de la ventana a la derecha de la palabra Ecualizador está


indicada la longitud de la ventana de FFT (transformación rápida de Furier). Cuanto
mayor es este número, tanto más bandas y tanto más precisión tiene el filtro. El
número de bandas se elige en la ventana de diálogo Opciones complementarias (mire
abajo).

97
Para asegurar la mayor precisión del filtro hay que determinar el mayor número de
bandas posible, pero recordando que con la aumentación de este número se aumenta
proporcionalmente la carga al sistema. La cantidad de bandas del ecualizador está
vinculada duramente con la longitud de la ventana de FFt: su valor es siempre cuatro
veces mayor que el número establecido de bandas.

14.9.1 Órganos de mando del ecualizador


En el Dibujo 43 se indica la vista de la ventana del ecualizador.

Dibujo 43. Ventana estándar del ecualizador

Directamente debajo del título de la ventana se ubica el panel de herramientas.


Abajo – la zona rectangular es para la representación del espectro actual de la señal
(color amarillo) y filtro (verde) con el indicador de cinta de escala horizontal. Sobre la
ventana de la representación del espectro están ubicados dos marcadores rojos de
frontera inferior (izquierda) y superior (derecha) del ancho de banda de la señal. En la
mitad baja están ubicados las barras deslizantes del ajuste de bandas del filtro. En la
parte inferior de la ventana está situado el indicador de herramienta Goma y barras
deslizantes de Regulación adicional de las característica de la frecuencias.

14.9.2 Panel de herramientas del ecualizador


En el panel de herramientas están presentados los órganos principales de control
del procedimiento:

98
Resolución máxima del eje Х – determina tal escala de la imagen por el eje
horizontal con que cada barra deslizante de regulación de la característica de la
frecuencia coincide con una banda del filtro.

Aumentar la escala por el eje Х – cada vez que apriete aumentará la escala por el
eje X dos veces.

Reducir la escala por el eje Х – cada vez que apriete reducirá la escala por el eje X
dos veces.

Mostrar todo el diapasón por el eje Х – determina tal escala de imagen por el eje
horizontal con que se representa el espectro de la señal en el rango de 0 Hz hasta la
mitad de la frecuencia de discretización.

Anular el filtro – establece todas las barras deslizantes de regulación de la


característica de la frecuencia en cero, anulando de tal modo todos los ajustes del
filtro.

Autoescalización por el eje Y – cambia las fronteras de zona visible por el eje Y
conforme al valor actual mínimo y máximo del espectro de la señal.

Cortar – permite aumentar la zona rectangular de la ventana del espectro. al


apretar este botón coloque el cursor del ratón en el ángulo superior izquierdo de la
zona para destacar y manteniendo apretado el botón izquierdo del ratón desplace el
cursor al ángulo inferior derecho. Durante el desplazamiento del ratón las fronteras se
trazan con lineas punteadas. Suelte el botón izquierdo del ratón. Las fronteras de
visibilidad por los ejes serán establecidas para representar la zona determinada.

dB/lineal – cambia la gradación del eje Y a la escala lineal o logarítmica. Si el botón


está apretado se usa la escala logarítmica, y si está desactivado – lineal.

Acumulación del espectro Activada/Desactivada - activa/desactiva el régimen de


acumulación del espectro. Mientras el botón está apretado pasa la acumulación de la
señal y la calculación del espectro promedio. Si el botón no está apretado, el régimen
de acumulación de espectro promedio se desactiva y se dibuja el espectro actual de la
señal.

Construir el filtro – calcula el filtro inverso o anti-armónico (según la elección del


usuario) en la base del espectro representado (promedio o instantáneo, si el régimen
de acumulación del espectro está desactivado). Cuando el botón está apretado el
régimen de acumulación del espectro promedio se desactiva. El filtro se calcula en los
limites que se determinan por la posición de los marcadores del ancho de banda.

Contrastar el filtro– profundiza los picos negativos. Más detalladamente sobre el


contraste mire en el artículo “Opciones complementarias”.

99
Atención!

Si Usted ha activado contraste en la ventana “Opciones Complementarias”, eso va a


ejecutarse automáticamente durante la construcción del filtro inverso y la filtración
automática. En este caso al apretar en este botón se provocará el contraste
complementario.

Filtración automática– activa automática y consecutivamente el régimen de


acumulación del espectro y la calculación del espectro inverso o anti-armónico (según
la elección del usuario). El tiempo de acumulación del espectro durante la filtración
automática se determina en la ventana “Opciones complementarias”.

Opciones – activa la ventana Opciones complementarias.

Guardar las regulaciones – permite guardar las regulaciones del ecualizador en el


archivo con extensión .eq_cfg.

Cargar las regulaciones – permite cargar las regulaciones del ecualizador


guardadas anteriormente desde el archivo con la extensión .eq_cfg.

Indicación de relleno – informa sobre el relleno de la red de bits en la salida del


ecualizador como resultado de demasiada amplificación de la señal. Cuando aparece el
relleno, el botón pasa al estado activo: el círculo se hace rojo. En este caso al apretar
este botón se pone en estado pasivo hasta el siguiente relleno.

14.9.3 Ventana de diálogo «Opciones complementarias»


La ventana de diálogo Opciones complementarias se activa con apretar el botón
Opciones en el panel de herramientas del Ecualizador (Dibujo 44).

Dibujo 44. Opciones complementarias del procedimiento « ecualizador».

100
En esta ventana se puede elegir de la lista el número de bandas del ecualizador. En
general cuanto mayor es este número tanto más preciso será el funcionamiento del
filtro, pero entonces va a aumentarse la carga al sistema. El número de bandas
máximo posible es de 4096.

En el centro de la ventana en un cuadro están ubicadas las opciones de contraste


del filtro. Aquí como contraste se comprende la revelación automática, extensión y
profundización de caídas estrechas en la característica del filtro. Esta operación a
menudo permite elevar la calidad de la filtración, sobre todo en los casos cuando en la
señal se distinguen los picos de las interferencias locales muy expresados. Se puede
activar el contraste durante la construcción del filtro inverso y la filtración automática
colocando en la parte baja de la ventana Opciones complementarias el banderín
Contraste de filtro. Las opciones dan la posibilidad de realizar el ajuste más delicado
del contraste.

ƒ El valor de la casilla Nivel de discriminación (relación “razón” el valor del


filtro en la caída y el valor en un lado) se usa por el programa para
determinar las caídas, destinadas para el contraste. El valor 1 significa
que van a contrastarse todos los mínimos locales, 0 – el filtro no se
cambiará. Con valores cercanos a 0,5, va a quedarse poca acantilación
natural y los mínimos expresados van a contrastarse.
ƒ La casilla Anchura de la ventana de análisis determina la anchura máxima
de la caída que va a considerarse «estrecha» y por eso va a contrastarse.
Sin otras órdenes (en automático) este parámetro es igual a 70 Hz.
ƒ El banderín Intensidad alta permite anchar las caídas durante el contraste.
Además del banderín ya descrito Contraste del filtro en la parte baja de la ventana
se ubica la casilla Tiempo de acumulación, que determina en segundos el tiempo de
acumulación usado para la calculación del espectro promedio de la señal durante la
filtración automática; asimismo que el banderín Dibujo de diagramas, que permite
desactivar la representación gráfica de la señal para economizar los recursos en los
ordenadores(computadores) de poco rendimiento.

El botón Instalar cierra la ventana junto con la grabación de todos los cambios
hechos; para salir sin guardar use el botón Cancelar.

14.9.4 Cambio de la escala de la imagen


Para ajustar la escala se puede usar los botones del panel de herramientas (mire el
artículo Panel de herramientas del ecualizador), asimismo que con los botones «< >«
e indicador de cinta de la escala horizontal que se ubica debajo de la zona de la
imagen del espectro de la señal. En el indicador con el color azul está dibujada la zona
del espectro por el eje X. Si todo el indicador es de color azul significará que en la
ventana está representada todo el espectro, lo que corresponde al apretar el botón
.

101
La colocación de fronteras (limites) de la zona del espectro representada por el eje
X se realiza con el clic de botones izquierdo y derecho del ratón por los puntos
correspondientes del indicador. Los botones «< >« a la izquierda de la escala sirven
para desplazar la zona representada a la izquierda/a la derecha. Lo mismo se puede
hacer con las teclas de control del cursor, colocando previamente el foco de la
introducción en la escala. Al apretar una vez el botón se desplaza la zona de la imagen
a 1/16 de anchura de la ventana del ecualizador.

14.9.5 Regulación de la característica de la frecuencia del filtro


En la ventana del ecualizador se ubican 16 barras deslizantes de regulación de la
característica de la frecuencia del filtro. Sobre cada barra hay un indicador digital (dB)
del grado de amplificación/reducción de la señal en la banda. A la izquierda de barras
están indicados los posibles valores de amplificación /reducción de la señal (+20/-72
dB), que corresponden a las posiciones superior e inferior de la barra deslizante,
asimismo que el número de bandas espectrales, que corresponde a una barra
deslizante con la escala horizontal actual. Después del cambio de la escala de la
imagen por el eje Х este valor se cambia, logrando “1” con resolución máxima.

14.9.6 Régimen «Goma»


El régimen «Goma» permite controlar simultáneamente varias barras deslizantes
vinculadas según la ley lineal. Así se asegura la regulación suave de la característica de
la frecuencia de la señal aún después del cambio de posición de una barra deslizante.
La unión de varias barras se realiza con clicks de los botones izquierdo y derecho
del ratón sobre el indicador de cinta que se ubica debajo de la escala de las barras
deslizantes. Las barras unidas con la goma se marcan en el indicador con el color azul.
Preste atención que con la goma se unen las barras deslizantes y no las bandas del
filtro que se regulan. Por eso después del cambio de la escala horizontal de la imagen
del espectro de la señal las barras deslizantes unidas con la goma van a regularlo ya
en otras bandas.

A la izquierda del indicador de cinta del régimen de goma está el botón х,


mediante la cual se activa/desactiva el régimen de alinealización (Aplanamiento).
Cuando está activado, el grafico del filtro construido con la ayuda de «goma» será
alisado y será representado como línea suave y no escalonada (si este régimen está
desactivado).

14.9.7 Regulación adicional de la característica de frecuencia


En la parte inferior de la ventana del ecualizador están las barras deslizantes Q1 y
Q2, que se usan para la regulación adicional de la característica de frecuencia. Los
cambios introducidos con su ayuda se sobreponen a la característica de la frecuencia
del filtro, que se determina con las barras deslizantes principales. Los parámetros Q1 y
Q2 crean un filtro formador destinado para dar al habla un sonido más natural y
asegurar el sonido de la señal más confortable para la percepción.

102
El valor Q1 determina «el relieve» de la característica de la frecuencia en el rango
de frecuencias de 100-800 Hz. Q2 regula ascenso/caída de la característica de la
frecuencia a cada 1000 Hz, empezando por la frecuencia 1000 Hz. Los cambios de
ambas regulaciones son posibles en el diapasón desde –18 hasta +18 dB. El valor
actual de cada barra deslizante está indicado a la izquierda de ella.

14.9.8 Regímenes de trabajo del ecualizador


Para empezar la filtración con el ecualizador hay que en el menú Filtración elegir
ecualizador: Filtración. Va a abrirse el menú estándar del tipo «Fuente-receptor». Aquí
para ajustar los regímenes del trabajo del ecualizador hay que apretar el botón
«OPCIONES» para activar la ventana de opciones del ecualizador (mire Figura 45).

Dibujo 45. Ventana de Opciones del ecualizador

Si está activada la opción «Sonido», simultáneamente con la filtración va a pasar la


reproducción de la señal. Este régimen da la posibilidad de audiocontrol de parámetros
de filtración.

Si la opción «Sonido» está desactivada la filtración va a pasar sin reproducción, lo


que aumenta la velocidad del procesamiento considerablemente.

El punto «Guardar en un segmento» permite elegir el régimen de trabajo del


ecualizador:

El régimen de ajuste del filtro – el punto «Guardar en un segmento» no está


elegido. En este régimen el resultado de filtración no se guarda en la ventana del
sistema SIS. El régimen de ajuste se usa para controlar y corregir los parámetros de la
filtración (si está activada la reproducción) o para la acumulación del espectro
promedio (si la reproducción está desactivada).

El régimen del procesamiento – el punto «Guardar en un segmento» está elegido.


En este régimen el resultado de filtración se conserva en la ventana del sistema SIS. Sin
otras órdenes (en automático) la señal filtrada se conserva en la misma ventana que la
original. La elección de otra ventana o la creación de la nueva se realiza de manera
habitual en el menú «Fuente/receptor».

103
14.9.9 La filtración de la señal estéreo
Como en los canales izquierdo y derecho de la señal estéreo pueden estar
interferencias diferentes, durante el procesamiento de la señal estéreo se recomienda
la siguiente sucesión de acciones:

1. Ajustar el filtro para el canal izquierdo.


2. Procesar el canal izquierdo eligiendo en la ventana de las opciones del ecualizador
Opciones de la señal estéreo: Canal izquierdo.
3. Ajustar el filtro para el canal derecho.
4. Procesar el canal derecho eligiendo en la ventana de las opciones del ecualizador
Opciones de la señal estéreo: Canal derecho.
Si no hay necesidad de ajustar los filtros para cada canal por separado, después del
ajuste del filtro del canal izquierdo se puede procesar ambos canales a la vez. Para
esto en la ventana de opciones del ecualizador hay que elegir Opciones de la señal
estéreo: Ambos canales. En este caso los canales van a procesarse consecutivamente y
sin la reproducción del sonido.

Nota
Después del intento de elegir en la ventana de opciones del ecualizador
simultáneamente Sonido y Opciones de la señal estéreo: Ambos canales el sistema
dará el aviso sobre el error.

104
15 ANÁLISIS DE LAS SEÑALES DE VOZ
Para efectúar el análisis de las señales de voz en el menú principal está previsto el
punto Análisis. Al entrar en este menú se abre la lista contenedora de las
posibilidades del análisis de la señal, accesibles al usuario, es decir:

ƒ Espectrograma,
ƒ El kepstrum,
ƒ Autocorrelación,
ƒ Respuesta de frecuencia LPC,
ƒ Obtención del promedio,
ƒ El tono principal (LLK),
ƒ El tono principal (Espectro),
ƒ Análisis de formantes,
ƒ Energía (Declinación Cuadrática Promedio.),
ƒ FFT espectro promedio de potencia,
ƒ Histograma,
ƒ Parámetros del histograma.
Eligiendo el punto Otras funciones..., usuario puede efectuar también los
siguientes tipos de análisis:

ƒ Coeficientes del pronóstico lineal,


ƒ Correlación particular,
ƒ Frecuencia del cruce del cero,
ƒ FFT espectro de potencia,
ƒ EdiTracker,
ƒ Comparación de hablantes.
Para calcular alguna característica hay que entrar en el campo correspondiente. Al
hacer esto aparecerá en la pantalla el menú estandartizado tipo «Fuente - receptor»
con el nombre de la característica elegida. La descripción de como usar este menú
está presentada en p. 4.5.

Para visualización de las características tridimensionales antes especificadas se


emplean las imágenes tridimensionales (tiempo, frecuencia, intensidad). El eje de la
tercera dimensión es perpendicular con respecto al plano de la pantalla, por lo tanto
los datos tridimensionales se expresan de alguna manera especial, por ejemplo, por la
desviación a la derecha, por los matices de gris, axonometría, etc.

105
15.1 Recepción de las imágenes tridimensionales de los macizos de los
espectrogramas, kepstrogramas, de los coeficientes de correlación
automática, correlación particular, de los coeficientes de
pronosticación lineal y de la respuesta de frecuencia del transmisor
LPC
Para obtener una imagen tridimensional de una de las características indicadas
entre en el punto Análisis del menú principal, elija la característica necesaria, entre en
el punto «Opciónes» del menú estándar y introduzca los parámetros que se necesitan
para la calculación.

La demostración de la tercera dimensión de los datos tridimensionales se puede


realizar de diversas maneras, es decir: por la desviación a la derecha, desviación hacia
arriba, por axonometría, color, por la escala de grises.

Los dos primeros métodos de representación de datos tridimensionales (por la


desviación a la derecha o desviación hacia arriba) producen imágenes semejantes. La
elección por parte del usuario de uno u otro tipo depende de su intuición geométrica.

El tipo de representación por axonometría se distingue de los primeros dos


métodos por lo que al representar los espectros se introduce la tercera coordenada,
según la cual se traza la intensidad.

La ventaja que mustran los tres tipos de representación descritos con respecto a
los tipos de representación por color y a la escala del gris consiste en que estos tipos
muestran un rango mucho más ancho y dinámico. El rango dinamico durante la
representación por color y por la intensidad se encuentra limitado por la capacidad del
display para mostrar algo, y por la capacidad que tiene el usuario para distinguir los
matices de colores o el grado de ennegrecimiento.
La elección del tipo de representación depende del objetivo planteado por el
usuario.

Se puede elegir tipo de representación de los datos tridimensionales al entrar en la


opción «Tipo de representación» en el menú «Opciónes» del tipo del análisis
correspondiente. En la pantalla aparecerá un menú complementario, en la cual estan
enumerados todos los métodos antedichos de representación de los datos. Al colocar
el cursor sobre la línea que comprende el tipo de representación elegido, hay que
apretar el botón del ratón o la tecla «Enter». El resultado de la elección será
presentado en el menú «OPCIÓNES» en la línea «Tipo de representación». Además, se
puede utilizar el punto «Tipo de representación» del menú contextual de la ventana y
elegir el tipo de representación deseable de los datos en la lista que se abre.

15.1.1 Manejo de la escala de la tercera dimensión en el box


El mínimo en el box por la tercera dimensión es siempre igual a 0. Por eso la
imagen de la tercera dimensión siempre está determinado por un coeficiente de escala,
por el cual se multiplican los datos antes de la representación.

106
Mientras más es este coeficiente, más se puede apreciar las particularidades
débiles de la señal en la imagen. Hay dos modos de cambiar este coeficiente:

1) Entrar en el menú Demostración-> Representar los datos tridimensionales y


corregir el valor del coeficiente en la opción «Multiplicador para la tercera dimensión:».
Al entrar en este menú el valor del coeficiente será el mismo que fue utilizado en la
ultima representación en la presente ventana. Al salir la ventana presente será
redibujada. Si en la ventana presente (activa) no hay datos tridimensionales, no se
logrará entrar en el menú indicado – en la línea de mensajes aparecerá el texto «La
ventana-recipiente no tiene el tipo correspondiente».

2) Utilizar el botón de control de la escala de la tercera dimención y el ratón. El


botón de control de la escala de la tercera dimensión se encuentra a la derecha del box
de datos debajo del botón-donador de cursores. Con la ayuda de este botón se puede
tanto aumentar como disminuir el multiplicador de escala. Al apretar con el ratón
sobre este botón, un poco a la izquierda de ella, aparecerá una barra tetraédrica
estrechándose hacía abajo, la parte inferior de la cual está pintada de color negro. El
cursor del «ratón» estará contenido en esta barra.

Si aprieta <ESC>, la escala no cambiará y la barra desaparecerá.


Si aprieta con el ratón en el límite entre el área negro y gris, la escala no cambiará.

Si al momento de apretar el cursor del ratón estubiese debajo del límite de los
colores, el multiplicador de escala se disminuirá tantas veces, cuanto menos es la
distancia entre el borde inferior del área negra y el cursor de toda la longitud del área
negra.

Si al momento de apretar el cursor del ratón estubiese por encima del límite de los
colores, entonces el multiplicador de escala se aumentará tantas veces, cuanto más es
la distancia entre el borde inferior de la área negra y el cursor de toda la longitud de la
área negra. De esa manera, sin entrar en el menú se puede aumentar el multiplicador
de escala 3 veces y disminuir 15 veces.

15.1.2 Preinstalación de la escala de la tercera dimensión


Todo lo mencionado en el párrafo anterior se refiere a los datos tridimensionales
que ya han sido representados. Para representar los datos que acaban de ser
calculados y se representan por primera vez, el multiplicador de escala en automático
es igual a 1. Para cambiar este multiplicador, hay que entrar en el menú
Demostración->Opciónes de los tridimensionales en automático у corregir el valor
del coeficiente en el punto «Multiplicador para la tercera dimensión:». Al entrar en este
menú el coeficiente tiene el valor fijado por el usuario durante la entrada anterior. El
valor del coeficiente corregido será utlilizado en la siguiente calculación de los datos
tridimensionales.

107
15.1.3 Cambio de los márgenes de la imagen
Para cambiar los márgenes de la imagen se puede utilizar la banda de
demostración, situada en la parte inferior de cualquiera de las ventanas, o fijar los
márgenes de la imagen directamente, utilizando la opción Demostración.

Para cambiar los márgenes de la imagen por la horizontal en este menú existe el
área «Cambio de la longitud /posición del box». Al apretar sobre esta opción, en la
pantalla aparece el menú complementario bajo el nombre de «Anchura del box:». Hay
que introducir en las casillas correspondientes de este menú a través del teclado los
valores de los márgenes derecho e izquierdo del box. Al apretar el botón «Sí» la
imagen tridimensional será redibujada en los límites nuevos.

Para cambiar los márgenes de la imagen por la vertical en el menú Demostración


hay la opción «Cambio de la altura/posición del box». Al apretar sobre este punto, en
la pantalla aparecerá el menú complementario debajo el nombre «Altura del box:». Hay
que introducir en las casillas correspondientes de este menú mediante el teclado los
valores de los márgenes superior e inferior del box. Al apretar el botón «Sí» la imagen
tridimensional será redibujada en los límites nuevos.

15.1.4 Cambio del brillo y contraste de la representación


Para controlar el brillo y el contraste de las representaciones tridimencionales se
puede utilizar el botón Brillo, Contraste, el cual se muestra a la derecha del box de
datos debajo del botón de Control de la velocidad de reproducción.

Al presionar en el por medio de la tecla izquierda del ratón entonces en la parte


derecha de la ventana aparece el slider de control del brillo y sobre este – el botón que
permite cambiar al régimen de control del contraste.

Al presionar el botón contraste se podrá cambiar el contraste con la ayuda del


mismo slider y sobre este aparecerá el botón que permitirá el cambio al régimen de
Brillo.

Cerrar el régimen se puede a través de la tecla <Esc> o volviendo a presionar el


botón Brillo, Contraste.

Navegando con el cursor en el botón Brillo, Contraste , el brillo se puede cambiar


suabemente girando la rueda del ratón.

15.1.5 Normalización de la voz vista


Para normalizar el habla (voz) vista (espectrograma, cepstrum y otros) en la
ventana se presta el botón Normalización de la voz(habla) vista, ubicado en la parte
derecha del box de datos, debajo del botón de brillo, contraste.

Al presionar el botón en la parte superior de la ventana aparece un eje


complementario y un círculo rojo que representa el valor en curso de la normalización.

108
Manteniendo presionada la tecla izquierda de ratón el círculo rojo se puede
trasladar al lugar necesario. Para volver a dibujar los datos se debe soltar la tecla del
ratón. Al mismo tiempo por el eje Y – se da el valor de subida de los altos desde
.......Hz, y por el eje X – el valor de subida de los altos en ..........(dB/octava).

Cerrar en régimen se puede presionando ta tecla <Esc>, o volviendo a presionar en


el botón Normalización de la voz(habla) vista.

15.1.6 Como volver a dibujar en otra forma de representación


Para volver a realizar el dibujo de la imagen tridimensional de la característica en
otra forma de representación se necesita entrar en el menú Demostración -
>Representar los datos tridimensionales. Al hacer esto en la pantalla aparecerá un
menú suplementario con el mismo nombre. En este menú hay la opción «Tipo
representación». Al apretar sobre ésta en la pantalla aparecerá un menú
suplementario donde estarán enumerados todos los modos posibles de la
representación de los datos tridimensionales. Al colocar el cursor sobre la línea que
contiene el tipo de representación elegido, hay que apretar el botón del ratón o la tecla
<Enter>. Después de esto apriete el botón «Si», y los datos tridimensionales serán
nuevamente dibujados.

15.2 Las ventanas de suspensión


En esta parte está presentada la descripción de las ventanas de suspensión, cuyo
uso es común para todos los espectros de Furie.

15.2.1 Argumentación teorética del uso de las ventanas


La descomposición de las señales por la base de senos y cósenos (transformación
de Furie) es adecuada sólo para las señales de una duración infinita. Sin embargo,
como las señales reales son finitas en el tiempo, y además en la mayoría de los casos
hay que saber, como se cambian las características espectrales de la señal de un
momento del tiempo a otro, en la calculación del espectro de la señal se usan los
segmentos finitos de ésta. El análisis del segmento finito de la señal corresponde al
uso de la señal infinita, multiplicado por la función rectangular, que es igual a uno en
este intervalo y a cero fuera del intervalo dado. Es costumbre llamar un proceso así

« la multiplicación por la ventana» o el peso, y la función, por la cual se multiplica –


la función pesante (función de la ventana) o «la ventana».

Ya que los bordes de la señal cortada por la ventana rectangular en el límite del
intervalo del análisis pueden cortarse bruscamente, un hecho semejante puede en
este caso llevar a la deformación del espectro, produciendo los lanzamientos de las
amplitudes espectrales, que no estan relacionados con la señal, sino con la colocación
y la forma de la ventana. Para disminuir este efecto es costumbre alisar(nivelar) los
extremos de la señal en en intervalo del análisis, es decir utilizar la función de la
ventana con la recesión de los valores a los extremos de la mitad de la ventana.

109
En la área espectral el uso de tales ventanas lleva al aplanamiento de los valores
del espectro y a la eliminación de los lanzamientos de amplitudes de ellas, aunque con
esto pasa un cierto empeoramiento de la exactitud de la resolución espectral.

El empleo de la ventana de análisis en el región temporal (de tiempo) corresponde


en la área espectral al enrollamiento (rotor) del espectro de la señal con el espectro de
la ventana del análisis. En particular, el empleo de la ventana «ninguna»
(«RECTANGULAR») del análisis corresponde al enrollamiento(rotor) del espectro de la
señal con el espectro de la función rectangular (así llamado núcleo de Dirichle). Por
cuenta de este enrollar(rotor) se producen « los efectos de la ventana» que causan
allanamiento de los espectros cercanos y que destacan la influencia de las
interferencias distantes por su frecuencia pero potenciales.
En el espectro de cada función de la ventana es costumbre distinguir el pétalo
espectral principal y los laterales – en esencia Parasitario, pétalos complementarios
que empeoran las apreciaciónes espectrales iniciales, afectando cada valor del
espectro. Con esto si los pétalos laterales tienen una amplitud grande, entonces la
influencia en este recuento espectral aun de los recuentos espectrales lejanos puede
ser considerable. Sin embargo, la amplitud de los pétalos espectrales laterales puede
ser reducida solo por cuenta de la ampliación del pétalo principal, es decir por cuenta
de la reducción de la exactitud de la resolución espectral. La elección de la ventana de
análisis se utiliza para manejar (controlar) los efectos, condicionados por la presencia
de pétalos laterales en apreciaciones espectrales.

La anchura mínima de los máximos espectrales de la sucesión pesada por la


ventana está limitada por la anchura, determinada por el pétalo principal de la
transformación de esta ventana, y no depende de los datos iniciales.

Los pétalos laterales de la transformación de la ventana, a veces llamados la


infiltración, cambiarán las amplitudes de los máximos espectrales próximos. Ya que la
transformación discreta temporal de Furie es la función periódica, la superposición de
los pétalos laterales de los períodos espectrales próximos puede llevar al
desplazamiento adicional de la posición de los extremos espectrales principales por la
frecuencia. La infiltración lleva no sólo a la aparición de los errores espectrales en los
espectros de las señales discretas, sino puede también enmascarar la presencia de las
señales débiles en el fondo de aquellos fuertes (débiles por amplitud formante en el
fondo de aquellos fuertes) y, por consecuencia, impedir su detección.

Se puede proponer una serie de funciónes de la ventana, el empleo de las cuales


permite bajar el nivel de los pétalos laterales en comparación con aquel nivel suyo, que
tengan en el caso de la ventana rectangular (sin la ventana de suspensión). La baja del
nivel de los pétalos laterales disminuirá el desplazamiento de las apreciaciones
espectrales. Sin embargo esto se logra a precio de la ampliación del pétalo principal
del espectro de la ventana, lo que naturalmente lleva al empeoramiento de la
resolución. Consiguientemente, se debe elegir algun compromiso entre la anchura del
pétalo principal y el nivel de depresión de los pétalos laterales.

110
Para la clasificación de las funciones de la ventana se emplean varios índices de
apreciación de su calidad.

La anchura de la banda de frecuencias del pétalo principal deja juzgar de la


resolución de frecuencia. Para la apreciación cuantitativa de la anchura de la banda del
pétalo principal se emplean dos índices. El índice tradicional es la anchura de la banda
en el nivel de la mitad de la potencia, que es 3 dB más bajo del máximo del pétalo
principal. En calidad del segundo índice se usa la anchura equivalente de la banda.

Dos índices se usan también para valorar las características de los pétalos laterales.
Uno de ellos es el nivel máximo de los pétalos laterales, que deja juzgar de lo cuanto
bien la ventana reprime la infiltración. El segundo es la velocidad de caída del nivel de
los pétalos laterales, que caracteriza la velocidad con la cual se baja el nivel de los
pétalos laterales más cercanos al pétalo principal. En esencia, la velocidad de la caída
de los pétalos laterales depende del número de recuentos N utilizados y con el
aumento N tiende a un cierto valor asintótica, la cual es costumbre expresar en
decibelios (dB) por la octava del cambio de anchura de la banda de frecuencia.

15.2.2 Descripción de las cinco ventanas principales


A continuación están presentadas las definiciónes de las cinco funciones discreta -
temporales más usadas del número de las que han sido propuestas en varios tiempos
para el uso en valoración espectral.

• «HANN»- la ventana de Hann - ( i=0.. N-1)


SIGNAL [ i ] =SIGNAL [ i ] * (0.5-0.5* СOS ( 2 * PI / N * i) ;
• «HAMMING»- la ventana de Hamming - ( i=0.. N-1)
SIGNAL [ i ] =SIGNAL [i] * (0.54-0.46 * СOS ( 2 * PI / N * I) ;
• «NUTTALL»- la ventana de Nuttall - ( i=0.. N-1)
ARG:= ( i- ( N-1) / 2 / (N-1) ;
SIGNAL [ i ] =SIGNAL [ i ] * ( 0.3635819 + 0.4891775 *
СOS (2 * PI * ARG) + 0.1365995 * СOS ( 4 * PI * ARG) +
0.0106411 * СOS (6 * PI * ARG) );
• «GAUSS» – la ventana de Gauss, i=0, ..., N-1, ARG=(I-N12) / N *8
SIGNAL [ i ] = SIGNAL [ i ] * EXP (-ln (2) * ARG * ARG) * 2.51
• «REСTANGLE»- la ventana rectangular (no hay ventana) – la señal sin alteración.

111
Características de las ventanas:

Ventana Rectangular De Hamming De Hann De Nuttall De Gauss


(no hay)

Nivel máximo de los -13.3 -43 -31.5 -98 -115


pétalos laterales (dB)
La velocidad asintótica -6 -6 -18 -6 (-139)*
de la caída de los
pétalos
laterales(dB/oct)
Anchura equivalente 1.00 1.36 1.50 1.80 3.50
de la banda
Anchura de la banda 0.89 1.30 1.44 1.70 3.0
por el nivel de la
potencia media
Para las señales de 16 y 24 bit se emplean las ventanas de Gauss de varia anchura,
por eso el nivel de los pétalos laterales para las señales de 24 bit constituye (-139) dB.

De todas las ventanas presentadas en el cuadro el pétalo principal más estrecho


tiene la característica de frecuencia de la ventana rectangular, pero tiene el nivel más
alto de los pétalos laterales. Los pétalos laterales de la ventana de Gauss en la escala
logarítmica doble no tienden a la línea recta, pero caen mucho más rápido, que a
cualquiera de las ventanas presentadas.

La ventana del tipo « coseno cuadrado» fue llamada en honor del meteorólogo
austriaco Ulius von Hann. A esta ventana a menudo la llaman erróneamente la ventana
de Hanning.

La ventana del tipo de la cosinusoide elevada fue introducido por R. U. Hamming


y por eso a menudo se llama con su nombre. Los multiplicadores 0.54 y 0.46 han sido
elegidos para que eliminen prácticamente por completo el pétalo lateral máximo.

15.2.3 Ventana de los períodos iguales


En algunos tipos de análisis en el programa SIS se emplea así llamada Ventana de
períodos iguales.

En la calculación del espectro regular y las funciónes relacionados con el


típicamente en la calculación de la amplitud de las harmónicas participa un número
diferente de los períodos de la función. Si se calcula el espectro con la ventana 256, la
primera harmónica con el período 256 cave en la ventana de análisis 1 vez, y la última
armónica con el período 2 se ubica en la ventana 128 veces. Como resultado las
armónicas de alta frecuencia (con los períodos menores) se exponen a la obtención de
un promedio considerable, y las de baja frecuencia no.

112
Para la Ventana de períodos iguales se calcula la función autocovariable de tal
manera, que la anchura de la ventana de análisis con la disminución de la frecuencia se
aumente, compensando el efecto antes mencionado. Espectro, kepstrum y la
autocorrelación se calculan más tarde por esta función autocovariativa.

La anchura de la ventana de análisis aumenta linealmente con el aumento del


período de la armónica (y el período es inversamente proporcional a la frecuencia, sin
superar al valor de la dimensión del cuadro. El coeficiente de la proporcionalidad se
fija en el intervalo de 0.3 a 9 al apretar cualquier botón del ratón en cualquier punto
fuera del menú de la ventana de suspensión, después de separar en la lista de las
ventanas la Ventana de períodos iguales.

Se recomienda elegir el paso pequeño del desplazamiento del cuadro, para no


omitir los datos para frecuencias altas.

15.2.4 Recomendaciones para la elección del tipo de ventana


La estrategia de elección de la ventana está determinada por el compromiso entre
la alteración del espectro en la región de los pétalos laterales cercanos (espectro
borrado) y alteración a causa de la influencia de los pétalos laterales lejanos (aparición
de lanzamientos(alteraciones) falsos).
Por ejemplo, si los componentes bastante fuertes de la señal se encuetran junto y a
lo lejos del componente débil de la señal, entonces para su análisis hay que elegir una
ventana con el nivel igual de los pétalos laterales junto al pétalo principal, para
asegurar el desplazamiento pequeño de los máximos espectrales.

Si hay una componente fuerte, alejada de la componente débil de la señal, hay que
elegir la ventana con el nivel de pétalos laterales cayendo rapidamente. Y su nivel de
ellos en la proximidad inmediata al pétalo principal en este caso no tiene mucha
importancia.

En el caso cuando se necesita asegurar una alta resolución entre las componentes
de la señal muy cercanas y faltan los componentes alejados, es del todo aceptable la
ventana aun con el nivel aumentando de los pétalos laterales, pero con un pétalo
principal muy estrecho.
Si el rango dinámico de la señal está limitado, entonces las características de los
pétalos laterales no tienen mucha importancia.

Si el espectro de la señal es relativamente llano, se puede no emplear las ventanas


de ningún modo.

Para obtener una forma más demostrativa de la imagen se recomienda elegir una
de las primeras tres ventanas. Están situadas en el orden de decrecimiento del nivel de
los pétalos laterales de la característica espectral de la ventana y del aumento de la
anchura del pétalo espectral principal. La anchura efectiva de la ventana en
comparación con la rectangular se les disminuye respectivamente {1.36, 1.5, 1.8 и 3.5}
veces.

113
15.3 Cálculo del espectrograma dinámico
Para caracterizar algun sonido complejo - acústico, se necesitan los datos de su
tono principal, de la frecuencia de las armónicas del tono principal y de la intensidad
relativa de todos sus componentes de frecuencia (es decir sobre como el tono principal
y las armónicas se relacionan por intensidad). Estos datos puede obtenerlos por el
análisis espectral del sonido. El espectrograma dinámico permite ver el estado
continuo de los cambios de las características espectrales de los segmentos sonoros
de duración diversa.

Para obtener una imagen del espectrograma dinámico se necesita entrar en el


punto Análisis->Espectrograma. Después de esto en la pantalla aparecerá el menú de
elección de la fuente-recipiente de los datos y fijación de las opciones para el cálculo
del espectrograma. Primeramente hay que entrar en el campo «OPCIÓNES», después de
que el la pantalla aparecerá el submenú «OPCIÓNES», en el cual el usuario podrá
introducir los parámetros necesarios (véanse. p.15.3.1).

Como un impedimento a la ejecución de esta operación puede ser el tipo


inadecuado de la ventana-fuente.
En lo bajo de la pantalla en la línea de mensajes aparece el indicador del grado de
ejecución de la operación. Según este se llene se puede seguir el proceso de cálculo.
Se puede interrumpir el proceso de cálculo apretando la tecla <ESC>.

Fijación de los parámetros


La fijación de los parámetros se efectúa en el submenú «OPCIÓNES» (Dibujo 46).

Dibujo 46 Menú «OPCIÓNES» del procedimiento «Espectrograma»

114
Este menú contiene un cierto número de parámetros, al cambiar los valores de los
cuales el usuario puede obtener la imagen de el habla visible más aceptable para él.
Los parámetros incluidos en este submenú (inclusive los submenús incluidos en él),
son los siguientes:

«Tamaño del cuadro». El usuario puede elegir el cuadro de tamaño 16, 32, ...
16384 recuentos. Después de introducir la longitud del cuadro en los recuentos ella se
representa en seguida en ms en el campo próximo. Según como sea el tamaño del
cuadro se puede obtener el espectro de banda ancha o estrecha. En el espectro de
banda estrecha la imagen espectral resulta más detallada, en el espectro de banda
ancha – más general. Para obtener el espectro de banda estrecha el tamaño del cuadro
debe superar el valor máximo del período del tono principal. En este caso para la voz
masculina se fija el tamaño del cuadro de 256 recuentos y más, para la voz femenina –
de 128 recuentos y más. Para obtener el espectro de banda ancha el tamaño del
cuadro debe ser menos del valor máximo del período del tono principal. Para la voz
masculina es 64 recuentos, para la voz femenina - 32 recuentos.

«intervalo del desplazamiento del cuadro». El intervalo del desplazamiento del


cuadro determina el valor, al cual la ventana se desplaza por la señal. Hay que
recordar, que al elegir el intervalo del desplazamiento del cuadro superando al tamaño
del propio cuadro, no todos los puntos de la señal van a participar en el proceso de la
calculación del espectrograma . La óptima es la fijación del intervalo de
desplazamiento dentro de los límites de 1/4 - 1/2 de la longitud del cuadro de
análisis. Después de determinar el intervalo de desplazamiento del cuadro en los
recuentos este en seguida se representa en milisegundos en el área próxima.

«Tipo de la ventana de suspensión». Véase la descripción detallada de las ventanas


en el p. 15.2.

«Hamming»,
«Hann»,
«Nuttall»,
«No»,
«de los períodos iguales, 2.0».
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una de las tres primeras ventanas. Están ubicadas en el orden de
decrecimiento del nivel de los pétalos laterales de la característica espectral de la
ventana y del aumento de la anchura del pétalo espectral principal. Si ha sido elegida
la Ventana de períodos iguales entonces basta apretar con el ratón sobre cualquier
punto fuera del menú de la ventana de suspensión para que aparezca el diálogo «Elijan
el multiplicador del período [0.3,…,9]:». El usuario debe ingresar el multiplicador del
período y apretar «Sí». Si el usuario aprieta «Cancelar», se restablecerá el valor de
antes.

115
«Utilizar el filtro». Hay una posibilidad de elegir un filtro por 0.. 55 puntos.
Trabajando con el filtro se efectúa la obtención del promedio geométrico de la imagen
según la cantidad elegida de los puntos. La obtención del promedio se ingresa para
obtener una imagen más precisa de los formantes, para allanar las armónicas del tono.
En el caso cuando hay que ver las armónicas particulares, la obtención del promedio
no se efectúa.

«Utilizar la normalización». Al apretar sobre este área en la pantalla aparecerá un


menú más en el cual hay que introducir los siguientes parámetros:

ƒ Subida de ... Hz (para espectrogramas),


ƒ Subida de ... puntos (para otros),
ƒ Subida de ... dB por una octava.
Por este parámetro se determina para el espectrograma la frecuencia, comenzando
por la cual se efectúa la subida de la amplitud del espectro, y el valor de la subida. Por
ejemplo, la subida de la amplitud del espectro de la frecuencia de 200 Hz por 6 dB/oct
significa aumento de la amplitud del espectrograma en 6 dB a una frecuencia de 400
Hz en comparación con los 200 Hz, etc. Alterando la subida del espectro, se puede
obtener la imagen espectral más demostrativa en las altas frecuencias. El valor óptimo
de la subida de la amplitud se determina por medio de selección para cada señal
particular.

ƒ Normalización en el máximo de la amplitud de cizallamiento:


o «No» (sin normalización),
o «Toda la señal» (se normaliza toda la señal),
o «sólo el que supere el nivel» (se normalizan los segmentos de la
señal que superan el nivel determinado).
ƒ Normalizar la señal que supere al nivel por un ... % de lo máximo.
ƒ Tener en cuenta el componente de cero. Si este régimen está activo, la
filtración se realiza con la consideración del componente constante.
Al establecer los parámetros necesarios, aprieten «Sí». En la pantalla aparecerá de
nuevo el menú «Opciónes. Espectrograma».

«Tipo representación» (véanse. p. 15.1).


«Opciones representación» (véanse. p. 15.1).

«Número de formantes:» al fijar número negativo, el número de los formantes


representados será determinado por el programa, al fijar 0 formantes no se calcularán
y representarán, al fijar el número positivo se presentará el número de formantes
determinado, pero no más que 10.

116
El campo «Pérfiles» permite utilizar los parámetros estandartizados:

ƒ Formantes
o Hombre (Tenor (130-520 Hz), Barítono (110-390 Hz), Bajo (80-350 Гц) o
contrabajo (50-220 Hz))
o Mujer (Soprano (260-1050 Hz), mezzo-soprano (220-880 Hz) o contralto
(165-700 Hz))
o Niño
ƒ Espectrograma de banda ancha
o Hombre
o Mujer
o Niño
ƒ armónicas
o armónicas del tono (Alto (>220 Hz) o bajo (<220 Hz) tono principal)
o armónicas técnicas (Resolución máxima, media o mínima)

15.4 Cálculo de la función de periodicidad (del cepstrograma dinámico)


Para obtener la imagen del cepstrograma dinámico entren en el área Análisis->El
kepstrum Después de esto en la pantalla aparecerá un menú estándar, cuyo
funcionamiento está descrito en el p. 4.5. Al apretar sobre el área «OPCIÓNES» en la
pantalla aparecerá el submenú «OPCIÓNES», en el que el usuario podrá introducir los
parámetros necesarios.
Al introducir los parámetros el usuario debe crear o elegir la ventana para la
presentación de la información y poner en marcha el procesamiento por apretando
sobre el área con el tipo elegido del fragmento de datos. En lo bajo de la pantalla en la
línea de mensajes se ilumina el indicador del grado de ejecución de la operación.
Dependiendo de como se llena, se puede observar el proceso del cálculo. Se puede
interrumpir el proceso de cálculo apretando la tecla <ESC>.

La fijación de los parámetros se efectúa en el menú «OPCIÓNES» (Dibujo 47), que


contiene un cierto número de parámetros, cambiando el valor de los cuales el usuario
puede obtener la imagen del kepstrograma más aceptable para él.

Los parámetros incluidos en este submenú (inclusive los submenú incluidos en él)
son los siguientes:

«Tamaño del cuadro». El usuario puede elegir un cuadro de tamaño de 16, 32, ...
16384 recuentos. Para la calculación del kepstrograma habitualmente se elige el
tamaño del cuadro igual a 512 recuentos para la voz masculina y a 256 recuentos para
la voz femenina. Al determinar la longitud del cuadro el los recuentos esta se
representa en seguida en milisegundos en el área próxima.

117
Dibujo 47. Menú «OPCIÓNES» del procedimiento «El cepstrum»

«intervalo de desplazamiento del cuadro». El valor de desplazamiento del cuadro


habitualmente se elige en el tamaño de 1/4 del tamaño del cuadro o de ½ del tamaño
del cuadro. Al determinar el intervalo de desplazamiento del cuadro en recuentos este
se representa en seguida en milisegundos en el área próxima.

«Tipo de la ventana pesante». Véanse la descripción detallada en el p. 15.2.

«de Hamming»,
«de Hann»,
«de Nuttall»,
«No»,
«De los períodos iguales, 2.0».
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una de las tres primeras ventanas. Están ubicadas en el orden de
decrecimiento del nivel de los pétalos laterales de la característica espectral de la
ventana y del aumento de la anchura del pétalo espectral principal.

Si ha sido elegida la Ventana de períodos iguales entonces basta apretar con el


ratón sobre cualquier punto fuera del menú de la ventana de suspensión para que
aparezca el diálogo «Elijan el multiplicador del período [0.3,…,9]:». El usuario debe
ingresar el multiplicador del período y apretar «Sí». Si el usuario aprieta «Cancelar», se
restituirá el valor anterior.

«Utilizar el filtro». Hay una posibilidad de elegir un filtro para 0.. 55 puntos.
Trabajando con el filtro se efectúa la obtención del promedio móvil de la imagen por la
cantidad elegida de los puntos. La calculación del kepstrograma se realiza como regla
sin obtención del promedio.
118
«Utilizar la normalización». Al apretar sobre este área en la pantalla aparecerá un
menú más en el que hay que ingresar los siguientes parámetros:

ƒ Subida de Hz (para espectrogramas),


ƒ Subida de puntos (para otros),
ƒ Subida de dB por una octava.
Cuando se calcula el kepstrograma habitualmente se determina la subida de 1
recuento (punto) por 3 dB. Los valores más exactos se seleccionan manualmente por el
espectrograma dinámico

ƒ Normalización en el máximo de la amplitud de la sección:


o «No» (sin normalización),
o «Toda la señal» (se normaliza toda la señal),
o «Sólo el que supere el nivel» (se normalizan los segmentos de la señal
que superen al nivel determinado).
ƒ Normalizar la señal que supere el nivel por un... % de lo máximo.
ƒ Tomar en cuenta el componente de cero. Si este régimen está activo, la
filtración se realiza con consideración del componente constante.
Al establecer los parámetros necesarios, apriete «Sí». En la pantalla aparecerá
nuevamente el menú «Opciónes. El kepstrum».
«Tipo de representación» (véase. p. 15.1).

«Opciónes representación» (véase. p. 15.1).

La opción «Pérfiles» permite utilizar los parámetros estandartizados:

ƒ Hombre
o Tenor (130-520 Hz)
o Barítono (110-390 Hz)
o Bajo (80-350 Гц)
ƒ Mujer
o Soprano (260-1050 Hz),
o Contralto (165-700 Hz))
o Niño
ƒ Espectrograma de banda ancha
o Hombre
o Mujer
o Niño
ƒ Complementariamente
o Canto (hombre)
o Señal superruidosa
o Infrasonido
o armónicas constantes (la resolución máxima)

119
15.5 Cálculo de las características dinámicas del modelo regresivo
automático de la señal de voz
En este sistema hay la posibilidad de calcular las siguientes características
dinámicas del modelo regresivo automático de la señal de voz:

ƒ de coeficientes de autocorelación (Análisis -> Autocorelación),


ƒ de coeficientes de correlación particular (Análisis->Más funciones…->
Correlación particular),
ƒ de coeficientes de pronosticación lineal (Análisis->Más funciones…->
Coeficientes de pronóstico lineal).
Para obtener una imagen tridimensional de una de las características indicadas
entre en el punto del menú principal Análisis y elija la característica necesaria. En la
pantalla aparecerá el menú estándar, cuyo funcionamiento está descrito en el p. 4.5.
Después de apretar en el área «OPCIÓNES» en la pantalla aparecerá el submenú
«OPCIÓNES», en el que el usuario puede establecer los parámetros necesarios.

Al establecer los parámetros el usuario debe crear o elegir la ventana para ingresar
la información y poner en marcha el procesamiento apretando sobre el campo con el
tipo elegido del fragmento de los datos. En lo bajo de la pantalla en la línea de los
mensajes se ilumina el indicador del grado de ejecución de la función. Dependiendo de
como se llena se puede seguir el curso del proceso del cálculo. Se puede interrumpir
el proceso de cálculo apretando sobre <ESC>.
La fijación de los parámetros se efectúa en el submenú OPCIÓNES», que contiene
un cierto número de parámetros cambiando los valores de los cuales el usuario puede
obtener la representación de voz visible más aceptable para él.
Los parámetros incluidos en este submenú (inclusive los submenú incluidos), son
los siguientes:

«Tamaño del cuadro». El usuario puede elegir un cuadro de tamaño de 16, 32, ...
16384 recuentos. Al fijar la longitud del cuadro esta se representa en milisegundos en
el campo próximo.

«Intervalo de desplazamiento del cuadro». El usuario puede fijar el intervalo


temporal del cuadro (en puntos). Al fijar el paso del desplazamiento del cuadro en los
recuentos este en seguida se representa en milisegundos en el área próxima.

«Tipo de la ventana de suspensión». Véase la descripción detallada de las ventanas


en el p. 15.2.

«de Hamming»,
«de Hann»,
«de Nuttall»,
«No»,
«de los períodos iguales, 2.0».

120
Para obtener una forma más demostrativa de representación de la señal se
recomienda elegir una de las primeras tres ventanas.

Si ha sido elegida la Ventana de períodos iguales entonces basta apretar con el


ratón sobre cualquier punto fuera del menú de la ventana de suspensión para que
aparezca el diálogo «Elijan el multiplicador del período [0.3,…,9]:». El usuario debe
ingresar el multiplicador del período y apretar «Sí». Si el usuario aprieta «Cancelar», se
restituirá el valor de antes.

«Utilizar el filtro». Hay la posibilidad de elegir un filtro por 0.. 55 puntos.


Trabajando con el filtro se efectúa la obtención del promedio móvil de la imagen por
la cantidad elegida de los puntos.

«Utilizar la normalización». Al apretar sobre este área en la pantalla aparecerá un


menú más en el que hay que entrar los siguientes parámetros:
ƒ Subida de ... Hz (para espectrogramas),
ƒ Subida de ... puntos (para otros),
ƒ Subida de ... dB por una octava.
Al uso de los métodos de calculación de las características dinámicas del modelo
regresivo automático de la señal del habla la subida se determina en recuentos
(puntos).
ƒ Normalización en el máximo de la amplitud de cizallamiento:
o «No» (sin normalización),
o «Toda la señal» (se normaliza toda la señal),
o «Sólo el que supere el nivel» (se normalizan los segmentos de la señal
que superen al nivel determinado).
ƒ Normalizar la señal que supere al nivel por ... % de lo máximo.
ƒ Tomar en cuenta el componente de cero. Si este régimen está activo, la
filtración se realiza con la consideración del componente constante.
Al establecer los parámetros necesarios, aprieten «Sí». En la pantalla aparecerá de
nuevo el menú «Opciones».

«Tipo de representación» (véase. p. 15.1).

«Opciones de representación» (véase. p. 15.1).


El área «Perfiles» permite utilizar los parámetros estandartizados:
ƒ Hombre
o Tenor (130-520 Hz)
o Barítono (110-390 Hz)
o Bajo (80-350 Гц)
ƒ Mujer
o Soprano (260-1050 Hz),
o Contralto (165-700 Hz))
o Niño
121
ƒ Complementariamente
o Canto (hombre)
o Señal superruidosa
o Infrasonido
o Harmónicas constantes (la resolución máxima)

15.6 Análisis espectral en la base de la predicción lineal de voz (obtención


de la imagen de la respuesta particular del transmisor LPC)
El análisis del espectro por los coeficientes del pronóstico lineal (a continuación
LPC) se realiza de la siguiente manera. LPC se calculan por el algoritmo de Levinson
Darwin, con esto los coeficientes de autocorrelación se calculan en una ventana
temporal, los tamaños de la cual no pueden ser menor que número de coeficientes y
mayor que 1024. La señal de voz se pesa en esta ventana por la función (cual
exactamente - eso depende de la elección del tipo de la ventana de suspensión). Al
determinar los coeficientes, se forma una secuencia en la que los primeros m+1
miembros son LPC (m – orden del modelo polar), y los otros - ceros. La longitud de la
secuencia se elige partiendo de la resolución necesaria por la frecuencia (con la
frecuencia de discretizacion de 10kHz y la resolución no peor que 30 Hz longitud
N>=10000/30; eligiendo el grado 2, que supera a N, obtenemos la longitud de la
secuencia). Al calcular FFT de esta secuencia y al tomar el valor contrario de ella,
obtenemos el espectro allanado de la señal de voz, en el que se efectúa la búsqueda
de máximos. Este espectro de representación espectral de la señal de voz permite ver
la estructura de formantes más claramente, en comparación con el análisis regular.

Para obtener una imagen tridimensional de la respuesta de la frecuencia de LPC


hay que entrar en el menú Análisis->La respuesta de la frecuencia LPC. Después de
esto en la pantalla aparecerá un menú estándar, cuyo funcionamiento está descrito en
el p. 4.5. Primero, es necesario apretar sobre el área «OPCIÓNES», después de lo cual
en la pantalla aparecerá el submenú «OPCIÓNES. La respuesta de la frecuencia LPC», en
el que el usuario puede fijar todos los parámetros necesarios. Al fijar los parámetros el
usuario debe crear o elegir la ventana para la presentación de la información y poner
en marcha el procesamiento apretando sobre el área que contecga el tipo elegido del
fragmento de datos. En lo bajo de la pantalla en la línea de mensajes se ilumina el
indicador del grado de ejecución de la operación. Dependiendo de como se llena se
puede seguir el curso del proceso de cálculo. Se puede interrumpir el proceso de
cálculo apretando sobre la tecla <ESC>.

El submenú «OPCIÓNES. La respuesta de la frecuencia LPC» (Dibujo 48) contiene un


cierto número de los parámetros, que al carbiar los valores de los cuales el usuario
puede obtener la representación de voz visible más aceptable para él.

122
Dibujo 48. El Menú «OPCIÓNES» del procedimiento
«La respuesta de la frecuencia LPC»

Los parámetros incluidos en este submenú (inclusive los submenús incluidos en él):

«Tamaño del cuadro (puntos)». El usuario puede determinar el tamaño del cuadro
deseable. Por defecto está fijado 512.

«Intervalo del desplazamiento del cuadro». El usuario puede fijar el intervalo


temporal del cuadro (en puntos). La medida del desplazamiento del cuadro
habitualmente se elige en el tamaño de 1/4 del tamaño del cuadro o ½ del tamaño del
cuadro. Por defecto- 128.

«Resolución de frecuencia (Hz)». El valor se elige de: 5,3; 10,7; 21,5; 43,0; 86,1;
172,2; 344,5; 689,0.

«Número coeficientes LPC» – el número de los coeficiente del pronóstico lineal, que
se emplean para formación de la respuesta de la frecuencia.

«Tipo de la ventana de suspensión». Véase la descripción detallada en el p. 15.2.

ƒ De Hamming
ƒ De Hann
ƒ De Nuttall
ƒ No
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una de las tres primeras ventanas. Están ubicadas en el orden de
decrecimiento del nivel de los pétalos laterales de la característica espectral de la
ventana y del aumento de la anchura del pétalo espectral principal.

123
«Utilizar el filtro». Hay una posibilidad de elegir un filtro por 0.. 55 puntos.
Trabajando con el filtro se efectúa la obtención de media geométrica de la imagen
según la cantidad elegida de los puntos.

«Utilizar la normalización». Al apretar sobre esta opción en la pantalla aparecerá un


menú más en el que hay que introducir los siguientes parámetros:

ƒ Subida de ... Hz (para espectrogramas),


ƒ Subida de ... puntos (para otros),
ƒ Subida de ... dB por una octava..
ƒ Normalización por el máximo de la amplitud de la sección:
o «No» (sin normalización),
o «Toda la señal» (se normaliza toda la señal),
o «Sólo el que supere el nivel» (se normalizan los segmentos de la señal
que superen al nivel determinado).
ƒ Normalizar la señal que supera al nivel por ... % de lo máximo.
ƒ Tener en cuenta el componente de cero. Si este régimen está activo, la filtración
se realiza con consideración del componente constante.
Al establecer los parámetros necesarios, aprieten «Sí». En la pantalla aparecerá de
nuevo el menú «Opciones. La respuesta de la frecuencia LPC».

«Tipo representación» (véanse. p. 15.1).

«Número de formantes» introduciendo un número negativo el numero de


formantes representados será determinado por el programa, introduciendo 0
formantes no serán calculados y representados, fijando el numero positivo se
presentará el número de formantes determinado, pero no más que 10

La opción «Perfiles» permite utilizar los parámetros estandartizados:

ƒ Formantes
o Hombre (Tenor (130-520 Hz), Barítono (110-390 Hz), Bajo (80-350 Гц) o
contrabajo (50-220 Hz))
o Mujer (Soprano (260-1050 Hz), mezzo-soprano (220-880 Hz) o contralto
(165-700 Hz))
o Niño
ƒ Formantes igualadas
o Hombre, bajo (80-350 Hz)
o Hombre, tenor (130-520 Hz)
o Mujer
ƒ armónicas
o Harmónicas del tono (Alto (>220 Hz) o bajo (<220 Hz) tono principal)
o Harmónicas técnicas (Resolución máxima o mínima)

124
15.7 Cálculo energético (Declinación Cuadrada Promedio)
Para calcular la energía de la señal se necesita entrar en el punto Análisis->Energía
(Declinación Cuadrada Promedia). Con el cálculo de energía en el sistema SIS se
entiende el cálculo de la raíz cuadrada del móvil medio del cuadrado de la señal. Con
esto el usuario debe fijar la longitud del cuadro (en milisegundos), por la que se
efectúa la obtención de medio. Por ejemplo, si el usuario ha fijado la longitud del
cuadro de 1ms, con la frecuencia de descretización del segmento activo de 10 kHz,
eso corresponde a cien recuentos. Entonces, para obtener el valor de la energía en
cualquier punto de la señal, el sistema toma 50 valores de la señal a la izquierda del
punto, 50 – a la derecha, eleva cada valor al cuadrado, suma los resultados, divide la
suma por 101 y extrae la raíz cuadrada del cada número obtenido. En todos casos el
cuadro, por el que se efectúa la obtención de medio se desplaza por la señal con el
paso en un recuento.

Al entrar al menú Análisis->Energía (Declinación Cuadrada Promedia) en la pantalla


aparecerá un menú estándar, el uso del cual está descrito en el p. п. 4.5.

Apretando sobre el campo «OPCIÓNES» se abre la ventana, en la que el usuario


puede corregir el parámetro «Tamaño del cuadro, mc». Al fijar el valor deseable del
paso, aprieten «Sí». El proceso del cálculo se pone en marcha por apretar sobre el
campo con el tipo necesario del objeto procesado.

15.8 Cálculo de la frecuencia del cruce del cero


Esta operación permite calcular la frecuencia media por intervalo, la longitud del
cual (en milisegundos) tiene que indicar el usuario. El intervalo en el proceso del
cálculo se mueve por un punto para el cálculo de cada valor siguiente. El resultado se
calcula en hertzios.
Para efectuar el cálculo de la frecuencia de cruce de cero, es necesario entrar en el
menú Análisis->Más funciones… y de la lista que se abrirá elegir el punto Frecuencia
de el cruce del cero. En la pantalla aparecerá un menú estándar, el trabajo con el cual
está descrito en el p. 4.5. Entren en el campo «OPCIÓNES» y establescan los
parámetros para el cálculo. En este caso sólo es necesario fijar el tamaño del cuadro en
milisegundos.

Al establecer el valor necesario, apriete «Aceptar», después de que volverán al


menú anterior. Cree y elija una ventana recipiente y pongan en marcha el proceso del
cálculo apretando sobre el área con el tipo necesario del fragmento procesado. Al
terminar los cálculos en la ventana-recipiente se dibujará la curva de la frecuencia de
el cruce del cero.

15.9 Obtención del promedio


La operación de obtención de medio se realiza para los datos tridimensionales
calculados antes.

125
Para promediar los datos, hay que entrar en el menú Análisis->Obtención del
promedio. En la pantalla aparecerá el menú estándar, el modo del trabajo con el cual
está descrito en el p. 4.5.

Realizando esta operación simultáneamente pueden ser calculados la correlación


cruzada y la dispersión de la curva promediada. Para su calculación hay que entrar en
el área «OPCIÓNES» del menú y Establecer/Anular las señales «Calcular la correlación
cruzada» y «Calcular la dispersión». Como la correlación cruzada se entiende la
correlación promedio entre los dos cuadros más cercanos.

Al apretar sobre «Aceptar», volverá al menú anterior. Cree o elija una ventana-
recipiente y ponga en marcha el proceso del cálculo apretando sobre el campo con el
tipo necesario del fragmento procesado. Al terminar los cálculos en la ventana-
recipiente se dibujará la representación de la característica promediada.

15.10 Cálculo de las características del tono fundamental

15.10.1 Generalidades
El tono fundamental se calcula para los partes vocalizadas de la señal de voz. La
señal se considera tonal si en el cuadro (ventana) dado de análisis hay una
periodicidad de la señal en general o, por lo menos, en una región de frecuencia baja.

Como período del tono se considera a la duración del intervalo de la periodicidad


de la señal. La longitud del período se mide en recuentos (cuentas) o milisegundos. La
longitud promedio del período del tono principal es aproximadamente 70-80
recuentos para las voces masculinos y 40-50 recuentos para las voces femeninas con
la frecuencia de 10000Hz.

Como frecuencia del tono principal(fundamental) se considera a la cantidad igual a


la duración inversa del período del tono principal en milisegundos o a la frecuencia de
la señal, dividida por la duración del período del tono principal en recuentos. La
frecuencia del tono principal de las voces masculinas en promedio constituye 120-
140 Hz; para las voces femeninas - 200-240Hz.

El tono principal se calcula para mono señales. Para señales estéreo se calcula el
tono principal del canal de izquierda.

15.10.2 Método LLK


Para calcular el tono principal por el método de LLK, es necesario entrar en el
menú Análisis->Más funciones->Espectro de la potencia LLK. En la pantalla aparecerá
un menú estándar, el trabajo con el cual está descrito en el p. 4.5. Apretando sobre el
menú OPCIÓNES» se abre el submenú de opciones del procedimiento «Tono principal»,
en el que usuario puede fijar los parámetros necesarios. (Dibujo 49).

126
Dibujo 49. Menú «OPCIÓNES» del procedimiento «Tono principal»

El usuario puede elegir el variante de opciones que se utilizarán en el cálculo. Para


calcular el tono principal se puede utilizar los parámetros estándares, eligiendo uno de
los campos:

«Estándares para los hombres»,


«Estándares para las mujeres».
Además, se puede fijar los parámetros manualmente, entrando en el campo «
Establecer los parámetros manualmente». Con esto el estado inicial de los parámetros
estará conforme con aquel guardado en el file de configuración, pero será posible
alterarlo, utilizando el campo «Copiar opciones estándares».
Copiando opciones para el cambio manual de los parámetros se utilizan los valores
estándares - «Estándares para hombres» o «Estándares para las mujeres», según
cuales fueron elegidos en el momento de copiar.
Después de la corrección a mano hay que entrar en la opción «Fijados
manualmente».

Al entrar en el campo « Fijar los parámetros manualmente» en la pantalla aparecerá


el menú conteniendo dos campos activos: «Opciones para la señal» и «Opciones para
ruido y pausas» y algunos campos de información, el los que están representados los
valores presentes de los parámetros (véanse el dibujo 50). Para corregir estos valores,
hay que entrar en uno de los campos activos.

Si el valor del campo es igual a –1 , quiere decir que en este método de cálculo del
tono principal este parámetro no se emplea.

«Opciones para la señal»:

«Tamaño del cuadro, ms» – la longitud necesaria del cuadro del análisis de la señal
en milisegundos.

127
Dibujo 50. La ventana de ajuste del procedimiento «Tono principal LLK»

«Inicio (Hz)» – valor inicial del tono principal (Hz). Este valor para más estabilidad
del funcionamiento de cada método tiene que corresponder aproximadamente a la
señal dada, o más exactamente, al tono principal medio para los partes iniciales de la
curva del tono principal para cada traspaso de una parte de ruido a una parte tonal. En
el programa por el valor entrado F se calcula la duración correspondiente del período P
como el cociente de la división de la frecuencia de la señal por F. El primer valor de la
frecuencia del tono principal para cada segmento del tono se busca dentro de los
límites de F-ID hasta F+ID. El valor inicial del tono principal se puede determinar por
el kepstrograma como el valor medio del tono principal.

«Igualdad (%)» – igualdad de la curva melódica (en porcentaje). Este número


establece la duración máxima posible de la alteración del presente período del tono
principal respecto al período anterior.

«Igualdad inicial (%)» - ID – este número establece la duración inicial del cambio del
presente período del tono principal respecto al período anterior.

«Mínimo absoluto (Hz)» – mínimo absoluto del tono principal (en Hz). En cada
método de separación del tono principal la frecuencia del tono principal se busca sólo
sobre el límite dado. El valor del mínimo absoluto de la frecuencia del tono principal se
determina por el kepstrograma como el valor mínimo de la función del cambio del
tono principal.

«Máximo absoluto. (Hz)» - Máximo absoluto del tono principal (en Hz). En cada
método de separación del tono principal la frecuencia de cada tono principal se busca
solo bajo el límite dado. El valor del máximo absoluto se determina por el
kepstrograma como el valor máximo de la función del cambio del tono principal.

Los valores máximos y mínimos del tono principal consienten en obtener un


resultado más correcto en el caso de la señal superruidosa. Si al primer cálculo del
tono principal han descubierto, que el algoritmo se desvía a la frecuencia,
correspondiente a la frecuencia de la interferencia tonal que está fuera de la gama de
frecuencias del tono principal real, trate de fijar los valores de límites del tono
principal de tal modo que en ellos caiga la gama real del tono principal, pero que no
caiga la frecuencia de la interferencia tonal.

128
«Opciones para ruido y pausas»:

«Tamaño del cuadro, ms» - la longitud de la ventana del análisis para


determinación de los intervalos de ruido y pausas.

«Desplazamiento del cuadro, ms» – valor del desplazamiento del cuadro por la
señal a la identificación del cuadro como intervalo de ruido o pausa.
«Límite de la amplitud de la pausa» – valor de umbral de la amplitud para
identificación de la pausa. La señal en el cuadro de análisis con la amplitud inferior a
este umbral se considera una pausa. El valor de umbral de la amplitud se fija por
medio de selección, controlando de oído si el umbral ha sido elegido correctamente.
Vale la pena cambiar este parámetro si tiene una señal superruidosa, y al separar el
tono principal una parte de las pausas superruidosas ha sido percibida por el
algoritmo como los partes tonales. La señal con el nivel de la energía (o sea, de la raíz
cuadrada de la energía) inferior a él del parámetro fijado, se considera una pausa.

«Cruce 0 (Hz)» – el valor umbral de la frecuencia de el cruce del nivel «0» (en Hz).
La señal en el cuadro del análisis con la frecuencia de cruce del valor cero superior al
umbral dado se considera ruido. El valor de umbral para la pausa se fija por medio de
selección, controlando de oído si el umbral ha sido elegido correctamente . La parte de
la señal que tiene la frecuencia de cruce 0 superior a la indicada en este parámetro, se
considera la parte de ruido. Vale la pena cambiar este parámetro si su señal está
dominada por el ruido del componente de altas frecuencias. Trabajando con las
señales puras es más funcional utilizar los valores de los parámetros por defecto.

«Autocorrelación». Calculando el tono principal por el algoritmo LLK para los partes
tonales se calcula autocorrelación con la ventana 0.02 segundos. Por 15 valores de
autocorrelación sucesivamente calculados se hace una suposición del valor del tono
principal.

15.10.3 Proceso de separación del tono principal


Para elegir correctamente los valores para el cálculo del tono principal por medio
de LLK, hay que hacer lo siguiente:

1. Calcule el kepstrograma dinámica del modelo de voz investigado y con ayuda


del cursor horizontal determinen los valores mínimo y máximo de la curva del
cambio del tono principal.
2. Calcule el espectro de banda estrecha de la señal investigada y con ayuda del
cursor horizontal determinen los limites inferior y superior de la periodicidad
(estado de bandas) de la señal.
3. Determine el valor del umbral de la amplitud para cortar las pausas; este valor
se determina por selección manual al escuchar la señal.
4. Determine el valor del umbral para el corte del ruido por el parámetro ZC – la
frecuencia de el cruce por la señal del eje cero частоте пересечения сигналом
нулевой оси, который определяется путем ручного подбора при прослуши-
вании сигнала.
129
Uno de los métodos de la verificación de los cálculos del tono principal es la
superposición de un tono sobre kepstrum. Por eso antes de calcular el tono principal
calculen el cepstrum y calculando el tono principal utilicen como la ventana-recipiente
la ventana con el kepstrum calculado.

Al fijar todas las opciones aprieten «Sí», después de que volverá al menú anterior.
Creen o elijan una ventana-recipiente y pongan en marcha el proceso del cálculo
apretando sobre el campo con el tipo necesario del fragmento procesado.

Empezará el proceso de separación del tono principal. En lo bajo de la pantalla en


la línea de mensajes se ilumina el indicador del grado de ejecución de la función. Por
lo como se llena se puede seguir el curso del proceso del cálculo. Se puede interrumpir
el proceso apretando sobre <ESC>.

Al terminar la operación el tono principal destacado se dibuja en la ventana


anterior (segunda desde arriba). Por el eje horizontal de la izquierda a la derecha se
traza el tiempo en la misma escala que en la representación de la oscilograma, por la
que se determinaba el tono principal. Por el eje vertical se traza la duración del período
del tono principal en los recuentos. Eligiendo la ventana hay que cumplir una
condición: la ventana no contiene ni un segmento o contiene los segmentos del mismo
tipo, o del tipo «kepstrum».

15.10.4 Método espectral


Para calcular el tono principal de la señal por el método espectral, hay que entrar
en el menú Análisis->Tono principal (espectro). En la pantalla aparecerá el menú
estándar, el modo del uso del cual está descrito en el p. 4.5. Al apretar sobre el campo
«OPCIONES» se abre el submenú de las opciones del procedimiento «Tono principal»
(Dibujo 51).

Dibujo 51. La ventana de ajuste para el cálculo del tono


principal por el método espectral
El método espectral del cálculo del tono principal utiliza las siguientes opciones:

ƒ La voz femenina o masculina


ƒ Micrófono o canal telefónico
Este método funciona sólo para las señales con la frecuencia de discretización
11025 y la longitud no menos que 10 segundos. Sobre la base del análisis espectral
fue realizado el algoritmo de comparación de hablantes.

130
15.10.5 Comparación de locutores
Para comparar los hablantes según la estadística de su tono principal hay que
colocar en la ventana Для сравнения дикторов по статистике их основного тона
необходимо поместить o 2 fragmentos acústicos comparados o dos fragmentos del
tono principal calculado (algoritmo espectral). La longitud de los fragmentos debe ser
no menos que 10 segundos.

Al elegir el punto del menú Análisis -> Más funciones…-> Comparación de los
locutores en la pantalla аparecerá la ventana con nombres de las señales
comparados.

Se puede fijar las opciones:

• La voz femenina
• El canal telefónico
• Por el tiempo menor. En este caso las señales se comparan por el intervalo,
correspondiente a la duración de la señal más corte.
Al apretar sobre «START» el programa calcula el tono principal (si en la ventana
están los datos acústicos) para cada de las señales y efectúa la comparación de las
características estadísticas. Los resultados de la comparación se presentan en el
cuadro (Dibujo 52).

Si es necesario introducir los resultados obtenidos en un documento textual –


destaquen el texto con el ratón, copien un fragmento en el portapapeles del cambio, y
luego interpóngalo del portapapeles del cambio en el documento.

Dibujo 52. Comparación de la estadística del tono principal

131
15.10.6 Control de la justeza del cálculo del tono principal
Se puede realizar control de la corrección del cálculo del tono principal por varios
métodos:

• Haciendo coincidir la curva del tono principal y el kepstrograma;


• Comparando los resultados del cálculo del tono principal recibidos al usar
varios métodos del cálculo del tono principal y determinando el valor del tono
principal en partes distintos;
• Midiendo las distancias entre los períodos próximos en los sectores tonales en
el ocsilograma.
Un método más conveniente y demostrativo es el primero. Para usarlo, hay que
introducir el tono principal a la misma ventana que el kepstrum. Ahora podrá con
facilidad comprobar si es correcto el cálculo del tono principal: el tono principal está
calculado correctamente si por la mayoría absoluta de los partes coincide con
ennegrecimiento máximo del кепстрограммы dinámico. En caso contrario calculen de
nuevo el tono principal, cambiando los valores de límite de las frecuencias. (véase el p.
15.10.2).

Si al calcular el tono principal vuelve a revelarse la incoincidencia del tono principal


y del ennegrecimiento máximo en el kepstrograma dinámico, es necesario por medio
de aproximaciones consecutivas conseguir a separar correctamente el tono principal,
lo para que existen varios métodos:

• El valor del tono medio (inicial) en las instalaciones aumentar o disminuir así
que los valores de esta frecuencia +/- igualdad inicial permitan «cortar» las
intermitencias indeseables en las harmónicas múltiples del tono;
• Disminuir la igualdad inicial de la curva, por ejemplo, de 40 hasta 20;
• Aumentar un tanto el mínimo absoluto o reducir el máximo absoluto, cortando
con esto las gamas de frecuencias indeseables;
• Cambiar los parámetros para cortar pausas y ruido.
Al fijar de esta manera los valores terminantes de los parámetros, realicen el
cálculo del tono principal por toda la señal.

Si para distintos partes de la señal se necesita realizar los cálculos con


instalaciones diversos, estos partes deben procesarse separadamente y los resultados
obtenidos deben ser guardados en un file.

Notas

En tales situaciones es deseable realizar el procesamiento en los partes que se cruzan,


pues el separar del tono principal se termina sin alcanzar la ultima marca (en el
momento cuando en el fragmento no quedan bastantes recuentos para la ventana de
análisis)
Además, hay una posibilidad de corregir el tono principal sobre la imagen del
espectro.

132
15.10.7 Corrección del tono principal para la imagen del espectro
En caso necesario, se puede utilizar la función de la corrección manual del tono
principal. Para hacerlo hay que introducir el tono principal a la misma ventana que el
kepstrum, y abrir en la ventana-lupa el fragmento que se necesita corregir. (más
detalladamente sobre el régimen «Lupa» véanse. p. 10.5). Después de esto la
redacción del tono principal se efectúa por medios regulares del sistema SIS (véanse.
p.10.6. )

15.11 Cálculo del espectro momentáneo de Furie


En cualquier punto de colocación del marcador puede ser efectuado el análisis del
espectro («FFT» – la transformación rápida de Furie) en 32 … 131072 recuentos con
uno de los cuatro realizados en el programa de las ventanas de suspensión (Hamming,
Hann, Nuttall, rectangular (sin la ventana)).

Para realizar esta operación es necesario que haya por lo menos una marca
temporal.

Para calcular el espectro momentáneo, hay que entrar en el menú Análisis->Más


funciones… y en la lista que se abrirá elijan FFT espectro de la potencia. Después de
hacer esto en la pantalla aparecerá en seguida el menú especializado «FFT espectro de
la potencia» (Dibujo 53), con la ayuda del cual el usuario puede fijar los parámetros
necesarios para calcular el espectro.

Dibujo 53. Menú del procedimiento «FFT del espectro de la potencia»

Para calcular el espectro hay que fijar los valores para los siguientes parámetros:

«Tamaño del cuadro (puntos)». El usuario puede elegir la dimensión necesaria de la


transformación rápida de Furie.

133
«Tipo de la ventana de suspensión». Véanse la descripción detallada de las ventanas en
el p. 15.2. El usuario puede elegir uno de los cuatro tipos de la ventana de suspensión:

«Hamming»,
«Hann»,
«Nuttall»,
«No»,
«De los períodos iguales, 2.0».

Al fijar todas las opciones hay que poner en marcha el proceso del cálculo del
espectro momentáneo por elegir el campo «Sí». Al terminar la operación el espectro
calculado se dibujará en la ventana recipiente.

Eligiendo la ventana-recipiente hay que recordar que tiene que comprender los
segmentos del mismo tipo o estar vacío.

15.12 Cálculo del espectro medio de Furie


Calculando el espectro medio de la señal pasa la acumulación de los espectros
calculados en los segmentos particulares de la señal. Esto se puede representar de la
manera siguiente. Sobre la señal se pone la ventana, el tamaño de la que corresponde
al tamaño del cuadro fijado. Sobre la extracción de la señal que ha caído a esta
ventana se calcula el espectro. Luego la ventana se desplaza por algún cantidad y en la
extracción siguiente se calcula el espectro, etc. Así pasa la acumulación de los
espectros por toda la señal y se calcula el espectro promediado.
Para calcular el espectro medio de la potencia hay que entrar en el menú Análisis
-> FFT espectro medio de la potencia. En la pantalla aparecerá el menú estándar, el
trabajo con el cual está descrito en el p. 4.5. Al apretar sobre el campo «OPCIÓNES»
en la pantalla aparecerá submenú «FFT espectro medio de la potencia», en el que el
usuario puede fijar todos los parámetros necesarios.

Al fijar los parámetros necesarios, el usuario debe crear o elegir la ventana para
introducción de la información y al elegir el tipo del fragmento procesado, poner en
marcha el proceso de la ejecución de la operación (acumulación del espectro).
Impedimento para ejecución de esta operación puede ser sólo el tipo inadecuado de la
ventana recipiente.

En lo bajo de la pantalla en la línea de los mensajes se representará el indicador del


grado de ejecución de la operación. Por lo como se llene se puede seguir el proceso
del cálculo. Se puede interrumpir el proceso apretando sobre la tecla ESC>. Al terminar
la operación el espectro medio se dibujará en la ventana recipiente.

La fijación de los parámetros se efectúa en el submenú «Espectro promedio de la


potencia» (Dibujo 54).

134
Parámetros de este submenú (inclusive los submenú incluidos) son los siguientes:

«Tamaño del cuadro (puntos):». El usuario puede elegir el cuadro del tamaño 32 ...
131072 recuentos. Al fijar la longitud del cuadro en los recuentos en seguida se
presentará en milisegundos arriba a la izquierda.

«Paso del desplazamiento del cuadro (puntos)». El usuario puede intentar de


establecer el tamaño del desplazamiento del cuadro por la señal para el cálculo del FFT
siguiente. Hay que recordar que eligiendo el paso del desplazamiento del cuadro
superando el tamaño del propio cuadro, no todos los puntos de la señal participarán
en el proceso de acumulación del espectro. La óptima es la fijación del paso del
desplazamiento dentro de los límites 1/4 - 1/2 de la longitud de la ventana del
análisis. Al fijar la longitud del paso del desplazamiento del cuadro en los recuentos
esta en seguida se representa en milisegundos arriba a la derecha.

Dibujo 54. «FFT espectro medio de la potencia»

«Tipo de la ventana de suspensión». Véanse la descripción detallada de la ventana


en el p. 15.2.

«Hamming»,
«Hann»,
«Nuttall»,
«Gauss»,
«No».

135
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una del las primeras cuatro ventanas: rectangular («No»), de
Hamming, de Hann, de Nuttall, de Gauss.

«Normalización» – es la normalización de la señal en cada extracción por una


amplitud fija. En caso de elegir este opción antes del procedimiento FFT en cada
cuadro se efectúan los siguientes normalizaciones. La inclusión de la opción permite
conseguir que los partes de la señal grabados con niveles de la amplificación distintos
(los que tienen diferencias en la amplitud máxima), harán una contribución igualmente
relevante en la obtención de medio de los componentes espectrales. Sin embargo la
inclusión de solo una esta opción puede llevar a la acumulación de las alteraciones
indeseables, ya que los partes ruidosos que se encontraron en el cuadro corriente
también serán amplificados. Para eliminar este efecto se necesita la conexión
simultánea de la opción «Omitir las pausas».

«Omitir las pausas» – realizar el análisis de verificación de la presencia de la pausa


en la parte de la señal con la amplitud inferior al umbral fijo. A inclusión de este
régimen en el caso de que la amplitud máxima por la extracción para FFT no supere al
valor del límite, la extracción será omitida.

«La media geométrica» – si este régimen está activo, se estará acumulando no el


espectro medio aritmético, sino aquel medio geométrico (la raíz de la potencia N del
producto de N factores).

«El nivel de la normalización» – la amplitud para la normalización del cuadro con la


opción fijada «Normalización». La amplitud real máxima de la señal en el cuadro se
trasforma al nivel fijado de la normalización. Las demás amplitudes se representan en
una escala relativa.

«La amplitud para la determinación de las pausas» – la amplitud máxima para el


análisis por la presencia de la pausa. Se utiliza sólo en caso de la opción fijada «Omitir
las pausas».

Al fijar todos los parámetros hay que apretar «Sí». En la pantalla aparecerá el menú
anterior «FFT Espectro medio de la potencia».

15.13 Análisis de formante

15.13.1 Cálculo de formantes


El análisis formante sirve de suplemento al cálculo de los formantes en la
obtención de los espectrogramas dinámicos (véanse el p. 15.3). El análisis formante
(menú Análisis->Análisis formante) permite calcular sólo formantes (sin
espectrograma) y representar los formantes de señales diferentes uno sobre otro.

Con la ayuda de la operación Redacción->Desplazamiento del segmento se puede


mover los formantes a la derecha o a la izquierda, mirando por la coincidencia o
incoincidencia de la estructura de los formantes de la voz para varios hablantes.

136
En este sistema están previstos dos métodos distintos del cálculo: «LPC» (por el
modelo de los coeficientes de la pronosticación lineal) o «espectral» (por los espectros
igualados de Furie con la sustracción del ruido). El método «LPC» da los resultados
más precisos en los sonidos tonales, aquel «espectral» – en los sonidos no tonales y
las señales superruidosas. El método «espectral» determina el número de los
formantes por sí mismo, y si su cantidad es más que la fijada en el menú, omite a la
grabación los excesivos (los de alta frecuencia). Los valores de los formantes
inexistentes se llenan por el número irrealizable (-1) y no se representan. El método
«LPC» siempre calcula tantos formantes cuantos están indicados en el menú. Con esto
una parte de los formantes puede no estar conforme a los datos reales.

Apretando sobre el campo «OPCIÓNES» se abre el menú especializado de la


operación (Dibujo 55).

Dibujo 55. El análisis formante

Al cambio del método del cálculo, el aspecto del menú algo cambia, ya que los
métodos utilizan varias selecciones de los parámetros :

«Tamaño del cuadro (de los puntos):»

• Para el método «LPC» – el número derivado, superando la cantidad doble de los


formantes,
• Para el método espectral – la potencia del número 2 (de 16 hasta 2048), ya que
para el análisis se utiliza FFT.
«Paso del desplazamiento (de los puntos)» – número derivado para los ambos
métodos.

«Resolución por la frecuencia (Hz)» – se utiliza sólo en el método «LPC», cambia de


5.3 hasta 689.0 Hz. Cuanto mejor es la resolución, tanto más despacio se calculan los
formantes.

137
«El número de los formantes» – cualquier número positivo de 1 hasta 16, se utiliza
para desviación de la memoria.

«Tipo de la ventana de suspensión». Véanse la descripción detallada de las


ventanas en el p. 15.2.

(«Hamming», «Hann», «Nuttall», «Gauss», «No»).


«El variante del método» - sirve para el cambio del método del cálculo. Para
cambiar el método, hay que entrar en el campo y apretar sobre el campo «Método del
cálculo».
Al apretar repetidamente el método volverá a aquel inicial . Al cambiar el método
la selección de los parámetros cambia.

El campo «Pérfiles» permite utilizar los siguientes parámetros estándares:

ƒ Hombre
o Tenor (130-520 Hz)
o Barítono (110-390 Hz)
o Bajo (80-350 Hz)
ƒ Mujer
o Soprano (260-1050 Hz)
o Mezzo soprano (220-880 Hz)
o Contralto (165-700 Hz)

15.13.2 Corrección de formantes bajo las imágenes de los espectrogramas


En caso necesario, se puede utilizar la función de la corrección a mano de los
formantes sobre la imagen de la espectrograma. Para esto hay que introducir los
formantes a la misma ventana que la espectrograma, y abrir en la ventana lupa el
fragmento que hay que corregir (véanse más detalladamente sobre el régimen «Lupa».
En la ventana-lupa cada formante se representa con su color (por ejemplo, la primera –
con el verde, la segunda – con el rojo, etc.).

Luego hay que abrir el menú contextual de la lupa de los formantes, haciendo el
clic con el botón derecho del ratón sobre el campo funcional de la ventana-lupa
(Dibujo 56).

Dibujo 56. Menú contextual de la lupa de los formantes


138
Para entrar en el régimen de la corrección de los formantes hay que elegir «El
cambio del formante X», donde X es el numero del formante. Con esto en lo bajo de la
ventana de la lupa aparecerá una inscripción correspondiente, y el cursor adquiere el
aspecto . Si el botón izquierdo está apretado se efectúa la corrección de la
formante. El número de la formante redactada se puede cambiarlo girando la rueda del
ratón.

Para borrar el formante hay que elegir en el menú contextual «Borrar los
formantes» o «Borrar los formantes en la región (todos)».

El régimen «Eliminación de las formantes» permite eliminar los formantes según el


principio de la goma de borrar. El tamaño de la goma se ajusta por girar la rueda del
ratón.

Eligiendo el régimen «Borrar las formantes en el campo (todos)» el cursor se


desaparece, y aparece el cuadro punteando. Apretando sobre el botón derecho del
ratón TODOS los formantes, que caen dentro de los límites del cuadro por el eje del
tiempo, serán eliminados y el cursor entrará en el régimen de la goma de borrar. Los
tamaños del cuadro se regulan por el movimiento del ratón con el botón izquierdo
apretado.

Para salir del régimen del cambio o del borrar de las formantes hay que elegir en el
menú contextual «La lupa de los formantes».

Para salir del régimen de lupa hay que apretar sobre <Esc> en el teclado.

15.14 Calculación de histogramas


En el SIS las histogramas pueden ser calculadas para oscilogramas y el tono
principal.

Para calcular la histograma hay que entrar en el menú Análisis->La histograma. En


la pantalla aparecerá un menú estándar del tipo «Fuente-recipiente», el trabajo con el
cual está descrito en el p. 4.5. Al apretar sobre el campo «OPCIÓNES» se abre el
submenú de la operación «Histograma», en el que el usuario puede fijar los
parámetros necesarios.
La histograma se calcula de la manera siguiente: todo el intervalo del límite inferior
hasta el límite superior con el paso fijo se divide en subintervalos. A cada subintervalo
corresponde su valor propio de histograma. Si el valor de la señal analizada cae en el
intervalo determinado, entonces el valor de la histograma en el se aumenta por 1. Al
analizar todos los valores de la señal inicial, recibimos la histograma. Luego se
normaliza de tal manera que el total de todos los valores de la histograma multiplicado
por la longitud del intervalo, sea igual a uno. Consiguientemente, de hecho el valor de
la histograma después de la normalización es igual a la densidad de la probabilidad de
encontrar el valor determinado de la señal. De resultas, si la histograma es fluida,
entonces casi no depende del paso. Esto se puede fácilmente comprobarlo, por
ejemplo, calculando histogramas de la oscilograma de la voz alta en el intervalo de -
500 hasta 500 con el paso 2, 5 o 10 recuentos.

139
Para esta operación se utilizan tres parámetros a fijar:

«El límite inferior» – todos los valores inferiores al valor dado caen en el primer
recuento de la histograma.

«La límite inferior» todos los valores superior al valor dado caen en el último
recuento de la histograma.
«El paso» – paso de la división del intervalo en subintervalos del límite superior al
límite inferior

Todos los parámetros se fijan en los recuentos para la oscilograma y en los


hertzios para el tono principal. Si para formar la histograma determinada al programa
carece de la memoria, aparecerá el mensaje «El paso de la histograma es demasiado
pequeño». Entonces hay que o disminuir el paso, o cambiar los límites inferior y
superior.

Además, los datos básicos de cualquier tipo pueden ser leídos del disco como
textuales. Después de esto se puede calcular la histograma según ellos.

15.15 Comparación de histogramas y calculación de sus parámetros


Para comparar los histogramas y calcular sus parámetros hay que tener dos
histogramas en una ventana. Pueden ser:

• dos histogramas de un tipo (o tipo semejante),


• dos histrogramas «el suyo/opositor».
Para realizar la comparación de las histogramas, hay que entrar en el menú Análisis
-> Parámetros de la histograma. En la pantalla aparecerá el menú de la selección del
tipo de histogramas:

• «El par el suyo/opositor»


• «Histogramas semejantes»
Si será elegida la opción «El par el suyo/opositor», entonces al realizar los cálculos
en la pantalla aparecerá el menú «Parámetros de la histograma» (Dibujo 57).

Dibujo 57. El menú del procedimiento


«Parámetros de la histograma» (el tipo «Par el suyo/opositor»)

140
El menú tiene cuatro columnas. En la primera columna se encuentran los nombres
de los parámetros calculados. En la segunda – el nombre del primer file y los valores
de estos parámetros para su histograma. En la tercera - el nombre del segundo file y
los valores de estos parámetros para su histograma. En la cuarta («Relación») – los
valores de relaciones de los parámetros para el primero y el segundo archivo.
Los parámetros calculados:
«Mediana» – coordenada del punto, a la izquierda y a la derecha de la cual las áreas
en lo bajo de las histogramas son iguales.
«Centro de gravedad» – el primer momento de la histograma. Para las histogramas
simétricas se coincide con la mediana.
«El nivel único del error» – con un cierto valor de la abscisa la probabibilidad de
omitir al locutor «mio» tomándolo por él ajeno es igual a la probabilidad de aceptar al
locutor «ajeno» tomándolo por el «mio». El valor de esta probabilidad se llama Nivel
único del error
«Coordenada Nivel único del error» - coordenada (abscisa) del Nivel único del
error
Si será elegida la opción «Las histogramas semejantes», entonces después del
cálculo en la pantalla aparecerá el menú «Parámetros de la histograma» (Dibujo 52).

Dibujo 58. Menú del procedimiento


«Parámetros de la histograma».(tipo «Histogramas semejantes»)

El menú tiene cuatro columnas. En la primera columna se encuentran los nombres


de los parámetros calculados. En la segunda – el nombre del primer file y los valores
de estos parámetros para su histograma. En la tercera - el nombre del segundo file y
los valores de estos parametros para su histograma. En la cuarta («Relación») – los
valores de relaciones de los parámetros para el primero y el segundo file.

« Desviación media aritmética» – la raíz cuadrada de la dispersión (del segundo


momento) de la histograma.

« Asimetría (inclinación)» – la raíz cúbica del momento tercero de la histograma.

«Correlación» - correlación de aquellas partes de las histogramas que se


encuentran entre las marcas temporales. Si no hay las marcas temporales, entonces se
busca la correlación entre las histogramas completas. El valor de la correlación siempre
se encuentra dentro de los límites de 0 (sin correlación) hasta 1 (las señales son
proporcionales).
141
15.16 Investigación de las fonogramas con el módulo EdiTracker
En el programa SIS se puede utilizar el módulo programático para detectar los
índices del montaje de las fonogramas magnéticas EdiTracker. Para abrir a este
módulo ha que utilizar el mando del menú Análisis->Más funciones->EdiTracker o
con el botón sobre el panel de herramienta de la ventana principal. La instrucción
detallada sobre el trabajo con EdiTracker se encuentra en el manual del usuario de este
módulo programático.

142
16 MANUAL DEL EXPERTO ACÚSTICO PARA EL ANÁLISIS DE LAS
NEGOCIACIONES DE AVIACIÓN
Para decodificar información de grabadoras automáticas del bordo se ofrece el
siguiente procedimiento:

1) Grabación de la señal de grabadora automática del bordo en el régimen


«Estéreo» (en el canal derecho las señales del tiempo astronómico). La conservación
de la señal introducida en el file en disco rígido.
2) Decodificación de señales del tiempo astronómico. La conservación de la señal
obtenida en el file en disco rígido.
3) Elaboración y escucha de señal usando las funciones del programa SIS.
La información sobre tiempo astronómico grabada en el régimen MSRP-64-2
puede ser decodificada automáticamente por el programa. En caso de que el programa
no reconoce las marcas del tiempo durante la decodificación entonces el usuario
puede formar canal de las marcas del tiempo a base de la información acerca de
correspondencia de lugar determinado del fonograma al determinado momento de
tiempo.

16.1 Introducción de los datos sacados de las grabadoras automáticas del


bordo al ordenador
Para grabar la señal de la grabadora automática del bordo el usuario necesita usar
la opción del menú Los datos-> Introducir la señal del transmisor automático y
establecer el régimen de grabación «Estéreo», 16 bits. La grabación en el ordenador
empieza al pulsar la tecla «Espacio» Al pulsar la tecla la segunda vez se para la
grabación.

Se recomienda para conservar el sonido introducido en el disco usar la opción del


menú Los datos->Conservar segmento o Los datos->Conservar fragmento. Lo que
permite evitar larga introducción repetida de la señal de la grabadora automática del
bordo.

Después se puede decodificar las marcas del tiempo de la señal introducida con la
opción Redacción->Canal del tiempo de servicio->Decodificar las marcas. Al descubrir
errores en el código de las marcas del tiempo el programa emite una señal acústica e
informa acerca de tipo de error en la línea bajo de la pantalla. Para corregir errores se
puede usar funciones del menú Redacción->Canal del tiempo de servicio.
La señal formada de esta manera contiene información acerca del tiempo
astronómico para cada punto. La información se presenta en la ventana como una
escala adicional en el eje del tiempo. Con cursor se puede conseguir información más
detallada acerca del tiempo astronómico. La señal examinada y corregida debe ser
conservada en el disco. Sin embargo, se puede borrar la primera copia de la señal para
ahorrar espacio en el disco.

143
16.2 Trabajo con señales que contienen marcas del tiempo
Para trabajar con señales grabadas en formatos MSRP-64-2 y MSRP-A y que
contienen las marcas del tiempo es necesario entrar en el menú Redacción->Canal del
tiempo de servicio. El menú abierto tiene varios puntos que se describen a
continuación. Todos ellos sirven para correlación correcta de la señal, que contiene
marcas del tiempo, con el tiempo astronómico. En vez de la señal analógica obtenida
de la grabadora automática del bordo en el canal de servicio se graban los significados
decodificados del tiempo astronómico de tipo binario con la exactitud hasta 0,1 seg.
Hasta que la operación sea realizada el file con las marcas del tiempo para el sistema
SIS es un estéreo file ordinario. Al terminar de realizar la operación el sistema SIS
puede presentar el tiempo astronómico justamente bajo la imagen de la señal de una
manera correcta. (Dibujo 59).

Dibujo 59. La presentación de la señal con valores


del tiempo astronómico en el canal de servicio

Si la señal en el canal de servicio no contiene errores es suficiente realizar una sola


operación «Decodificar las marcas». En caso de errores se requieren más operaciones.

Observación:
-se debe tomar en cuenta que al presentar en el programa los valores de las marcas
del tiempo están limitados por el intervalo de 12 horas.
-los valores falsos del tiempo de marcas del tiempo astronómico pueden ser
presentados en la escala del tiempo como:

144
16.2.1 Decodificar las marcas
La señal inicial es la señal estéreo con impulsos del tiempo en el segundo canal.
Para sacar la información grabada es necesario realizar la decodificación. Al decodificar
las marcas en la ventana de los datos aparece una escala adicional del tiempo con el
tiempo astronómico.

En caso de que las marcas del tiempo aparecen en el primer canal se puede realizar
la operación «Cambiar de lugares los estéreo canales» del menú Redacción-
>Mono/Estéreo operaciones.

El programa automáticamente decodifica las marcas del tiempo grabadas en los


regímenes MSRP-64-2 y MSRP-A. Los singulares impulsos de fallo se ignoran. En caso
de revelar secuencia incorrecta de los códigos del tiempo el programa emite la señal
acústica y el usuario puede analizar la causa y también corregir los errores con la
función del menú Redacción->Canal del tiempo de servicio.

Si el canal de servicio fue hecho primero hay que iniciar la función «Examinar las
marcas del tiempo». Luego en los lugares de errores se ponen las marcas fijas. Tiene
que analizar los errores y si es preciso corregirlos. Sólo al hacerlo se puede considerar
que el tiempo astronómico es correcto.

16.2.2 Crear las marcas


La señal inicial es la monoseñal con información acústica. Al realizar operación
«Crear las marcas» en el canal de servicio se graban los valores del tiempo
astronómico de tipo binario con una exactitud hasta 0,1 seg. Se precisa tal operación
en caso de faltar el canal de servicio en la grabación inicial o está dañado éste
irreversiblemente.

Observación:
La señal inicial debe ser de 16 descargas. Para las señales de 24 descargas no se crean
las marcas del tiempo.
La monoseñal se puede obtener de la estéreo con la opción del menú Redacción ->
Mono/Estéreo operaciones -> Dividir la estéreo señal en 2 mono. La estéreo señal
decodificada con las marcas del tiempo incorrectas puede ser transformada en mono
con la operación «Quitar el Canal de Servicio» del menú Redacción -> Canal de tiempo
de servicio.
Las marcas del tiempo pueden ser creadas por uno o dos puntos indicados
(derecho, izquierdo o los dos límites del intervalo dado). Es necesario indicar en la
ventana de parámetros los límites a usar y también los valores del tiempo en los
puntos.

Ejemplo 1:

Se sabe que el tiempo astronómico (2:12′37″) corresponde al valor (14.56) del


tiempo relativo. Sus acciones son:
• Ponga dos marcas del tiempo, una en la posición 14.56 segundos, y la otra
cerca.
145
• Entre en el menú Redacción, haga que el intervalo entre las marcas del tiempo
sea corriente (submenú «Está computando»), entre en el menú Canal del tiempo
de servicio y escoja el punto «Crear las marcas».
• Establezca en la ventana de parámetros el banderín junto al valor 14.56 y
remueva el banderín en otra ventana (Dibujo 60).
• Introduzca el tiempo 2:12′37″0 en la línea con banderín.
• Pulse «Sí» para continuar,

Dibujo 60. La ventana de introducir el tiempo para el intervalo elegido

El canal del tiempo de servicio se creará en toda la señal según un sólo punto
indicado (14.56 seg. - 2:12′37″).
Ejemplo 2:

Se sabe que el inicio de la grabación corresponde a 10:17′33″ y el final a


11:22′33″. Sus acciones son:

• Entre en el menú Redacción, haga que el intervalo «Todos los datos» sea
corriente, luego entre en el menú Canal del tiempo de servicio y escoja el punto
«Crear las marcas».
• En la ventana de parámetros (Dibujo 52) ponga el banderín en cada línea.
• De el tiempo 12:17′33″0 en la línea arriba y 13:22′33″0 en la línea bajo. Pulse
«Sí» para continuar.
El canal del tiempo de servicio se creará en toda la señal según dos puntos «Todos
los datos».

16.2.3 Interpolar en el intervalo


En la señal que contiene una parte con significados del tiempo astronómico
decodificados incorrectamente es necesario subrayar el intervalo superando el
intervalo con significados fallados. Se puede usar siguientes intervalos:

• todos los datos;


• los visibles en la ventana;
• iluminados;
• entre las marcas del tiempo.
Para ello pulse la señal correspondiente en el menú Redacción->Canal de tiempo
de servicio.

146
Los valores del tiempo relativo en los márgenes del intervalo se presentan en la
ventana de los parámetros para poder controlar.

Todos los valores de las marcas del tiempo dentro del intervalo serán copiados
según la fórmula de la interpolación lineal.

Ejemplo:
Dos envíos fallados durante la decodificación consecutivamente han marcado la
parte con valores del tiempo astronómico incorrectos. Sus acciones son:

• Ponga dos marcas preliminares a la izquierda y a la derecha de la parte


• con valores fallados.
• Entre en el menú Redacción, haga que el intervalo entre las marcas del tiempo
sea corriente, en el submenú Canal de tiempo de servicio escoja el punto»
interpolar en el intervalo».
• En la ventana de los parámetros aparecen los valores del tiempo relativo y el
astronómico en los márgenes del intervalo. Si los tiempos están indicados
correctamente, pulse «Si» para continuar. Todos los valores del tiempo
astronómico entre las marcas del tiempo serán calculados con una exactitud
hasta 0,1 seg. según la fórmula de la interpolación lineal.

16.2.4 Cambiar la frecuencia de discretización


Para controlar la correspondencia del tiempo astronómico con el relativo y también
para concordar el tiempo relativo y el astronómico grabado es necesario escoger el
intervalo en el que se calcule el coeficiente de adaptación defectuosa. El coeficiente
puede ser usado para cambiar la frecuencia de discretización lo que debe concordar la
velocidad del cambio de código de las marcas del tiempo y del tiempo relativo. Por
ejemplo, la señal en el tiempo astronómico dura de 5 horas 0 minutos hasta 5 horas
30 minutos (1800 segundos), y en el relativo de 0 a 25 minutos 10 segundos (1510
seg.). Entonces para concordar los tiempos es necesario dar el coeficiente
1510/1800=0.838888.

La frecuencia de discretización se cambia en toda la señal y no sólo en el intervalo


indicado. El nuevo valor de la frecuencia se obtendrá por dividir el valor antiguo de la
frecuencia en coeficiente dado.

Para facilitar el procedimiento el valor del coeficiente calculado en los márgenes


del intervalo se presenta al usuario en la ventana de los parámetros. Si el valor del
coeficiente se varía de 1, en este caso se recomienda fijar la causa de adaptación
defectuosa en vez de aceptar el coeficiente automáticamente.

Por ejemplo, en uno de los márgenes del intervalo el valor del tiempo astronómico
ha sido decodificado incorrectamente. En este caso es necesario interpolar las marcas
del tiempo para corregir la situación y sólo al hacerlo se puede iniciar el procedimiento
del cambio de frecuencia de discretización.

Cabe señalar que cada vez el programa calcula automáticamente el valor del
coeficiente para corregir sin presentar el valor introducido antes.
147
16.2.5 Trasladar las marcas
Dicha opción del menú permite trasladar las marcas del tiempo en cada punto de la
señal en una magnitud dada. Por ejemplo, cambiar de zona del tiempo o introducir la
corrección de diferencia de indicaciones del tiempo de grabadoras automáticas del
bordo. Es preciso tomar en cuenta que las marcas se trasladan dentro del intervalo de
12 horas.

16.2.6 Revisar las marcas del tiempo


La opción del menú permite ubicar y marcar lugares en los que el código de las
marcas del tiempo sufre una ruptura. La consecuencia correcta del código de las
marcas del tiempo supone el cambio del código en 1. Si aparecen partes problemáticas
se marcarán con las marcas. La operación debe iniciarse al decodificar las marcas del
tiempo. Las marcas puestas automáticamente pueden ser usadas para dar intervalos
en operaciones con el canal de servicio.

Ejemplo:

En la cinta de la grabadora automática del bordo hay una parte de la grabación de


conversación del vuelo anterior que se debe borrar. Al realizar la operación de
decodificar el programa informa que el orden de las marcas está violado.Sus acciones
son:

• Elija la opción del menú «Comprobar las marcas del tiempo». La parte de la
grabación de conversaciones del vuelo anterior está marcado con marcas en los
márgenes.
• Ilumine el intervalo pulsando la tecla derecha del ratón entre las marcas.
• Haga que el intervalo «Los datos iluminados» sea corriente y elimínalo usando la
opción del menú Redacción->Eliminar. Cabe señalar que las marcas que están
después de la parte a quitar se dejan en sus lugares y los datos se trasladan. Si
hay otras partes a corregir se debe repetir la operación «Comprobar las marcas
del tiempo».

16.2.7 Eliminar el canal de servicio


Es necesario eliminar el canal de servicio si fue hecho o redactado incorrectamente.
Al pulsar esta panel aparece la solicitación en la pantalla(Dibujo 61).

Si el usuario pulsa la tecla «Sí» entonces el canal del tiempo de servicio será
eliminado y toda la ventana se cambia sin digitalizar según el tiempo astronómico.

Si el usuario pulsa la tecla «Cancelar» entonces no habrá ningún cambio en el


sistema.

148
Dibujo 61 Solicitud de confirmación de la eliminación del canal de tiempo de servicio

16.3 Descripción del principio de decodificación de


las marcas del régimen msrp-64-2(en el canal de servicio)
Los impulsos TTL al pasar por la capacidad entrante del preamplificador se
someten a la deformación por ello para decodificar se usan las porches de impulsos y
no la amplitud de éstos.

El cambio del código en más de 1000 de un punto a otro significa la presencia de


la porche del impulso. La falta de porches de impulsos en más de 0.1 seg. significa la
pausa entre los envíos de impulsos. El intervalo entre impulsos permite definir el tipo
de impulso (la sincronización o los datos). En el régimen MSRP-64-2 la duración de
impulsos es 2-4 mseg., la relación de repetición de los impulsos es 16 mseg. el
desplazamiento de los impulsos de los datos en cuanto a los de sincronización es
8mseg.. El programa comprueba el corresponder del código del envío al valor
esperado (es el valor del tiempo anterior o se aumenta en un minuto más). En caso de
no corresponder el único código de falla éste se ignora.

149
17 PRUEBA DE LA TARJETA DE ENTRADA/SALIDA CON LA AYUDA DEL
PROGRAMA SIS
El ADC y D/A convertidores usados para el proceso de las señales tienen más
características dinámicas obtenidas después de transformar y hacer el análisis
espectral de la señal ejemplar sinusoidal:

• la relación (razón) señal/ruido (SNR),


• el coeficiente de las deformaciones armónicas (el coeficiente de las
deformaciones no lineales) (THD),
• la capacidad eficaz del ADC y del D/A convertidor (Nd).
Las deformaciones de la señal aparecida en el proceso de transformación se
presentan por el nivel del ruido de transformación y por el nivel de la segunda
armónica y de las siguientes de la señal principal.

La capacidad eficaz (Nd). del ADC y del D/A convertidor se calcula de la siguiente
manera:

SNR - 1,76
Nd = -----------------
6,02
El coeficiente de las deformaciones armónicas se calcula de la siguiente manera:

V[2] + V[3] + ... + V[k]


THD = 10 *lg ---------------------------------- , dB
V[1]
o

V[2] + V[3] + ... + V[k]


ТHD = sqrt( -------------------------------- ) *100 %,
V[1]
donde V[1] ... V[k] es el poder de la primera armónica y de las siguientes y k es igual a
la relación entre la frecuencia máxima en el espectro y la frecuencia de la primera
armónica, sqrt es el signo de la raíz cuadrada.

La relación señal/ruido se calcula de la siguiente manera:

V[1]
SNR = sqrt( ----------------------------------------------------------- )
suma de potencias de todas las armónicas - V[1]-V[2]-..-V[k]

150
17.1 Prueba del canal de entrada
Se necesita lo siguiente para obtener los valores de las características antes
mencionadas para el canal de entrada del sonido:

1. Introducir la señal ejemplar sinusoidal (por ejemplo, usando el generador. La


frecuencia de la señal no debe ser menos de 500 Hz y mayor de un cuarto de
la elegida amplitud de discretización, la longitud no debe ser menos de 5 seg.,
la amplitud se aproxima a la máxima (pero sin restricciones del nivel) (se
arregla con el mezclador del programa de antemano). En el caso estándar se
necesita introducir 6-7 segundos de la señal de la frecuencia cerca de 900 Hz.
2. Establecer las marcas del tiempo en la señal obtenida quitando un segundo en
el principio y en el final de la señal.
3. Entrar en el menú Análisis->FFT el espectro promedio de poder.
4. Entrar en el panel «Opciones».
5. En el menú aparecido establecer los valores:
- «El tamaño de la imagen (puntos) – 2048 (aproximadamente 10% de la
frecuencia de discretización en los Hz),
- «Tipo de la ventana de ponderación de Gauss»
- « Intervalo de desplazamiento de la imagen (puntos)» – 401 (20% del tamaño
de la imagen),
- Las opciones «Normalización», «Omitir las pausas» y «El promedio
geométrico» no se activan, en caso contrario es necesario remover los
banderines. Luego tiene que volver al menú inicial pulsando la tecla «Sí».
6. Usando el panel «Crear ventana-receptor» crear la ventana-receptor de
cualquier altura pero que abarque toda la anchura de la pantalla. La anchura
de la pantalla no influye en el resultado pero sí influye en la visibilidad.
7. Pulsar el panel «Entre las marcas provisionales». Después de ello se calcula el
espectro de Fourier y el resultado se muestra en la ventana-receptor.
8. Entrar en el menú Los datos->Prueba de la entrada/salida. Primero el sistema
le da una pregunta: «Usted acaba de introducir en el ordenador la señal
ejemplar sinusoidal y calcular su espectro de Fourier según 2048 puntos con
la ventana de Gauss». Si todas las acciones han sido hechas es necesario
comprobar» sí « pulsando el panel correspondiente. En caso contrario tiene
que comprobar «Cancelar» y volver a hacer todas las acciones según la
descripción.
9. Sí comprueba «Sí» a la pregunta anterior entonces en la ventana corriente
debe aparecerse el multicursor vertical que representa el sistema de los
cursores verticales vinculados, cada cual corresponde a la frecuencia obtenida
por multiplicar una frecuencia de base F0 en un numeral entero que es más o
igual a 1. El valor de la señal (segmento corriente) en estas frecuencias
significa la raíz cuadrada de V[0],V[1], ...,V[N] (véase arriba la fórmula para

151
THD). El sistema considera automáticamente la anchura final de las armónicas
de la señal y no la mezcla con el ruido.
10. Si pone a mover el ratón a la izquierda y a la derecha o a pulsar las teclas
del teclado <flecha a la izquierda>, <flecha a la derecha> entonces el sistema
de los cursores su mueve y en el panel de los mensajes (la línea debajo de la
pantalla) aparece el texto: «SNR=....dB, THD=...dB, Nd=..., f= ... Hz», donde
SNR es la relación señal/ruido, THD es el coeficiente de las deformaciones no
lineales, Nd es la capacidad eficaz de la tarjeta de entrada/salida (bit), f es la
frecuencia correspondiente al primer cursor (F0 en 8). Todos los numerales no
son importantes hasta que el usuario no combine el primer cursor con el pico
principal de la señal ejemplar sinusoidal. El usuario puede tratar de hacerlo
por sí mismo aunque incluso un pixel de la pantalla corresponde a un
desplazamiento de frecuencias bastante grande. Por ello se recomienda
recurrir a la opción del sistema presentada más abajo:
11. Pulsar la tecla F3. Luego en la pantalla aparece el menú de la información
que contiene los paneles: «Relación señal/ruido», «El coeficiente de las
deformaciones no lineales». Enfrente de cada inscripción se da el valor de la
magnitud correspondiente, al mismo tiempo el coeficiente de las
deformaciones no lineales se presenta tanto en decibelios como en por ciento
(Dibujo 62).

Dibujo 62. Tanto en decibelios como en por ciento

12. Si le convienen las valores calculados se puede considerar acabada la


prueba. Si los resultados no le convienen trate de volver a hacer la prueba
realizando antes lo siguiente:
a. cambiar el generador de las señales estándares,
b. compruebe que el equipo de entrada/salida no está puesto encima
de la pantalla, del ordenador ni en cualquier otro equipo electrónico,
c. compruebe que los cables de Winchester y del driver flexible del
disco no están puestos justamente en la tarjeta de entrada/salida.

152
17.2 Prueba del canal de salida
Para obtener los valores de las siguientes características: la relación señal/ruido, el
coeficiente de deformaciones armónicas y el poder eficaz del D/A convertidor para el
canal de salida del sonido es necesario:

Entrar en el menú «Los datos->Crear la señal-prueba».

1. Establecer la amplitud del seno cerca del máximum (por ejemplo, 30 000,
como 32767 es el máximum independientemente de la descarga de la tarjeta
de la entrada/salida). Dar la frecuencia del seno no menos de 500 Hz y no mas
del cuarto de la frecuencia de disctretización. Dar la amplitud del resto de las
señales de prueva con ceros.
2. En el panel «La longitud de la señal en segundos» dar la continuidad deseada
para la señal (de unos 30 seg.).
3. Poner los bits para la señal en la casilla«La señal de 24 bits». Si en el panel
está marcado, el resultado será de 24 bits, en caso contrario de 16 bits. La
descarga (bits) de la señal debe corresponder a la descarga (bits) del equipo
de entrada/salida.
4. Generar la señal de prueba pulsando la tecla «Sí».
5. Para obtener la sinusoide de prueba volver a hacer las operaciones descritas
en el párrafo 18.1 puntos 2-11. Los valores obtenidos de la relación
señal/ruido (105-140 dB), del coeficiente de deformaciones armónicas
(0,0013%-0% para la señal de amplitud 30 000) son los máximos con la
magnitud dada de la señal que se define por la descarga (bits) de la tarjeta y
por el modo dado de analizar (el usar la ventana de Gauss).
6. Obtener el sonido por la salida lineal del equipo usando el menú «El habla-
>Todos los datos» y analizar sus parámetros con el analizador de espectro de
alta calidad. Los valores obtenidos por tal análisis no serán mejor que los
indicados en el subpunto 6 ni de los indicados en el pasaporte técnico del
analizador de espectro. Si le convienen los valores obtenidos se puede
considerar acabada la prueba. Si los resultados no le convienen trate de volver
a hacer la prueba, tiene que hacer de antemano:
ƒ cambiar el generador de las señales estándares,
ƒ compruebe que el equipo de entrada/salida no está puesto encima
de la pantalla, del ordenador ni encima de cualquier otro equipo
electrónico.
ƒ compruebe que los cables de Winchester y del driver flexible de
disco no están puestos justamente en la tarjeta de entrada/salida.

153
17.3 Prueba pasante del canal de entrada/salida
La opción del menú «Los datos->la prueba pasante de la entrada/salida» permite
probar el canal de la entrada/salida de la tarjeta acústica y también los parámetros del
equipo acústico exterior sin usar generadores ni analizadores de espectro. Para ello es
necesario vincular la entrada del equipo de ingreso/salida del sonido con la salida
directamente mediante el cable o a través del equipo probado (amplificador,
ecualizador etc.). Haciendo la prueba, la señal corriente en la ventana se ejecuta y se
graba simultáneamente. El resultado cabe en la nueva ventana con el nombre
«NONAME».

Tiene que tomar en cuenta que recibiendo los valores de las características técnicas
de los equipos no se usa en el programa SIS la A-ponderación (la función de
ponderación que imita las propiedades del oído humano según la sensibilidad de
frecuencias). Por ello los valores de las características obtenidas con el programa SIS se
varían de los indicadas en el pasaporte técnico del equipo que toman en cuenta la A-
ponderación de los resultados de las mensuraciones. La diferencia de los valores no
debe superar 10 dB.

Para obtener la función amplitud-frecuencia del canal de entrada/salida es


necesario formar 10 seg. de la señal-prueba (mono y estéreo) del ruido blanco (Los
datos->crear la señal-prueba) con una amplitud de 5000 y una frecuencia de
discretización desde 10 000 a 30 000 e iniciar la prueba («Los datos->la prueba
pasante de entrada/salida»). Luego es preciso calcular el espectro de la señal
introducida (los puntos 2-7 del párrafo 18.1). El espectro de la señal introducida será
proporcional a la función amplitud - frecuencia del canal de entrada/salida. Como el
generador del programa del ruido blanco no es perfecto pueden aparecer desviaciones
hasta de 1,5 dB en el espectro.
Para medir la relación(razon) señal/ruido y el coeficiente de las deformaciones no
lineales es necesario formar la señal sinusoidal (Los datos->crear la señal-prueba) con
la frecuencia de 1000 hertz en la frecuencia de discretización desde 10 000 a 192 000
Hz y la amplitud de 30 000. Luego se puede escoger el punto del menú «Los datos->la
prueba pasante de entrada/salida».
Es importante no cometer la superación del nivel del valor máximo de la señal es
decir 32 767 conteos. Sin embargo, tiene que tomar en cuenta que el trabajo con
señales débiles disminuye los parámetros de los equipos electrónicos a causa del error
de redondear. Para arreglar el nivel de la señal se usan los mezcladores del programa.

Si el programa SIS fue suministrado en el equipo de «IKAR LAB II+» producido por
«Centro de tecnologías articulatorias,» SA, el conjunto tiene también el mezclador del
programa «Mixer». Para los fines de probar el canal de entrada/salida el régimen de
disminución, los valores de disminución y amplificación en la entrada y salida de la
tarjeta se ponen en 0dB.

Si el valor de la amplitud de la señal-prueba obtenida en la entrada supera el nivel


máximo se debe disminuir el nivel de la señal en la salida de la tarjeta acústica.

154
Se puede hacerlo justamente durante la prueba. Después de ello es preciso volver a
hacer la prueba pasante sin cambiar el nivel de la señal. Sólo los resultados de la
prueba realizada con la amplitud fija que no supere el nivel máximo del valor de la
señal pueden ser usados para evaluar los parámetros del canal de la entrada/salida.

Para obtener el valor numérico de la relación señal/ruido y coeficiente de las


deformaciones no lineales es preciso realizar el procedimiento y adjuntarlo al
resultado de la prueba de la señal. El procedimiento está descrito en el párrafo 18.1.
puntos 2-11.

La estéreo señal se debe dividir en dos mono preliminarmente con el punto


correspondiente del menú Redacción->Mono/estéreo operaciones->Dividir la estéreo
señal en 2 mono. Luego tiene que entrar en el punto del menú «Los datos->la prueba
pasante de la entrada/salida» y aplicarlas a cada una de las mono señales obtenidas
durante el procedimiento descrito en el párrafo 18.1. puntos 2-11.

Se debe señalar que antes de probar cualquier equipo exterior se necesita hacer la
prueba pasante del canal de la entrada/salida de la tarjeta acústica.

155
18 UTILIZACIÓN DE LOS MÓDULOS CONECTADOS
En el programa SIS estan establecidas las posibilidades de conección de módulos
complementarios – plug-in, es decir, programas de módulos independientemente
compilados, conectados dinámicamente al programa principal y destinados para la
amplificación de las posibilidades del mismo.

Para la utilización exitosa de los módulos es posible que sea necesaria la


renovación de algunas bibliotecas dinámicas, comprendidas en el programa SIS.

Para la conección del módulo al programa principal es necesario:

1. Copiar la carpeta con los archivos del módulo a la carpeta plugins,


comprendida en el directorio en cual fué instalado el programa SIS.
Para este caso es C:\Program Files\Speech Technology Center\
SIS\plugins;
2. Mediante en menú Módulo ► Registración del módulo abrir la ventana
de dialogo Registración de los módulos cargados, establecer un
visto delante del módulo (en este ejemplo Speech splitter), el cual se
exige conectar (dibujo 63) y presionar el boton OK.

Dibujo 63. Ventana de registración de los módulos cargados

Si el módulo necesario no se encuentra en la ventana de Registración de los


módulos cargados. Fijese que la carpeta con los archivos del modulo se encuentren en
la carpeta plugins.

Copiar la carpeta con los archivos del módulo a la carpeta plugins en caso de que
esta no este comprendida o cambiarla por una nueva en caso de que esté
comprendida, compruebe su contenido.

156
Nuevamente abrir la ventana de Registración de modulos cargados (menú Modulos
► Registración del módulo) y en ella presionar el boton renovar. Después de la
aparición del módulo necesario en la lista establecer delante de él el banderin y
presionar OK.

En el caso de que por cualquier causa no exista la posibilidad de colocar la carpeta


con los archivos del módulo en el lugar adecuado, se puede tratar de indicar la ruta
hacia el módulo necesario. Para esto: en la ventana de Registración de los módulos
cargados(mirar. dib. 63) presionar en el boton Ruta. En la ventana Control de las rutas
para la busqueda de módulos (dib. 64) presionar en el boton Nuevo, utilizando las
posibilidades del sistema operativo, escoger la carpeta necesaria en la ventana
Resumen de carpetas y presionar en el boton OK (dib. 65)

Dibujo 64. Elección de la ruta nueva hacia el archivo del módulo

Dibujo 65. Elección de la carpeta con los archivos del módulo

157
DICCIONARIO DE TÉRMINOS
Acústico – Fonético (fonéticos) signos del habla(discurso oral) – signos que reflejan
las propiedades acústicas del canal de formación del habla, habilidades articulatorias
del hombre. Este grupo de signos(señales) se captan por medio de la audición y se
detecta a través de medios técnicos, sirve como el principal discurso oral del análisis
intrumental del fonograma.

Amplitud – el valor de la máxima declinación durante el proceso de oscilación


desde alguna posición media (posición de equilibrio), caracteriza la cantidad(valor) del
movimiento oscilatorio (distancia de oscilación). Durante la investigación de
oscilaciones armónicas de audio como amplitud se comprende la audio - presión en la
señal del habla, expresado como amplitud de corriente, voltage o de otra magnitud
eléctrica.

Los aparatos de grabación de audio y de reproducción del sonido – Conjunto de


medios técnicos, utilizados durante la realización de la grabación y reproducción del
sonido:

Micrófonos, amplificadores, mezcladores, grabadoras, dictáfonos


Box de datos – cuadrángulo negro en la ventana gráfica con la representación en
la misma de los ejes de coordenadas dijitalizados. Si en la ventana se ingresan los
datos, estos se representan en el box de datos.
La histograma ( diagrama de columnas) – uno de los tipos de la representación
gráfica de cualquier magnitud separada según signo de valor. El histograma representa
un conjunto de rectángulos continuos, ubicados en una misma linea, cada uno de los
cuales contiene una superficie proporcional a la frecuencia de localización de la
magnitud dada en el intervalo, en el cual se ubica el rectángulo dado.

Diapasón(Banda) – magnitud que caracteriza los límites máximos del camnio de


signos de discurso hablado, la cantidad de bit entre los valores del signo máximo y
mínimo.

Sonido – flujo de energía que provoca las oscilaciones mecánicas de las partículas
del medio flexible, dede el punto de vista filosófico - Oscilaciones mecánicas del
medio flexible captadas por el hombre de manera subjetiva a través de la audición y
que provocan en él determinadas sensaciones.
Sonido del habla(discurso) – unidades mínimas del circuito del habla, denominados
como resultado de una compleja función de artulación del hombre y caracterizados
por determinadas propiedades articulatorias y perceptivas (enlazadas con la captación
del habla).

Indicador/menager de la trasladación horizontal de los datos – dos flechas


triangulares, orientadas a la derecha e izquierda desde la parte media y un triángulo
distribuido(estirado) por el medio, parte del cual esta pintada de color negro.

Botón de la escala horizontal – botón, colocado en la izquierda bedajo del box de


datos con la representación de una flecha de doble sentido.

158
Botón de la escala de la tercera dimensión – botón con la representación de una
pirámide volteada, colocada a la derecha del box debajo del botón del donador de
cursores.

Marca temporal – línea de puntos vertical amarilla en el box de datos. Sirve para la
resaltación de fragmentos de datos. Las marcas temporales en el box pueden ser de 0
hasta 2. Al intentar colocar una tercera marca tempiral una de las ya existentes se
eliminará automaticamente.

Marca costante – línea punteada de color negro-blanco en el box de datos. Sirve


para la resaltación de fragmentos de datos. Puede ser dotada de una nota(en el menú
de lista de marcas) y seleccionada. Al eliminar una marca constante todos los datos
del box se vuelven a dibujar.

Ventana – ventana en el sistema se denomina al rectángulo en la pantalla y a las


representaciones gráficas de datos comprendidas sólo en él.

Frecuencia fundamental(Principal) – frecuencia de oscilación de una forma compleja


que es igual a la frecuencia de oscilación de la primera armónica del espectro discreto;
depende de las magnitudes y de la rapidez de las oscilaciones del paquete de sonido.
Se aplica a los discursos orales, caracteriza el tipo de voz (bas, tenor, discante y etc.).
Oscilograma de la señal oral – representación de la amplitud del proceso
oscilatorio en un intervalo de tiempo continuo, es decir en las coordenadas amplitud-
tiempo. Para su obtención se utilizan los oscilógrafos de bucle, registradores del nivel
de señales(autoregistrador) asi tambien oscilógrafos eléctricos. Con la ayuda del
oscilógrafo, el experto calcula los fragmentos orales (del habla), que después se
puedan investigar.

Pausa - detención en el habla, a la cual corresponde de manera acústica el sonido,


y desde el punto de vista fisiológico – detención en el trabajo de los organos fono-
articulatorios.
Píxel – punto grafico en la pantalla del monitor.

Interferencia – proceso que molesta la captación auditiva de las señales útiles


durante la reproducción de los fonogramas, se presente en forma de difentes tipos de
ruido de fondo y en forma de otras señales no contenedoras de información útil.

Segmento - parte de los datos, enlazados en un grupo y no poseedores de enlace


con otros datos. Por ejemplo, los datos leídos del archivo en el disco conforman un
segmento. Después de la terminación del ingreso del sonido a través de ADC, todos
los datos leidos conforman un segmento. Cada uno de los segmentos nuevos en la
ventana se representan con otro color, mientras existan colores distintos.

Espectro de audio(sonido) - característica acústica de un sonido complejo,


ofrecedora de información sobre la frecuencia de la fuente, la frecuencia de las
armónicas del tono fundamental y sobre la intencidad relativa de todos sus
componentes frecuenciales.

159
Análisis espectro-temporal de la grabación del discurso oral (del habla) – manera
instrumental de análisis de señales de sonido, el cual permite establecer la
dependencia(relación) entre las características de amplitud y frecuencia del espectro
del habla y el tiempo cubierto por el proceso oral. Análisis espectro-temporal permite
de manera mas completa abrir la comprención del habla como un cambio continuo del
espectro de las audio-oscilaciones obtenidas por las modificaciones constantes de los
parámetros de resonadores del aparato articulatorio.

Espectrogram – representación gráfica de los resultados del análisis espectral de


los procesos de audi-oscilación.

Ventana actual(corriente, en curso) – ventana gráfica que sirve en un momento


dado como una ventana-fuente (emisora) de datos. Siempre se encuentra mas arriva
que las demás ventanas. El nombre corto de la ventana corriente se encuentra en la
esquina de la ventana encerrado en un marco.

Transcripción – modo de fijación de manera escrita de las características de los


segmentos del habla.

Formante – región de concentración de energía en el espectro de sonido del habla,


la cual se define por las propiedades de resonancia del canal oral(del habla).

Fragmento – parte de los datos, resaltados de alguna manera en el segmento, pero


que no han perdido el enlace con el resto de datos. Esto puede ser, por ejemplo, una
parte del segmento comprendida entre las marcas temporales o una parte incluida en
el intervalo iluminado entre las marcas, o la parte del segmento vista en el box de
datos.

Energía de la señal - el valor cuadratico promedio de la señal por un cuadro con un


ancho dado, ubicado de forma simétrica según en punto actual de la señal.

160
10-240309-7.0.1.ххх

161

También podría gustarte