Documentos de Académico
Documentos de Profesional
Documentos de Cultura
STC-H203M
ГНОМ 2М
STC-H285
SIS 7
Руководство по эксплуатации
ЦВАУ 467669,008РЭ
Las copias del programa pueden ser trasladadas del disco duro de la computadora,
donde el programa ha sido instalado a modulos de almecenamiento de informacion,
exclusivamente con el objetivo de archivarlos en caso de averia del disco duro de la
computadora.
En el caso de violación de los derechos del autor expuestos en esta licencia, Speech
Technology Center ejecutará el derecho de anulación de sus obligaciones de de
otorgar las: garantías, consultas, instalaciones de las siguientes versiones de software
en las condiciones priveligiadas y también podrá tomar otras medidas para la defensa
de sus derechos de autor en concordancia con la ley del derecho de autor para los
productos de software.
web: http://www.speechpro.ru
1
INTRODUCCIÓN
El sistema ofrecido por Speech Technology Center S.A. está destinado al análisis de
las señales de voz, a la limpieza de ruidos y a la automatización de la ejecución de las
pruebas criminalísticas de los fonogramas en todas las etapas. El sistema dado es
también el medio universal potente para la realización de los trabajos vinculados con:
la limpieza de ruidos, el aumento de la Inteligibilidad y el mejoramiento de la calidad
de las grabaciones del habla. Concede al operador las posibilidades únicas de
entrada/salida, de redacción, de análisis, de visualización y de procesamiento de las
señales de voz y otras señales de baja frecuencia.
En el caso de que SIS estubiese incluido como parte del Complejo de Software y
hardware Ikar-Lab entonces en la lista de los artículos suministrados estará también
la herramienta de alta precisión de entrada/ salida de las señales de voz, que permite:
2
1 DESTINACIÓN DEL SISTEMA
Sistema SIS permite:
3
¾ los kepstros materiales,
¾ la funcíon de autocorrelación,
¾ los coeficientes de la predicción lineal,
¾ los coeficientes de la correlación de frecuencia,
¾ la respuesta de frecuencia del transmisor «KLP»,
¾ las características dinámicas medias de la señal,
¾ las características estadísticas de las curvas de frecuencia del tono
básico;
• realizar la comparación de las características paramétricas medias de las señales
de voz y la obtención de la medida de la semejanza de algunas muestras de las
señales, comparando:
o los espectros medios de las muestras de las señales,
o las características estadísticas de las curvas del tono básico de las muestras
de las señales,
o los espectros instantáneos de los fragmentos básicos eligidos de las señales,
o las características medias de kepstros, los coeficientes de la autocorrelación,
la predicción lineal, la autocorrelación privada, de las estructuras formantes
en las partes básicas de fonogramas;
• realizar la visualización para despues obtener la imagen en el archivo o la copia
de las imágenes sobre el papel para:
o los oscilogramas,
o los espectrogramas dinámicos (sonogramas, o las imágenes del habla
visible),
o kepstrogramas dinámicos (las funciones de la periodicidad de la señal),
o autocorrelogramas dinámicos,
o las curvas del tono básico,
o las trayectorias formantes para realizar un análisis visual u subvectivo y
también para:
¾ la toma de la decisión, acerca de la coincidencia o no coincidencia de
las muestras del señal,
¾ la determinación de las particularidades específicas de la señal,
¾ la determinación de las características personales del locutor,
¾ la confirmación objetiva de la presencia de los fenómenos fonéticos y
prosódicos en la señal , señalados en el etapa de la prueba lingüístic1a
de auditor.
• realizar la corrección del tono básico sobre la imagen de kepstro y la corrección
de formantes sobre la imagen del espectrograma.
4
2 REQUERIMIENTOS DEL SISTEMA.
5
Atención!
Si en su computador ya ha sido instalada la versión 4 y 5 del programa Sound
Cleaner, se recomienda instalar la versión ofrecida junto con el programa SIS en un
catálogo diferente al de las versiones 4 y 5.
Para la instalación del programa Sound Clear se debe oprimir el boton “Setup” en la
ventana de diálogo y luego seguir las instrucciones.
Haga clik en el botón derecho del ratón en cualquier lugar libre del escritorio de
su computador. En el menú de contexto escoja el punto “Propiedades”.
En la ventana de “Propiedades: Pantalla” pase a la sección “Ajustes”.
Luego en el menú que se abre “Paleta de color” escoja el régimen «True Color
(32 bits)».
Si la pantalla de visualización se encuentra en otro régimen, durante la ejecutación
del programa aparecerá un mensaje indicando que el programa será inmediatamente
descargado ( mirar Dib.1).
6
3.4 Aparatos configurados de introducción – deducción del sonido
Durante la carga del programa se usan las configuraciones fijadas en el archivo de
configuración sis_60.ini, que se encuentra en el mismo catálogo que el archivo
SIS_70.exe. El contenido automático del archivo para la tarjeta STC_H216 se encuentra
más abajo:
[SETTINGS]
YMS_DISK = C
SOUND_CARD = STC-H216
CARD_NUM=1
[SOUND CARD]
BIT24_MODE = 0
Nota
7
4 ACCESO AL SISTEMA
8
4.3 Elección del tamaño de la letra a utilizarse en el diálogo
Según la dimensión y la resolución de la pantalla del monitor las ventanas de
diálogo que surgen y el menú pueden o no caber en la pantalla, o ser demasiado
pequeñas. Se puede cambiar su dimensión (tanto de las ventanas, así como de la letra
en la ventana) por medio del menú Opciones-> Tamaño de la letra. En la pantalla
surge una ventana de diálogo que permite la elección entre dos puntos(ver Dibujo 4) :
«Pequeño»,
«Regular».
La elección no influye en la dimensión de la letra del menú principal (Cambiar la
letra es posible por los medios de Windows), pero cambia la dimensión de la letra de
las ventanas de diálogo. La dimensión de la ventana es proporcional a la dimensión de
la letra utilizada.
«Pequeño»,
«Regular».
9
4.5 El menú principal, panel de herramientas y teclas «hot»
Después de la carga del sistema en la pantalla aparece la ventana principal del
programa (Dibujo 6).
Panel «Archivo»
guardar el fragmento
10
procesar (reproducir) los datos entre las marcas temporales
Panel «Sonido»
comenzar la reproducción
detener la reproducción
Panel «Información»
Panel «Demostración»
11
Panel «Redacción»
Para quitar el botón del panel de las herramientas, seleccionelo con el ratón en la
lista de la derecha y presione «<Quitar». Para devolver el botón al panel de las
herramientas, es necesario seleccionarlo con el ratón en la lista de la izquierda y
presionar «Añadir->».
12
Para regresar a la visualización automatica, presione «Quitar».
13
En algunas versiones del programa SIS (empezando desde la 7.0.1) se encuentra
realizada la función Undo(Anular) – Anulación de la última operación en la señal
reservando la oportunidad de retomar la operación. Esta función se realiza a través del
menú Datos ► Undo (Anular) para la mayoria de las operaciones de redacción de
datos. La cantidad de pasos a realizarse durante la anulación se encuentra limitada por
el volúmen de espacio del disco dejado por el usuario.
14
Crear y seleccionar ventana-receptor tambien es posible con la ayuda del área con
la imagen de la flecha en la parte superior de la ventana: presionando este campo, el
nombre de la ventana-receptor cambiará en concordancia con la lista de las ventanas
ya existentes (útiles por el tipo) y una nueva ventana (no creada). Las ventanas
existentes aparecen en el campo, que sigue la flecha, con su nombre corto (un
símbolo), y el nuevo - con la raya. Sin embargo de este modo es posible escoger
solamente las cinco primeras ventanas útiles.
«Entre las marcas temporales» - la parte del segmento corriente (activo) que esta
comprendido en el intervalo entre las marcas temporales, las cuales serán dos.
15
5 TRABAJO CON LAS VENTANAS
En el sistema no hay datos de usuario, a los que no se los pueda ver. Para la
presentación de números y texto se usa el menú, para presentar los datos gráficos y el
texto sirven las ventanas. Con el término ventana en este sistema se denomina un
cuadrángulo en la pantalla con una imagen gráfica dentro y los datos, que se ubican
sólo en está ventana. Si la ventana se cancela (borra), todos los datos, que al mismo
tiempo no esten presentados en otra ventana. Las ventanas se pueden sobreponer,
transferir, cambiar de tamaño y forma, desplazar hacia arriba. Para iniciar el trabajo
con los datos hay que leerlos del disco o del convertidor análogo-digital (ADC), en este
caso el sistema previamente crea una ventana.
Para crear una ventana hay que utilizar la opción del menú Ventanas->Abrir nueva
ventana o hacer click el botón .
Cada ventana creada recibe un nombre corto (un símbolo en cada uno de los
cuatro ángulos) y es de tipo «UNIVERSAL»(UNI), es decir abierto (accessible) para
introducir cualquiera información.
16
La nueva ventana siempre se presenta encima de las demás. Pero se hace corriente
(activa) es decir se usa para entrada-salida a y de todas las operaciones con un
operando (en ella se introduce el sonido del ADC, los archivos del disco, aquí se
redacta la señal, de aquí se toman los datos iniciales para el habla visualizada en la
pantalla y etc.).
El menú contextual contiene las opciones de las secciones del menú principal
Demostración y Ventanas y las opciones de las operaciones de copia y
inserción(pegado) del fragmento. Además, según el tipo de datos en la ventana, el
menú puede contener las opciones de cambio del color de fondo y del tipo de
presentación de datos y de haber las marcas constantes – la opción «Iluminar».
17
Si los datos en la ventana son resultado del análisis, entonces estará accesible la
opción «Recalculo», la que permite repitir las operaciones calculatorias con los
parámetros nuevos.
18
La primera columna contiene el indicador de la ventana activa, la segunda columna
– los nombres de las ventanas y los segmentos con el índice de selectividad de la
ventana, la tercera - tipo(clase) de la ventana.
Para pasar de una a otra columna en una línea se utiliza las teclas <Tab>-
<Shift>/<Tab> o el cursor del ratón; para moverse en la columna – utilise las teclas
flechas del teclado o hágalo por medio del ratón. La elección de la línea necesaria en la
primera columna se realiza mediante la tecla “Espacio,que se encuentra en el tecaldo
entre las teclas Alt”, o por medio del botón izquierdo del ratón – el indicador de la
ventana activa va a pasar a este campo (área).
La salida desde la redacción se realiza mediante la tecla <Enter>, o por medio del
botón del ratón, cuando el cursor no se encuentra dentro del espacio de comentario.
A cada ventana se puede agregar varias líneas, sin embargo, si la dimensión
vertical de la ventana resulta insuficiente para la representación de todas las líneas,
parte de las líneas dejan de aparecer. A medida que se reducen las dimensiones de la
ventana, las primeras en desaparecer resultan las que están abajo (primero – encima
de los datos del box, luego – debajo de los datos). Si las dimensiones de la ventana
vuelven a aumentarse, las líneas aparecerán nuevamente.
Para borrar la línea del comentario de la ventana hay que entrar en el espacio del
comentario y presionar la combinación de las teclas <Ctrl>/<Delete>.
19
5.5 Adición del campo del texto de marca
En el sistema SIS cada marca vertical constante puede ser dotada con el texto que
comprende hasta 40 símbolos. Este texto se lo puede introducir o ver en el menú
Marcas->Lista de las marcas, pero a veces esto no es cómodo. A fin de que los
nombres (texto) de las marcas se presenten directamente debajo de la señal, hay que
utilizar la opción Agregar el campo de los textos de las marcas del menú Ventanas o
del menú contextual de la ventana. En este caso debajo del box de los datos aparece
un visualizador de textos de las marcas, que tiene forma de un campo(área) cuadrado
grande (normalmente de color negro). Si el visualizador no aparece, hay que aumentar
el tamaño vertical de la ventana. Durante un intento reiterado de agregar el
visualizador el sistema genera un mensaje «El objeto requerido ya existe en la ventana.
El segundo está prohibido», y la demanda (orden) quedará ignorada.
El visualizador se vuelve a dibujar cada vez que se cambie el tamaño horizontal del
box de datos y además cuando se cancela o se inserta los fragmentos.
El texto de cualquiera marca y la altura del área del visualizador pueden ser
modificados sin salir al menú principal. Para cambiar el texto de la marca hay que
acercar el cursor del ratón a la línea vertical correspondiente (más – menos 5 pixeles)
en el visualizador de los textos de las marcas y cuando el cursor tome el aspecto ,
presionar el botón derecho del ratón. En la pantalla en el lugar del cursor aparecerá el
menú contextual, que contiene las opciones «Texto de la marca», «Copiar» y
«Cancelar». Para redactar el texto de la marca hay que seleccionar la opción «Texto de
la marca». Para copiar la marca utilice «Copiar». Para borrar la marca sirve la opción
«Cancelar».
20
Para el cambio de altura del área hay que presionar el botón derecho del ratón
dentro del sector del visualizador y en el menú contextual que aparecesca seleccione
la opción «Altura del campo (área)». Luego se introducirá el parámetro de la altura del
área. Éste debe ser número par (de cualquier modo SIS lo redondeará) y estar en el
diapasón de 4 a 42 (según la cantidad de los símbolos).
Una vez establecido el enlace, todas las operaciones con las marcas y con el cursor
en una ventana serán duplicadas en todas las ventanas con las que fue establecido
dicho enlace.
21
5.8 Traslado del menú, que tapa la ventana
A veces ocurre que el box del menú corriente tapa la imagen en la ventana activa o
en otra parte de la pantalla. En este caso, si el menú no ocupa toda la pantalla, éste
puede ser desplazado. Para hacerlo hay que acercar el cursor del ratón al marco del
menú corriente (activo), presionar el botón izquierdo y mantenerlo presionado sin
soltar. En los limites del menú aparecerá el marco punteado. No se puede cambiar su
tamaño, pero moviendo el ratón con el botón izquierdo presionado se lo puede
desplazar a cualquier lugar de la pantalla. Apenas el usuario deje de presionar el botón
izquierdo del ratón, el menú se acomodará en su lugar nuevo. La anchura y la altura
del marco del menú son iguales a la anchura y la altura de un símbolo textual
respectivamente. El espacio accesible para los desplazamientos es toda la ventana SIS,
a excepción de la línea superior (menú radical) y la línea inferior (línea de avisos).
«Eje X:» – contiene información sobre el eje horizontal (Vease el sub-punto anterior
(5.9.1). Este sector puede ser activo para algunos tipos de ventanas.
22
«Eje Y:» - contiene información sobre el eje vertical (Vease el sub-punto anterior
(5.9.1). Este sector puede ser activo para algunos tipos de ventanas.
«Eje Z:» - contiene información sobre el tercer eje (Vease el sub-punto anterior
(5.9.1). No se utiliza para los datos bidimensionales.
Los sectores «Eje X:» y «Eje Y:» pueden ser activos. Al presionar sobre el sector se
presentará una de las listas de las opciones:
«OR» - los datos más recientes se representan encima de los anteriores con
composición de los colores según el método lógico OR (bit-to-bit composición 0 y 1 -
1; 0 y 0 - 0; 1 y 0 - 1, 1 y 1 - 1).
23
«XOR» - los datos más recientes se representan encima de los anteriores con
composición de los colores según el método exclusivo XOR (bit-to-bit composición 0 y
1 - 1; 0 y 0 - 0; 1 y 0 - 1; 1 y 1 - 0).
«Memoria libre (Мб): XXXX» – área informativa, donde está indicado el volumen de
memoria virtual desocupada en el sistema SIS en Megabytes. Todos los datos de todos
las señales se guardan en la memoria virtual y si está totalmente ocupada, el análisis
de las señales y la filtración resultan imposibles.
Lineal,
Logarítmica o
Escala Bark.
Para comodidad del usuario en el menú contextual se presenta también la
información sobre el eje corriente: significado físico de valor, unidades de medición,
tipo de escala.
24
La tecla <F5> permite cambiar la escala de la representación por el eje vertical
(lineal – en Decibelios “dB”) de manera más rapida y eficaz. Como información
adicional: La magnitud de la señal en decibelios es igual al logaritmo decimal del valor
de la señal multiplicado por 20 (para los valores negativos se toma el módulo).
25
Para cambiar el color del segmento, hay que seleccionar el color deseado en el
menú de selección de colores (trasladar a la línea necesaria el símbolo de selección).
Luego hay que entrar en el submenú derecho y en la línea correspondiente al
segmento deseado hacer clic con el «ratón» sobre el campo «С». El color del nombre
del segmento y el campo (área) «С» en seguida va a teñirse del color elegido.
Inmediatamente después de salir del menú “Lista de segmentos” (al presionar el botón
«Sí») en la ventana activa van a representarse los nuevos nombres y colores de los
segmentos.
Para los segmentos de «habla visualizada» el color elegido se aplicarán sólo en
modo de dibujar con desviación a la derecha o con desviación hacia arriba.
26
6 LECTURA DE LOS ARCHIVOS DE DATOS DEL DISCO DEL PC
El sistema SIS permite leer del disco los datos de diferentes tipos, grabados por el
mismo sistema SIS (*.DAT, incluso por las versiones anteriores), o mediante los
dispositivos que soportan el formato *.WAV estandartizado para MS WINDOWS.
Es de notar, que si un archivo fue grabado con el mismo sistema SIS o mediante los
dispositivos que soportan el formato *.WAV estandartizado para MS WINDOWS, antes
de introducirlos, se comprobará la compatibilidad del tipo de los datos a introducir con
el tipo de la ventana en la que se pretende introducir los datos. Si en un archivo está
indicado, por ejemplo, que los datos de archivo representan el espectro Fourier,
quiere decir que estos serán introducidos como un espectro Fourier, sin tomar en
cuenta los deseos del usuario e independientemente de la extensión de este archivo.
Para los archivos con la extensión.DAT hay la posibilidad de leer sólo alguna parte
del archivo. Para activar esta opción en la ventana de apertura de un archivo es
necesario quitar la “banderita” del área «Leer archivo íntegramente». Una vez elegida
esta opción cada vez que se abra un archivo .DAT va a aparecer la ventana «Archivos
grandes», en la que se debe indicar el principio de la lectura y longitud del intervalo
para lectura (en segundos – Dibujo 13):
27
Si un archivo tiene la extensión «ALW» (A-law waveform), el sistema propone al
usuario leerlo como 8-bit en el formato A-law. La frecuencia de discretización es de
8 кHz.
Además, la opción Los datos ->Abrir archivo permite al usuario abrir cualquier
archivo sin formato o de formato no identificado como oscilograma (mono, 16 bit,
PCM).
28
En una ventana pueden estar representadas varias señales. En este caso los
distintos segmentos serán representados con colores diferentes, los nombres de los
segmentos se presentan en la parte superior de la ventana del mismo color que el
segmento correspondiente (Dibujo 15).
Dibujo 15. La ventana con varios segmentos, representados con distintos colores
«SPE» - espectrograma,
«CEP» - cepstrum,
«LPС» - CPL (coeficiente de predicción lineal),
«PCR» – correlación particular,
«AUС» - autocorrelación,
«DAT» - oscilograma,
«ENE» - energía,
«ZFR» - frecuencia de intersección con cero,
«SPA» – espectro medio de Fourie (de amplitudes),
«PIT» – tono principal,
«CEA» - cepstrum medio (''A' - accumulated),
«LPA» - CPL medio,
«PСA» - coeficiente medio de la correlación particular,
«ACA» – autocorrelación media.
29
Independientemente del régimen en el que se encontrase el menu de ingreso a los
archivos, el usuario puede según su deseo borrar cualquier archivo , por ejemplo, para
liberar lugar en el disco. Para esto hay que hacer click en el botón derecho del ratón en
el nombre del archivo y presionar en la tecla <Delete> ( o escoger la opción Eliminar).
El sistema pedirá confirmar la eliminación del archivo, después de lo cual el archivo
sera enviado al basurero.
Los archivos textuales, creados por el SIS, tienen prefijo de formato, y por eso
desde el punto de vista del usuario, su lectura no se diferencia de la lectura de otros
archivos.
30
6.25e-005 459
0.000125 463
0.0001875 527
0.00025 602
0.0003125 536
Si la tercera línea del archivo contiene «F=%%%%%%» esto significa, que la
frecuencia de muestreo (discretización de la señal en Hz) está considerándose. Por
ejemplo, «F=11025».
Ejemplo:
STCautoidentification Text segment
Waveform
F=11025
Y
-87
-78
-88
-97
-111
Si la tercera línea contiene «S=%%%%%%», esto significa que está inscrito el intervalo
entre abscisas (X), por ejemplo, «S=10.7666». El primer valor de la abscisa equivale a
cero.
Ejemplo:
STCautoidentification Text segment
Spectrum
S=10.7666
Y
34.1674
59.8291
85.2392
96.8834
104.305
31
6.2.2 Lectura de los archivos de texto sin los encabezamientos
El usuario puede abrir en el SIS los archivos de texto, en los cuales en una de sus
columnas están inscritas las cifras – los valores de la señal con un intervalo constante,
o en dos de sus columnas – los valores de la abscisa y la ordenada.
Este archivo debe tener la extensión «*.TXT». Entonces, cuando el usuario intente
leerlo aparecerá en la pantalla la pregunta “El tipo de archivo pero fué determinado
como archivo de texto. Está Ud. de acuerdo?».
En caso de que el usuario responda “No”, empesará el ingreso del archivo con
formato binario MIC 16 bits.
Debajo de la línea ”Las tres primeras” se muestran las tres primeras líneas del
archivo que se pretende leer, a fin de que el usuario pueda verificar su elección. De
cada línea se apuntan solo hasta 30 símbolos.
32
Al escoger con la ayuda del ratón uno de los últimos cuatro campos (áreas), el
usuario puede cancelar la operación o elegir el tipo del segmento (oscilograma, el tono
principal o el espectro FFT). L a cancelación de la operación provocará el ingreso del
archivo con formato binario, MIC 16 bits. En caso contrario aparecerá la ventana que
permitirác la elección del formato de archivo”,
Debajo de la línea «Las tres primeras» sin lugar a dudas se muestran las tres
primeras líneas del archivo que se pretende leer, ésto para que el ususario pueda
verificar en que formato se encuentran grabadas las cifras en el archivo. De cada línea
se muestran solo hasta 30 símbolos.
La elección del formato «X,Y» significa que en cada línea estarán inscritas dos
cifras, la primera de las cuales se interpreta como coordenada, la segunda – como el
valor de la señal. Las coordenadas(las abscissas) deben ir cambiando con un intervalo
constante. De lo contrario, el SIS automaticamente calculará el intervalo promedio y lo
utilizará como intervalo constante para el segmento introducido.
“Y” significa que en cada línea está inscrita una cifra – el valor de la señal en un
punto dado.
33
7 INTRODUCCIÓN DE LA SEÑAL DESDE EL ADC
Durante el proceso de introducción de la señal desde el ADC, es decir con ayuda
del micrófono, magnetófono y etc. a través de una placa(tarjeta) de sonido, no es
necesario tratar de sincronizar el comienzo de la señal acústica con la ejecución de la
opción Los datos -> Introducir la señal desde el ADC (o con la presión del botón de
grabación). El usuario en primer lugar se encontrará en el régimen de ajuste de los
parámetros de la introducción y luego en el régimen de ajuste del oscilógrafo digital.
Sólo despés de que el usuario haya elegido los parámetros deseados y haya
regulado(ajustado) el nivel de la señal, podrá empezar la introducción para esto debera
presionar la tecla “Espacio, Barra Espaciadora”.
34
Nota
El programa SIS no prohibe generar la señal con una amplitud que supere 32767. Sin
embargo, no se recomienda operar con tales señales, porque no pueden ser
reproducidas correctamente por la tarjeta de sonido.
Durante la salida del float- señal a la tarjeta de 24-bits, su valor se multiplica por
256 y se convierte en un entero. De este modo, si la amplitud de la señal supera
32767, surge el desbordamiento, y la señal (sonido) será añadida. Es decir como se
citó anteriormente, las señales con amplitud que superan los 32767, no pueden ser
reproducidas correctamente en el programa aún con la ayuda de la tarjeta de sonido
de 24-bits.
35
La precisión de la señal que se introduce (16 o 24 bit) determina el modo de
conservación de los datos introducidos dentro del programa. Independientemente de
la capacidad de su tarjeta la señal puede guardarse como un entero de 16-bits o en el
formato con un punto flotante (24-bits).
Debajo del selector de la precisión de la señal que se introduce, está situada una
línea informativa, que representa la capacidad (bits) máxima de la señal que se
introduce, la cual puede soportar la tarjeta de sonido utilizada.
[SOUND CARD]
BIT24_MODE = 0
En caso del suministro del programa para trabajar con las placas (tarjetas) de otros
productores esta línea se incluye en el archivo de configuración sis_70.ini del
distributivo.
La opción «Sin reproducción» sirve para detener la reproducción del sonido durante
el proceso de introducción. En este caso Usted puede estimar el nivel de la señal
introducida mediante el gráfico del oscilograma.
36
Nota
El control del proceso de introducción del sonido es posible sólo en la ventana activa.
Por eso trás ajustar el nivel de la señal en la ventana del mezclador hay que activar la
ventana de introducción del sonido, haciendo con el cursor un click sobre ella.
Para la escala de la señal en el régimen del oscilógrafo digital son ascesibles las
teclas siguientes:
La presión de la tecla <Esc> en la ventana activa del habla visualizada sirve para
detener la representación. Al mismo tiempo la señal que se introduce sigue
representándose en la ventana con el oscilograma. Interrumpir/reanudar la
introducción de la señal se puede mediante la tecla <Espacio>. Para salir del régimen
de la introducción de la señal mediante el ADC precione la tecla <ESC>.
37
8 COMO ESCUCHAR EL FONOGRAMA
Para escuchar el fonograma es necesario que se encuentre en la ventana corriente
(superior). Además, si en la ventana corriente el segmento corriente (superior) es de
tipo «habla visualizada» y el oscilograma inicial del que fué calculado dicho segmento,
todavía no estubiese cancelado y siguiese sin modificaciones, el sistema por sí mismo
encontrará el oscilograma inicial y comenzará su reproducción. Durante el proceso de
reproducción el cursor se mueve en la ventana con el «habla visualizada», indicando la
posición actual de la reproducción. Al presionar la tecla «barra espaciadora» la
reproducción del sonido y el movimiento del cursor simultáneamente se detienen. Las
posibles acciones del usuario en esta situación están explicadas detalladamente en
ap. 8.3. Luego se puede presionar la tecla <Insert> y en la posición corriente del
cursor se pondrá una marca permanente. Con la segunda presión de la tecla «barra
espaciadora» la reproducción va a reanudarse.
Para escuchar se puede entrar en el menú Habla-> y presionar sobre una de las
casillas para elegir el tipo del fragmento a reproducir. Según la casilla seleccionada se
escuchará uno de los fragmentos del segmento corriente (activo) de la ventana
corriente (activa) (o del segmento-fuente en caso del «habla visualizada»). Al escoger
el tipo “Todos segmentos en la ventana” se irán reproduciendo todos los segmentos en
la ventana activa, empezando desde el superior (su nombre siempre está más a la
izquierda de los demás). Entre la reproducción de uno y otro segmento el sistema
hace una pausa, cuya duración se determina en el menú Habla ->Opciones.
38
fragmento, mientras que cualquier presión de la tecla <barra espaciadora> - lleva al
régimen de la reproducción continua (repetición de ciclo) del sonido.
Sin salir de este régimen “de escucha” (en la pausa), el usuario puede poner una
marca, presionando la tecla <Insert>. Se puede también suspender la escucha, marcar
con precisión el fragmento necesario, inscribir las marcas y reanudar la escucha
mediante la opción «Vistas en la ventana y adelante».
Al presionar la tecla izquierda del ratón en el botón el coeficiente toma el valor 1.0,
es decir la velocidad de reproducción es igual a la original. Si se mantiene presionada
la tecla y se mueve a la derecha el valor llega hasta 3.0(es decir la velocidad de
reproducción aumenta tres veces) y si mover el cursor a la izquierda el valor llega
hasta 0,33 (velocidad de reproducción se reduce tres veces).
39
9 CONSERVACION DE LOS DATOS
Hay que tener en cuenta, que las marcas y los comentarios (como toda información
auxiliar) se guarda sólo en caso de que para la grabación de datos hubiese sido
indicado el formato *.DAT.
En una ventana puede haber varios segmentos, pero siempre será guardado el
superior (el segmento activo). En el nombre de la ventana, el nombre del segmento
activo va primero (el mas izquierdo). Se puede hacer activo cualquier otro segmento de
la ventana .
Para guardar todo el segmento de los datos sin la información complementaria
(marcas, comentarios), es necesario entrar en el menú Los datos->Guardar el
segmento. En la pantalla va a aparecer la ventana estándar, en la cual es necesario
escribir el nombre y el tipo de archivo, además seleccionar el catálogo para guardar los
datos.
Debajo del área Ahora Usted esta procesando se muestra el tipo de archivo, el cual
será guardado. Según el deseo el tipo de los fragmentos guardados puede ser
cambiado con la ayuda de uno de los botónes, ubicados debajo. Para guardar el
segmento de datos es necesario escoger Todos los datos.
40
Hay que tener en cuenta que al guardar las marcas se guardan sólo las marcas
relacionadas con el fragmento guardado(se encuentran en dentro del fragmento en sus
límites).
Además, para guardar los datos en formato textual está prevista la opción del
menú principal Los datos ->Exportación de texto.
41
10 DESPLAZAMIENTO Y EL CAMBIO DE ESCALA DE LOS DATOS EN EL BOX
DE LA VENTANA
Apenas aparezca en la ventana el box de los datos, en él se muestran las
herramientas de control de la escala de datos. Estas son la barra horizontal de
desplazamiento (scrollbar), los botones de la escala horizontal y vertical, y para los
datos tridimensionales – el botón de escala de la tercera dimensión.
10.1 Definiciones:
Segmento - Nosotros llamamos segmento a una parte de los datos, asociados en
un grupo, pero sin relación inmediata con otros datos. Por ejemplo, los datos leidos de
un archivo del disco forman un segmento. Al terminar la introducción del sonido a
través del ADC todos los datos leidos forman un segmento. Para cada nuevo segmento
en la ventana se utiliza su propio color (mientras bastan los colores visualmente
distinguibles).
42
En el menú Opciones->Opciones complementarias («Desplazamiento de los datos
visibles») el usuario puede cambiar el valor de desplazamiento del área visible al
presionar la flecha de la barra de desplazamiento. El desplazamiento siempre se
consigna dentro de la anchura del área visible y adquiere los valores desde 0.001
hasta 1.0.
Si los límites del box por la horizontal no salen de los límites de los datos, la
anchura total del área media corresponde a la longitud total de los datos, y el marker
de color negro corresponde a la anchura del box y a su posición respecto a los datos.
Después de presionar con el ratón sobre cualquier punto de la parte media, los límites
del box se cambiarán de manera que el límite izquierdo del área negra se encontrará
en este punto. Es decir, para ver el principio de los datos hay que presionar con el
ratón en el punto más izquierdo de la parte media y etc. Si los límites del box por la
horizontal salen de los límites de los datos, el límite izquierdo de la parte media de la
barra de desplazamiento corresponde al mínimum del límite izquierdo del box y límite
izquierdo de los datos, y el límite derecho corresponde al máximum del límite derecho
del box y el límite derecho de los datos. Va a aparecer también una raya horizontal en
la mitad de la altura del marker, que indica el área donde faltan los datos.
De este modo, sin entrar en el menú, se puede aumentar la anchura del box 3
veces y reducirla 15 veces.
43
El tercer método para cambiar la escala horizontal – por medio de la rueda del
ratón. Para hacerlo hay que acercar el cursor del ratón al eje horizontal. Cuando el
cursor se convierta en una flecha horizontal de doble sentido, girando la rueda del
ratón se puede cambiar la escala horizontal de la representación de los datos en el
box.
10.4 Establecimiento de las coordenadas del box por los límites del
fragmento seleccionado
Mediante el menú se puede establecer los límites del box de los datos de tal
manera, que en el box se presentará enteramente el fragmento seleccionado. Mediante
el menú Demostración se puede representar en el box:
44
Al presionar en el límite entre el área negra y el área gris, la escala no cambiará.
Si al momento de presionar el ratón, el cursor del mismo estuvíera más abajo del
borde de los colores, los valores de las coordenadas físicas de los bordes superior e
inferior del box van a reducirse tantas veces, cuan menor sea la distancia desde el
borde inferior del área negra hasta el cursor en relación a toda la longitud del área
negra.
Si al momento de presionar el ratón, el cursor sel mismo estuvíera más arriba del
borde de los colores, los valores de las coordenadas físicas de los bordes superior e
inferior del box van a aumentarse tantas veces, cuan mayor sea la distancia desde el
borde inferior del área negra hasta el cursor en relación a toda la longitud del área
negra.
Existe también otro método para cambiar la escala vertical – por medio de la rueda
del ratón. Para hacerlo hay que acercar el cursor del ratón al eje vertical. Cuando el
cursor se convierta en una flecha vertical de doble sentido, girando la rueda del ratón
se puede cambiar la escala vertical de la representación de los datos en el box.
Para cambiar los valores de las coordenadas físicas de los bordes superior e
inferior del box, se puede utilizar el botón del desplazamiento vertical. Este botón está
situado en cada ventana a la derecha del box y esta representado por un cuadrado: .
Haciendo un clic con el ratón sobre este botón el cursor del ratón desaparece y se
presenta un cuadrángulo punteado, cuyos bordes coinciden con los bordes del box, y
directamente en el medio está una línea horizontal punteada. Desplazando el ratón por
la vertical, el cuadrángulo se desplazará también por la vertical. Los nuevos límites del
cuadrángulo después del desplazamiento van a corresponder a las nuevas
coordenadas físicas de los bordes del box. Si en el proceso de desplazamiento una de
las líneas horizontales del cuadrángulo sale de los límites de la ventana, esta línea deja
de representarse.
Para cambiar las dimensiones del cuadrángulo, hay que mantener presionado el
botón izquierdo del ratón. Entonces al desplazarse el ratón hacia «arriba» el
cuadrángulo se baja, “hacia abajo”– más arriba, ”a la izquierda” – más estrecho, “a la
derecha” – más ancho. De todas maneras el ángulo superior izquierdo permanece
inmóvil. Las dimensiones del cuadrángulo se las puede reducir sólo hasta dos pixeles
por la horizontal y por la vertical, y aumentar – sólo hasta las dimensiones del box por
la horizontal y hasta dos veces las dimensiones del box por la vertical . Para salir del
régimen, es necesario presionar el segundo o el tercer botón del ratón, en este caso
las coordenadas físicas del box independientemente de la escala vienen a
corresponder a las coordinadas del cuadrángulo, y el box vuelve a dibujarse. Si
presionamos la tecla <Esc>, la salida del régimen se realiza sin cambios algunos en el
box.
45
Para cambiar en el box de los datos la escala/desplazamiento por la vertical, se
puede entrar en el menú Demostración->Cambio de altura/posición del box y corregir
los valores de los bordes superior e inferior del box en coordenadas físicas (segundos,
cuentas, Hz, es decir en las mismas coordenadas dadas en el momento de corrección
en el box por la vertical).
Para cambiar la escala del box por la vertical, se puede utilizar la opción del menú
Demostración->Autoescala. En este caso la escala del box será cambiada de tal
manera que los valores de los bordes superior e inferior del box automáticamente
llegan a ser iguales a la amplitud máxima y mínima de la señal en el oscilograma. El
mismo efecto se puede alcanzar al presionar la tecla <5> (está rodeada con las teclas
flechas).
Nota
El régimen «Lupa» no se utiliza para representaciones «de grandes volúmenes»
(demostración de los datos mediante axonometría, desviación a la derecha/hacia
arriba).
Al entrar en el menú Demostración->Lupa de la ventana de los datos
tridimensionales en la pantalla aparece la ventana nueva, en la que está representado
el corte espectral, que corresponde a la posición de la marca temporal. Mediante las
teclas flechas puede desplazarse por el segmento hacia la derecha y hacia la izquierda.
Con solo presionar una vez en las teclas indicadas el cursor se mueve a una distancia
equivalente al tamaño de un cuadro. En este caso en la ventana «Lupa» estarán
representados los cortes espectrales, que corresponden a la posición del cursor. Al
presionar la tecla «+» que está en el teclado complementario en la ventana «Lupa» se
presentará el corte anterior. En una misma ventana simultáneamente pueden ser
representados con distintos colores solo 4 cortes como máximo. El desplazamiento de
los cortes complementarios respecto al primer corte (en milisegundos) se utiliza como
el nombre de cada corte.
Al determinar el tamaño del marco, hay que presionar el botón derecho del ratón.
En este momento en la pantalla se abre una ventana nueva, en la que se presentará un
46
sector del segmento (o segmentos), que se mostró en el marco. Todos los segmentos
mostrados en el marco, indepedendientemente de su cantidad, se presentarán en la
ventana-lupa. Para los estéreo-segmentos se presentarán ambos canales (el derecho –
de color más oscuro). Mediante las teclas flechas del teclado se puede desplazarse por
el segmento en todas direcciones( hacia la derecha, izquierda, arriba y hacia abajo.
Tecla Función
← El cuadro se desplaza a un cuarto (1/4) de la anchura (o a un corte del
«habla visualizada») hacia la izquierda
<Ctrl> + ← El cuadro se desplaza a 3/4 de la anchura hacia la izquierda (para el
«habla visualizada» no se utiliza).
→ El cuadro se desplaza a un cuarto (1/4) de la anchura (o a un corte del
«habla visualizada») hacia la derecha
<Ctrl> + → El cuadro se desplaza a 3/4 de la anchura a la derecha (para el «habla
visualizada» no se utiliza).
<Shift> + ← La anchura de un cuadro se reduce dos veces (a la mitad) a costa del
desplazamiento del borde derecho (para el «habla visualizada» no se
utiliza)
<Shift>+ → La anchura de un cuadro se aumenta dos veces( se duplica) a costa del
desplazamiento del borde derecho (para el «habla visualizada» no se
utiliza)
↑ El cuadro se desplaza a 1/10 de la altura hacia arriba
↓ El cuadro se desplaza a 1/10 de la altura hacia abajo
<PgUp> El cuadro se desplaza a 1/2 de la altura hacia arriba
<PgDn> El cuadro se desplaza a 1/2 de la altura hacia abajo
<Home> El cuadro se hace simétrico con respecto al punto “cero” por la vertical
<F6> La escucha de un fragmento
<5> Autoescala de la señal por la vertical (el borde superior del box se
en el teclado igualará al valor máximo de las señales en esta ventana, el borde
digital inferior del box se igualará al valor mínimo de las señales en esta
ventana)
<F5> Cambio de escala de representación de los datos (lineal/logarítmica)
<+> Sólo para el «habla visualizada»:
en el teclado En la ventana de lupa se añade un corte más, que precede en la señal
digital al corte, indicado por el cursor en la ventana-fuente (no más que un
total de cuatro cortes). Para los cortes previos como nombre se utiliza
su desplazamiento en milisegundos con respecto al último corte,
indicado por el cursor en la ventana-fuente.
47
Tecla Función
<- > Sólo para el «habla visualizada»:
en el teclado De la venta-lupa se elimina un corte añadido.
digital
<Insert> Poner una marca permanente en la ventana-fuente.
<ESC> Salida del régimen «Lupa»
Para el «habla visualizada»:
<F9> - Guardar la ventana de lupa junto con todos los datos dentro de
ésta después de salir del régimen «Lupa».
Para los oscilogramas y etc.:
- Salir del régimen «Lupa»y al salir representar en la ventana
inicial la parte visible de la señal de la ventana-lupa.
En la línea de avisos (en la parte inferior de la pantalla) se representa la
información sobre las teclas «calientes» más usadas.
En la ventana-lupa, tanto como en cualquier otra, existen los botones activos que
se puede utilizar sin restricciones. Por ejemplo, si durante la representación de los
datos bidimensionales (oscilogramas, tono principal) se presiona con el ratón sobre el
botón «Donador de cursores» , acercar el cursor punteado que aparece al lugar
necesario y se pone una marca permanente (al presionar la tecla <Insert>), entonces la
marca permanente va a aparecer no sólo en la ventana-lupa, sino en la ventana-fuente
también. En las ventanas con los datos bidimensionales la marca se pone en el punto,
que corresponde a la posición media de la ventana-lupa corriente (activa). Para el
«habla visualizada» la marca indica el corte corriente (actual).
Atención!
Las modificaciones ejecutadas con la señal durante la redacción en el régimen «Lupa»,
no se pueden anular. Por eso, para evitar una pérdida de datos, se recomienda guardar
el archivo inicial en el disco o copiar el segmento que se redacta en otra ventana.
48
En el régimen «Borrar» al presionar el botón izquierdo del ratón en la ventana-lupa
se ejecuta el borrado de la señal – el valor de amplitud se reduce a cero.
Para salir del régimen de redacción es necesario sacar el menú contextual y quitar
el “visto” en la casilla del régimen seleccionado.
49
• la visualización de la reproducción del sonido. Durante la reproducción en la
ventana junto con los datos corre (se mueve) el cursor, indicando el punto de
reproducción.
• cambiar los límites del box al introducir los datos. Durante cada lectura de un
archivo en el box de datos, se lleva a cabo la autoescala por la vertical según los
datos que se acaba de leer, independientemente de los valores de los datos
introducidos anteriormente. Si este punto no está seleccionado, la autoescala
se lleva a cabo sólo durante la lectura del primer archivo.
• dibujar los datos de modo “intransparente”. Se utiliza el régimen COPY durante
el proceso de dibujo, y los segmentos, situados por encima, tapan los
segmentos, situados por debajo. Si el punto no está seleccionado, se utiliza el
régimen OR, y en caso de pocos segmentos estos se transparentan entre si.
• introducir una área de texto en el Habla Visualizada. Cada vez que se crea el
Habla Visualizada (espectrograma, cepstrum, autocorrelación…)
simultáneamente será creado un campo de comentario por encima del box de
datos, que luego será utilizado para indicar la posición de las marcas
temporales: verticales y horizontales.
• Establecer la copia continua de los datos iluminados. Después de copiar los
datos iluminados el diálogo Copiar inmediatamente volvera a aparecer. Por
cuanto el área iluminada entre las marcas permanentes puede ser cambiada
presionando 2 veces el botón derecho del ratón, sin salir del diálogo, este
régimen permite optimizar el trabajo con los datos.
• invertir el color negro al copiar la ventana en el portapapeles. Esta opción puede
resultar útil si más tarde fuese necesario imprimir la representación.
• utilizar horas y minutos para digitalizar (mumerar) el tiempo.
• sincronizar las ventanas enlazadas. Si esta opción está seleccionada, la escala
horizontal de la representación de datos en las ventanas enlazadas será
sincronizada automáticamente con la escala horizontal en la ventana activa.
• guardar la configuración al salir del programa. Cada vez antes de salir del
programa la configuración corriente será guardada automáticamente (Vease
4.1.). Este régimen se utiliza en automático (por omisión).
50
11 OPERACIONES CON LOS CURSORES, LAS MARCAS TEMPORALES Y
PERMANENTES PARA SELECCIONAR LOS FRAGMENTOS DE DATOS
Algunos datos, por ejemplo, el habla visualizada pueden tardar mucho tiempo en
volver a dibujarse. Para evitar los excesivos re-dibujos, hay que entrar en el menú
Opciones->Opciones complementarias y seleccionar la opción Insertar el área de texto
en el Habla visualizada. Entonces una línea vacía de comentario siempre será creada
junto al habla visualizada, y los excesivos re-dibujos para trabajar con el cursor no
serán necesarios.
La salida del régimen se realiza presionando el botón medio o derecho del ratón o
tambien por medio de la tecla <Esc>. En este caso en la pantalla aparece el cursor
estándar (indicador) del ratón y el cursor (línea punteada vertical de color amarillo) en
el box va a desaparecer.
Para llamar al cursor a través del teclado, hay que seleccionar la opción del menú
Marcas->Poner el cursor/marca. En el medio del box аparecerá una línea punteada
vertical de color amarillo – el cursor. En el ángulo superior izquierdo de la ventana se
verá representado el valor de abscisa, que corresponde a la posición corriente (actual)
del cursor.
51
11.2 Las marcas temporales
Las marcas temporales se utilizan para resaltar los puntos y los sectores en la
señal. En un box simultáneamente no pueden colocarse más de dos marcas
temporales. Para poner una marca temporal, hay que presionar en «Donador de
cursores» (o hacer el doble clic con el botón izquierdo del ratón), luego acercar el
cursor a la posición necesaria y presionar el botón izquierdo del ratón o una
combinación de las teclas <Ctrl>/<Insert>. Al mismo tiempo en la línea de las
coordenadas se presentará el valor de abscisa en el lugar en el cual una marca
temporal se coloca. Luego, después de una coma, de modo sincrónico con el
movimiento del cursor, será representada la posición del cursor en el segmento
corriente (superior). La segunda marca se coloca análogamente, sus coordenadas
también se representan en la línea de coordenadas. Si en la ventana ya están colocadas
dos marcas temporales, la más vieja va a desaparecer. Al presionar las teclas
<Ctrl>/<Delete> la marca temporal que está más cercana al cursor será eliminada.
Haciendo un clic con el ratón en otro lugar de la señal será colocada otra marca
temporal, y los límites de selección van a cambiar.
Para anular la selección hay que presionar <ESC>. En este caso ambas marcas
temporales serán eliminadas.
52
Al presionar la tecla <Delete> la marca permanente que está más cercana al
cursor será eliminada. Para eliminar simultáneamente todas las marcas hay que entrar
en el menú Мarcas->Eliminar todas las marcas.
53
La lista contiene la siguiente información:
Si una marca se encuentra dentro del box de datos (y no fuera de sus límites),
entonces en la última posición de la línea se muestra un indicador de la visibilidad de
la marca (V). Al presionar sobre éste con el ratón (o mediante la tecla <Enter>), el
sector de la señal desde la marca corriente hasta la siguiente se presentará en el box
de datos.
Para seleccionar la marca en la lista hay que indicar con la ayuda del ratón o con el
teclado la marca necesaria y presionar la tecla <Espacio>. Al mismo tiempo en la
casilla correspondiente va a aparecer una señal «v».
54
Este diálogo contiene un consejo de cómo se puede transformar el archivo
guardado en una tabla mediante MS Word. Además, al poner un visto en la casilla
«Guardar sólo las seleccionadas», se puede evitar el problema de guardar las marcas
innecesarias. Al presionar el botón «Sí» aparece un diálogo estándar de Windows
«Guardar como…», que permite poner el nombre e indicar el catálogo para guardar
este archivo.
55
Al presionar el botón derecho del ratón o la tecla <Esc> el cursor horizontal
desaparece y vuelve a aparecer el cursor regular (indicador) del ratón. En este caso la
línea de comentario y los valores de las marcas temporales comprendidas en en la
misma quedan fijas en la ventana.
11.6 Cómo guardar las marcas en un archivo junto con los datos
Para guardar las marcas verticales permanentes junto con los datos es necesario
hacer lo siguiente. Al guardar el fragmento de los datos (Vease ap. 9.1) en la ventana
de diálogo en donde se pone el nombre del archivo de salida (archivo definitivo) hay
que seleccionar el formato de datos *.DAT y marcar una señal (banderita) en la casilla
«Guardar las marcas».
En este caso todas las marcas verticales, que se encuentran dentro de los límites
del fragmento que se guarda, serán guardados junto con los textos correspondientes.
Luego estas marcas se cargarán junto con los datos automáticamente.
56
12 FORMACIÓN DE LA SEÑAL DE VERIFICACIÓN
En este sistema esta prevista la posibilidad de formar las señales de verificacion de
varios tipos con los diferentes parametros ( amplitud, período, frecuencia). Con este
fin hay que entrar en el menú Datos->Formar la señal de prueba.. De esta manera en
la pantalla aparece el menú (Dibujo 22).
57
13 REDACCIÓN DE DATOS
Para redactar los datos es necesario mediante el teclado o el ratón entrar en el
menú Redacción. En el menú que se abrirá será representada la lista de operaciones
accesibles para el usuario.
El punto «Ahora está procesando» en la parte superior del menú sirve para la
elección del tipo del fragmento que está procesando. La elección actual está indicada
en la línea situada debabajo.
El usuario puede no redactar el segmento entero, sino que al contrario puede elegir
de éste un fragmento para redactar mediante uno u otro procedimiento. En el menú
Redacción en la segunda línea desde arriba siempre está indicado con que fragmento
va a trabajar ahora. Para cambiarlo es necesario entrar en el área «Ahora está
procesando» y en la lista que va a aparecer elegir el tipo necesario del fragmento para
trabajar:
58
5) «Seleccionados» – van a procesarse las partes del segmento actual que están
comprendidas en los intevalos seleccionados entre las marcas ( la selección se realiza
en el menú Demostración->Lista de marcas).
Cambiar el tipo del fragmento también se puede con la ayuda de los botones del
panel de herramientas. La selección del tipo de fragmento prosesado se muestra en el
panel de instrumentos. Esto permite llevar un control del prosesamiento del
fragmento.
- iluminados;
- visibles en la ventana;
- seleccionados.
59
Dibujo 23. Menú de procedimientos de la normalización de la señal
60
« + » – sumar con una constante,
« - » – restar una constante de la señal,
« * » – multiplicación por una constante,
« / » – división para una constante.
Hace falta elegir una de las operaciones e introducir el valor necesario de la
constante en la casilla que se ubica a la derecha de la palabra «Señal», debajo de la
palabra «Constante».
Después para las señales “mono” se muestra una raya horizontal punteada y para
las señales estereofónicas hay una opsión «Está procesando 'Ambos canales'«.
Mediante el ratón o el teclado se pueden cambiar el texto o el régimen de
procesamiento. Son accesibles tres regímenes:
Ambos canales,
Canal derecho,
Canal izquierdo.
Después de apretar el botón «Aceptar» la operación será realizada, y la ventana
actual se volvera a didujar.
Al procesar las señales de 16 clases hay que tener en cuenta lo siguiente. Si el valor
de la constante de da de tal manera que el resultado de operación en uno de los
puntos de la señal pueda salir del intervalo (-32767,32767), en la línea de mensajes
aparecerá el texto «Relleno. La operación está cancelada», y la operación no será
realizada. Esta observación no tiene relación con las señales de 24 bits. Sobre
trasformación de precisión de las señales mire p. 13.19.
Las opsiones superiores sirven para elegir el tipo del fragmento a procesar. El
trabajo con estas opsiones es completamente análogo al descrito en el p. 13.2.
62
Dibujo 26. Menú del procedimiento de adición de la señal
Para elegir una de ellas hay que en la columna «Actividad» establecer el indicador
en la línea que contiene el nombre de la ventana necesaria. Si la ventana elegida es de
tipo “no conveniente”, por ejemplo, si ésta contiene espectros, pero el usuario opera
con el fragmento de fonograma, el resultado de elección será anulado y en la línea de
avisos aparecerá el mensaje correspondiente. Después de apretar el botón «Aceptar» la
operación se realizará y la ventana-receptor se dibujará de nuevo. El obstáculo en
realizar esta operación puede ser sólo el tipo no convencional de la ventana-receptor.
Al adicionar la señal estereofónica a la señal mono, los datos de los canales
derecho e izquierdo se mezclan. Al adicionar la señal mono a la señal estereofónica se
en ambos canales se agregan los mismos datos.
En ella hay cinco opsiones para la elección del lugar dentro del segmento actual de
la ventana-receptor, en el cual hay que insertar el fragmento seleccionado. estas
opsiones son:
63
1) «Antes de la marca temporal» (si en la ventana-receptor hay dos marcas
temporales, los datos serán insertados antes de la marca izquierda);
64
Si no hay otras órdenes, los fragmentos de oscilogramas de el tono principal se
copian con un desplazamiento hacia cero (es decir el limite izquierdo de cada
resultado de copia es igual a 0). No obstante se lo puede cambiar entrando en el menú
Opciones->Opciones complementarias y quitando un banderín en «Desplazar los
datos hacia cero durante la copia». En este caso los límites horizontales de los
fragmentos no van a cambiarse durante la copia. Para facilitar el trabajo futuro con los
segmentos dispersados por tiempo, use el botón <F8> (para mostrar el segmento
superior completo).
65
13.11 Desplazamiento del segmento corriente
Para realizar el desplazamiento del segmento corriente (actual, en curso) es
necesario poner en la ventana activa dos marcas temporales para así lograr que la
distancia entre ellas sea exactamente igual al valor del desplazamiento deseado y
después de esto entrar en el campo Redacción->Desplazamiento de segmento.
Después de esto en la pantalla va a aparecer la ventana con dos opsiones :
«Desplazamiento hacia la izquierda» y «Desplazamiento hacia la derecha». Es necesario
apretar(elegir) uno de ellas según su deseo después de lo cual el segmento va a
desplazarse a la distancia determinada y la ventana actual se dibujará de nuevo.
Las opciones superiores sirven para elegir el tipo del fragmento a procesar. El
trabajo con estas opciones es completamente análogo al descrito en el p. 13.1 y 13.2.
66
Después en el menú hay una opción «Crear un segmento nuevo» con ayuda de la
cual se puede elegir o cancelar la creación de un segmento nuevo: para el caso cuando
sea elegido el régimen de creación de un segmento nuevo, el espectro nivelado será
dibujado en la misma ventana en la cual se encuentra la senal a procesarse pero se
dibujara con otro color; si el régimen recién indicado está cancelado, en la ventan
actual será dibujado sólo el espectro alisado (nivelado) y no habrá ningón otro.
Luego en el menú hay la opción «Promedio geométrico», con ayuda del cual se
puede convertir la nivelación desde el espacio lineal a logarítmico. Si este régimen está
elegido ([v]), antes de la nivelación los datos van a exprezarse en forma logarítmica y
después de la nivelación, al resultado será aplicada la operación inversa. Para usar este
régimen, mire que los datos no contengan valores negativos.
El submenú ubicado abajo permite elegir la longitud necesaria para la ventana de
nivelación comprendida entre las ofrecidas. La longitud de la ventana está indicada
tanto en puntos, como en hertzios (Hz). La nivelación con la longitud mínima de la
ventana casi no cambia el espectro, la nivelación con la longitud máxima de la ventana
lo convierte aproximadamente en un polinomio de segundo grado. La aproximación se
realiza por el criterio de « los cuadrados mínimos» mediante el método del polinomio
aproximador.
67
Dibujo 29. Menú de procesamiento «Mezcla»
elegir el fragmento con que va a trabajar: todos los datos, los datos iluminados,
datos conprendidos entre las marcas temporales, datos visibles en la ventana,
los datos seleccionados;
determinar el segmento-resultado: actual o nuevo. Si como resultado se elige el
segmento actual, entoces en el lugar del segmento actual será dibujado el
segmento-resultado de la mezcla; si como resultado se elige un segmento
nuevo, entonces el segmento-resultado de la mezcla se dibujará con otro color
por encima de las señales que se mezclan;
determinar la longitud del segmento-resultado: ésta puede ser determinada
como igual a la longitud del segmento actual o al intervalo de mezcla (por
ejemplo, entre las marcas temporales);
determinar los pesos deseables a cada una de las señales: en el menú hay una
tabla que contiene todas las señales a mezclar, y frente a cada una de ellas el
usuario introduce el peso necesario mediante el teclado;
introducir el nombre del resultado.
Después de establecer todos los parámetros es necesario apretar el botón
«Aceptar» y la mezcla será realizada después de lo cual, la ventana actual se dibujará
de nuevo.
68
13.14 Recorte (clipping)
Esta operación se aplica más frecuentemente para supresión parcial de
inteferencias de impulsos extendidos (en los casos cuando se observan paquetes de
impulsos, cada uno de los cuales tiene una duración larga).
Las opsiones superiores sirven para elegir el tipo del fragmento a procesar. El
trabajo con estas opsiones es completamente análogo al descrito en el p. 13.2.
Después se ubica la opsion que permite elegir el tipo necesario de clipping:
«Según la amplitud» o «En un intervalo», tambien permite establecer el nivel de
máximo y mínimo.
Después de apretar «Aceptar» la operación será realizada y la ventana actual se
dibujará nuevamente.
69
El cambio de la frecuencia de discretización se usa cuando la señal fue mal
grabada. Para algunas frecuencias escogidas es un procedimiento largo, pero a veces
es necesario realizarlo.
70
«Crear un segmento nuevo» – si este banderín está colocado se creará un nuevo
segmento. En caso contrario los datos van a grabarse en el segmento original y su
longitud va a reducirse.
71
13.16 Reversión
Para realizar la reversión es necesario entrar en el menú Redacción->Reversión.
Después de esto la operación será realizada inmediatamente y la ventana actual se
dibujará de nuevo.
13.17 Inversión
Para realizar inversión es necesario entrar en el menú Redacción->Inversión. Para
los oscilogramas y las señales de tono principal y de energía, esta operación consiste
en que todos los valores de la señal dentro del intervalo determinado cambian su signo
al inverso (es decir se multiplican por (-1)). Para el espectro de Furier en el proceso de
inversión cada valor de la señal dentro del intervalo determinado se sustituye por uno
dividido para el valor original.
72
Dibujo 33. Menú «OPCIONES» del procedimiento «Corrección del ritmo»
Nota
13.19 Modulación
Al régimen de modulación se acude mediante el menú Redacción->Modulación y
representa multiplicación por puntos de dos señales con normalización flotante del
resultado. Para este procedimiento se puede usar oscilogramas grabados en el
régimen «mono», de 16 bits o 24 bits que tengan la frecuencia de discretización igual.
Con esto representación interior en el SIS del número de 24 bits es de 32 bits, de las
cuales 24 son mantisa y 8 - orden.
73
13.20 Transformación de la precisión del oscilograma
La operación «Transformación de la precisión» se usa para obtención de la señal de
precisión necesaria y es aplicable sólo a los ocsilogramas (mono o estéreo).
74
Operación de union de dos señales mono puede resultar de duración larga en caso
de que empiezen desde puntos distintos según el tiempo, porque la parte de datos de
la señal que empieza más temprano será eliminada.
75
14 FILTRACIÓN
El programa SIS permite realizar la filtración de señales. Para esto hay que entrar
en el menú Filtración. Entonces aparecerá el menú de elección del tipo de filtración:
Filtración adaptativa
Igualización de frecuencia
Ruido de banda ancha
Interferencias tonales y regulares
Interferencias estéreo
----------------------------------
Ruido fijo de banda ancha
Filtración de interferencias IMPULSIVAS
Igualización dinámica de nivel
Las opciones del menú Filtración se eligen por el usuario en dependencia del
carácter de las interferencias que hay en la señal que está siendo procesada.
76
14.1.2 Descripción de parámetros
Para realizar la operación de igualización adaptativa de frecuencia es necesario
elegir el punto del menú Redución de ruido->Igualización de la frecuencia. En la
pantalla va a aparecer el menu estándar del tipo «Fuente-receptor», como trabajar col
el menu se describe en el p. 4.5. Apretando el campo «OPCIONES», se puede entrar en
el menu «OPCIONES» específico para esta operación y corregir los valores de
parámetros (Dibujo 35).
«La constante temporal del filtro, seg.» - 1 ... 1000 segundos – determina el
tiempo de ajuste del filtro de corrección para los cambios de espectro de la señal. El
valor recomendado es 3..4; para las interferencias no fijas y para la música 1..2.
77
Para una cantidad grande de interferencias de banda estrecha (impulsos periódicos,
etc.) se recomienda 1024-2048.
Inversión
Contraste
La variante del método «Inversión» suprime las interferencias fuertes de armónica y
la variante «Contraste» al revés subraya (resalta) los máximos de frecuencia en el habla
(en ausencia de las interferencias armónicas).
1. Tratamiento de habla,
2. Tratamiento de la música,
3. Eliminación del ruido en las pausas.
Simultáneamente en cada régimen se puede adicionalmente utilizar o no los
regímenes de corrección del timbre y supresión de las armónicas, asimismo que el
régimen de separación de fondo.
78
El destino principal del algoritmo de filtración adaptativa del ruido de banda ancha
es la aumentación de confortabilidad de percepción de la señal verbal útil con
presencia de ruido aditivo de banda ancha. Según su sonido los ruidos de esta
modalidad corresponden a bullicio, susurro, zumbido, fragor (aire acondicionado, mar,
viento, calle). Los ruidos de esta variedad no pueden ser eliminados mediante los
métodos de filtración adaptiva unicanal, igualización del espectro o ecualización
porque el espectro de la interferencia es disperso.
La filtración adaptativa del ruido de banda ancha permite suprimir el ruido tanto
en las pausas del habla como en los momentos de habla activo. Con esto la legibilidad
no se mejora pero se reduce considerablemente la fatiga durante audición.
Simultáneamente el algoritmo de filtración de ruido de banda ancha permite suprimir
los componentes de interferencia de banda estrecha y esto hace el método bastante
universal.
El régimen «Extraer el fondo en vez de la señal» (en las opciones amplificadas) está
destinado para separación de ambiente acústico de fondo (es decir el resultado será lo
que habitualmente se suprime).
79
El régimen «El filtro de corrección de timbre» permite «separar» la zona más
informativa del espectro de la señal suprimiendo la señal en las zonas de frecuencia
alta o baja, donde la interferencia supera la señal útil.
Por fin durante el ajuste del régimen de sustracción adaptativa espectral hay que
tener en cuenta una particularidad más – el cambio significativo del sonido de fondo
cuando se suprime el ruido (por ejemplo, el fragor exprimido del automóvil pasante
puede sonar como «murmullo» ). Para utilizar la propiedad de oído «orientarse» en los
sonidos conocidos es necesario reducir el diapasón de supresión hasta un valor
comprendido en el intervalo 25-15 dB, lo que provocará el aumento del fondo y
aparición del ambiente acústico conocido. Después de esto, aumentando el diapasón,
se puede lograr el compromiso deseable entre el grado de supresión de ruido y el de la
señal útil.
80
Además los algoritmos «Aplanamiento del espectro» y «Aplanamiento según el
tiempo» ejecutan adicionalmente la corrección de timbre, igualando el espectro y con
esto elevando aquella parte del espectro, donde la señal es débil.
Con razones pequeñas de señal /ruido la señal útil filtrada puede resultar débil.
Para aumentar su amplitud puede ser conveniente la amplificación adicional
determinada por el parámetro «Amplificación máxima para una frecuencia, dB».
Los parámetros se eligen de oído. Debbajo está descrita la influencia de cada uno
de los parámetros y están indicados los valores recomendados.
«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
se banda de filtro. El valor recomendado - 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor.
Atención!
Este submenú se usa en los casos cuando las opciones estándares resultan
insuficientes y contiene las siguientes áreas:
82
«La constante temporal de filtro, seg.» - 1 ... 1000 segundos – determina el
tiempo de ajuste de filtro de corrección a los cambios de espectro de la señal. El valor
recomendado es 3..4; para las interferencias no fijas es 1..2.
83
14.3 Filtración del ruido fijo de banda ancha
El usuario debe destacar con marcas temporales la parte de ruido limpio que será
utilizado como patrón.
Si el ruido es fijo o cercano a fijo (ruido de disco, calle, auditorio), tal algoritmo es
a menudo más preferible que el adaptivo. Esto está vinculado con el que la apreciación
adaptiva del ruido de fondo puede ser imprecisa , además, ella misma produce el
ruido. Este ruido que se llama el ruido de adaptación se percibe por el oído del hombre
y empeora la confortabilidad de audición, y en casos difíciles aún la legibilidad de la
señal verbal.
Dibujo 38. Menú «OPCIONES» del procedimiento «Ruido fijo de banda ancha»
84
«Variante del método» – permite determinar el método del procedimiento
dependiendo del tipo de la señal:
«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
de banda del filtro. El valor recomendado - 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor.
85
El régimen de filtración adaptativa unicanal de interferencias trabaja con señales-
mono y está destinado a la supresión de interferencias periódicas y cercanas a ellas
(vibraciones, interferencias producidas por los cables de la red, ruidos de aparatos
domésticos, música lenta, automóvil, etc.). Este régimen se utiliza para
desenmascaramiento de la señal verbal (mediante la supresión de interferencia tonal
de 20..40 dB), y en algunos casos también para supresión del rumor de una sala
grande.
El método temporal tiene una velocidad de convergencia mucho mayor, pero con la
misma cantidad de coeficientes exige la potencia calculadora mayor.
Los parámetros principales que determinan el grado de supresión del ruido son el
número de los coeficientes del filtro Ni y la detención. Para los régimes mono y estereo
estos parametros son dados de diferente forma.
86
El tiempo de ajuste del filtro se determina por medio del valor del parámetro de la
velocidad. Para las interferencias no fijas la velocidad se determina en el diapasón
16..29, para las interferencias que cambian lentamente – en el diapasón 2..15.
Los valores de los parámetros se eligen por el usuario de oído. Debajo está descrita
la influencia de cada uno de los parámetros y están indicados los valores
recomendados.
87
«REGULACIONES ESTANDARTIZADAS» – al apretar esta opsión los valores de todos
los parámetros se cambian a los estandartizados y el menú se dibuja de nuevo.
Espectral,
De tiempo,
Supresión de eco,
Supresión de armónicas.
«Retardo» – se cambia en los límites 0..1024 – Se recomienda establecer un valor
mayor que 250, pero menor que la cantidad de coeficientes (dimensión del cuadro).
Con un retardo menor que 0.02 seg. (200 cuentas(puntos) con la frecuencia de
discretización igual a 10000 Hz) se empeora la calidad de la señal verbal procesada.
«Salida del segundo canal» – Al ser activada envia al segmento de salida no la señal
útil sino el ruido que se a extraido(limpiado de la señal). Es útil para comprovar si el
algoritmo no a eliminado también la señal útil junto con el ruido.
88
«Corrección del timbre» – activa/desactiva el filtro de corrección del timbre.
«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
de banda del filtro. El valor recomendado es 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor(cantidad, magnitud).
Para realizar la filtración hay que entrar en el menú Redución de ruido (Filtración) -
>Filtración de las interferencias IMPULSIVAS. En la pantalla va a aparecer el menú
estándar, el trabajo con la ventana se describe en el p. 4.5.
Para cambiar los ajustes de la filtración entre en el menú «OPCIONES» (Dibujo 40).
89
Dibujo 40. Menú «OPCIONES» de procedimiento
«Filtración de interferencias IMPULSIVAS»
«Variante del método» – permite elegir uno de los tres métodos del procesamiento
de la señal:
90
«Interpolación de impulsos» – en la zona de detectación de los impulsos
la señal se restablece mediante la interpolación.
«Aplanamiento(nivelación) de impulsos» – los impulsos detectados se
alisan. Es efectivo sólo cuando no se procede la interpolación de
impulsos.
«Detector de impulsos» – sirve no para obtener la señal limpia sino para
la apreciación de los parámetros de filtración. En la salida da la función
de detectación la cual es igual a 32000 en todas partes donde no se ha
encontrado el impulso y igual a 0 en todas las partes donde el impulso se
encuentra con probabilidad 1.
Para ejecutar el proceso de filtración hay que apretar la opción que corresponde al
tipo de fragmento para procesar. El fragmento filtrado va a ser colocado o en la
ventana-receptor o si no hay receptor – en la ventana actual(activa) por encima del
fragmento que se procesa.
Apretando el área «OPCIONES», el usuario puede elegir uno de los cuatro métodos
siguientes:
«Limitador» está destinado a debilitar tanto impulsos potentes con larga duración y
como el ruido débil de fondo.
91
Después de la elección de cualquiera de estas variantes en la pantalla va a aparecer
la ventana común para todos los métodos –determinación del límite – nivel en caso de
desbiación del límite por parte de la amplitud promedio empezará el procesamiento de
la señal.
14.7.1 Menú de opciones del filtro adaptativo para las interferencias estéreo
Al entrar en el menú Filtración ->Interferencias estéreo en la pantalla va a aparecer
el menú estándar del tipo «Fuente-receptor», trabajo con el cual se describe en el p.
4.5. Los parámetros del método como siempre están descritos en el menú «OPCIONES»
(Dibujo 41).
92
El menú contiene las siguientes opciones:
93
«Velocidad de adaptación» - [2-30]– determina la velocidad de adaptación. Con el
valor demasiado grande de este coeficiente el filtro sale fuera de los límites de
estabilidad. Con el valor demasiado pequeño el filtro va a suprimir las interferencias
mal.
«Frecuencia superior, Hz» - 2000..Fmax Hz. Determina el límite superior del ancho
de banda del filtro. El valor recomendado - 3600 Hz. En el caso de ruido intensivo de
banda ancha es útil disminuir el valor.
La supresión del sonido desde la fuente inmóvil suele realizarse en dos etapas.
Primero se activan los regímenes «Adaptación» y «Guardar coeficientes» y se procesa la
parte de la señal que principalmente contiene el ruido de la fuente fija,
obligatoriamente sin la señal útil. Después se elimina el banderín «Adaptación» y se
procesa toda la señal.
94
14.8 Filtración de la señal con la ayuda de los módulos conectados de
DirectX
«Ajuste». Esta opción está destinada para el ajuste de parámetros del filtro del
módulo Sound Cleaner para el procesamiento de la señal actual. Con esto los datos
pasan del programa SIS a Sound Cleaner, se procesan allí y de nuevo pasan a SIS para
la reproducción. Al elegir este punto el usuario entra en Sound Сleaner y puede con
ayuda de los medios accesibles y audiocontrol constante ajustar el filtro de
purificación del ruido. Al lograr un resultado satisfactorio (lo que se verifica durante la
escucha), hay que regresar al programa SIS, apretar el botón <ESC> y elegir el punto
siguiente.
95
Al cargar Sound Cleaner previamente permitirá excluir intermitencias posibles al
ejecutar Sound Cleaner durante el trabajo en el programa de SIS.
Hay que tener en cuenta que Sound Сleaner de la versión 6.02 y menos no podrá
procesar señales de 24bits, por eso se recomienda instalar la versión 6.03.
El trabajo con los filtros del programa Sound Cleaner está descrito en el manual del
mismo “Sound Cleaner”.
Botón Función
Ajuste. Permite escuchar la señal después del procesamiento sin
conservarla.
Procesamiento. Procesa la señal y la conserva (guarda) en la ventana
de SIS.
Stop. Para la escucha o el procesamiento.
96
Los filtros durante el procesamiento van a ser utilizados en el mismo orden que
estan en la lista.
Para eliminar el filtro de la lista hay que elegir su nombre en la lista con el botón
izquierdo del ratón y manteniéndolo apretar el botón <Delete> en el teclado.
El trabajo con los filtros del DirectX es posible en dos regímenes: el régimen de
ajuste y el régimen de procesamiento.
El régimen de ajuste está destinado a la escucha previa de la señal procesada y
audiocontrol de los parámetros del procesamiento. Al apretar el botón «Ajuste» se
se ejecuta el procesamiento de la señal obtenida del programa SIS y la reproducción de
la señal procesada. en este caso no se guarda el resultado de filtración en la ventana
de SIS. Al lograr el resultado satisfactorio se puede pasar al régimen de procesamiento.
97
Para asegurar la mayor precisión del filtro hay que determinar el mayor número de
bandas posible, pero recordando que con la aumentación de este número se aumenta
proporcionalmente la carga al sistema. La cantidad de bandas del ecualizador está
vinculada duramente con la longitud de la ventana de FFt: su valor es siempre cuatro
veces mayor que el número establecido de bandas.
98
Resolución máxima del eje Х – determina tal escala de la imagen por el eje
horizontal con que cada barra deslizante de regulación de la característica de la
frecuencia coincide con una banda del filtro.
Aumentar la escala por el eje Х – cada vez que apriete aumentará la escala por el
eje X dos veces.
Reducir la escala por el eje Х – cada vez que apriete reducirá la escala por el eje X
dos veces.
Mostrar todo el diapasón por el eje Х – determina tal escala de imagen por el eje
horizontal con que se representa el espectro de la señal en el rango de 0 Hz hasta la
mitad de la frecuencia de discretización.
Autoescalización por el eje Y – cambia las fronteras de zona visible por el eje Y
conforme al valor actual mínimo y máximo del espectro de la señal.
99
Atención!
100
En esta ventana se puede elegir de la lista el número de bandas del ecualizador. En
general cuanto mayor es este número tanto más preciso será el funcionamiento del
filtro, pero entonces va a aumentarse la carga al sistema. El número de bandas
máximo posible es de 4096.
El botón Instalar cierra la ventana junto con la grabación de todos los cambios
hechos; para salir sin guardar use el botón Cancelar.
101
La colocación de fronteras (limites) de la zona del espectro representada por el eje
X se realiza con el clic de botones izquierdo y derecho del ratón por los puntos
correspondientes del indicador. Los botones «< >« a la izquierda de la escala sirven
para desplazar la zona representada a la izquierda/a la derecha. Lo mismo se puede
hacer con las teclas de control del cursor, colocando previamente el foco de la
introducción en la escala. Al apretar una vez el botón se desplaza la zona de la imagen
a 1/16 de anchura de la ventana del ecualizador.
102
El valor Q1 determina «el relieve» de la característica de la frecuencia en el rango
de frecuencias de 100-800 Hz. Q2 regula ascenso/caída de la característica de la
frecuencia a cada 1000 Hz, empezando por la frecuencia 1000 Hz. Los cambios de
ambas regulaciones son posibles en el diapasón desde –18 hasta +18 dB. El valor
actual de cada barra deslizante está indicado a la izquierda de ella.
103
14.9.9 La filtración de la señal estéreo
Como en los canales izquierdo y derecho de la señal estéreo pueden estar
interferencias diferentes, durante el procesamiento de la señal estéreo se recomienda
la siguiente sucesión de acciones:
Nota
Después del intento de elegir en la ventana de opciones del ecualizador
simultáneamente Sonido y Opciones de la señal estéreo: Ambos canales el sistema
dará el aviso sobre el error.
104
15 ANÁLISIS DE LAS SEÑALES DE VOZ
Para efectúar el análisis de las señales de voz en el menú principal está previsto el
punto Análisis. Al entrar en este menú se abre la lista contenedora de las
posibilidades del análisis de la señal, accesibles al usuario, es decir:
Espectrograma,
El kepstrum,
Autocorrelación,
Respuesta de frecuencia LPC,
Obtención del promedio,
El tono principal (LLK),
El tono principal (Espectro),
Análisis de formantes,
Energía (Declinación Cuadrática Promedio.),
FFT espectro promedio de potencia,
Histograma,
Parámetros del histograma.
Eligiendo el punto Otras funciones..., usuario puede efectuar también los
siguientes tipos de análisis:
105
15.1 Recepción de las imágenes tridimensionales de los macizos de los
espectrogramas, kepstrogramas, de los coeficientes de correlación
automática, correlación particular, de los coeficientes de
pronosticación lineal y de la respuesta de frecuencia del transmisor
LPC
Para obtener una imagen tridimensional de una de las características indicadas
entre en el punto Análisis del menú principal, elija la característica necesaria, entre en
el punto «Opciónes» del menú estándar y introduzca los parámetros que se necesitan
para la calculación.
La ventaja que mustran los tres tipos de representación descritos con respecto a
los tipos de representación por color y a la escala del gris consiste en que estos tipos
muestran un rango mucho más ancho y dinámico. El rango dinamico durante la
representación por color y por la intensidad se encuentra limitado por la capacidad del
display para mostrar algo, y por la capacidad que tiene el usuario para distinguir los
matices de colores o el grado de ennegrecimiento.
La elección del tipo de representación depende del objetivo planteado por el
usuario.
106
Mientras más es este coeficiente, más se puede apreciar las particularidades
débiles de la señal en la imagen. Hay dos modos de cambiar este coeficiente:
Si al momento de apretar el cursor del ratón estubiese debajo del límite de los
colores, el multiplicador de escala se disminuirá tantas veces, cuanto menos es la
distancia entre el borde inferior del área negra y el cursor de toda la longitud del área
negra.
Si al momento de apretar el cursor del ratón estubiese por encima del límite de los
colores, entonces el multiplicador de escala se aumentará tantas veces, cuanto más es
la distancia entre el borde inferior de la área negra y el cursor de toda la longitud de la
área negra. De esa manera, sin entrar en el menú se puede aumentar el multiplicador
de escala 3 veces y disminuir 15 veces.
107
15.1.3 Cambio de los márgenes de la imagen
Para cambiar los márgenes de la imagen se puede utilizar la banda de
demostración, situada en la parte inferior de cualquiera de las ventanas, o fijar los
márgenes de la imagen directamente, utilizando la opción Demostración.
Para cambiar los márgenes de la imagen por la horizontal en este menú existe el
área «Cambio de la longitud /posición del box». Al apretar sobre esta opción, en la
pantalla aparece el menú complementario bajo el nombre de «Anchura del box:». Hay
que introducir en las casillas correspondientes de este menú a través del teclado los
valores de los márgenes derecho e izquierdo del box. Al apretar el botón «Sí» la
imagen tridimensional será redibujada en los límites nuevos.
108
Manteniendo presionada la tecla izquierda de ratón el círculo rojo se puede
trasladar al lugar necesario. Para volver a dibujar los datos se debe soltar la tecla del
ratón. Al mismo tiempo por el eje Y – se da el valor de subida de los altos desde
.......Hz, y por el eje X – el valor de subida de los altos en ..........(dB/octava).
Ya que los bordes de la señal cortada por la ventana rectangular en el límite del
intervalo del análisis pueden cortarse bruscamente, un hecho semejante puede en
este caso llevar a la deformación del espectro, produciendo los lanzamientos de las
amplitudes espectrales, que no estan relacionados con la señal, sino con la colocación
y la forma de la ventana. Para disminuir este efecto es costumbre alisar(nivelar) los
extremos de la señal en en intervalo del análisis, es decir utilizar la función de la
ventana con la recesión de los valores a los extremos de la mitad de la ventana.
109
En la área espectral el uso de tales ventanas lleva al aplanamiento de los valores
del espectro y a la eliminación de los lanzamientos de amplitudes de ellas, aunque con
esto pasa un cierto empeoramiento de la exactitud de la resolución espectral.
110
Para la clasificación de las funciones de la ventana se emplean varios índices de
apreciación de su calidad.
Dos índices se usan también para valorar las características de los pétalos laterales.
Uno de ellos es el nivel máximo de los pétalos laterales, que deja juzgar de lo cuanto
bien la ventana reprime la infiltración. El segundo es la velocidad de caída del nivel de
los pétalos laterales, que caracteriza la velocidad con la cual se baja el nivel de los
pétalos laterales más cercanos al pétalo principal. En esencia, la velocidad de la caída
de los pétalos laterales depende del número de recuentos N utilizados y con el
aumento N tiende a un cierto valor asintótica, la cual es costumbre expresar en
decibelios (dB) por la octava del cambio de anchura de la banda de frecuencia.
111
Características de las ventanas:
La ventana del tipo « coseno cuadrado» fue llamada en honor del meteorólogo
austriaco Ulius von Hann. A esta ventana a menudo la llaman erróneamente la ventana
de Hanning.
112
Para la Ventana de períodos iguales se calcula la función autocovariable de tal
manera, que la anchura de la ventana de análisis con la disminución de la frecuencia se
aumente, compensando el efecto antes mencionado. Espectro, kepstrum y la
autocorrelación se calculan más tarde por esta función autocovariativa.
Si hay una componente fuerte, alejada de la componente débil de la señal, hay que
elegir la ventana con el nivel de pétalos laterales cayendo rapidamente. Y su nivel de
ellos en la proximidad inmediata al pétalo principal en este caso no tiene mucha
importancia.
En el caso cuando se necesita asegurar una alta resolución entre las componentes
de la señal muy cercanas y faltan los componentes alejados, es del todo aceptable la
ventana aun con el nivel aumentando de los pétalos laterales, pero con un pétalo
principal muy estrecho.
Si el rango dinámico de la señal está limitado, entonces las características de los
pétalos laterales no tienen mucha importancia.
Para obtener una forma más demostrativa de la imagen se recomienda elegir una
de las primeras tres ventanas. Están situadas en el orden de decrecimiento del nivel de
los pétalos laterales de la característica espectral de la ventana y del aumento de la
anchura del pétalo espectral principal. La anchura efectiva de la ventana en
comparación con la rectangular se les disminuye respectivamente {1.36, 1.5, 1.8 и 3.5}
veces.
113
15.3 Cálculo del espectrograma dinámico
Para caracterizar algun sonido complejo - acústico, se necesitan los datos de su
tono principal, de la frecuencia de las armónicas del tono principal y de la intensidad
relativa de todos sus componentes de frecuencia (es decir sobre como el tono principal
y las armónicas se relacionan por intensidad). Estos datos puede obtenerlos por el
análisis espectral del sonido. El espectrograma dinámico permite ver el estado
continuo de los cambios de las características espectrales de los segmentos sonoros
de duración diversa.
114
Este menú contiene un cierto número de parámetros, al cambiar los valores de los
cuales el usuario puede obtener la imagen de el habla visible más aceptable para él.
Los parámetros incluidos en este submenú (inclusive los submenús incluidos en él),
son los siguientes:
«Tamaño del cuadro». El usuario puede elegir el cuadro de tamaño 16, 32, ...
16384 recuentos. Después de introducir la longitud del cuadro en los recuentos ella se
representa en seguida en ms en el campo próximo. Según como sea el tamaño del
cuadro se puede obtener el espectro de banda ancha o estrecha. En el espectro de
banda estrecha la imagen espectral resulta más detallada, en el espectro de banda
ancha – más general. Para obtener el espectro de banda estrecha el tamaño del cuadro
debe superar el valor máximo del período del tono principal. En este caso para la voz
masculina se fija el tamaño del cuadro de 256 recuentos y más, para la voz femenina –
de 128 recuentos y más. Para obtener el espectro de banda ancha el tamaño del
cuadro debe ser menos del valor máximo del período del tono principal. Para la voz
masculina es 64 recuentos, para la voz femenina - 32 recuentos.
«Hamming»,
«Hann»,
«Nuttall»,
«No»,
«de los períodos iguales, 2.0».
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una de las tres primeras ventanas. Están ubicadas en el orden de
decrecimiento del nivel de los pétalos laterales de la característica espectral de la
ventana y del aumento de la anchura del pétalo espectral principal. Si ha sido elegida
la Ventana de períodos iguales entonces basta apretar con el ratón sobre cualquier
punto fuera del menú de la ventana de suspensión para que aparezca el diálogo «Elijan
el multiplicador del período [0.3,…,9]:». El usuario debe ingresar el multiplicador del
período y apretar «Sí». Si el usuario aprieta «Cancelar», se restablecerá el valor de
antes.
115
«Utilizar el filtro». Hay una posibilidad de elegir un filtro por 0.. 55 puntos.
Trabajando con el filtro se efectúa la obtención del promedio geométrico de la imagen
según la cantidad elegida de los puntos. La obtención del promedio se ingresa para
obtener una imagen más precisa de los formantes, para allanar las armónicas del tono.
En el caso cuando hay que ver las armónicas particulares, la obtención del promedio
no se efectúa.
116
El campo «Pérfiles» permite utilizar los parámetros estandartizados:
Formantes
o Hombre (Tenor (130-520 Hz), Barítono (110-390 Hz), Bajo (80-350 Гц) o
contrabajo (50-220 Hz))
o Mujer (Soprano (260-1050 Hz), mezzo-soprano (220-880 Hz) o contralto
(165-700 Hz))
o Niño
Espectrograma de banda ancha
o Hombre
o Mujer
o Niño
armónicas
o armónicas del tono (Alto (>220 Hz) o bajo (<220 Hz) tono principal)
o armónicas técnicas (Resolución máxima, media o mínima)
Los parámetros incluidos en este submenú (inclusive los submenú incluidos en él)
son los siguientes:
«Tamaño del cuadro». El usuario puede elegir un cuadro de tamaño de 16, 32, ...
16384 recuentos. Para la calculación del kepstrograma habitualmente se elige el
tamaño del cuadro igual a 512 recuentos para la voz masculina y a 256 recuentos para
la voz femenina. Al determinar la longitud del cuadro el los recuentos esta se
representa en seguida en milisegundos en el área próxima.
117
Dibujo 47. Menú «OPCIÓNES» del procedimiento «El cepstrum»
«de Hamming»,
«de Hann»,
«de Nuttall»,
«No»,
«De los períodos iguales, 2.0».
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una de las tres primeras ventanas. Están ubicadas en el orden de
decrecimiento del nivel de los pétalos laterales de la característica espectral de la
ventana y del aumento de la anchura del pétalo espectral principal.
«Utilizar el filtro». Hay una posibilidad de elegir un filtro para 0.. 55 puntos.
Trabajando con el filtro se efectúa la obtención del promedio móvil de la imagen por la
cantidad elegida de los puntos. La calculación del kepstrograma se realiza como regla
sin obtención del promedio.
118
«Utilizar la normalización». Al apretar sobre este área en la pantalla aparecerá un
menú más en el que hay que ingresar los siguientes parámetros:
Hombre
o Tenor (130-520 Hz)
o Barítono (110-390 Hz)
o Bajo (80-350 Гц)
Mujer
o Soprano (260-1050 Hz),
o Contralto (165-700 Hz))
o Niño
Espectrograma de banda ancha
o Hombre
o Mujer
o Niño
Complementariamente
o Canto (hombre)
o Señal superruidosa
o Infrasonido
o armónicas constantes (la resolución máxima)
119
15.5 Cálculo de las características dinámicas del modelo regresivo
automático de la señal de voz
En este sistema hay la posibilidad de calcular las siguientes características
dinámicas del modelo regresivo automático de la señal de voz:
Al establecer los parámetros el usuario debe crear o elegir la ventana para ingresar
la información y poner en marcha el procesamiento apretando sobre el campo con el
tipo elegido del fragmento de los datos. En lo bajo de la pantalla en la línea de los
mensajes se ilumina el indicador del grado de ejecución de la función. Dependiendo de
como se llena se puede seguir el curso del proceso del cálculo. Se puede interrumpir
el proceso de cálculo apretando sobre <ESC>.
La fijación de los parámetros se efectúa en el submenú OPCIÓNES», que contiene
un cierto número de parámetros cambiando los valores de los cuales el usuario puede
obtener la representación de voz visible más aceptable para él.
Los parámetros incluidos en este submenú (inclusive los submenú incluidos), son
los siguientes:
«Tamaño del cuadro». El usuario puede elegir un cuadro de tamaño de 16, 32, ...
16384 recuentos. Al fijar la longitud del cuadro esta se representa en milisegundos en
el campo próximo.
«de Hamming»,
«de Hann»,
«de Nuttall»,
«No»,
«de los períodos iguales, 2.0».
120
Para obtener una forma más demostrativa de representación de la señal se
recomienda elegir una de las primeras tres ventanas.
122
Dibujo 48. El Menú «OPCIÓNES» del procedimiento
«La respuesta de la frecuencia LPC»
Los parámetros incluidos en este submenú (inclusive los submenús incluidos en él):
«Tamaño del cuadro (puntos)». El usuario puede determinar el tamaño del cuadro
deseable. Por defecto está fijado 512.
«Resolución de frecuencia (Hz)». El valor se elige de: 5,3; 10,7; 21,5; 43,0; 86,1;
172,2; 344,5; 689,0.
«Número coeficientes LPC» – el número de los coeficiente del pronóstico lineal, que
se emplean para formación de la respuesta de la frecuencia.
De Hamming
De Hann
De Nuttall
No
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una de las tres primeras ventanas. Están ubicadas en el orden de
decrecimiento del nivel de los pétalos laterales de la característica espectral de la
ventana y del aumento de la anchura del pétalo espectral principal.
123
«Utilizar el filtro». Hay una posibilidad de elegir un filtro por 0.. 55 puntos.
Trabajando con el filtro se efectúa la obtención de media geométrica de la imagen
según la cantidad elegida de los puntos.
Formantes
o Hombre (Tenor (130-520 Hz), Barítono (110-390 Hz), Bajo (80-350 Гц) o
contrabajo (50-220 Hz))
o Mujer (Soprano (260-1050 Hz), mezzo-soprano (220-880 Hz) o contralto
(165-700 Hz))
o Niño
Formantes igualadas
o Hombre, bajo (80-350 Hz)
o Hombre, tenor (130-520 Hz)
o Mujer
armónicas
o Harmónicas del tono (Alto (>220 Hz) o bajo (<220 Hz) tono principal)
o Harmónicas técnicas (Resolución máxima o mínima)
124
15.7 Cálculo energético (Declinación Cuadrada Promedio)
Para calcular la energía de la señal se necesita entrar en el punto Análisis->Energía
(Declinación Cuadrada Promedia). Con el cálculo de energía en el sistema SIS se
entiende el cálculo de la raíz cuadrada del móvil medio del cuadrado de la señal. Con
esto el usuario debe fijar la longitud del cuadro (en milisegundos), por la que se
efectúa la obtención de medio. Por ejemplo, si el usuario ha fijado la longitud del
cuadro de 1ms, con la frecuencia de descretización del segmento activo de 10 kHz,
eso corresponde a cien recuentos. Entonces, para obtener el valor de la energía en
cualquier punto de la señal, el sistema toma 50 valores de la señal a la izquierda del
punto, 50 – a la derecha, eleva cada valor al cuadrado, suma los resultados, divide la
suma por 101 y extrae la raíz cuadrada del cada número obtenido. En todos casos el
cuadro, por el que se efectúa la obtención de medio se desplaza por la señal con el
paso en un recuento.
125
Para promediar los datos, hay que entrar en el menú Análisis->Obtención del
promedio. En la pantalla aparecerá el menú estándar, el modo del trabajo con el cual
está descrito en el p. 4.5.
Al apretar sobre «Aceptar», volverá al menú anterior. Cree o elija una ventana-
recipiente y ponga en marcha el proceso del cálculo apretando sobre el campo con el
tipo necesario del fragmento procesado. Al terminar los cálculos en la ventana-
recipiente se dibujará la representación de la característica promediada.
15.10.1 Generalidades
El tono fundamental se calcula para los partes vocalizadas de la señal de voz. La
señal se considera tonal si en el cuadro (ventana) dado de análisis hay una
periodicidad de la señal en general o, por lo menos, en una región de frecuencia baja.
El tono principal se calcula para mono señales. Para señales estéreo se calcula el
tono principal del canal de izquierda.
126
Dibujo 49. Menú «OPCIÓNES» del procedimiento «Tono principal»
Si el valor del campo es igual a –1 , quiere decir que en este método de cálculo del
tono principal este parámetro no se emplea.
«Tamaño del cuadro, ms» – la longitud necesaria del cuadro del análisis de la señal
en milisegundos.
127
Dibujo 50. La ventana de ajuste del procedimiento «Tono principal LLK»
«Inicio (Hz)» – valor inicial del tono principal (Hz). Este valor para más estabilidad
del funcionamiento de cada método tiene que corresponder aproximadamente a la
señal dada, o más exactamente, al tono principal medio para los partes iniciales de la
curva del tono principal para cada traspaso de una parte de ruido a una parte tonal. En
el programa por el valor entrado F se calcula la duración correspondiente del período P
como el cociente de la división de la frecuencia de la señal por F. El primer valor de la
frecuencia del tono principal para cada segmento del tono se busca dentro de los
límites de F-ID hasta F+ID. El valor inicial del tono principal se puede determinar por
el kepstrograma como el valor medio del tono principal.
«Igualdad inicial (%)» - ID – este número establece la duración inicial del cambio del
presente período del tono principal respecto al período anterior.
«Mínimo absoluto (Hz)» – mínimo absoluto del tono principal (en Hz). En cada
método de separación del tono principal la frecuencia del tono principal se busca sólo
sobre el límite dado. El valor del mínimo absoluto de la frecuencia del tono principal se
determina por el kepstrograma como el valor mínimo de la función del cambio del
tono principal.
«Máximo absoluto. (Hz)» - Máximo absoluto del tono principal (en Hz). En cada
método de separación del tono principal la frecuencia de cada tono principal se busca
solo bajo el límite dado. El valor del máximo absoluto se determina por el
kepstrograma como el valor máximo de la función del cambio del tono principal.
128
«Opciones para ruido y pausas»:
«Desplazamiento del cuadro, ms» – valor del desplazamiento del cuadro por la
señal a la identificación del cuadro como intervalo de ruido o pausa.
«Límite de la amplitud de la pausa» – valor de umbral de la amplitud para
identificación de la pausa. La señal en el cuadro de análisis con la amplitud inferior a
este umbral se considera una pausa. El valor de umbral de la amplitud se fija por
medio de selección, controlando de oído si el umbral ha sido elegido correctamente.
Vale la pena cambiar este parámetro si tiene una señal superruidosa, y al separar el
tono principal una parte de las pausas superruidosas ha sido percibida por el
algoritmo como los partes tonales. La señal con el nivel de la energía (o sea, de la raíz
cuadrada de la energía) inferior a él del parámetro fijado, se considera una pausa.
«Cruce 0 (Hz)» – el valor umbral de la frecuencia de el cruce del nivel «0» (en Hz).
La señal en el cuadro del análisis con la frecuencia de cruce del valor cero superior al
umbral dado se considera ruido. El valor de umbral para la pausa se fija por medio de
selección, controlando de oído si el umbral ha sido elegido correctamente . La parte de
la señal que tiene la frecuencia de cruce 0 superior a la indicada en este parámetro, se
considera la parte de ruido. Vale la pena cambiar este parámetro si su señal está
dominada por el ruido del componente de altas frecuencias. Trabajando con las
señales puras es más funcional utilizar los valores de los parámetros por defecto.
«Autocorrelación». Calculando el tono principal por el algoritmo LLK para los partes
tonales se calcula autocorrelación con la ventana 0.02 segundos. Por 15 valores de
autocorrelación sucesivamente calculados se hace una suposición del valor del tono
principal.
Al fijar todas las opciones aprieten «Sí», después de que volverá al menú anterior.
Creen o elijan una ventana-recipiente y pongan en marcha el proceso del cálculo
apretando sobre el campo con el tipo necesario del fragmento procesado.
130
15.10.5 Comparación de locutores
Para comparar los hablantes según la estadística de su tono principal hay que
colocar en la ventana Для сравнения дикторов по статистике их основного тона
необходимо поместить o 2 fragmentos acústicos comparados o dos fragmentos del
tono principal calculado (algoritmo espectral). La longitud de los fragmentos debe ser
no menos que 10 segundos.
Al elegir el punto del menú Análisis -> Más funciones…-> Comparación de los
locutores en la pantalla аparecerá la ventana con nombres de las señales
comparados.
• La voz femenina
• El canal telefónico
• Por el tiempo menor. En este caso las señales se comparan por el intervalo,
correspondiente a la duración de la señal más corte.
Al apretar sobre «START» el programa calcula el tono principal (si en la ventana
están los datos acústicos) para cada de las señales y efectúa la comparación de las
características estadísticas. Los resultados de la comparación se presentan en el
cuadro (Dibujo 52).
131
15.10.6 Control de la justeza del cálculo del tono principal
Se puede realizar control de la corrección del cálculo del tono principal por varios
métodos:
• El valor del tono medio (inicial) en las instalaciones aumentar o disminuir así
que los valores de esta frecuencia +/- igualdad inicial permitan «cortar» las
intermitencias indeseables en las harmónicas múltiples del tono;
• Disminuir la igualdad inicial de la curva, por ejemplo, de 40 hasta 20;
• Aumentar un tanto el mínimo absoluto o reducir el máximo absoluto, cortando
con esto las gamas de frecuencias indeseables;
• Cambiar los parámetros para cortar pausas y ruido.
Al fijar de esta manera los valores terminantes de los parámetros, realicen el
cálculo del tono principal por toda la señal.
Notas
132
15.10.7 Corrección del tono principal para la imagen del espectro
En caso necesario, se puede utilizar la función de la corrección manual del tono
principal. Para hacerlo hay que introducir el tono principal a la misma ventana que el
kepstrum, y abrir en la ventana-lupa el fragmento que se necesita corregir. (más
detalladamente sobre el régimen «Lupa» véanse. p. 10.5). Después de esto la
redacción del tono principal se efectúa por medios regulares del sistema SIS (véanse.
p.10.6. )
Para realizar esta operación es necesario que haya por lo menos una marca
temporal.
Para calcular el espectro hay que fijar los valores para los siguientes parámetros:
133
«Tipo de la ventana de suspensión». Véanse la descripción detallada de las ventanas en
el p. 15.2. El usuario puede elegir uno de los cuatro tipos de la ventana de suspensión:
«Hamming»,
«Hann»,
«Nuttall»,
«No»,
«De los períodos iguales, 2.0».
Al fijar todas las opciones hay que poner en marcha el proceso del cálculo del
espectro momentáneo por elegir el campo «Sí». Al terminar la operación el espectro
calculado se dibujará en la ventana recipiente.
Eligiendo la ventana-recipiente hay que recordar que tiene que comprender los
segmentos del mismo tipo o estar vacío.
Al fijar los parámetros necesarios, el usuario debe crear o elegir la ventana para
introducción de la información y al elegir el tipo del fragmento procesado, poner en
marcha el proceso de la ejecución de la operación (acumulación del espectro).
Impedimento para ejecución de esta operación puede ser sólo el tipo inadecuado de la
ventana recipiente.
134
Parámetros de este submenú (inclusive los submenú incluidos) son los siguientes:
«Tamaño del cuadro (puntos):». El usuario puede elegir el cuadro del tamaño 32 ...
131072 recuentos. Al fijar la longitud del cuadro en los recuentos en seguida se
presentará en milisegundos arriba a la izquierda.
«Hamming»,
«Hann»,
«Nuttall»,
«Gauss»,
«No».
135
Para obtener una forma más demostrativa de la representación de la señal se
recomienda elegir una del las primeras cuatro ventanas: rectangular («No»), de
Hamming, de Hann, de Nuttall, de Gauss.
Al fijar todos los parámetros hay que apretar «Sí». En la pantalla aparecerá el menú
anterior «FFT Espectro medio de la potencia».
136
En este sistema están previstos dos métodos distintos del cálculo: «LPC» (por el
modelo de los coeficientes de la pronosticación lineal) o «espectral» (por los espectros
igualados de Furie con la sustracción del ruido). El método «LPC» da los resultados
más precisos en los sonidos tonales, aquel «espectral» – en los sonidos no tonales y
las señales superruidosas. El método «espectral» determina el número de los
formantes por sí mismo, y si su cantidad es más que la fijada en el menú, omite a la
grabación los excesivos (los de alta frecuencia). Los valores de los formantes
inexistentes se llenan por el número irrealizable (-1) y no se representan. El método
«LPC» siempre calcula tantos formantes cuantos están indicados en el menú. Con esto
una parte de los formantes puede no estar conforme a los datos reales.
Al cambio del método del cálculo, el aspecto del menú algo cambia, ya que los
métodos utilizan varias selecciones de los parámetros :
137
«El número de los formantes» – cualquier número positivo de 1 hasta 16, se utiliza
para desviación de la memoria.
Hombre
o Tenor (130-520 Hz)
o Barítono (110-390 Hz)
o Bajo (80-350 Hz)
Mujer
o Soprano (260-1050 Hz)
o Mezzo soprano (220-880 Hz)
o Contralto (165-700 Hz)
Luego hay que abrir el menú contextual de la lupa de los formantes, haciendo el
clic con el botón derecho del ratón sobre el campo funcional de la ventana-lupa
(Dibujo 56).
Para borrar el formante hay que elegir en el menú contextual «Borrar los
formantes» o «Borrar los formantes en la región (todos)».
Para salir del régimen del cambio o del borrar de las formantes hay que elegir en el
menú contextual «La lupa de los formantes».
Para salir del régimen de lupa hay que apretar sobre <Esc> en el teclado.
139
Para esta operación se utilizan tres parámetros a fijar:
«El límite inferior» – todos los valores inferiores al valor dado caen en el primer
recuento de la histograma.
«La límite inferior» todos los valores superior al valor dado caen en el último
recuento de la histograma.
«El paso» – paso de la división del intervalo en subintervalos del límite superior al
límite inferior
Además, los datos básicos de cualquier tipo pueden ser leídos del disco como
textuales. Después de esto se puede calcular la histograma según ellos.
140
El menú tiene cuatro columnas. En la primera columna se encuentran los nombres
de los parámetros calculados. En la segunda – el nombre del primer file y los valores
de estos parámetros para su histograma. En la tercera - el nombre del segundo file y
los valores de estos parámetros para su histograma. En la cuarta («Relación») – los
valores de relaciones de los parámetros para el primero y el segundo archivo.
Los parámetros calculados:
«Mediana» – coordenada del punto, a la izquierda y a la derecha de la cual las áreas
en lo bajo de las histogramas son iguales.
«Centro de gravedad» – el primer momento de la histograma. Para las histogramas
simétricas se coincide con la mediana.
«El nivel único del error» – con un cierto valor de la abscisa la probabibilidad de
omitir al locutor «mio» tomándolo por él ajeno es igual a la probabilidad de aceptar al
locutor «ajeno» tomándolo por el «mio». El valor de esta probabilidad se llama Nivel
único del error
«Coordenada Nivel único del error» - coordenada (abscisa) del Nivel único del
error
Si será elegida la opción «Las histogramas semejantes», entonces después del
cálculo en la pantalla aparecerá el menú «Parámetros de la histograma» (Dibujo 52).
142
16 MANUAL DEL EXPERTO ACÚSTICO PARA EL ANÁLISIS DE LAS
NEGOCIACIONES DE AVIACIÓN
Para decodificar información de grabadoras automáticas del bordo se ofrece el
siguiente procedimiento:
Después se puede decodificar las marcas del tiempo de la señal introducida con la
opción Redacción->Canal del tiempo de servicio->Decodificar las marcas. Al descubrir
errores en el código de las marcas del tiempo el programa emite una señal acústica e
informa acerca de tipo de error en la línea bajo de la pantalla. Para corregir errores se
puede usar funciones del menú Redacción->Canal del tiempo de servicio.
La señal formada de esta manera contiene información acerca del tiempo
astronómico para cada punto. La información se presenta en la ventana como una
escala adicional en el eje del tiempo. Con cursor se puede conseguir información más
detallada acerca del tiempo astronómico. La señal examinada y corregida debe ser
conservada en el disco. Sin embargo, se puede borrar la primera copia de la señal para
ahorrar espacio en el disco.
143
16.2 Trabajo con señales que contienen marcas del tiempo
Para trabajar con señales grabadas en formatos MSRP-64-2 y MSRP-A y que
contienen las marcas del tiempo es necesario entrar en el menú Redacción->Canal del
tiempo de servicio. El menú abierto tiene varios puntos que se describen a
continuación. Todos ellos sirven para correlación correcta de la señal, que contiene
marcas del tiempo, con el tiempo astronómico. En vez de la señal analógica obtenida
de la grabadora automática del bordo en el canal de servicio se graban los significados
decodificados del tiempo astronómico de tipo binario con la exactitud hasta 0,1 seg.
Hasta que la operación sea realizada el file con las marcas del tiempo para el sistema
SIS es un estéreo file ordinario. Al terminar de realizar la operación el sistema SIS
puede presentar el tiempo astronómico justamente bajo la imagen de la señal de una
manera correcta. (Dibujo 59).
Observación:
-se debe tomar en cuenta que al presentar en el programa los valores de las marcas
del tiempo están limitados por el intervalo de 12 horas.
-los valores falsos del tiempo de marcas del tiempo astronómico pueden ser
presentados en la escala del tiempo como:
144
16.2.1 Decodificar las marcas
La señal inicial es la señal estéreo con impulsos del tiempo en el segundo canal.
Para sacar la información grabada es necesario realizar la decodificación. Al decodificar
las marcas en la ventana de los datos aparece una escala adicional del tiempo con el
tiempo astronómico.
En caso de que las marcas del tiempo aparecen en el primer canal se puede realizar
la operación «Cambiar de lugares los estéreo canales» del menú Redacción-
>Mono/Estéreo operaciones.
Si el canal de servicio fue hecho primero hay que iniciar la función «Examinar las
marcas del tiempo». Luego en los lugares de errores se ponen las marcas fijas. Tiene
que analizar los errores y si es preciso corregirlos. Sólo al hacerlo se puede considerar
que el tiempo astronómico es correcto.
Observación:
La señal inicial debe ser de 16 descargas. Para las señales de 24 descargas no se crean
las marcas del tiempo.
La monoseñal se puede obtener de la estéreo con la opción del menú Redacción ->
Mono/Estéreo operaciones -> Dividir la estéreo señal en 2 mono. La estéreo señal
decodificada con las marcas del tiempo incorrectas puede ser transformada en mono
con la operación «Quitar el Canal de Servicio» del menú Redacción -> Canal de tiempo
de servicio.
Las marcas del tiempo pueden ser creadas por uno o dos puntos indicados
(derecho, izquierdo o los dos límites del intervalo dado). Es necesario indicar en la
ventana de parámetros los límites a usar y también los valores del tiempo en los
puntos.
Ejemplo 1:
El canal del tiempo de servicio se creará en toda la señal según un sólo punto
indicado (14.56 seg. - 2:12′37″).
Ejemplo 2:
• Entre en el menú Redacción, haga que el intervalo «Todos los datos» sea
corriente, luego entre en el menú Canal del tiempo de servicio y escoja el punto
«Crear las marcas».
• En la ventana de parámetros (Dibujo 52) ponga el banderín en cada línea.
• De el tiempo 12:17′33″0 en la línea arriba y 13:22′33″0 en la línea bajo. Pulse
«Sí» para continuar.
El canal del tiempo de servicio se creará en toda la señal según dos puntos «Todos
los datos».
146
Los valores del tiempo relativo en los márgenes del intervalo se presentan en la
ventana de los parámetros para poder controlar.
Todos los valores de las marcas del tiempo dentro del intervalo serán copiados
según la fórmula de la interpolación lineal.
Ejemplo:
Dos envíos fallados durante la decodificación consecutivamente han marcado la
parte con valores del tiempo astronómico incorrectos. Sus acciones son:
Por ejemplo, en uno de los márgenes del intervalo el valor del tiempo astronómico
ha sido decodificado incorrectamente. En este caso es necesario interpolar las marcas
del tiempo para corregir la situación y sólo al hacerlo se puede iniciar el procedimiento
del cambio de frecuencia de discretización.
Cabe señalar que cada vez el programa calcula automáticamente el valor del
coeficiente para corregir sin presentar el valor introducido antes.
147
16.2.5 Trasladar las marcas
Dicha opción del menú permite trasladar las marcas del tiempo en cada punto de la
señal en una magnitud dada. Por ejemplo, cambiar de zona del tiempo o introducir la
corrección de diferencia de indicaciones del tiempo de grabadoras automáticas del
bordo. Es preciso tomar en cuenta que las marcas se trasladan dentro del intervalo de
12 horas.
Ejemplo:
• Elija la opción del menú «Comprobar las marcas del tiempo». La parte de la
grabación de conversaciones del vuelo anterior está marcado con marcas en los
márgenes.
• Ilumine el intervalo pulsando la tecla derecha del ratón entre las marcas.
• Haga que el intervalo «Los datos iluminados» sea corriente y elimínalo usando la
opción del menú Redacción->Eliminar. Cabe señalar que las marcas que están
después de la parte a quitar se dejan en sus lugares y los datos se trasladan. Si
hay otras partes a corregir se debe repetir la operación «Comprobar las marcas
del tiempo».
Si el usuario pulsa la tecla «Sí» entonces el canal del tiempo de servicio será
eliminado y toda la ventana se cambia sin digitalizar según el tiempo astronómico.
148
Dibujo 61 Solicitud de confirmación de la eliminación del canal de tiempo de servicio
149
17 PRUEBA DE LA TARJETA DE ENTRADA/SALIDA CON LA AYUDA DEL
PROGRAMA SIS
El ADC y D/A convertidores usados para el proceso de las señales tienen más
características dinámicas obtenidas después de transformar y hacer el análisis
espectral de la señal ejemplar sinusoidal:
La capacidad eficaz (Nd). del ADC y del D/A convertidor se calcula de la siguiente
manera:
SNR - 1,76
Nd = -----------------
6,02
El coeficiente de las deformaciones armónicas se calcula de la siguiente manera:
V[1]
SNR = sqrt( ----------------------------------------------------------- )
suma de potencias de todas las armónicas - V[1]-V[2]-..-V[k]
150
17.1 Prueba del canal de entrada
Se necesita lo siguiente para obtener los valores de las características antes
mencionadas para el canal de entrada del sonido:
151
THD). El sistema considera automáticamente la anchura final de las armónicas
de la señal y no la mezcla con el ruido.
10. Si pone a mover el ratón a la izquierda y a la derecha o a pulsar las teclas
del teclado <flecha a la izquierda>, <flecha a la derecha> entonces el sistema
de los cursores su mueve y en el panel de los mensajes (la línea debajo de la
pantalla) aparece el texto: «SNR=....dB, THD=...dB, Nd=..., f= ... Hz», donde
SNR es la relación señal/ruido, THD es el coeficiente de las deformaciones no
lineales, Nd es la capacidad eficaz de la tarjeta de entrada/salida (bit), f es la
frecuencia correspondiente al primer cursor (F0 en 8). Todos los numerales no
son importantes hasta que el usuario no combine el primer cursor con el pico
principal de la señal ejemplar sinusoidal. El usuario puede tratar de hacerlo
por sí mismo aunque incluso un pixel de la pantalla corresponde a un
desplazamiento de frecuencias bastante grande. Por ello se recomienda
recurrir a la opción del sistema presentada más abajo:
11. Pulsar la tecla F3. Luego en la pantalla aparece el menú de la información
que contiene los paneles: «Relación señal/ruido», «El coeficiente de las
deformaciones no lineales». Enfrente de cada inscripción se da el valor de la
magnitud correspondiente, al mismo tiempo el coeficiente de las
deformaciones no lineales se presenta tanto en decibelios como en por ciento
(Dibujo 62).
152
17.2 Prueba del canal de salida
Para obtener los valores de las siguientes características: la relación señal/ruido, el
coeficiente de deformaciones armónicas y el poder eficaz del D/A convertidor para el
canal de salida del sonido es necesario:
1. Establecer la amplitud del seno cerca del máximum (por ejemplo, 30 000,
como 32767 es el máximum independientemente de la descarga de la tarjeta
de la entrada/salida). Dar la frecuencia del seno no menos de 500 Hz y no mas
del cuarto de la frecuencia de disctretización. Dar la amplitud del resto de las
señales de prueva con ceros.
2. En el panel «La longitud de la señal en segundos» dar la continuidad deseada
para la señal (de unos 30 seg.).
3. Poner los bits para la señal en la casilla«La señal de 24 bits». Si en el panel
está marcado, el resultado será de 24 bits, en caso contrario de 16 bits. La
descarga (bits) de la señal debe corresponder a la descarga (bits) del equipo
de entrada/salida.
4. Generar la señal de prueba pulsando la tecla «Sí».
5. Para obtener la sinusoide de prueba volver a hacer las operaciones descritas
en el párrafo 18.1 puntos 2-11. Los valores obtenidos de la relación
señal/ruido (105-140 dB), del coeficiente de deformaciones armónicas
(0,0013%-0% para la señal de amplitud 30 000) son los máximos con la
magnitud dada de la señal que se define por la descarga (bits) de la tarjeta y
por el modo dado de analizar (el usar la ventana de Gauss).
6. Obtener el sonido por la salida lineal del equipo usando el menú «El habla-
>Todos los datos» y analizar sus parámetros con el analizador de espectro de
alta calidad. Los valores obtenidos por tal análisis no serán mejor que los
indicados en el subpunto 6 ni de los indicados en el pasaporte técnico del
analizador de espectro. Si le convienen los valores obtenidos se puede
considerar acabada la prueba. Si los resultados no le convienen trate de volver
a hacer la prueba, tiene que hacer de antemano:
cambiar el generador de las señales estándares,
compruebe que el equipo de entrada/salida no está puesto encima
de la pantalla, del ordenador ni encima de cualquier otro equipo
electrónico.
compruebe que los cables de Winchester y del driver flexible de
disco no están puestos justamente en la tarjeta de entrada/salida.
153
17.3 Prueba pasante del canal de entrada/salida
La opción del menú «Los datos->la prueba pasante de la entrada/salida» permite
probar el canal de la entrada/salida de la tarjeta acústica y también los parámetros del
equipo acústico exterior sin usar generadores ni analizadores de espectro. Para ello es
necesario vincular la entrada del equipo de ingreso/salida del sonido con la salida
directamente mediante el cable o a través del equipo probado (amplificador,
ecualizador etc.). Haciendo la prueba, la señal corriente en la ventana se ejecuta y se
graba simultáneamente. El resultado cabe en la nueva ventana con el nombre
«NONAME».
Tiene que tomar en cuenta que recibiendo los valores de las características técnicas
de los equipos no se usa en el programa SIS la A-ponderación (la función de
ponderación que imita las propiedades del oído humano según la sensibilidad de
frecuencias). Por ello los valores de las características obtenidas con el programa SIS se
varían de los indicadas en el pasaporte técnico del equipo que toman en cuenta la A-
ponderación de los resultados de las mensuraciones. La diferencia de los valores no
debe superar 10 dB.
Si el programa SIS fue suministrado en el equipo de «IKAR LAB II+» producido por
«Centro de tecnologías articulatorias,» SA, el conjunto tiene también el mezclador del
programa «Mixer». Para los fines de probar el canal de entrada/salida el régimen de
disminución, los valores de disminución y amplificación en la entrada y salida de la
tarjeta se ponen en 0dB.
154
Se puede hacerlo justamente durante la prueba. Después de ello es preciso volver a
hacer la prueba pasante sin cambiar el nivel de la señal. Sólo los resultados de la
prueba realizada con la amplitud fija que no supere el nivel máximo del valor de la
señal pueden ser usados para evaluar los parámetros del canal de la entrada/salida.
Se debe señalar que antes de probar cualquier equipo exterior se necesita hacer la
prueba pasante del canal de la entrada/salida de la tarjeta acústica.
155
18 UTILIZACIÓN DE LOS MÓDULOS CONECTADOS
En el programa SIS estan establecidas las posibilidades de conección de módulos
complementarios – plug-in, es decir, programas de módulos independientemente
compilados, conectados dinámicamente al programa principal y destinados para la
amplificación de las posibilidades del mismo.
Copiar la carpeta con los archivos del módulo a la carpeta plugins en caso de que
esta no este comprendida o cambiarla por una nueva en caso de que esté
comprendida, compruebe su contenido.
156
Nuevamente abrir la ventana de Registración de modulos cargados (menú Modulos
► Registración del módulo) y en ella presionar el boton renovar. Después de la
aparición del módulo necesario en la lista establecer delante de él el banderin y
presionar OK.
157
DICCIONARIO DE TÉRMINOS
Acústico – Fonético (fonéticos) signos del habla(discurso oral) – signos que reflejan
las propiedades acústicas del canal de formación del habla, habilidades articulatorias
del hombre. Este grupo de signos(señales) se captan por medio de la audición y se
detecta a través de medios técnicos, sirve como el principal discurso oral del análisis
intrumental del fonograma.
Sonido – flujo de energía que provoca las oscilaciones mecánicas de las partículas
del medio flexible, dede el punto de vista filosófico - Oscilaciones mecánicas del
medio flexible captadas por el hombre de manera subjetiva a través de la audición y
que provocan en él determinadas sensaciones.
Sonido del habla(discurso) – unidades mínimas del circuito del habla, denominados
como resultado de una compleja función de artulación del hombre y caracterizados
por determinadas propiedades articulatorias y perceptivas (enlazadas con la captación
del habla).
158
Botón de la escala de la tercera dimensión – botón con la representación de una
pirámide volteada, colocada a la derecha del box debajo del botón del donador de
cursores.
Marca temporal – línea de puntos vertical amarilla en el box de datos. Sirve para la
resaltación de fragmentos de datos. Las marcas temporales en el box pueden ser de 0
hasta 2. Al intentar colocar una tercera marca tempiral una de las ya existentes se
eliminará automaticamente.
159
Análisis espectro-temporal de la grabación del discurso oral (del habla) – manera
instrumental de análisis de señales de sonido, el cual permite establecer la
dependencia(relación) entre las características de amplitud y frecuencia del espectro
del habla y el tiempo cubierto por el proceso oral. Análisis espectro-temporal permite
de manera mas completa abrir la comprención del habla como un cambio continuo del
espectro de las audio-oscilaciones obtenidas por las modificaciones constantes de los
parámetros de resonadores del aparato articulatorio.
160
10-240309-7.0.1.ххх
161