Examen Parte 2

1.
Test
1. Según la teoría de la dualidad onda-partícula, la luz es una onda
electromagnética…
a) … de longitud de onda larga que se emite en cuantos o paquetes de radiación de
aproximadamente 8-10 segundos de duración con bruscos cambios de fase entre
paquetes.… de longitud de onda estrecha que se emite en cuantos o paquetes de
radiación de aproximadamente 8-10 segundos de duración con bruscos cambios de
fase entre paquetes.
b) … de longitud de onda estrecha que se emite en cuantos o paquetes de radiación de
aproximadamente 80-100 segundos de duración con leves cambios de fase entre
paquetes.
c) … de longitud de onda larga que se emite en cuantos o paquetes de radiación de
aproximadamente 80-100 segundos de duración con leves cambios de fase entre
paquetes.
d) Ninguna de las anteriores es cierta.
2. En el espectro radioeléctrico, la luz ultravioleta:

a) Tiene menor longitud de onda que los Rayos X.
b) Tiene mayor longitud de onda que la luz visible.
c) Tiene menor frecuencia que la luz visible.
d) Todas las anteriores son ciertas.
e) Ninguna de las anteriores es cierta.
3. Un objeto que iluminado con un foco de luz Blanca se ve de color Rojo, si es

iluminado con un foco de luz Cyan se ve:
a) Rojo o Negro.
b) Azul o Negro. Se veria negro
c) Magenta o Rojo. solo
d) Amarillo o Verde.
4. La zona macular o foveal de la retina:

a) Es el punto ciego de la retina.
b) Contiene fotoreceptores especialmente activos en la visión escotópica.
c) Tiene una alta concentración de conos.
d) Tiene una alta concentración de bastones.
5. En la percepción de brillo, la luminancia:

a) Es el brillo percibido.
b) Se mide perceptualmente en Watios por Estereoradián.
c) Depende de la intensidad de radiación de la fuente de luz.
6. Las pérdidas en un esquema de codificación de vídeo híbrido predictivo-
transformacional se producen en:
a) La aplicación de la transformada del coseno (DCT) sobre cada bloque.
b) La etapa de compensación de movimiento.
c) El proceso de predicción de cada bloque.
d) La codificación estadística de los datos a transmitir/almacenar.
e) Ninguna de las anteriores es cierta. cuantificacion
7. Debido a que, para no transmitirla/s, la/s imagen/es de predicción están en

codificador y decodificador:
a) En el codificador la predicción se realiza sobre imágenes reconstruidas.
b) La/s imagen/es de predicción no están en el decodificador.
c) En el codificador y decodificador la predicción se realiza sobre imágenes
reconstruidas.
d) En el decodificador la predicción se realiza sobre imágenes reconstruidas.
8. En el sistema de contención de un esquema de codificación de vídeo híbrido

predictivo-transformacional:
a) Permite adaptar la cuantificación a las características de la red.
b) Permite refrescar la codificación para evitar la degradación de la compensación de
movimiento.
c) Evita que los errores de transmisión se propaguen en el tiempo.
d) Minimiza los errores de transmisión.
9. El estándar para la digitalización y codificación (binaria) de señales de vídeo para

estudio: IT BT.601:
a) a)Establece resoluciones de número de filas variable y número de columnas fijo
para suministrar tasa constante fija a sistemas PAL y NTSC.
b) Utiliza todo el rango disponible para representar las señales de luminancia y
crominancia.
c) Define, entre otros, esquemas de muestreo 4:4:4 y 4:4:0.
10. ¿Cuál de las siguientes estructuras de GOP es correcta?

a) I
b) IPPPPPPP
c) IBBPBBPBBP
d) Todas las anteriores estructuras de GOP son correctas.
e) Ninguna de las anteriores estructuras de GOP es correcta.
11. El estándar MPEG-4 parte 10: advanced video coding
a) Resulta de la colaboración entre la ITU-T y la ISO/IEC.
b) Incorpora un filtro de deblocking.
c) Es ampliamente utilizado en la actualidad.
12. Dada la gráfica de la derecha, ¿a qué frecuencia

será inaudible un nivel de 5 dB?
a) 5 kHz.
b) 50 Hz.
c) 2 kHz.
d) A todas.
e) A ninguna.
13. ¿Cuál de las siguientes respuestas describiría mejor los objetivos de un codificador
de audio o voz?
a) a)Transmitir o almacenar la señal de audio o voz con el menor número de
información (bits) pero manteniendo la calidad de la mejor forma y la menor
complejidad posible.
b) Adaptar la señal de audio o voz para que pueda ser oída por personas con
capacidades auditivas específicas.
c) Establecer un modelo teórico riguroso de las características de la señal de audio y
de voz de cara a su estudio detallado.
d) Transformar la señal de audio o voz para producir efectos perceptivos agradable, sm
sin estridencias, al oyente.
e) Ninguna de las anteriores describe parcial o globalmente los objetivos de un
codificador de audio o voz.
14. El enmascaramiento temporal:

a) Se puede explicar porque el sonido enmascarador excita la misma región de la
membrana basilar de la cóclea que el sonido enmascarado.
b) Puede dividirse en tres etapas: pre-enmascaramiento, enmascaramiento y post-
enmascaramiento.
c) Se produce porque dos sonidos de frecuencia similar están presentes
simultáneamente se hayan o no emitido al mismo tiempo.
d) Todas las anteriores son correctas.
e) Ninguna de las anteriores es correcta.
15. ¿Qué ventajas presenta la conversión tiempo-frecuencia de tipo PQMF con

respecto a la codificación por DCT?
a) No distorsiona la señal por enventanado.
b) Permite la división en muchas bandas.
c) No requiere digitalización del audio.
d) Tiene un coste computacional mucho menor.
16. En un codificador perceptual de audio, se asignarán más bits a una subbanda para
conseguir el menor… posible.
a) SMR.
b) MSR.
c) SNR.
d) NMR.
e) MNR.
17. ¿Cuál de las siguientes es la principal motivación de la conversión tiempo-

frecuencia en un codificador de audio?
a) Aumentar la tasa binaria para una mayor fidelidad.
b) Eliminar componentes por debajo del umbral de audición.
c) Realzar la señal de audio en las zonas altas de la frecuencia, donde la sensibilidad
es mayor.
d) d) Dividir la señal en subbandas de frecuencia para un tratamiento diferenciado
de cada parte del espectro de la señal.
18. Un códec perceptual de audio funciona a una tasa binaria que ofrece buena
calidad para señales de audio musical. Si una señal de voz se codifica con dicho
códec en esas mismas condiciones, ¿cómo se puede esperar que sea la calidad de la
voz decodificada con respecto a la señal de audio musical decodificada?
a) Mucho peor.
b) Tras la decodificación el audio generado será inaudible.
c) Mucho mejor.
d) Similar.
e) El codificador perceptual descrito no es capaz de procesar señales de voz.
19. ¿En qué etapa de un codificador perceptual de audio se calculan los umbrales de
enmascaramiento?
a) En el modelo psicoacústico.
b) En el filtro de síntesis.
c) En la conversión tiempo-frecuencia.
d) En la generación de ancillay data o datos adicionales.
e) En ninguna de las anteriores.
20. ¿Cuál de las siguientes tasas binarias no es típica en los codificadores perceptuales
de audio que contempla MP3?
a) 128 kbps.
b) 8 kbps.
c) 64 kbps.
d) Todas las anteriores son típicas.
e) Ninguna de las anteriores es típica.
21. Dada la gráfica de la derecha, ¿cuál es la
función del generador de ruido aleatorio en
dicho modelo?
a) Mejorar el modelado del pulso glotal.
b) Mejorar el módulo de predicción lineal.
c) Generar la señal de excitación en sonidos
sordos.
d) Simular el ruido presente en cualquier
grabación de voz.
e) Otra, ninguna de las anteriores.
22. ¿Cuál de los siguientes no es un componente de alguno de los esquemas de

compresión de voz vistos en clase?
a) Modelo de predicción lineal a corto plazo.
b) Modelo de predicción lineal a largo plazo.
c) Generador de ruido blanco.
d) Modelo psicoacústico.
e) Todos los anteriores son componentes de alguno de los esquemas de comprensión
de voz vistos en clase.
23. Los contenedores o wrappers

a) Nunca están asociados a un tipo de modalidad determinado.
b) Carecen de información para la presentación multimedia en recepción.
c) Contienen paquetes multiplexados compuestos por datos y cabeceras.
d) Se integran generalmente con un único formato de codificación.
e) Todas las anteriores son ciertas.
24. Acerca de la multiplexación de flujos elementales en los estándares MPEG

a) Un TS puede contener varios programas, cada uno compuesto por varios flujos
elementales empaquetados y sincronizados con cada programa.
b) Un PS puede contener varios flujos elementales empaquetados, pero todos
compartiendo la misma base temporal.
c) El PS genera paquetes de longitud variable, lo que desaconseja su uso en entornos
de alta probabilidad de error.
25. Sobre las tablas del estándar ISO/IEC 13818-1 MPEG TS

a) Las tablas TSDT contienen la información del acceso condicional en TS multi-
programa.
b) Las tablas CAT identifican cada programa específico.
c) Las tablas PAT están presentes tanto en TS mono-programa como multi-programa.
d) Las tablas PMT contienen los identificadores de los flujos elementales
empaquetados.
2. Cuestiones
A. Diagrama de bloques de un codificador híbrido predictivo transformacional.
a. Transcriba el diagrama de bloques de un codificador híbrido transformacional.
b. Describa brevemente el funcionamiento y objetivo en el proceso de codificación de

los siguientes módulos.
Módulo Funcionamiento Objetivo
Cuantificación
Compensación de
movimiento
Sistema de contención
B. Eficiencia de la estimación de movimiento.
Sea el área de búsqueda (línea continua gruesa) alrededor de la estimación del bloque en
ausencia de movimiento (línea sólida gruesa) de la Figura 1.
Figura 1. Área de búsqueda y bloque
a. Calcule el número de operaciones por segundo necesarias para procesar un vídeo de

resolución 1920x1080 a 30 cuadros/s, utilizando búsqueda exhaustiva.
1.5*10^(10) OP/s
Sea el esquema de búsqueda ortogonal ejemplificado en la Figura 2 para precisión de
estimación de movimiento de 1 píxel.
1 1 1
3 2 3
Figura 2. Algoritmo de búsqueda ortogonal para precisión de 1 píxel.

b. Calcule el número de operaciones por segundo necesarias para procesar un video de
resolución 1920x1080 a 30 cuadros/s, utilizando búsqueda ortogonal, precisión de 1
píxel y área de búsqueda y tamaño de bloque como en la Figura 1.
c. Calcule el número de operaciones por segundo necesarias para procesar un vídeo de
resolución 1920x1080 a 30 cuadros/s, utilizando búsqueda ortogonal, precisión de
¼ de píxel, tamaño de bloque como en la Figura 1 y un área de búsqueda cuadrada
con el doble de área del representado en la Figura 1.
C. Diagrama de bloques de los codificadores perceptuales de audio MPEG

a. Transcriba el diagrama de bloques o esquema general de las capas I y II del
estándar MPEG-1 Audio.
b. Indique las diferencias respecto al esquema anterior del esquema general de la capa
III del estándar MPEG-1 Audio.
D. Complete la tabla adjunta sobre esquemas de comprensión de voz.
Nombre (desglose de Ventaja/s respecto a Tasa (aprox.) kb/s Ejemplo (estándar)

siglas) esquemas anteriores
LPC
RPE
CELP
ACELP
SOLUCIONES
1. Test
1 2 3 4 5 6 7 8 9 10 11
b e e c c e a a a d d
12 13 14 15 16 17 18 19 20 21 22
b a d a d d d a c c d
23 24 25
c d c
2. Cuestiones
A. Diagrama de bloques de un codificador híbrido predictivo transformacional.
a) Transcriba el diagrama de bloques de un codificador híbrido transformacional.
b) Describa brevemente el funcionamiento y objetivo en el proceso de codificación de
los siguientes módulos.
Módulo Funcionamiento Objetivo
Asignarle un valor único Reducir la tasa binaria
a un rango de valores (bits) a transmitir.
distinto de la señal. Hay que tener cuidado
porque si cuantificamos
Cuantificación
mucho la señal puede
afectar a la calidad
percibida por el SVH.
Utilizando una o varias Reducir el error de

imágenes de referencia y predicción, es decir, la
la información obtenida diferencia entre la señal
Compensación de en la estimación del original y la predicha.
movimiento movimiento obtiene la
imagen predicción 𝐼𝐼𝐼𝑛𝑛
CBR (Constant Bit Rate) Con VBR podemos

se transfiere a una tasa de reducir la tasa binaria de
bits constante. bit transmitidos cuando
VBR (Variable Bit Rate) la red está congestionada
Sistema de contención para que no se
reproduzcan tantos
errores o pérdidas de
paquetes.
B. Eficiencia de la estimación de movimiento.

a. Calcule el número de operaciones por segundo necesarias para procesar un vídeo de
resolución 1920x1080 a 30 cuadros/s, utilizando búsqueda exhaustiva.
H := 1920 M := 8
W := 1080 N := 8
T := 30
16 − M
p := =4
2
16 − N
q := =4
2
H⋅W⋅T 10
⋅3⋅(2p + 1)⋅(2⋅q + 1)⋅M⋅N = 1.512 × 10
M⋅N
b. Calcule el número de operaciones por segundo necesarias para procesar un video de
resolución 1920x1080 a 30 cuadros/s, utilizando búsqueda ortogonal, precisión de 1
píxel y área de búsqueda y tamaño de bloque como en la Figura 1.
H := 1920 M := 8
W := 1080 N := 8
T := 30
d := p = 4
d 4 3 2 1 0
k 0 1 2 3 4
k := 3
H⋅W⋅T 9
⋅3⋅(2⋅k + 1)⋅M⋅N = 1.3064 × 10
M⋅N
c. Calcule el número de operaciones por segundo necesarias para procesar un vídeo de

resolución 1920x1080 a 30 cuadros/s, utilizando búsqueda ortogonal, precisión de
¼ de píxel, tamaño de bloque como en la Figura 1 y un área de búsqueda cuadrada
con el doble de área del representado en la Figura 1.
H := 1920 M := 8
W := 1080 N := 8
T := 30
Condicion => (2*p1 + 1) * (2*q1 + 1) = 16 * 16 * 2

16⋅16⋅2 − 8
p1 := = 7.3137
2
q1 := p1 = 7.3137
d 7.3137 6.3137 5.3137 4.3137 3.3137 2.3137 1.3137

k 0 1 2 3 4 5 6
k := 5
H⋅W⋅T 9
⋅3⋅(2⋅k + 1)⋅M⋅N = 2.0529 × 10
M⋅N
C. Diagrama de bloques de los codificadores perceptuales de audio MPEG
a. Transcriba el diagrama de bloques o esquema general de las capas I y II del
estándar MPEG-1 Audio.
Codificador perceptual de audio básico válido para MPEG-1 y MPEG-2
Decodificador perceptual de audio básico válido para MPEG-1 y MPEG-2

b. Indique las diferencias respecto al esquema anterior del esquema general de la capa
III del estándar MPEG-1 Audio.
D. Complete la tabla adjunta sobre esquemas de comprensión de voz.
Nombre Ventaja/s respecto a esquemas anteriores Tasa (aprox.) Ejemplo (estándar)

(desglose de kb/s
siglas)
Base fundamental de la mayoría de los
codificadores paramétricos de voz.
Este tipo de
Permite reducir enormemente la tasa binaria de la codificadores encontró
Linear 2 – 5 kb/s
voz, pero el modelo en el que se basa es aplicación en el campo
LPC Prediction
demasiado simplista, lo que hace que la voz militar, donde la
Coding 2.4 kb/s
sintética en muchos casos sea desagradable y muy calidad es sólo un
poco natural. factor secundario.
Decisión binaria sobre la sonoridad.

Evita el problema de LPC que diferenciaba sólo
entre sonidos sonoros y sordos.
La señal transmitida se parece a la señal original

(fase y forma).
Regular Pulse GSM Full Rate (GSM-
RPE 13 kb/s
Excitation FR)
Consiste en enviar un único índice (entre 0 y N-1)
y el valor de las amplitudes.
Se evita la decisión de sonoridad de LPC y se

modela la excitación de forma más detallada.
Se evita una clasificación estricta en segmentos
sonoros y sordos.
Se preserva parte de la información de fase y parte

de la información de la forma de onda de la señal.
Code-Excited
Reduce el envío de muestras codificadas de la
CELP Linear 5 kb/s FS1016 (4.8kb/s)
excitación a un índice del codebook.
Prediction
Reduce la tasa binaria empleando un codebook de
vectores de excitación, de modo que es sólo
necesario enviar el índice del codebook para
transmitir la excitación. Consigue reducir la tasa
binaria con calidad aceptable.
Es un codificador CELP en el que el vector de
excitación se genera por medio de operaciones
algebraicas sencillas y reglas matemáticas
definidas a partir de un índice de vector de
excitación de cierto número de bits.
MP-MLQ (8 kb/s)
El coste computacional de búsqueda de la señal
Videollamadas con
CELP óptima de excitación se reduce drásticamente.
ACELP 5 - 8 kb/s baja tasa binaria (5.3 –
Algebraico
6.3 kb/s)
Para mejorar el inconveniente de los codebooks
(ocupan mucha memoria y el proceso de búsqueda
en la codificación es muy costoso) aparecen los
codebooks estocásticos con solapamiento en el
que el vector de excitación se genera como suma
de un número dado de pulsos con distintos signos
y en posiciones distintas.

Examen Parte 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Examen Parte 2

Cargado por

Copyright:

Formatos disponibles

1.

2. En el espectro radioeléctrico, la luz ultravioleta:

3. Un objeto que iluminado con un foco de luz Blanca se ve de color Rojo, si es

4. La zona macular o foveal de la retina:

5. En la percepción de brillo, la luminancia:

7. Debido a que, para no transmitirla/s, la/s imagen/es de predicción están en

8. En el sistema de contención de un esquema de codificación de vídeo híbrido

9. El estándar para la digitalización y codificación (binaria) de señales de vídeo para

10. ¿Cuál de las siguientes estructuras de GOP es correcta?

12. Dada la gráfica de la derecha, ¿a qué frecuencia

14. El enmascaramiento temporal:

15. ¿Qué ventajas presenta la conversión tiempo-frecuencia de tipo PQMF con

17. ¿Cuál de las siguientes es la principal motivación de la conversión tiempo-

22. ¿Cuál de los siguientes no es un componente de alguno de los esquemas de

23. Los contenedores o wrappers

24. Acerca de la multiplexación de flujos elementales en los estándares MPEG

25. Sobre las tablas del estándar ISO/IEC 13818-1 MPEG TS

b. Describa brevemente el funcionamiento y objetivo en el proceso de codificación de

Figura 1. Área de búsqueda y bloque

a. Calcule el número de operaciones por segundo necesarias para procesar un vídeo de

Figura 2. Algoritmo de búsqueda ortogonal para precisión de 1 píxel.

C. Diagrama de bloques de los codificadores perceptuales de audio MPEG

Nombre (desglose de Ventaja/s respecto a Tasa (aprox.) kb/s Ejemplo (estándar)

Utilizando una o varias Reducir el error de

CBR (Constant Bit Rate) Con VBR podemos

B. Eficiencia de la estimación de movimiento.

c. Calcule el número de operaciones por segundo necesarias para procesar un vídeo de

Condicion => (2*p1 + 1) * (2*q1 + 1) = 16 * 16 * 2

d 7.3137 6.3137 5.3137 4.3137 3.3137 2.3137 1.3137

Codificador perceptual de audio básico válido para MPEG-1 y MPEG-2

Decodificador perceptual de audio básico válido para MPEG-1 y MPEG-2

D. Complete la tabla adjunta sobre esquemas de comprensión de voz.

Nombre Ventaja/s respecto a esquemas anteriores Tasa (aprox.) Ejemplo (estándar)

Decisión binaria sobre la sonoridad.

La señal transmitida se parece a la señal original

Se evita la decisión de sonoridad de LPC y se

Se preserva parte de la información de fase y parte

También podría gustarte

Condicion => (2p1 + 1) (2q1 + 1) = 16 16 * 2