Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Semana No.2 - Estandar de Comprensión Video y Audio PDF
Semana No.2 - Estandar de Comprensión Video y Audio PDF
Introducción
Formato de 4:4:4
El caso del formato de video 4:4:4 utiliza la misma frecuencia de muestreo
para las señales de color que para la de luminancia.
Formato 4:2:2
En el formato 4:2:2, en cambio, la frecuencia de muestreo de las señales de color pasa a
ser la mitad. Sin embargo, esta forma de compresión no degrada subjetivamente la
calidad, sino que este formato se ajusta más a las distintas sensibilidades del ojo.
Pixeles intercalados, unos llevan luminancia más
crominancia y otros solo lleva crominancias
Frecuencia de muestreo f= 13,5 MHz para la
luminancia y f=6,75 para la crominancia
Cuantización de 8 bits
Taza de bits por cuadro 216 Mbps
Utilizado por la televisión digital
Formatos 4:2:0
El paso del formato 4:2:2 al 4:1:1 o al 4:2:0 sí supone eliminar información sensible al
ojo. Esta información que se elimina, no es en este caso redundante, y no puede
recuperarse en un hipotético proceso de descompresión. Por ello esta compresión se
denomina con pérdidas, o degradante.
Es una simplificación del formato de cuadro
4:2:2
Frecuencia de muestreo para luminancia
f=13,5 MHz y para crominancia f=6,75
Cuantización de 8 bits
Taza de bits por cuadro de 162 Mbps
Utilizado para televisión Digital
Realizado por: Mg. Javier De la Torre
Estándares de comprensión de video
Formato 4:1:1
• Eficiencia de codificación. Por lo general, se expresa en bits por muestra o en bits por
segundo y está limitada por el contenido de información. Cuanto mayor sea ésta, más
difícil y compleja será la compresión.
• Complejidad de codificación. La complejidad del proceso de compresión tiene que ver
directamente con la carga o esfuerzo de cómputo para implementar las funciones de
codificación y decodificación. Esto afecta tanto al hardware como al software y, por lo
general, se mide en función de los requerimientos de memoria y de la cantidad de
operaciones aritméticas necesarias, expresada en millones de operaciones por segundo
(MOPS) o bien de millones de instrucciones por segundo (MIPS).
Realizado por: Mg. Javier De la Torre
Estándares de comprensión de video
• Caudal binario a la salida del codificador. Según la forma de implementar el codificador, las
características del caudal binario a la salida del codificador pueden dar lugar a los siguientes
casos:
a) Retardo fijo de codificación y flujo constante de salida. La eficiencia de codificación varía
según las muestras y por consecuencia, también la calidad de la señal.
b) Procesamiento de muestras en paralelo. Con esta técnica es posible mejorar la eficiencia
de codificación dando lugar a símbolos de longitud fija a la salida, pero a intervalos
irregulares dependiendo de la cantidad de información de las muestras
c) Eficiencia de codificación fija. En este caso, la calidad de la señal varía en función de la
cantidad de información contenida en las muestras a comprimir.
d) Calidad constante y eficiencia de codificación variable. Si los medios de transmisión o de
almacenamiento no restringen la velocidad de transmisión, o bien si es deseable una
calidad determinada de señal a la salida del decodificador, puede permitirse que varíe la
eficiencia de codificación para mantener constante calidad.
Realizado por: Mg. Javier De la Torre
Estándares de comprensión de video
Técnicas de compresión
Existe dos técnicas de compresión las cuales se clasifican como reversibles e irreversibles.
La DCT bidimensional es una transformación matemática que convierte una matriz genérica de M x N
valores, que en el caso de las imágenes corresponderían a niveles de brillo o color, en otra matriz del
mismo tamaño (MxN), cuyos valores representan la distribución de las frecuencias.
La transformada de coseno discreta por si sola, como se ha visto no comprime. Ésta, al transformar la
información del dominio espacial al dominio de la frecuencia, recolecta la información de tal manera que
es más fácil eliminar la parte redundante, consiguiendo reducir el flujo binario. A continuación, se
presenta un ejemplo de matriz 8x8 y su correspondiente DCT bidimensional.
Estándar MPEG-2
Las normas MPEG, han revolucionado la industria de la televisión y las
comunicaciones, al conseguir reducir de manera drástica el flujo binario, sin
pérdida subjetiva de calidad en la imagen. El estándar de compresión MPEG-2
en la televisión digital actual ha sido adoptado por varios sistemas de
televisión digital a nivel mundial.
Estándar MPEG-2
Mayor calidad de imagen.
Método de compresión DCT
Maneja Barrido entrelazado de imágenes
Alto grado de compresión:
Video digital sin comprimir:
[13.5Mhz (Y) +6.25Mhz(Cr)+6.25Mhz (Cb)] *10bits/muestra=270Mbps
Video digital comprimido: 15 - 4 Mbps
-Redundancia Espacial o Temporal.
-Redundancia de Entropía.
-Redundancia Psico-visual.
Realizado por: Mg. Javier De la Torre
Estándares de comprensión de video
Estándar MPEG-4
MPEG-4, orientado a conseguir caudales binarios muy bajos, tales como los
empleados para teleconferencia y otras aplicaciones relacionadas, que
requieren una elevada relación de compresión y gran eficiencia de
codificación.
Vector en Movimiento
Vector en Movimiento
El proceso de predicción comienza por comparar el macrobloque actual con el homólogo del
fotograma anterior, si estos no son iguales, buscará un macrobloque idéntico en la
denominada zona de búsqueda, si lo encuentra codificará los vectores de desplazamiento, y
si no lo encuentra realizará la comparación con el más parecido, codificando la diferencia
entre los dos y los vectores de movimiento. Si la diferencia es mayor que la cifra establecida,
abandonará la búsqueda presumiendo que el bloque no se encuentra ya en la imagen, y
codificará el mismo con codificación espacial. Realizado por: Mg. Javier De la Torre
Estándares de comprensión de video
La predicción hacia atrás puede emplearse para definir áreas cubiertas que no aparezcan en
imágenes previas.
Realizado por: Mg. Javier De la Torre
Fundamentos y estándares de
compresión de audio
Estándares de comprensión de video
Compresión de audio
Compresión de voz: Se ha realizado desde hace bastantes años, sobre todo para aplicaciones en comunicaciones
telefónicas (300-3400 Hz) y el modelo psicoacústico se basó más en las características del tracto vocal humano que en las
características perceptuales, es decir, las propiedades del sistema auditivo.
Compresión de audio genérico: El objetivo es la compresión de audio de “alta fidelidad”, en principio con un ancho de
banda de 20 Hz a 20 kHz. El primer estándar internacional fue MPEG (Motion Picture Experts Group) El modelo
psicoacústico se basa principalmente en las características perceptuales del sistema auditivo humano.
El audio no posee redundancia espacial y la redundancia temporal es pequeña, de modo que aquí se explotan mucho más
características perceptuales del sistema auditivo humano
En MPEG se define el decodificador, o más bien los parámetros del flujo binario a
decodificar. El codificador no se define, pero debe cumplir con producir un flujo
binario válido. Realizado por: Mg. Javier De la Torre
Estándares de comprensión de video
Dolby
o Dolby Digital
o Dolby Digital EX
o Dolby Digital Live
o Dolby Digital Surround EX
o Dolby Digital Plus
o Dolby TrueHD
Realizado por: Mg. Javier De la Torre
GRACIAS