Una gua de fundamentos de MPEG y anlisis de protocolos
Primer
www.tektronix.com/video_audio i Seccin 1 Introduccin a MPEG 1 1.1 Convergencia 1 1.2 Por que es necesaria la compresin 1 1.3 Principios de Compresin 1
1.4 Compresin en aplicaciones de Televisin 2 1.5 Introduccin a la compresin de video digital 3 1.6 Introduccin a la compresin de audio 5 1.7 Streams MPEG 6 1.8 Necesidad de monitoreo y anlisis 7 1.9 Inconvenientes de la compresin 7
Seccin 2 Compresin en Video 8 2.1 Codificacin espacial o temporal? 8 2.2 Codificacin espacial 8 2.3 Ponderacin 10 2.4 Scanning (exploracin) 11 2.5 Codificacin de Entropa 11 2.6 Un Coder espacial 12 2.7 Codificacin temporal 13 2.8 Compensacin de movimiento 14 2.9 Codificacin bidireccional 16 2.10 Imgenes I-, P- y B- 16 2.11 Un compressor MPEG 18 2.12 Pre procesamiento 21 2.13 Wavelets 22
Seccin 3 Compresin de Audio 23 3.1. El mecanismo de audicin 23 3.2. Codificacin sub banda 24 3.3 MPEG Capa 1 25 3.4 MPEG Capa 2 26 3.5 Codificacin de transformada 26 3.6 MPEG Capa 3 27 3.7 Audio MPEG-2 27 3.8 Audio MPEG-4 27 3.9 AC-3 28
Seccin 4 Las normas MPEG 29 4.1. Que es MPEG? 29 4.2 MPEG-1 29 4.3 MPEG-2 30 4.3.1 Perfiles y niveles en MPEG-2 30 4.4 MPEG-4 32 4.4.1 Documentos de la norma MPEG-4 32 4.4.2 Codificacin de objetos 32 4.4.3 Codificacin de audio y video 34 4.4.4 Escalabilidad 35 4.4.5 Otros aspectos de MPEG-4 36 4.4.6 El futuro de MPEG-4 37 4.5 MPEG-7 38 4.6 MPEG-21 39
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio ii Seccin 5 Streams elementales 40 5.1 Sintaxis del stream elemental de Video 40 5.2 Streams elementales de Audio 41
Seccin 6 Streams elementales paquetizados o PES (Packetized Elementary Streams) 42 6.1 Paquetes PES 42 6.2 Estampado de tiempo 42 6.3 PTS/DTS 42
Seccin 7 Streams de elemental 44 7.1 Grabacin vs. Transmisin 44 7.2 Introduccin a los streams de programa 44
Seccin 8 Streams de transporte 45 8.1 La funcin del Stream de transporte 45 8.2 Paquetes 46 8.3 Referencia del reloj de programa o (Program Clock Reference) 46 8.4 Identificacin de paquete o PID (Packet Identification) 47 8.5 Informacin especfica del programa (Program Specific Information) 48
Seccin 9 Modulacin Digital 50 9.1 Principios de Modulacin 50 9.2 Modulacin Analgica 50 9.3 Modulacin de Cuadratura 50 9.4 Sistemas de Modulacin Digital Simple 51 9.5 Llaveo (Keying) de corrimiento de fase 51 9.6 Modulacin de amplitud de cuadratura o QAM (Quadrature Amplitude Modulation) 52 9.7 Modulacin de banda lateral vestigial o VSB (Vestigial Sideband Modulation) 53 9.8 Divisin Multiplexada de frecuencias ortogonalmente codificadas o COFDM (Coded Orthogonal Frequency Division Multiplex) 53 9.9 Servicios integrados de transmisin de datos o ISDB (Integrated Services Data Broadcasting) 55 9.9.1 Sistema de satlite ISDB-S 55 9.9.2 Sistema de cable ISDB-C 55 9.9.3 Modulacin terrestre ISDB-T 55 9.9.4 El ISDB en resumen 55
Seccin 10 Introduccin a DVB y ATSC 56 10.1 Una vista general 56 10.2 Remultiplexin 57 10.3 Servicio de Informacin o SI (Information Service) 57 10.4 Correccin de errores 58 10.5 Codificacin de canal 59 10.6 Codificacin interna 60 10.7 Transmitiendo dgitos 61
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio iii Seccin 11 Transmisin de datos 62 11.1 Aplicaciones 62 11.1.1 Datos relacionados con los programas 62 11.1.2 Datos de oportunidad 62 11.1.3 Datos de red 63 11.1.4 TV mejorada 63 11.1.5 TV Interactiva 63 11.2 Encapsulamiento del contenido 63 11.2.1 Encapsulado de datos MPEG 63 11.2.1.1 Canalizacin de datos 63 11.2.1.2 Streaming de datos 63 11.2.1.3 DSMCC - Digital Storage Medium Command and Control (Instruccin y control del medio de almacenamiento digital) 64 11.2.1.4 MPE Multi-protocol Encapsulation (Encapsulado con protocolos mltiples) 64 11.2.1.5 Carruseles 64 11.2.1.6 Carruseles de datos 65 11.2.1.7 Carruseles de objetos 66 11.2.1.8 Como se transmiten los objetos de los carruseles 67 11.2.1.9 Sincronizacin de datos MPEG-2 68 11.2.2 Encapsulado de datos DVB 68 11.2.3 Encapsulado de datos ATSC A/90 68 11.2.4 Encapsulado de datos ARIB 69 11.3 Transmisin de contenido de datos 69 11.3.1 Anuncio de DVB 70 11.3.2 Anuncio de ATSC 70 11.4 Presentacin de contenido 70 11.4.1 Set Top Box intermediario (Middleware) 70 11.4.2 Plataforma DVB de multimedia para el hogar o MHP (Multimedia Home Platform) 71 11.4.3 ATVEF DASE 72 11.4.4 DASE 72
Seccin 12 Prueba de MPEG 73 12.1 Requerimientos para las pruebas 73 12.2 Anlisis de un stream de transporte 73 12.3 Vista jerrquica 74 12.4 Vista interpretada 76 12.5 Sintaxis y anlisis de CRC 76 12.6 Filtraje 77 12.7 Anlisis de temporalizacin 77 12.8 Pruebas al Stream elemental 79 12.9 Streams de bits que cumplen con Sarnoff 79 12.10 Anlisis del stream elemental 80 12.11 Creando un stream de transporte 81 12.12 Generacin de inexactitudes PCR 81
Glosario 82
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio iv
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio v
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 1 Seccin 1 Introduccin a MPEG
MPEG es una de las tcnicas de compresin de audio y video ms popula- res debido a que no es una sola norma. En lugar de eso es un rango de normas tiles para diferentes aplicaciones basadas en principios similares. MPEG es un acrnimo de Moving Picture Experts Group que es parte del comit tcnico J TC1, establecido por la ISO (International Standards Organization u Organizacin electrotcnica internacional) y la IEC (Interna- tional Electrotechnical comisin o Comisin electrotcnica internacional). La J TC1 es responsable de la tecnologa de informacin. Dentro de la J TC1, el subgrupo SG29 es el responsable de la codificacin de la informacin de audio, imgenes e hipermedia. Hay una buena cantidad de grupos de trabajo dentro de la SG29, incluyendo el J PEG (J oint Photographic Experts Group o Grupo de expertos en fotografa) y el grupo de trabajo 11 para la compresin de imgenes en movimiento. El grupo ISO/IEC J TC1/ SG29/ WG11 es el MPEG. MPEG puede ser descrito como la interaccin de acrnimos. Como estable- ce la ETSI, El CAT es un indicador para permitirle al IRD encontrar los EMMs asociados con los sistemas CA que lo usan. Si puede entender esta oracin, entonces no necesita este libro! 1.1 Convergencia Las tcnicas digitales para audio y video han progresado rpidamente por un buen nmero de razones. La informacin digital es ms robusta y puede ser codificada para eliminar substancialmente los errores. Esto significa que las prdidas por generaciones en grabacin y las prdidas por transmisin pueden ser eliminadas. El disco compacto o CD fue el primer producto para el consumidor en demostrar esto. Mientras que el CD tiene una calidad de sonido mejorada con respecto a su predecesor en vinil, la comparacin en calidad por s misma no es suficien- te. Lo importante es que la grabacin digital y las tcnicas de transmisin permiten la manipulacin del contenido hasta un grado que es imposible de lograr con el analgico. Una vez que el audio y el video son digitalizados, el contenido quedar en forma de datos. Dichos datos pueden ser manejados en la misma forma que cualquier otro tipo de datos; por ello, el audio y video digitales han pasado a ser de la incumbencia de la tecnologa de cmputo. La convergencia de las computadoras con equipo de audio y video es una consecuencia inevitable de las invenciones clave de cmputo y la modula- cin de cdigo de pulso o PCM (Pulse Code Modulation). La media digital puede almacenar cualquier tipo de informacin por lo que resulta sencillo utilizar un dispositivo de almacenamiento para cmputo para el video digital. Las estaciones de trabajo no lineales fueron el primer ejemplo de una aplicacin de la tecnologa convergente que no tiene un equivalente en el mundo analgico. Otro ejemplo, multimedia, combina el almacenamiento de audio, video, grficos, texto y datos en el mismo medio, la multimedia no tiene equivalente en el dominio analgico. 1.2 Por que es necesaria la compresin El xito inicial del video digital en aplicaciones de post-produccin se debi a que los altos costos del video digital fueron sobrepasados por la capaci- dad de usar capas ilimitadas y su capacidad de efectos; sin embargo, la produccin normal de video digital genera cerca de 200 megabits por se- gundo y esta relacin de bits requiere una capacidad extensa para su almacenamiento y un ancho de banda alto para su transmisin. El video digital solo puede ser usado en aplicaciones ms amplias si los requeri- mientos de almacenamiento y ancho de banda pueden ser llenados; ese es el propsito de la compresin. La compresin es una forma de expresar el audio y video digitales usando menos datos. La compresin tiene las siguientes ventajas: Se necesita una menor cantidad de almacenamiento por cantidad dada de material de fuente. Cuando se trabaja en tiempo real, la compresin reduce el ancho de banda nece- saria; adicionalmente, la compresin permite una transferencia ms rpida que en tiempo real entre la media, por ejemplo, entre cinta y disco. Un formato de grabacin comprimido puede usar una menor densidad de grabacin y esto puede hacer que la grabadora sea menos sensible a factores ambientales y mantenimiento. 1.3 Principios de Compresin Hay dos tcnicas fundamentalmente diferentes que pueden ser usadas para reducir la cantidad de datos usados para transmitir informacin de conteni- do. En sistemas de compresin prcticos, usualmente se usan combinados, frecuentemente en formas muy complejas. La primera tcnica es mejorar la eficiencia de la codificacin. Hay muchas formas de codificar cualquier informacin dada y la mayora de las repre- sentaciones de datos de audio y video contienen una cierta cantidad de redundancia. El concepto de entropa se discute ms abajo. Muchos trucos de codificacin pueden usarse para reducir o eliminar la redundancia; los ejemplos incluyen la codificacin de longitud corrida y los sistemas de codificacin de longitud variable como los cdigos de Huffman, Cuando se usan adecuadamente esas tcnicas son completamente reversi- bles por lo que despus de la descompresin los datos sern idnticos a los de la entrada al sistema. A este tipo de compresin se le llama sin prdida. Los programas de archivado para computadora como PKZip emplean este tipo de compresin. Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 2 Obviamente, la compresin sin prdidas es ideal pero desafortunadamente usualmente no proporciona el grado de reduccin de datos necesario para aplicaciones de audio y video; sin embargo, debido a que es sin prdidas puede aplicarse en cualquier punto del sistema y frecuentemente se usa a la salida de datos de los compresores con prdidas. Si la eliminacin de la redundancia no reduce los datos tanto como fuera necesario una parte de la informacin tendr que ser descartada. Los sistemas de compresin con prdidas logran la reduccin de datos remo- viendo informacin que sea irrelevante o de menor relevancia. Estas no son tcnicas generales que puedan ser aplicadas a cualquier stream de datos; la estimacin de la relevancia solo puede hacerse en el contexto de la aplicacin, entendiendo lo que los datos representan y como sern usados. En el caso de la televisin, la aplicacin es la presentacin de imgenes y sonidos a los sistemas de visin y audicin humanos y los factores huma- nos deben ser bien entendidos para disear un sistema de compresin efectivo. Una parte de la informacin de las seales de video no puede ser percibida por el sistema de visin humana y por ello ser relevante en este contexto, Un sistema de compresin que descarta solo informacin irrelevante de la informacin de la imagen es conocido como visualmente sin prdidas. 1.4 Compresin en aplicaciones de Televisin Las seales de televisin, analgicas y digitales, siempre han representado mucha informacin y se han usado tcnicas de reduccin del ancho de banda desde el principio. Probablemente uno de los primeros ejemplos es el entrelazado. Para un nmero de lneas dadas y una determinada relacin de refrescamiento de imgenes, el entrelazado ofrece una reduccin de 2:1 en el ancho de banda requerido. El proceso es con prdidas; el entrelazado genera artifacts causados por las interferencias entre la informacin verti- cal y temporal y reduce la resolucin vertical utilizable de la imagen. A pesar de ello, la mayor parte de lo que es descartado es bastante irrelevante por lo que el entrelazado represent un cambio simple y muy valioso en su poca, Desafortunadamente el entrelazado y los artifacts que genera son muy molestos para los sistemas de compresin digital ms sofisticados, Mucha de la complejidad del MPEG-2 es producida por la necesidad de manejar seales entrelazadas y an hay prdidas significativas en eficiencia de codificacin cuando se le compara con seales en progresivo. El siguiente pasos evolutivo se dio con el advenimiento del color. Las cma- ras de color producen seales en RGB por lo que nominalmente hay tres veces la cantidad de informacin que en una seal monocromtica pero haba el requerimiento de transmitir seales de color en el mismo canal usado para la seal monocromtica.
La primera parte de la solucin fue transformar la seal de RGB a una seal de brillantez (normalmente designada como Y) ms dos seales de dife- rencia de color, U y V o I y Q. La generacin de la seal de brillantez supu- so un gran avance hacia la resolucin del problema de compatibilidad con los receptores monocromticos pero el paso ms importante hacia la reduc- cin del ancho de banda lleg con las seales de diferencia de color. Estas destacaron el hecho de que el sistema de visin humana usa sensores que son sensibles a la brillantez y que pueden ver una imagen de muy alta resolucin. Otros sensores capturan informacin de color pero a mucha menor resolucin. El resultado neto es que, dentro de ciertos lmites, una imagen monocromtica bien definida que represente la brillantez de una escena sobrepuesta a informacin de color menos definida o borrosa (me- nor ancho de banda) aparecer como una imagen de color bien definida. No es posible aprovecharse de esto cuando se usan seales en RGB ya que cada seal contiene informacin tanto de brillantez como de color; sin embargo, en el espacio YUV, la mayora de la informacin de brillantez es transportada en la seal Y y muy poca en las seales de diferencia de color. Por eso es posible filtrar las seales de diferencia de color y reducir drsti- camente la informacin a transmitir. Lo anterior es un ejemplo de eliminacin (en su mayora) de informacin irrelevante. Bajo las condiciones de diseo de la visin, el sistema visual no responde significativamente a la informacin de alta frecuencia de las seales de diferencia de color por lo que pueden ser descartadas. Las transmisiones de color en NTSC solo transmiten cerca de 500 Hz en cada seal de diferencia de color pero las imgenes resultan adecuadamente definidas para muchas aplicaciones. El paso final en el proceso de reduccin del ancho de banda de NTSC y PAL es esconder las seales de diferencia de color en partes que no se usen del espectro de la seal monocromtica. Aunque el proceso no es estrictamente sin prdidas esto puede ser a travs de incrementar la efi- ciencia de codificacin de la seal. Algunas de las tcnicas en el mundo digital son muy diferentes pero se aplican principios similares. Por ejemplo, MPEG transforma las seales a un dominio diferente para permitir el aislamiento de informacin irrelevante. La transformacin a un espacio de diferencia de color an se emplea pero las tcnicas digitales permiten el filtrado de la seal de diferencia de color para reducir la resolucin vertical para un mayor ahorro.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 3
Figura 1-1
La Figura 1-1a muestra que en los sistemas de televisin tradicional, la seal RGB de la cmara se convierte en las componentes Y, Pb y Pr para la compresin y codificacin de una seal analgica compuesta par la transmisin. En la Figura 1- 1b se muestra el equivalente moderno. Las seales Y, Pb y Pr son digitalizadas y transportadas como seales Y, Cb y Cr en su forma SDI en el proceso de produc- cin antes de ser codificadas para la transmisin en MPEG. Claro que MPEG puede ser considerada por quien transmite como un reemplazo ms eficiente para el video en compuesto. Adems, MPEG tiene una mayor flexibilidad debido a que la relacin de bits requerida puede ser ajustada de acuerdo con la aplicacin. A relaciones de bits menores MPEG puede ser usado para videoconferencias y videotelfonos. La transmisin de video digital o DVB (Digital Video Broadcasting) y las normas de la ATSC (Advanced Television Systems Committee o Comit de sistemas de televisin avanzada) (las normas europeas y americanas originadas para la trans- misin de televisin digital) no seran viables sin la compresin debido a que el ancho de banda requerido sera demasiado grande. La compresin extiende el tiempo de reproduccin del DVD (digital video/versatile disk o disco verstil de video digital) permitiendo contar con pelculas completas en un solo disco. La compresin tambin reduce el costo del ENG y otras contribuciones de la produccin de televi- sin. DVB, ATSC y los discos de video digital (DVD) estn basados en la compre- sin MPEG-2. En la grabacin de cintas una compresin moderada facilita la tolerancia y adiciona confiabilidad en Digital Betacam y Digital-S, mientas que en SX, DVC, DVCPRO y DVCAM, la meta es la miniaturizacin. En servidores de video basados en disco, la compresin disminuir el costo de almacenamiento. La compresin tambin dismi- nuye el ancho de banda que permite que ms usuarios tengan acceso al servidor. Esta caracterstica tambin es importante para aplicaciones de VOD (video on demand o video en demanda) 1.5 Introduccin a la compresin de video digital En todo el material de programa real hay dos tipos de componentes de la seal: aquellas que son nuevos e impredecibles y los que pueden ser anticipados. Las componentes nuevas son llamadas entropa y es la informacin real en la seal. El resto es llamado redundancia porque no es esencial. La redundancia puede ser especial, como la que encontramos en las grandes reas planas de la imagen en la que los pixeles adyacentes tienen casi el mismo valor. La redundancia tambin puede ser temporal y aqu es donde las similitudes entre imgenes sucesivas se usan. Todos los sistemas de compresin trabajan separando la entropa de la redundancia en el Encoder. Solo la entropa ser grabada o transmitida y el Decoder calcular la redundancia de la seal transmitida. La Figura 1-2a (vea la siguiente pgina muestra este concepto. Un Encoder ideal extraer toda la entropa y solo esta ser transmitida al Decoder. Un Decoder ideal entonces reproducir la seal original. En la prctica, este ideal no puede ser alcanzado. Un Coder ideal sera complejo y provocara un retraso muy grande con el fin de usar la redundancia tem- poral. En ciertas aplicaciones como la grabacin o el broadcast, ser acep- table cierto retraso pero no en videoconferencias. En algunos casos, un Coder muy complejo sera demasiado caro. De lo anterior se desprende el hecho de que no haya un sistema de compresin ideal.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 4
Figura 1-2
En la prctica se necesitar un rango de Coders que tengan un rango determinado de retrasos de procesamiento y complejidades. La potencia del MPEG es que no es un formato de compresin simple sino un rango de herramientas de codificacin normalizadas que pueden ser combinadas en una forma flexible para satisfacer un rango de aplicaciones. La forma en la que la codificacin es ejecutada se incluye en los datos comprimidos para que el Decoder pueda manejar automticamente cualquier cosa que haya decidido hacer el Coder. En MPEG-2 y MPEG-4 la codificacin se divide en varios perfiles que tienen diferente complejidad y cada perfil puede ser implementado a diferente nivel dependiendo de la resolucin de la imagen de entrada. En la Seccin 4 se vern con detalle los perfiles y niveles. Hay muchos formatos diferentes de video digital y cada uno tiene una relacin de bits diferente. Por ejemplo, un sistema de alta definicin puede ser de 6 veces la relacin de bits de un sistema de definicin estndar. Consecuentemente, saber tan solo la relacin de bits de la salida de un Coder no es muy til, lo que importa es el factor de compresin que es la relacin entre la relacin de bits de la entrada con respecto a la relacin de bits comprimidos, por ejemplo 2:1, 5:1 y as sucesivamente.
Desafortunadamente el nmero de variables involucradas hace que sea muy difcil determinar un factor de compresin til. La Figura 1-2a muestra esto para un Coder ideal: si se enva toda la entropa la calidad ser buena, sin embargo, si el factor de compresin es incrementado con el fin de reducir la relacin de bits no se enviar toda la entropa y la calidad decae- r. Note que en un sistema comprimido cuando ocurre una perdida de calidad esto ser brusco (Figura 1-2b). Si la relacin de bits disponible es inadecuada es mejor evitar esa rea reduciendo la entropa de la imagen de entrada. Esto puede hacerse mediante el filtrado. La prdida de resolucin causada por el filtraje es subjetivamente ms aceptable que los artifacts de compresin. Para identificar la entropa a la perfeccin un compresor ideal tendra que ser extremadamente complejo. Un compresor prctico puede ser menos complejo por razones econmicas y deber enviar ms datos para asegurar el transporte de toda la entropa. La Figura 1-2b muestra la relacin entre la complejidad del Coder y su desempeo. Entre mayor sea el factor de com- presin requerido, ms complejo tendr que ser el Encoder.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 5 La entropa vara en las seales de video. La grabacin de un locutor dando las noticias tiene muchas redundancias y es fcil de comprimir. En contraste es ms difcil comprimir una grabacin con hojas flotando en el aire o la de un estadio de football que est en movimiento constante por lo que habr menos redundancia (ms informacin o entropa). En cualquier caso, si toda la entropa no se enva habr prdida de la calidad. As, podemos escoger entre un canal de relacin de bits constante con calidad variable o un canal de calidad constante con relacin de bits variable. Los operadores de redes de Telecomunicaciones tienden a preferir una relacin de bits constante por razones prcticas pero se puede usar un Buffer de memoria para promediar las variaciones de entropa si la dismi- nucin resultante en retraso es aceptable. Para la grabacin una relacin de bits variable puede ser ms sencilla de manejar y los DVDs usan una rela- cin de bits variable usando el Buffering de tal forma que la relacin de bits permanezca dentro de las capacidades del sistema de disco. La intracodificacin (intra =dentro) es una tcnica que explota la redundan- cia espacial o redundancia dentro de la imagen; la nter codificacin (inter = entre) es una tcnica que explora la redundancia temporal. La Intra codifi- cacin puede ser usada sola como en la norma J PEG para imgenes estticas o combinada con la inter codificacin como en MPEG. La intra codificacin depende de dos caractersticas de las imgenes tpi- cas. La primera es que no todas las frecuencias espaciales estn presentes simultneamente y segundo, que entre mayor sea la frecuencia espacial ser ms probable que la amplitud sea menor. La intra codificacin requiere el anlisis de las frecuencias espaciales en una imagen. Este anlisis es el propsito de las transformaciones como las wavelets y el DCT (Discrete cosine transform. Transformada discreta de coseno). Las transformadas producen coeficientes que describen la magnitud de cada frecuencia espacial. Tpicamente, muchos coeficientes sern cero o cerca de cero y pueden ser omitidos dando como resultado una reduccin en la relacin de bits. La inter codificacin depende de encontrar similitudes entre las imgenes sucesivas. Si una imagen dada est disponible en el Decoder, la siguiente imagen puede ser creada enviando solo las diferencias en la imagen. Las diferencias de la imagen se incrementarn cuando se muevan los objetos pero esta magnificacin puede ser contrarrestada usando la compensacin de movimiento ya que un objeto en movimiento generalmente no cambia su apariencia mucho de una imagen a la siguiente. Si el movimiento puede ser medido una aproximacin ms cercana a la imagen actual puede ser creada corriendo parte de la imagen previa a una nueva localidad. El proceso de corrimiento es controlado por un par de valores de desplazamiento vertical y horizontal (conocidos en conjunto como vector de movimiento) que es transmitido al Decoder. La transmisin del vector de movimiento requerir de menos datos que enviar los datos de la diferencia de imagen. MPEG puede manejar imgenes tanto entrelazadas como no entrelazadas. Una imagen en algn punto del eje del tiempo es llamada cuadro sin importar si es un campo o un cuadro. El entrelazado no es ideal como fuente para la compresin digital ya que por si misma es una tcnica de compresin. La codificacin temporal se hace ms compleja porque los pixeles en un campo estn en diferente posicin que los que estn en el siguiente. La compensacin de movimiento minimiza pero no elimina las diferencias entre las imgenes sucesivas. La diferencia de imagen es por s misma una imagen espacial y puede ser comprimida usando una transformacin basa- da en la intra codificacin como se describi previamente. La compensacin de movimiento simplemente reduce la cantidad de datos en las diferencias de la imagen. La eficiencia de un Coder temporal crece con la extensin del tiempo sobre la cual puede actuar. La Figura 1-2c muestra que si se requiere un factor de compresin alto se debe considerar una extensin de tiempo mayor en la entrada y por tanto se experimentar un mayor retraso de codificacin. Claramente, las seales codificadas temporalmente son difciles de editar ya que el contenido de una imagen de salida dada puede estar basado en los datos de imagen que fueron transmitidos un poco antes. Los sistemas de produccin tendrn que limitar el grado de codificacin temporal para permitir la edicin y esta limitacin a su vez limitar el factor de compresin disponible. 1.6 Introduccin a la compresin de audio La relacin de bits de un canal de audio digital en PCM es de tan solo unos 1.5 megabits por segundo, que es cerca del 0.5 % del de la del video digital. Con esquemas de compresin de video suaves como los de Betacam Digital, la compresin de audio resulta innecesaria; pero a medida que el factor de compresin se eleva, resulta importante comprimir tambin el audio. La compresin de audio aprovecha dos hechos. El primero es que en las seales tpicas de audio, no todas las frecuencias estarn presentes simul- tneamente. Segundo, debido al fenmeno del enmascaramiento, la audi- cin humana no puede discernir todos los detalles de una seal de audio. La compresin de audio divide el espectro de audio por medio del filtraje y las transformadas e incluye menos datos cuando describe bandas en las cuales el nivel es bajo. Donde el enmascaramiento previene o reduce la audibilidad de una banda en particular, se necesitarn enviar an menos datos.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 6
Figura 1-3 La compresin de audio no es tan fcil de lograr como la compresin de video debido a la agudeza de la audicin. El enmascaramiento solo funcio- na adecuadamente cuando la mascarilla y los sonidos a enmascarar coinci- den espacialmente. La coincidencia espacial siempre estar presente en las grabaciones monoaurales pero no en las estereofnicas en las que las seales de bajo nivel an pueden orse si estn en alguna parte del escena- rio sonoro. Consecuentemente, en los sistemas estreo y surround sound es permisible un menor factor de compresin para una calidad dada. Otro factor que complica la compresin de audio es que las resonancias retrasa- das en altavoces de no muy alta calidad enmascaran los artifacts de com- presin. Probar un compresor con altavoces baratos nos dar resultados falsos y las seales que aparentemente son satisfactorias pueden ser decepcionantes cuando se escuchan en un buen equipo. 1.7 Streams MPEG La salida de un Coder MPEG simple de audio o video es llamada stream elemental. Un stream elemental es una seal infinitamente cercana a tiempo real. Por conveniencia, el stream elemental puede ser dividido en bloques de datos de tamao manejable que forman un stream elemental paquetizado o PES (Packetized elementary stream). Esos bloques de datos necesitan informacin de header para identificar el inicio de los paquetes y deben incluir un estampado de tiempo debido a que la paquetizacin inte- rrumpe el eje del tiempo. La Figura 1-3 muestra que un PES de video y un nmero de PES de audio se pueden combinar para formar un stream de programa, asumiendo que todos los Coders estn amarrados a un reloj comn. El estampado de tiempo en cada PES puede usarse para asegurar el lip-sync entre el video y el audio. Los streams de programa tienen paquetes de longitud variable con encabezadores. Se pueden usar para transferencia de datos de y hacia discos duros y pticos que esencialmente estn libres de errores y en el que se esperan archivos de tamaos arbitra- rios. Los DVDs usan streams de programa. Para transmisin y broadcasting digital muchos programas y sus PES asociados pueden multiplexarse en un stream de transporte simple. Un stream de transpor- te difiere de los streams de programa en que los paquetes PES se subdividen an ms en paquetes cortos de tamao fijo y en que se pueden transportar programas mltiples codificados con diferentes relojes. Esto es posible ya que el stream de transporte tiene un mecanismo de referencia de reloj de programa o PCR (Program Clock Reference) que permite la transmisin de relojes mltiples, uno de los cuales ser seleccionado y regenerado en el Decoder. Un stream de transporte de programa simple o SPTS (Single Program Transport Stream) tambin es posible y se le puede encontrar entre un Coder y un Multiplexor. Ya que el stream de transporte puede amarrar el reloj del Decoder al reloj del Encoder, el STPS es ms comn que el Stream de programa. Un stream de programa es ms que solo un Multiplexor de audio y un PES de video. Adems de audio y video comprimido y datos, un stream de transporte incluye metadata que describe el stream de bits. Esto incluye la Tabla de asociacin de programas o PAT (Program Association Table) que enlista cada programa del stream de transporte. Cada entrada en la PAT apunta a una Tabla de mapeo de transporte o PMT (Program Map Table) que enlista los streams elementales que constituyen cada programa. Algunos programas sern abiertos pero algunos pueden estar sujetos al acceso condicional (encriptacin) y esta informacin tam- bin ser transportada por la metadata. El stream de transporte consiste de paquetes de datos de tamao fijo; cada uno contiene 188 bytes. Cada paquete transporta un Cdigo de identificador de programa o PID (Program Identifier Code). Los paquetes del mismo stream elemental tendrn el mismo PID, de tal forma que el Decoder (o Demultiplexor) pueda seleccionar el stream(s) elemental que quiera y des- echar los dems. La enumeracin de continuidad de los paquetes asegura que cada paquete que sea necesario para decodificar un stream sea recibi- do. Ser necesario un sistema de sincronizacin efectivo para que los decodificadores puedan identificar correctamente el inicio de cada paquete y deserialice el stream de bits en palabras.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 7 1.8 Necesidad de monitoreo y anlisis El stream de transporte MPEG es una estructura extremadamente compleja que usa tablas interrelacionadas e identificadores codificados para separar los programas y los streams elementales dentro de los programas. Dentro de cada stream elemental hay una estructura tambin compleja que le permite al Decoder distinguir entre, por ejemplo, vectores, coeficientes y tablas de cuantizacin. Las fallas pueden dividirse en dos categoras muy amplias. En la primera categora el sistema de transporte entregar correctamente la informacin de un Encoder/Multiplexor a un Decoder sin errores de bit o jitter adicionado pero el Encoder/Multiplexor o el Decoder tendr alguna falla. En la segunda categora, el Encoder/Multiplexor y el Decoder estarn bien pero el transpor- te de datos de uno a otro ser defectuoso. Es muy importante saber si la falla est en el Encoder/Multiplexor, el transporte o el Decoder si se quiere encontrar pronto la solucin. Los problemas de sincronizacin como las prdidas o la corrupcin de los patrones de sincrona pueden evitar la recepcin del stream de transporte completo. Los defectos en el protocolo del stream de transporte pueden evitar que el Decoder encuentre todos los datos para un programa, quiz se entregue la imagen pero no as el sonido. La distribucin correcta de los datos con excesivo jitter puede causar problemas de temporalizacin en el Decoder. Si un sistema que est usando un stream de transporte MPEG falla, esta podra estar en el Encoder, el Multiplexor o en el Decoder. Cmo se puede aislar la falla? Primero hay que verificar que el stream de transporte cumpla con las normas de codificacin de MPEG. Si el stream no cumple con ellas, difcilmente se puede culpar a un Decoder del problema. Si el stream cum- ple con las normas, podra ser necesario checar el Decoder. Las herramientas para prueba de video tradicionales: el generador de seales, el monitor de forma de onda y el vectorscopio no son apropiados para analizar los sistemas MPEG excepto para asegurar que las seales de video que entran o salen del sistema MPEG son de la calidad adecuada. En lugar de lo anterior, un juego de fuentes de seales de prueba MPEG vlidas ser esencial para probar el equipo receptor y los Decoders. Con un analizador adecuado, el desempeo de los Encoders, sistemas de transmi- sin, Multiplexores y Remultiplexores podr estimarse con un alto grado de confianza. Como reputado proveedor de equipo de prueba de alta calidad en la industria de video, Tektronix sigue proporcionando soluciones de prueba y medicin a medida que la tecnologa evoluciona dando a los usuarios de MPEG la confianza de que los sistemas comprimidos complejos estn funcionando adecuadamente y permiten un diagnstico rpido an cuando no estn presentes. 1.9 Inconvenientes de la compresin La compresin MPEG es con prdidas ya que lo que es decodificado no es idntico al original. La entropa de la fuente vara y cuando es alta, el siste- ma de compresin puede dejar artifacts visibles cuando se decodifica. En la compresin temporal, se asume la redundancia entre imgenes sucesivas. Cuando el caso no es ese, el sistema puede fallar. Un ejemplo es el video de una conferencia de prensa en la que los destellos de las cmaras estn presentes. Las imgenes individuales que contienen los destellos sern totalmente diferentes de las imgenes inmediatamente anteriores y poste- riores en los que los artifacts de codificacin pueden volverse muy obvios. El movimiento irregular o muchos objetos movindose independientemente en la pantalla requerirn mucho ancho de banda de vector y este requeri- miento solo puede ser llenado reduciendo el ancho de banda disponible para los datos de imagen. De nuevo, puede haber artifacts visibles cuyo valor varia y depende del movimiento. Este problema frecuentemente ocurre en videos de deportes. Una cuantizacin poco precisa provocar un conturing de luminancia y pasterizacin del color. Esto puede verse como sombras manchadas y bloqueo de reas grandes de color plano. Subjetivamente, los artifacts de compresin son ms molestos que el deterioro relativamente constante provocada por los sistemas de transmisin analgicos. La nica solucin a esos problemas es reducir el factor de compresin. Consecuentemente, el usuario tendr que hacer un juicio de valor entre la economa de un factor de compresin alto y el nivel de los artifacts. Adems de extender el retraso de la codificacin y la decodificacin, la codificacin temporal tambin produce dificultades para la edicin. De hecho, un stream de bits MPEG no puede ser editado de forma arbitraria. Esta restriccin aparece debido a que en la codificacin temporal la decodi- ficacin de una imagen puede requerir el contenido de una imagen anterior y este podra no estar disponible. El hecho de que las imgenes puedan estar fuera de la secuencia tambin complica la edicin. Si se va a usar una codificacin adecuada las ediciones se pueden hacer pero solo en puntos de edicin que estn relativamente distantes. Si se requiere una edicin arbitraria, el stream MPEG deber seguir un proceso de decodificar-modificar-recodificar que provocar una prdida por genera- cin.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 8 Seccin 2 Compresin en Video
Figura 2-1
Esta seccin muestra como la compresin de video est basada en la percepcin del ojo. Algunas tcnicas habilitadoras importantes como las transformadas y la compensacin de movimiento son consideradas como una introduccin a la estructura de un Coder MPEG. 2.1 Codificacin espacial o temporal? Como se vio en la Seccin 1, la compresin de video puede aprovechar las redundancias tanto espaciales como temporales, en MPEG, la redundancia temporal es reducida primero usando las similitudes entre las imgenes sucesivas. Tanto como sea posible de la imagen actual, esta ser creada o predicha usando informacin de las imgenes que ya se enviaron. Cuando se usa esa tcnica solo es necesario enviar una imagen diferencial que elimina las diferencias entre la imagen actual y la predicha. La imagen diferencial entonces estar sujeta a la compresin espacial. Como algo prctico es ms fcil explicar la compresin espacial antes de explicar la compresin temporal. La compresin espacial depende de las similitudes entre los pixeles adya- centes en las reas planas de la imagen y en las frecuencias espaciales dominantes en reas con patrones. El sistema J PEG usa solo la compre- sin espacial ya que est diseada para transmitir imgenes estticas individuales; sin embargo, J PEG puede ser usado para codificar una suce- sin de imgenes individuales para video. En la aplicacin llamada Motion J PEG, el factor de compresin no ser tan bueno como si se usara la codificacin temporal pero el stream de bits ser editable libremente en base a imagen a imagen. 2.2 Codificacin espacial El primer paso en la codificacin espacial es hacer un anlisis de las fre- cuencias espaciales usando una transformada. Una transformada simple- mente es una forma de expresar una forma de onda en un dominio diferen- te, en este caso, en el dominio de la frecuencia. La salida de una transfor- mada es un juego de coeficientes que describen que tanto de una frecuen- cia dada est presente. Una transformada inversa reproducir la forma de onda original. Si los coeficientes son manejados con suficiente exactitud, la salida de la transformada inversa es idntica a la forma de onda original. La transformada mejor conocida es la Transformada de Fourier. Esta trans- formada encuentra cada frecuencia de la seal de entrada multiplicando la forma de onda de la entrada por una muestra de una frecuencia de target llamada una funcin basee integrando el producto. La Figura 2-1 muestra que cuando la forma de onda de entrada no contiene la frecuencia de target, la integral ser 0 pero cuando la contiene la integral ser un coefi- ciente que describe la amplitud de esa frecuencia componente. Los resultados sern como los que se describen si la frecuencia componen- te est en fase con la funcin base; sin embargo, si la frecuencia compo- nente est en cuadratura con la funcin base, la integral seguir siendo cero por lo que es necesario hacer dos bsquedas por cada frecuencia con las funciones base en cuadratura entre s para que cada fase de la entrada sea detectada.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 9
Figura 2-2.
La transformada de Fourier tiene la desventaja de requerir coeficientes para las componentes tanto de seno como de coseno de cada frecuencia. En la transfor- mada de coseno, la forma de onda de la entrada es una imagen especular en tiempo consigo misma antes de ser multiplicada por las funciones base. La Figura 2-2 muestra como esta imagen especular cancela todas las componentes senoida- les y duplica todas las componentes coseno. La funcin de base senoidal es innecesaria y solo se necesita un coeficiente para cada frecuencia. La transformada discreta de coseno o DCT (Discrete Cosine Transform) es la versin muestreada de la transformada de coseno y se usa extensamente en forma bidimensional en MPEG. Un bloque de 8x8 pixeles es transformado para convertirse en un bloque de 8x8 coeficientes. Ya que la transformada requiere la multiplicacin por fracciones, hay una extensin de longitud de palabra que da como resultado coeficientes que tienen una mayor longitud de palabra que los valores de pxel. Tpicamente un bloque de pixeles de 8 bit dar como resultado un bloque de coeficientes de 11 bits. As, un DCT no dar como resultado ninguna compresin, de hecho provoca lo opuesto; sin embargo, el DCT convierte los pixeles de la fuente a una forma en la que la compresin es ms simple. La Figura 2-3 muestra los resultados de una transformada inversa de cada uno de los coefi- cientes individuales de un DCT de 8x8. En el caso de la seal de luminancia, el coeficiente superior izquierdo es la brillantez promedio o componente de DC de todo el bloque. Movindose por la fila superior, la frecuencia especial horizontal se incrementa. Movindose hacia abajo por la columna de la izquierda, la frecuencia especial vertical se incrementa. En las imgenes reales, diferentes frecuencias espaciales verticales y horizontales podrn ocurrir simultneamente y un coeficiente en algn punto dentro del bloque representar todas las posibles combinaciones horizontal y vertical. La Figura 2-3 tambin muestra 8 coeficientes como formas de onda horizontales unidimensionales. Combinando esas formas de onda con varias amplitudes y cualquier polaridad se pueden reproducir cualquier combinacin de 8 pixeles. As, combinando 64 pixeles de la DCT en 2D tendremos como resultado el bloque original de 8x8 pixeles.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 10
Figura 2-3. Claro que para imgenes en color, las muestras de diferencia de color tambin tendrn que manejarse. Los datos de Y, Cb y Cr se ensamblan en arreglos de 8x8 y se transforman individualmente. En material de programa, muchos de los coeficientes tendrn valores de 0 o muy cercanos y por tanto no sern transmitidos. Este hecho da como resul- tado una compresin significativa que virtualmente es sin prdidas. Si se necesita un factor de compresin mayor, entonces la longitud de palabra de los coeficientes que no son 0 deber reducirse. Esta reduccin har dismi- nuir la exactitud de esos coeficientes e introducir prdidas al proceso. Con cuidado, las prdidas pueden introducirse en una forma que sea muy poco visible para el espectador. 2.3 Ponderacin La Figura 2-4 muestra que la percepcin humana del ruido en las imgenes no es uniforme sino que est en funcin de la frecuencia espacial: ms ruido puede ser tolerado a mayor frecuencia espacial; adems, el ruido de video es enmascarado efectivamente por el detalle fino en la imagen mien- tras que en las reas planas es altamente visible. El lector debe estar conciente de que las mediciones tradicionales de ruido son ponderadas frecuentemente de tal forma que las mediciones tcnicas se relacionen mejor con el resultado subjetivo. La compresin reduce la exactitud de los coeficientes y tiene un efecto similar a usar muestras de longitud de palabra menores en PCM; esto es, el nivel del ruido se eleva. En PCM el resultado de acortar la longitud de la palabra es que el nivel del ruido se eleva por igual a todas las frecuencias. A medida que el DCT divide la seal en diferentes frecuencias se hace posible controlar el espectro del ruido. En una forma efectiva los coeficientes de baja frecuencia se repre- sentarn en una forma ms exacta que los coeficientes de alta frecuencia por medio de un proceso de ponderacin. La Figura 2-5 muestra que en el proceso de ponderacin los coeficientes del DCT son divididos por medio de constantes que son una funcin de una frecuencia bidimensional. Los coeficientes de baja frecuencia sern dividi- dos por nmeros pequeos y los coeficientes de alta frecuencia por gran- des. Despus de la divisin, el resultado ser truncado al entero ms cerca- no. Esto es una forma de recuantizacin, en ausencia de ponderacin, esta recuantizacin tendr el efecto de incrementar en forma uniforme el tamao del paso de cuantizacin pero con la ponderacin se incrementar el tama- o del paso de acuerdo con el factor de divisin.
Figura 2-4. Como resultado, los coeficientes que representan frecuencias espaciales bajas, son recuantizados con pasos relativamente pequeos y sufren de ruido ligeramente incrementado. Los coeficientes que representan frecuen- cias espaciales mayores son recuantizados con pasos grandes y sufren de ms ruido; sin embargo, menos pasos implicarn que se necesiten menos pasos para identificar el paso y obtener la compresin. En el Decoder, los ceros de menor orden sern adicionados para regresar los coeficientes ponderados a su magnitud correcta. Entonces se multiplica- rn por factores de ponderacin inversos. Muy claramente a frecuencias altas los factores de multiplicacin sern mayores por lo que el ruido de recuantizacin ser mayor. Despus de la ponderacin inversa los coefi- cientes tendrn sus valores de DCT originales ms un error de recuantiza- cin que ser mayor en alta frecuencia que en baja frecuencia. Como alternativa al truncado, los coeficientes ponderados pueden ser alinealmente recuantizados de tal forma que el tamao del paso de cuanti- zacin incremente la magnitud del coeficiente. Esta tcnica permite factores de compresin ms altos pero con peores niveles de artifacts. Claramente, el grado de compresin obtenido y, a su vez, la relacin de bits de salida obtenida, ser una funcin de la severidad del proceso de recuan- tizacin. Diferentes relaciones de bit requerirn diferentes tablas de ponde- racin. En MPEG es posible usar diferentes tablas de ponderacin y la tabla en uso puede ser transmitida al Decoder para asegurar la decodificacin correcta.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 11
Figura 2-5
2.4 Scanning (exploracin) En material de programa tpico, los coeficientes de DCT ms significativos se encuentran generalmente en o cerca de la esquina superior izquierda de la matriz. Despus de la ponderacin los coeficientes de bajo valor pueden ser truncados a 0. Se puede obtener una transmisin ms eficiente si se envan primero todos los coeficientes que no son 0 seguido por un cdigo que indique que todo lo restante es 0. El Scanningo exploracin es una tcnica que incrementa la probabilidad de lograr ese resultado debido a que enva coeficientes en orden descendiente de magnitud de probabilidad. La Figura 2-6a muestra que en un sistema no entrela- zado, la posibilidad de un coeficiente que tenga un valor alto ser ms alto en la esquina superior izquierda (vea la siguiente pgina) y ms bajo en la esquina inferior derecha. Una exploracin en zigzagen diagonal a 45 es la mejor secuen- cia a utilizar. En la Figura 2-6b, se muestra un patrn de exploracin alternativa que puede ser usado para Fuentes entrelazadas. En una fuente entrelazada, un bloque DCT de 8x8 de un campo se extiende por dos veces el rea vertical de la pantalla por lo que para un detalle de imagen dado, las frecuencias verticales parecern dos veces ms grandes que las frecuencias horizonta- les. As, la exploracin ideal para una imagen entrelazada ser en diagonal que tiene un paso del doble de longitud. La Figura 2-6b muestra que una frecuencia espacial vertical dada es explorada antes de escanear la misma frecuencia espacial horizontal. 2.5 Codificacin de Entropa En video real, no todas las frecuencias espaciales estarn presentes simul- tneamente por lo que la matriz de coeficientes de DCT contendr trminos en 0. La recuantizacin incrementar el nmero de ceros eliminando los valores pequeos.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 12
Figura 2-6
A pesar del uso del scanning o exploracin, los coeficientes 0 seguirn apareciendo entre los valores significativos. La codificacin de longitud corrida o RLC (Run Length Coding) permite manejar esos coeficientes ms eficientemente. Donde se repiten los valores, como en los strings de ceros la RLC simplemente transmitir el nmero de ceros en lugar de cada bit individual. La probabilidad de ocurrencia de valores de coeficientes particulares en el video real se puede estudiar. En la prctica, algunos valores ocurren muy frecuentemente y otros menos. La informacin estadstica se puede usar para lograr una mayor compresin usando la codificacin de longitud varia- ble o VLC (Variable Length Coding). Frecuentemente ocurren valores que son convertidos a palabras de cdigo cortas y los valores infrecuentes se convierten a palabras de cdigo largas. Para ayudar en la decodificacin ninguna palabra de cdigo puede ser el prefijo de otra.
2.6 Un Coder espacial La Figura 2-7 rene todos los conceptos precedentes de codificacin espacial. Se asume que la seal de entrada es SDI 4:2:2 SDI (Serial Digital Interface o Interfase serial digital), que puede tener una longitud de palabra de 8 o 10 bits. MPEG usa solo una resolucin de 8 bit por lo que ser necesaria una etapa de redondeo cuando la seal SDI contenga palabras de 10 bits. La mayora de los perfiles de MPEG operan con el muestreo 4:2:0 por lo que ser necesaria una etapa de filtraje/interpolacin de pasa bajas vertical. El redondeo y el submuestreo de color introducen una pequea prdida irreversible de informacin y una reduccin pro- porcional en la relacin de bits. El formato de entrada del rasterexplorado necesi- tar ser almacenado de tal forma que pueda ser convertido a bloques de 8x8 pixeles.
Figura 2-7 Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 13
Figura 2-8
El escenario DCT transforma la informacin de imagen al dominio de la frecuencia. El DCT por s mismo no logra ninguna compresin. Despus del DCT los coeficientes son ponderados y truncados proporcionando la prime- ra compresin significativa. Los coeficientes entonces se exploran en zigzag para incrementar la probabilidad de que los coeficientes significativos apa- rezcan pronto en la exploracin. Despus del ltimo coeficiente que no sea cero, se genera un cdigo de EOB (end of block, fin de bloque). Los datos de los coeficientes se comprimen an ms por medio de las codificaciones de longitud corrida o (run-length) y de longitud variable o (variable-length). En un sistema de relacin de bits variable, la cuantizacin puede ser fijada pero en un sistema de relacin de bits fija, se usa una memoria Buffer para absorber las variaciones en las dificultades de la codificacin. Las imgenes muy detalladas tendern a llenar el Buffer mientras que las planas permitirn que se vace. Si hubiera peligro de que el Buffer se desborde los pasos de recuantizacin tendrn que hacerse ms grandes de tal forma que se eleve el factor de compresin. En el Decoder el stream de bits se deserializa y la codificacin de entropa se invierte para reproducir los coeficientes ponderados. Los coeficientes son colocados en la matriz de acuerdo a la exploracin en zigzag y se aplica la ponderacin inversa para recrear el bloque de coeficientes de DCT. Des- pus de la transformada inversa se recrea el bloque de 8x8 pixeles. Para obtener una salida de raster explorado, los bloques son almacenados en RAM los cuales sern ledos lnea a lnea. Para obtener una salida 4:2:2 de datos en 4:2:0 ser necesario un procesamiento de interpolacin vertical como se muestra en la Figura 2-8. Las muestras de croma en 4:2:0 son posicionadas a medio camino entre las muestras de luminancia en los ejes verticales de tal forma que queden espaciados equitativamente cuando se use una fuente entrelazada. 2.7 Codificacin temporal La redundancia temporal puede ser explotada por la intercodificacin o transmitir solo las diferencias entre las imgenes. La Figura 2-9 muestra que el retraso de una imagen combinado con un substractor puede calcular las diferencias de imagen.
Figura 2-9 Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 14
Figura 2-10
La imagen diferencial es una imagen por derecho propio y se puede com- primir ms con el Coder especial como ya se describi previamente. El Decoder invierte la codificacin espacial y adiciona la imagen diferencial a la imagen previa para obtener la siguiente imagen. Hay algunas desventajas de este sistema simple. Primero, ya que solo se envan las diferencias es imposible comenzar a decodificar despus del inicio de la transmisin. Esta limitacin hace difcil que el Decoder propor- cione imgenes despus de cambiar de un stream al otro (como ocurre cuando el espectador cambia de canales). Segundo, si cualquier parte de los datos de la diferencia es incorrecta, el error en la imagen se propagar indefinidamente. La solucin a esos problemas es usa un sistema que no sea completamente diferencial. La Figura 2-10 muestra que se envan peridicamente imge- nes completas. Estas imgenes son llamadas imgenes intra codificadas (o imgenes I-) y se obtienen solo por medio de la compresin espacial. Si hay un error o un cambio de canal es posible reasumir la decodificacin correcta en la siguiente imagen I-. 2.8 Compensacin de movimiento El movimiento reduce las similitudes entre las imgenes e incrementa los datos necesarios para crear la imagen diferencial. La compensacin de movimiento se usa para incrementar la similitud. La Figura 2-11 muestra este principio. Cuando un objeto se mueve por la pantalla de TV puede aparecer en diferente lugar a cada imagen pero no cambiar mucho su apariencia. La imagen diferencial puede ser reducida midiendo el movimien- to en el Encoder. Esta ser enviada al Decoder como un vector. El Decoder usa el vector para correr parte de la imagen previa a un lugar ms apropia- do en la nueva imagen.
Figura 2-11
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 15
Figura 2-12
Un vector controla el corrimiento de un rea completa de la imagen que es conocida como macrobloque. El tamao del macrobloque es determinado por la codificacin DCT y la estructura del submuestreo de color. La Figura 2-12a muestra que con un sistema 4:2:0 el espaciado vertical y horizontal de las muestras de color es de exactamente el doble que el de la luminan- cia. Un bloque DCT simple de 8x8 muestras de color se extiende en la misma rea que 4 bloques de luminancia 8x8 por lo que esta ser el rea de imagen mnima que podr ser corrida por un vector. Un macrobloque 4:2:0 contiene 4 bloques de luminancia: un bloque Cb y un bloque Cr. En el perfil 4:2:2, el color solo es submuestreado en el eje horizontal. La Figura 2-12b muestra que en 4:2:2, un bloque DCT simple de 8x8 muestras de color se extiende por dos bloques de luminancia. Un macrobloque 4:2:2 contiene cuatro bloques de luminancia: dos bloques Cb y dos Cr. El estimador de movimiento trabaja comparando los datos de luminancia de dos imgenes sucesivas. Un macrobloque en la primera imagen se usa como referencia. La correlacin entre la referencia y la siguiente imagen se mide a todos los desplazamientos posibles con una resolucin de medio pxel en el rango de bsqueda completo. Cuando se encuentra la mayor correlacin, esta se asume que representa el movimiento correcto. El vector de movimiento tiene una componente vertical y una horizontal. Para material de programa tpico, un objeto en movimiento puede extender- se a travs de un nmero de macrobloques. Se obtendr un factor de compresin mayor si los vectores se transmiten en forma diferencial. Cuando un objeto grande se mueve, los macrobloques adyacentes tienen los mismos vectores y el vector diferencial se hace 0.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 16 Los vectores de movimiento estn asociados con macrobloques no con objetos reales en la imagen y habr ocasiones en las que parte del macro- bloque se mover y parte no. En ese caso es imposible compensar adecua- damente. Si el movimiento de la parte que se est moviendo es compensa- do transmitiendo un vector, la parte estacionaria se correr de forma inco- rrecta y necesitar datos diferenciales para ser corregido. Si no se envan vectores, la parte estacionaria ser correcta pero los datos diferenciales sern necesarios para corregir la parte que se est moviendo. Un compre- sor prctico puede intentar aplicar ambas estrategias y seleccionar la que requiera de menos datos. 2.9 Codificacin bidireccional Cuando un objeto se mueve, cancela el fondo en su contorno del frente y lo revela en el contorno posterior. El fondo revelado requiere que se transmi- tan nuevos datos debido a que el rea del fondo fue cancelado previamente y no se puede obtener informacin de una imagen previa. Un problema similar ocurre si la cmara hace un paneo; nuevas reas sern visibles y no se sabe nada de ellas. MPEG ayuda a minimizar este problema usando la codificacin bidireccional que permite que se tome informacin de las imgenes que estn antes y despus de la actual. Si se revela un fondo este estar presente en una imagen posterior y la informacin se puede mover hacia atrs en el tiempo para crear parte de una imagen anterior. La Figura 2-13 muestra el concepto de codificacin bidireccional. En base a macrobloques individuales, una imagen con codificacin bidireccional puede obtener datos con compensacin de movimiento de una imagen previa o posterior o, incluso, usar un promedio de datos anteriores o posteriores. La codificacin bidireccional reduce significativamente la cantidad de datos diferenciales necesarios para mejorar el grado de prediccin posible. MPEG no especifica como se debe construir un Encoder, solo lo que constituye un stream de bits que cumple con la norma; sin embargo, un compresor inteli- gente puede probar las tres estrategias y seleccionar la que proporcione menos datos a transmitir. 2.10 Imgenes I-, P- y B- En MPEG, se necesitan tres tipos diferentes de imgenes para respaldar la codificacin diferencial y la bidireccional para minimizar la propagacin de errores: Las imgenes I- son imgenes intracodificadas que no necesitan informa- cin adicional para decodificarlas; en cambio requieren muchos datos en comparacin con otros tipos de imgenes y por lo tanto no se transmiten ms frecuentemente que lo necesario. Consisten principalmente de coefi- cientes transformados y no tienen vectores. Las imgenes I- son decodifi- cadas sin referencias a ninguna otra imagen por lo que le permiten al es- pectador cambiar canales y detienen la propagacin de errores.
Figura 2-13
Las imgenes P- son predichas por adelantado a partir de una imagen anterior que puede ser una I- o una P-. Los datos de las imgenes P- con- sisten de vectores que describen donde, en la imagen previa, cada macro- bloque debe ser tomado y los coeficientes transformados que describen la correccin o datos diferenciales que deben ser adicionados a ese macro- bloque. Donde no se puedan encontrar coincidencias para un macrobloque por la bsqueda de la compensacin de movimiento, los datos intra se envan para codificar ese macrobloque. Las imgenes P- requieren aproxi- madamente la mitad de los datos que una imagen I-. Las imgenes B- se predicen en forma bidireccional de una imagen I- o P- anterior o posterior. Los datos de las imgenes B- consisten de vectores que describen en que parte de las imgenes anteriores o posteriores se deben tomar los datos. Tambin contienen los datos intracodificados que proporcionan las correcciones necesarias. De nuevo, cuando la bsqueda de compensacin de movimiento no encuentra coincidencias, los datos intrase envan para codificar ese macrobloque. La prediccin bidireccional es muy efectiva por lo que la mayora de los macrobloques en una imagen B- sern codificados principalmente por vectores de movimiento. Adems, una imagen B- nunca se usa como referencia para codificar otras imgenes por lo que no hay posibilidad de errores de propagacin. Esto le permite a los Encoders usar una recuantificacin ms agresiva para la correccin de datos. Una imagen B- tpica requiere aproximadamente una cuarta parte de los datos que una imagen I-. Hay que hacer notar que una imagen B- no tiene que usar ambas direccio- nes de la prediccin; en algunas circunstancias solo se emplea una direc- cin. Esta opcin se puede usar cuando se construyen grupos de imgenes o GOP (Groups Of Pictures) cerrados. Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 17
Figura 2-14
La Figura 2-14 presenta el concepto de GOP. El GOP representa la estruc- tura de las imgenes I-, P- y B- en la secuencia. Generalmente la estructura del GOP se repite en la secuencia pero su longitud y estructura puede cambiar en cualquier momento. No hay lmites formales para la longitud de un GOP pero para la transmisin una longitud tpica ser de 12 o 15 imge- nes. La naturaleza de la compresin temporal de MPEG implica que el orden de transmisin de las imgenes no es el mismo que el orden de despliegue. Una imagen P- en forma natural seguir a una I- o P- a partir de la cual es predicha, por lo que no habr requerimientos especiales. Sin embargo, una imagen B- codificada bidirecionalmente no se puede decodificar hasta que sus dos imgenes de referencia se hayan recibido y decodificado. La Figura 2-14 muestra las imgenes de un GOP en su orden de despliegue en la parte superior y en la inferior en orden de transmisin. Note que en el orden de transmisin las imgenes B- siempre siguen a las dos imgenes de referencia de las que es predicha. Hay dos tipos de GOP: abiertos y cerrados. Un GOP cerrado no requiere referencias fuera de l. En el orden de despliegue puede comenzar con una imagen I- y terminar con una P-. En el orden de transmisin usualmente habr imgenes B- despus de la ltima imagen P- pero son imgenes que se desplegarn antes de la ltima imagen P-. Es posible empezar y/o terminar un GOP cerrado con imgenes B- (en el orden de despliegue) pero en el caso de iniciar y terminar con imgenes B- se debe codificar usando una sola direccin de prediccin. Las imgenes B- al inicio de un GOP cerrado solo deben usar la prediccin retrasada. Las imgenes B- al inicio de un GOP usado pueden usar solo la prediccin adelantada, en forma similar a una imagen P- pero las reglas de las imge- nes B- sern usadas para la recuantizacin, etc. Un GOP abierto no tiene esas restricciones en los vectores de prediccin. Por ejemplo, las imgenes B- al final de un GOP pueden usar la prediccin adelantada de la ltima imagen P- y la prediccin retrasada de la primera imagen I- del siguiente GOP. Esta estructura es ligeramente ms eficiente pero las predicciones cualquier frontera de imgenes. Es mucho ms difcil
Figura 2-15
dividir los streams de video y ser ms probable que los eventos como los cambios de canal causen errores de imagen. La estructura del GOP puede ser alterada por el Encoder cuando haya cambios de escena. Las predicciones a travs de los cambios de escena usualmente fallarn ya que habr grandes cantidades de entropa entre las dos imgenes a cualquier lado del cambio de escena. Un Encoder puede elegir detectar el cambio de escena, usar un GOP cerrado que nos lleve al cambio de escena e iniciar un nuevo GOP (abierto o cerrado) con una imagen I- para representar la primera imagen de la nueva escena. Enviar datos de imagen de una secuencia requiere memoria adicional al Encoder y Decoder y tambin causara retrasos. El nmero de imgenes codificadas bidirecionalmente entre intra o predichas por adelantado se deben restringir para reducir el costo y minimizar el retraso si esto resultara importante. La Figura 2-15 muestra el compromiso que se debe establecer entre el factor de compresin y el retraso de codificacin. Para una calidad dada, enviar solo imgenes I- requerir ms de dos veces la relacin de bits de una secuencia IBBP. Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 18
Figura 2-16a
2.11 Un compresor MPEG Las Figuras 2-16a, b y c muestran la estructura de un compensador de movimiento bidireccional tpico. El video de entrada preprocesado entra a una serie de almacenes de cuadros a los que se les puede hacer un by- pass para cambiar el orden de la imagen. Los datos entonces entrarn al substractor y al estimador de movimiento. Para crear una imagen I-, el fin del retraso de entrada se selecciona y el substractor se desactiva de tal forma que los datos pasen directamente para ser codificados espacialmente (ver Figura 2-16a). La salida de datos del substractor tambin pasa a un almacn de cuadros que puede contener muchas imgenes. La imagen I- es mantenida en el almacn.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 19
Figura 2-16b
Para codificar una imagen P-, se les aplica un bypass a las imgenes B- del Buffer de entrada para seleccionar la siguiente imagen futura (ver Figura 2-16b). El estimador de movimiento comparar la imagen I- en el almacn de salida con la imagen P- en el almacn de entrada para crear los vectores de movimiento adelantados. Los macrobloques de la imagen I- son corridos por esos vectores para hacer una imagen P- predicha. La imagen P- predi- cha es substrada de la imagen P- real para producir el error de prediccin que se codifica espacialmente y se enva junto con los vectores. El error de prediccin tambin se adiciona a la imagen P- predicha para crear una imagen P- localmente decodificada que tambin entra al almacn de salida.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 20
Figura 2-16c
El almacn de salida entonces contendr una imagen I- y una imagen P-. Una imagen B- del Buffer de entrada podr seleccionarse ahora. El com- pensador de movimiento comparar la imagen B- con la imagen I- que le preceda y la imagen P- que le sigue para obtener vectores bidireccionales (ver Figura 2-16c). La compensacin de movimiento retrasada y adelantada es ejecutada para producir dos imgenes B- predichas. Estas sern subs- tradas de la imagen B- actual. En base a macrobloque a macrobloque, los datos retrasados y adelantados son seleccionados de acuerdo a cuales representan las diferencias ms pequeas. Las diferencias de la imagen sern codificadas espacialmente y se envan con los vectores. Cuando todas las imgenes B- intermedias estn codificadas, se le volver a hacer un bypass a la memoria de entrada para crear una nueva imagen P- basada en la imagen P- previa.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 21
Figura 2-17
La Figura 2-17 muestra un Coder MPEG. La salida del Compensador de movimiento se codifica espacialmente y los vectores son adicionados en un Multiplexor. Los datos sintcticos tambin se adicionan, lo que identificar el tipo de imagen (I-, P-, o B-) y proporcionar otra informacin para ayudar al Decoder (ver Seccin 5 Streams Elementales). La salida de datos es puesta en un Buffer para permitir variaciones temporales en relacin de bits. Si la relacin de bits media es demasiado alta el Buffer tender a llenarse. Para evitar el sobreflujo la cuantizacin tendr que hacerse en una forma ms severa. Igualmente, si el Buffermuestra signos de poco flujo se deber relajar la cuantizacin para mantener la relacin de bits promedio. 2.12 Pre procesamiento Un Compresor intentar eliminar la redundancia dentro de la imagen y entre ellas. Cualquier cosa que reduzca la redundancia aparente, que no sea contenido de imagen, no es deseable. El ruido y el grano de la pelcula son particularmente problemticos porque en general ocurren en toda la ima- gen. Despus del proceso de DCT, el ruido dar coeficientes diferentes de cero y el Coder no podr distinguir esta informacin de los datos genuinos de imagen. Una cuantizacin ms pesada se requerir para codificar todos los coeficientes reduciendo la calidad de imagen. El ruido tambin reduce las similitudes entre las imgenes sucesivas incrementando la diferencia de datos necesaria. La subportadora residual en el video decodificado de video compuesto es un problema serio porque dar como resultado frecuencias espaciales altas que normalmente estn a bajo nivel en programas en componentes. La subportadora tambin se alterna en fase de imagen a imagen causando un incremento en los datos diferenciales. Naturalmente, cualquier artifact de decodificacin en compuesto que sea visible a la entrada del Coder MPEG es muy probable que sea reproducido en el Decoder. Cualquier prctica que provoque movimiento no deseado hay que evitarla. Los montajes de cmara inestables, adems de darnos una imagen temblo- rosa incrementarn las diferencias de la imagen y los requerimientos de transmisin de vectores. Esto tambin pasar con el material de telecine si el dao de los orificios de la rueda dentada provoca ondulaciones de cinta o brincos. En general el video que se va a comprimir debe ser de la ms alta calidad posible. Si no se puede lograr eso entonces ser deseable la reduc- cin de ruido y otras tcnicas de estabilizacin. Si se requiere un alto factor de compresin, el nivel de artifacts se puede incrementar especialmente si la calidad de entrada es pobre. En ese caso lo mejor podra ser reducir la entropa presentada al Coder usando el pre filtraje; en l la seal de video estar sujeta a un filtraje bidimensional pasa bajas con lo que se reducir el nmero de coeficientes necesarios y se reducir el nivel de los artifacts. La imagen se ver menos definida pero es preferible a un alto nivel de artifacts. En la mayora de aplicaciones de MPEG-2 se usa el muestreo 4:2:0 por lo que se requerir un proceso de downsamplingde croma si la fuente est a 4:2:2. En MPEG-1, la Luminancia y la Croma atraviesan un proceso de downsamping mayor para producir una imagen de entrada o CIF (Com- mon Image Format, Formato de imagen comn) que es de solo 352 pixeles de ancho. Esta tcnica reduce la entropa en un factor mayor. Para una compresin muy alta se usa el QCIF (Quarter Common Image Format o Formato de imagen de un cuarto del comn), que es de 176 pixeles de ancho. El Downsampling es un proceso que combina un filtro pasa-bajas espacial con un interpolador. El Downsamplingde seales entrelazadas es problemtico porque el detalle vertical es esparcido por dos campos que se puede decorrelacionar debido al movimiento.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 22 Cuando el material de fuente es telecine, la seal de video tiene diferentes caractersticas que el video normal. En el video a 50 Hz, los pares de campos representan el mismo cuadro de pelcula y no hay movimiento entre ellos. As, el movimiento entre los campos se alterna entre cero y el movimiento entre los cuadros. En el video a 60 Hz se usa un pulldown 3:2 para obtener 60 Hz de pelcula a 24 Hz. Un cuadro se convierte en dos campos; el siguiente en tres campos y as sucesivamente. Consecuentemente, un campo de cada cinco es completamente redundan- te. MPEG maneja mejor el material de cine descartando el tercer campo en los sistemas 3:2. Un cdigo de 24 Hz en la transmisin alertar al Decoder que debe recrear la secuencia 3:2 volviendo a leer un almacn de campos. En el telecine a 50 y 60 Hz los pares de campos son desentrelazados para crear cuadros y luego el movimiento se mide entre los cuadros. El Decoder puede recrear el entrelazado leyendo lneas alternadas en el almacn de cuadros. Un corte es un evento difcil de manejar para el Compresor porque frecuen- temente provocar una falla de prediccin casi completa y se requerir una larga cantidad de correccin de datos. Si se puede tolerar un retraso de codificacin, un Coder puede detectar los cortes por adelantado y modificar dinmicamente la estructura del GOP de tal forma que una imagen I- se inserte para que coincida con el corte. En ese caso el corte es manejado con muy pocos datos extra. Las ltimas imgenes B- antes del cuadro I- es casi seguro que usen la prediccin adelantada. En algunas aplicaciones que no estn en tiempo real, como el masterizado de DVDs un Coder podra usar dos pasadas para codificar la entrada de video: una pasada para identificar las dificultades o reas de entropa alta y crear una estrate- gia de codificacin y una segunda pasada para comprimir en realidad la entrada de video. 2.13 Wavelets Todas las transformadas sufren de cierta incertidumbre ya que entre ms exactamente se conozca el dominio de la frecuencia menos exacto ser el dominio del tiempo (y viceversa). En la mayora de las transformadas como la de Fourier de transporte o DFT (Discreet Fourier Transport) y la trans- formada discreta de coseno o DCT (Discreet Cosine Transform), la longitud del bloque es fija por lo que el tiempo y la resolucin de frecuencia tambin sern fijos. Los coeficientes de frecuencia representan valores espaciados a la misma distancia en una escala lineal. Desafortunadamente, debido a que los sentidos humanos son logartmicos, la escala uniforme del DFT y de la DCT nos da una resolucin de frecuencia inadecuada en un extremo y un exceso de resolucin en el otro.
Figura 2-18 La transformada wavelet no es afectada por ese problema porque su reso- lucin de frecuencia es una fraccin fija de una octava y por tanto tendr una caracterstica logartmica. Esto se hace cambiando la longitud del bloque como una funcin de la frecuencia. A medida que disminuye una frecuencia, el bloque se har ms largo. As, una caracterstica de la trans- formada wavelet es que todas las funciones de base contendrn el mismo nmero de ciclos y estos se escalarn simplemente a lo largo del eje del tiempo para buscar diferentes frecuencias. La Figura 2-18 contrasta el tamao fijo de los bloques de DFT/DCT con el tamao variable del wavelet. Los wavelets son especialmente tiles para la codificacin de audio porque automticamente se adaptan a los requerimientos en conflicto de la locali- zacin exacta de los transitorios en tiempo y dan una valoracin exacta de las frecuencias de los tonos estables. Para la codificacin de video, las wavelets tienen la ventaja de producir seales de resolucin escalable casi sin esfuerzo extra. En el video en movimiento, las ventajas de las wavelets son contrarrestadas por la dificul- tad de asignar vectores de movimiento a un bloque de tamao variable pero la dificultad para codificar imgenes fijas o imgenes I- no es nada que deba preocupar. La codificacin wavelet ha mostrado beneficios particulares para aplicaciones con muy baja relacin de bits. Los artifacts generados por una cuantizacin excesiva de los coeficientes de la wavelet aparecen como smearing, y este es mucho menos objetable que la apariencia de bloques que provoca una cuantizacin excesiva de los coeficientes de DCT.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 23 Seccin 3 Compresin de Audio La compresin de audio con prdidas est completamente basada en las caractersticas de la audicin humana las cuales deben ser consideradas antes de que cualquier descripcin de la compresin sea posible. Sorpresi- vamente, la audicin humana, en particular en estreo, es en realidad ms crticamente discriminatoria que la visin humana y consecuentemente la compresin de audio debe ser considerada con cuidado. Como con la compresin de video, la de audio requiere cierto nmero de diferentes niveles de complejidad de acuerdo al factor de compresin requerido. 3.1 El mecanismo de audicin La audicin comprende procesos fsicos en el odo y los procesos nervio- so/mentales que combinados nos dan la impresin de sonido. La impresin que recibimos no es idntica a la forma de onda acstica real presente en el canal auditivo debido a que cierta entropa se pierde. Los sistemas de compresin de audio que pierden solo la parte de la entropa que se perde- r por el mismo mecanismo de audicin producirn buenos resultados. El mecanismo fsico de la audicin est formado por el odo externo, el medio y el interno. El odo externo comprende el canal auditivo y el tmpa- no. Este convierte el sonido incidente en una vibracin en una forma muy similar a como lo hace el diafragma de un micrfono. El odo interno trabaja censando las vibraciones transmitidas a travs de un fluido. La impedancia del fluido es mucho mayor que la del aire y el odo medio acta como un transformador de impedancias de acoplamiento que mejora la transferencia de potencia. La Figura 3-1 muestra que las vibraciones se transfieren al odo interno por medio del estribo que acta en la ventana oval. Las vibraciones en el fluido en el odo viajan por el caracol, una cavidad espiral en el crneo (se muestra desenrollado en la Figura 3-1 por claridad). La membrana basilar est estirada sobre el caracol. La membrana vara en masa y rigidez a lo largo de su longitud. Al final, cerca de la ventana oval, la membrana es rgida y ligera por lo que su frecuencia resonante es alta. En el extremo distante la membrana es pesada y suave y resuena a frecuencias bajas. El rango de las frecuencias resonantes disponibles determina el rango de frecuencia de la audicin humana, la cual, en la mayora de la gente es de 20 Hz a 15 KHz. Diferentes frecuencias a la entrada de sonido harn que diferentes reas de la membrana vibre. Cada rea tiene diferentes terminaciones nerviosas para permitir la discriminacin de los tonos. La membrana basilar tambin tiene pequeos msculos controlados por los nervios que juntos actan como una clase de sistema de retroalimentacin positiva que mejora el factor Q de la resonancia. El comportamiento resonante de la membrana basilar tiene un comporta- miento exactamente paralelo al de un analizador de transformadas. De acuerdo con la teora de incertidumbre de las Transformadas, entre mas exactamente se conozca el dominio de la frecuencia de una seal menos exactamente se conocer el dominio del tiempo. Consecuentemente, entre ms capaz sea una transformada de discriminar entre dos frecuencias, menos capaz ser discriminar entre el tiempo de dos eventos. La audicin humana ha evolucionado con un cierto compromiso que balancea la incerti- dumbre de discriminacin en el tiempo y la frecuencia; en el balance, nin- guna capacidad ser perfecta. La discriminacin imperfecta de la frecuencia provoca la incapacidad para separar frecuencias con muy poco espacio entre s. Esta incapacidad es conocida como enmascaramiento de auditorio, definido como la sensibili- dad reducida a un sonido en presencia de otro. La Figura 3-2a (vea la siguiente pgina) muestra que el umbral de audicin es una funcin de la frecuencia. La mayor sensibilidad estar, no sorpresi- vamente, en el rango del habla. En la presencia de un tono simple, el umbral es modificado como se ve en la Figura 3-2b. Note que el umbral se eleva para tonos de mayor frecuencia y hasta cierto punto a menor fre- cuencia. En la presencia de un espectro de entrada complejo, como la msica, el umbral se eleva a casi a todas las frecuencias. Una consecuen- cia de este comportamiento es que el hissde un cassette de audio anal- gico solo ser audible durante los pasajes ms tranquilos de la msica. El Compander usa este principio amplificando las seales de audio de bajo nivel antes de la grabacin o transmisin y luego las regresa con el nivel adecuado.
Figura 3-1
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 24
Figura 3-2a La discriminacin imperfecta del odo es debida a su respuesta resonante. El factor Q es tal que un sonido dado tienen que estar presente por lo menos 1 milisegundo antes de que sea audible. Debido a esta respuesta lenta, el enmascaramiento an puede llevarse a cabo cuando las dos seales involucradas no sean simultneas. El enmascaramiento adelantado y retrasado ocurre cuando el sonido enmascara- dor continua enmascarando los sonidos a niveles ms bajos antes y despus de la duracin real del sonido enmascarado- LA Figura 2-2 muestra este concepto. El enmascaramiento eleva el umbral de audicin y los Compresores aprovechan este efecto elevando el ruido de piso lo que permite que la forma de onda de audio sea expresada con menos bits. El ruido de piso solo puede ser elevado a frecuen- cias a las cuales hay un enmascaramiento efectivo. Para maximizar el efecto del enmascaramiento es necesario dividir el espectro de audio en diferentes bandas de frecuencia para permitir la introduccin de diferentes cantidades de compandingy ruido en cada banda.
Figura 3-3
Figura 3-2b 3.2 Codificacin sub banda La Figura 3-4 muestra un Compander divisor de banda. El filtro de divisin de banda es un juego de filtros de fase lineal de banda estrecha que se sobreponen entre s y todos tienen el mismo ancho de banda. La salida de cada banda consiste de muestras que representan una forma de onda. En cada banda de frecuencia la entrada de audio es amplificada hasta un nivel mximo antes de la transmisin. Despus de eso, cada nivel regresar a su valor correcto. El ruido captado en la transmisin es reducido en cada banda si la reduccin de ruido es comparable con el umbral de audicin. Se puede ver que se puede tolerar mayor ruido en algunas bandas debido al enmascaramiento. Consecuentemente, en cada banda, despus del companding, es posible reducir la longitud de las palabras de las muestra. Esta tcnica logra la compresin debido a que el ruido de cuantizacin introducido por la prdida de resolucin es enmascarado.
Figura 3-4
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 25
Figura 3-5
La Figura 3-5 muestra un Coder divisor de banda como el que se usa en MPEG capa 1. La entrada de audio digital es alimentada a un filtro de divisin de bandas que divide el espectro de la seal en un nmero deter- minado de bandas. En MPEG este nmero es 32. El eje del tiempo es dividido en bloques de igual longitud, de nuevo, en MPEG capa 1 hay 384 muestras de entrada, entonces habrn 12 muestras en cada una de las 32 bandas a la salida del filtro. Dentro de cada banda el nivel es amplificado por multiplicacin para llevar el nivel al mximo. La ganancia requerida es constante para la duracin del bloque y se transmite un factor de escala simple con cada bloque para cada banda con el fin de permitir la inversin del proceso en el Decoder. La salida del banco de filtros para MPEG capa 1 se analiza usando una FFT de 512 puntos para determinar el espectro de la seal de entrada. Este anlisis conduce a un modelo de enmascaramiento que determina el grado de enmascaramiento que se puede esperar en cada banda. Entre ms enmascaramiento est disponible, menos exactas necesitarn ser las muestras en cada banda. La exactitud de la muestra es reducida recuanti- zando para reducir la longitud de las palabras. Esta reduccin tambin es constante para cada palabra en una banda pero diferentes bandas pueden usar diferentes longitudes de palabra. Las longitudes de palabra necesitan ser transmitidas como un cdigo de asignacin de bits para cada banda para permitirle al Decoder deserializar adecuadamente el stream de bits.
Figura 3-6 3.3 MPEG Capa 1 La Figura 3-6 muestra un stream de bits de audio en MPEG capa 1. Des- pus del patrn de sincronizacin y el encabezador hay cdigos de asigna- cin de 32 bits de 4 bits cada uno. Esos cdigos describen la longitud de la palabra de las muestras en cada sub banda. Despus vienen los factores de escala 32 usados para el Companding de cada banda. Esos factores de escala determinan la ganancia necesaria en el Decoder para regresar el audio a su nivel correcto. Los factores de escala, a su vez, son seguidos por los datos de audio de cada banda.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 26
Figura 3-7
La Figura 3-7 muestra el Decoder de capa 1. El patrn de sincronizacin es detectado por el Generador de temporalizacin que deserializa la asignacin de bits y los datos del factor de escala. Los datos de asignacin de bits entonces permitirn la deserializacin de las muestras de longitud variable. La recuantiza- cin es invertida y la compresin es invertida por los datos del factor de escala para regresar cada banda al nivel correcto. Esas 32 bandas separadas son entonces combinadas en un filtro combinador que produce la salida de audio. 3.4 MPEG Capa 2 La Figura 3-8 muestra que cuando se usa el Filtro de divisin de banda para controlar el modelo de enmascaramiento, el anlisis espectral no es muy exacto ya que solo hay 32 bandas y la energa puede estar en cualquier parte de la banda. El ruido de piso no se puede elevar mucho porque, en el peor de los casos conocidos, el enmascaramiento no podra operar. Un anlisis espectral ms exacto permitira un factor de compresin ms alto. En MPEG capa 2, el anlisis espectral es ejecutado por medio de un proceso separado. En este caso se usa una FFT (Fast Fourier Transform o Transformada rpida de Fourier) de 1024 puntos trabajando directamente desde la entrada para controlar el modelo de enmascaramiento. Para resolver las frecuencias ms exactamente, la exten- sin de tiempo de la transformada se tiene que incrementar lo cual se hace elevando el tamao del bloque a 1152 muestras. Mientras que el esquema de compandingde bloque es el mismo que para la capa 1, no todos los factores de escala se transmiten ya que contienen cierto grado de redundancia en el material de programa real. El factor de escala de bloques sucesivos en la misma banda difieren por 2 dB, menos del 10% del tiempo y la ventaja es aprovechada por esta caracterstica analizando juegos de tres factores de escala sucesivas. Cuando el contenido de la sub banda es aproximadamente constante (conocido como programa estacionario o quasi estacionario), solo un factor de escala de entre los tres es enviado. A medida que el contenido transitorio se incrementa en una sub banda determinada dos o tres factores de escala se enviarn. Tambin se enviar un cdigo de seleccin de factor de escala para permitirle al Decoder determinar que se va a enviar en cada sub banda. Esta tcnica divide a la mitad en forma muy efectiva la relacin de bits del factor de escala.
Figura 3-8
3.5 Codificacin de transformada Las capas 1 y 2 estn basadas en filtros de divisin de banda en los que la seal sigue siendo representada como una forma de onda sin embargo, la capa 3 adopta una codificacin de transformada similar a la que se usa para la codifica- cin de video. Como se mencion antes, el odo ejecuta una clase de transfor- mada de frecuencia al sonido incidente y debido al factor Q de la membrana basilar, la respuesta no se puede incrementar o reducir rpidamente. Conse- cuentemente, si una forma de onda de audio es transformada al dominio de la frecuencia, no es necesario que los coeficientes se enven muy frecuentemente. Este principio es la base de la codificacin de transformada. Para factores de compresin ms altos se pueden recuantizar los coeficientes hacindolos menos exactos. Este proceso produce ruido que ser colocado en frecuencias en las que el enmascaramiento sea mayor. Uno de los resultados del uso del Coder de transformada es que el espectro de entrada es conocido con exactitud por lo que se podr crear un modelo de enmascaramiento preciso.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 27 3.6 MPEG Capa 3 Este complejo nivel de codificacin en realidad solo es requerido cuando se necesita el ms alto nivel de compresin. Tiene un alto grado de cosas en comn con la capa 2. Una transformada discreta de coseno se usa con 384 coeficientes de salida por bloque. Esta salida puede ser obtenida procesando directamente las muestras de entrada pero en un Coder de niveles mltiples es posible usar una transformada hbrida incorporando un filtraje a 32 bandas de las capas 1 y 2 como base. Si se hace esto, las 32 sub bandas del QMF (Qua- drature Mirror Filter o filtro de espejo de cuadratura) se procesarn adems con un MDCT (Modified Discreet Cosine Transform, Transformada Discreta de Coseno modificada) para obtener 384 coeficientes de salida. Se usan dos tamaos de ventana para evitar el pre eco en los transitorios. La conmutacin de ventana es ejecutada por el modelo psicoacstico. Se ha encontrado que el pre eco esta asociado con la entropa en el audio que se eleva por encima del valor promedio. Para obtener el factor de compresin ms alto se usa la cuantizacin no uniforme de los coeficientes junto con la codifica- cin Huffman. Esta tcnica asigna las longitudes de palabra ms cortas a los valores de cdigo ms comunes. 3.7 Audio MPEG-2 Aunque originalmente fueron designados como niveles de audio MPEG 1, 2 y 3, los sistemas ahora son conocidos con ms exactitud como MPEG-1 Nivel 1, etc. MPEG-2 define extensiones para el audio MPEG-1 y un nuevo sistema de codificacin avanzado. MPEG-2 permite el uso del muestreo a relaciones ms bajas que MPEG-1. Esto no es exactamente compatible con lo anterior pero solo requiere tablas adiciona- les en un Decoder MPEG-1 para la interoperatibilidad. El audio MPEG-2 BC (compatible con el anterior) proporciona 5.1 canales (5 canales de ancho de banda complete ms un canal de efectos de baja frecuen- cia y bajo ancho de banda), MPEG-2 BC tiene un stream de bits MPEG-1 (2 canales) en su ncleo y adicio- na las extensiones de canales mltiples en un formato que ser ignorado por un Decoder MPEG-1. MPEG-2 AAC (Advanced Audio Coding, Codificacin avanzada de audio) es un sistema ms sofisticado con bancos de filtros de mayor resolucin y herramien- tas de codificacin adicionales. Ofrece una eficiencia de codificacin significati- vamente mayor pero no es compatible con lo anterior.
3.8 MPEG-4 Audio La codificacin MPEG-4 est basada en objetos (vea la seccin 4.4.2). El audio en MPEG-4 puede representar sonidos naturales o sintticos. Para la codifica- cin de audio natural, el kit de herramientas de MPEG-4 incluye el MPEG-2 AAC as como una variedad de otras herramientas. Estas incluyen la codificacin paramtrica para relaciones de bit muy bajas y una tcnica conocida como codificacin predictiva lineal excitada por cdigo o CELP (Code Excited Linear Predictive) para la codificacin de la voz con relaciones de bits de rango medio. Se respaldan varias formas de escalabilidad incluyendo la escalabilidad del stream de bits que puede ser aplicada en puntos determinados en el sistema de transmisin. El uso de la codificacin de objetos permite hacer elecciones en el punto de decodificacin. Por ejemplo, se puede transmitir un concierto como dos objetos: orquesta y solista. La decodificacin normal presentar el trabajo com- pleto pero un instrumentista puede decodificar solo el objeto orquestay ejecu- tar la parte del solista en vivo. Otras aproximaciones similares pueden permitir la codificacin de programas de tal manera que el auditorio pueda seleccionar un modo de mix minuspara eliminar los comentarios de, digamos, un evento deportivo. Las capacidades de audio sinttico de MPEG-4 se usarn, sin duda, en forma extensa en el futuro. Estas incluyen las capacidades de texto a vozy tcnicas controladas por el resultadoen los que la msica es sintetizada con instrumen- tos descargados usando el lenguaje estructurado de orquesta de audio o SAOL (Structured Audio Orchestra Language).
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 28 3.9 AC-3 La tcnica de codificacin de audio AC-3, inventada por los Laboratorios Dolby se usa con el sistema ATSC en lugar de uno de los esquemas de codificacin de audio en MPEG. Est documentado como Norma ATSC a/52. Subsecuen- temente, el AC-3 fue adoptado como una componente opcional de la DVB y por el sistema de Motorola Digicypher II. AC-3 es un sistema basado en transforma- das que obtiene una ganancia de codificacin recuantizando los coeficientes de la frecuencia. La entrada PCM de un Coder AC-3 es dividida en bloques con ventanas que se sobreponen como se muestra en la Figura 3-9. Esos bloques contienen 512 muestras cada uno pero debido a la sobreposicin completa hay una redundan- cia del 100%. Despus de la transformada hay 512 coeficientes en cada bloque pero debido a la redundancia, esos coeficientes se pueden reducir a 256 coefi- cientes usando una tcnica llamada cancelacin de aliasing en el dominio del tiempo o TDAC (Time Domain Aliasing Cancellation. La forma de onda de la entrada se analiza y si hay un transitorio significativo en la segunda mitad del bloque, la forma de onda se dividir en dos para evitar el pre eco. En este caso, el nmero de coeficientes permanece igual, pero la resolucin de la frecuencia se dividir a la mitad y la resolucin temporal se duplicar. Se establecer una bandera en el stream de bits para indicarle al Decoder que se hizo esto. Los coeficientes son sacados en notacin de punto flotante como una mantisa y un exponente. La representacin es el equivalente binario de la notacin cientfi- ca. Los exponentes son efectivamente factores de escalado. El juego de expo- nentes en un bloque produce un anlisis espectral de la entrada con una exacti- tud finita en una escala logartmica llamada envolvente espectral. El anlisis espectral es la entrada al modelo de enmascaramiento que determina el grado al cual el ruido puede elevarse en cada frecuencia.
Figura 3-9 El modelo de enmascaramiento controla el proceso de recuantizacin que reduce la exactitud de cada coeficiente redondeando la mantisa. Una proporcin significativa de los datos transmitidos consiste de valores de mantisa. Los exponentes tambin son transmitidos pero no directamente ya que contie- nen redundancias que se pueden explotar. Dentro de un bloque solo el primer exponente (menor frecuencia) es transmitido en forma absoluta. Los exponentes restantes se transmiten en forma diferencial y el Decoder adiciona la diferencia al valor previo. Donde el audio de entrada tenga un espectro suave, los expo- nentes en muchas bandas de frecuencia pueden ser los mismos. Los exponen- tes se pueden agrupar en juegos de dos o cuatro con banderas que describan lo que se ha hecho, J uegos de 6 bloques se ensamblan en un cuadro de sincrona AC-3. El primer bloque del cuadro siempre tiene todos los datos de exponentes pero en casos de seales estacionarias, los ltimos bloques en el marco pueden usar los mismos exponentes.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 29 Seccin 4 Las normas MPEG Las secciones 2 y 3 presentaron las tecnologas de compresin de audio y video y muchas de las herramientas usadas en las normas MPEG. Esta seccin examina la historia y estructura de MPEG y la evolucin de varias de las normas MPEG. 4.1 Que es MPEG? MPEG es el Grupo de expertos de imgenes en movimiento, un comit al servicio de la Organizacin Internacional de Normas o ISO (International Stan- dards Organization) y la Comisin Electrotcnica Internacional o IEC (Internatio- nal Electrotechnical Commission). La IEC maneja la normalizacin internacional para las tecnologas elctrica y electrnica; ISO virtualmente maneja todo lo dems. Al inicio de la edad de la tecnologa de la informacin ISO e IEC forma- ron un comit tcnico (J TC1) para que se ocupara de las cosas relacionadas con la IT. El J TC1 tiene un nmero de grupos de trabajo, incluyendo J PEG (J oint Photographic Experts Group, Grupo de expertos en fotografa) y WG11 que es MPEG. El comit fue formado en 1988 bajo el liderazgo del convocante, Dr. Leonardo Chiariglione de Italia. La concurrencia a las reuniones de MPEG, normalmente mantenidas 4 veces al ao ha crecido de unos 15 delegados en 1988 a unos 300 en 2002. Establecieron un precedente envidiable de genera- cin de normas que lograron una adopcin extensa, MPEG-1, MPEG-2 y la norma de compresin de audio MP3 (MPEG-1 Audio, capa 3). Esta reputacin fue empaada de alguna forma por MPEG-4, no debido a deficiencias en la norma sino como resultado del largo retraso para publicar los trminos de la licencia y la fuerte reaccin adversa a los primeros trminos que eventualmente se publicaron a principios de 2002. Se debe hacer notar que MPEG por si misma no juega ningn papel para el licenciamiento. Como comit de ISO e IEC, requiere que las tecnologas inclui- das en sus normas sean licenciables bajo trminos razonables y no discrimina- toriospero no hay una definicin aceptada de razonable. El licenciamiento es responsabilidad de quienes poseen las patentes relevantes y esto tpicamente implica muchas organizaciones por todo el mundo que han contribuido a la investigacin y el desarrollo y quieren ver alguna recompensa. Para MPEG-2, quienes tienen la patente se agruparon y formaron MPEG-LA (Grupo MPEG para autorizar licencias). Todas las patentes esenciales son certificadas por este grupo y son licenciadas como un bloque a cualquier organi- zacin que quiera implementar las normas. Esto funcion bien para MPEG-2, pero como se mencion antes, se estn experimentando mayores dificultades con MPEG-4 y mucha gente responsabiliza a los retrasos en la publicacin de los trminos de la licencia por la actual falta de xito comercial de MPEG-4 (Esto, por supuesto, puede cambiar. El foro industrial de MPEG-4 est trabajan- do muy fuerte para encontrar soluciones aceptables para quienes ostentan las patentes y los usuarios potenciales y revisando las propuestas aparecidas a mediados del 2002 que son ms factibles de ser aceptadas ms fcilmente).
4.2 MPEG-1 El sistema MPEG-1, ISO/IEC 11172, es la primera norma de compresin para imgenes en movimiento y fue desarrollada entre 1988 y 1992. Usa transforma- das de DCT, cuantizacin de coeficientes y codificacin de longitud variable en una forma similar a J PEG pero tambin incluye la compensacin de movimiento para la compresin temporal. Ponindola en tres partes tendramos:
Sistema ISO/IEC 11172-1, la estructura mltiplex ISO/IEC 11172-2, codificacin de video ISO/IEC 11172-3, codificacin de audio MPEG-1 represent un logro tcnico excepcional. Fue diseada para comprimir Streams de imagen con tamaos de imagen SIF, 352x288 (25-Hz PAL) o 352x240 (30Hz NTSC) y el audio asociado a, aproximadamente 1.5 Mbits/s de relacin de datos comprimidos total. Esta relacin es adecuada para el transpor- te en circuitos de datos T1 y para la reproduccin desde CD-ROM; corresponde aproximadamente a la resolucin de una grabadora de video de consumidor. Una medicin de este logro puede verse comparando los nmeros de un CD de audio. Un CD de audio normal que transporta dos canales de audio con una resolucin de 16 bits, con una relacin de muestreo de 44.1 kHz, tiene una relacin de transferencia de datos de hasta 1.5 Mbit/s. MPEG-1 comprime el audio y video de tal forma que ambos puedan ser trans- mitidos con la misma relacin de datos! El formato CIF es un compromiso entre los formatos Europeo y Americano SIF (Source Input Format, Formato de fuente de entrada): resolucin espacial para 625 SIF (352x288) y Resolucin temporal 525 SIF (29.97 Hz). Esta es la base para la videoconferencia. MPEG-1 puede ser diseada para imgenes CIF y no tiene herramientas para manejar imgenes entrelazadas por lo que tiene un impacto obviamente peque- o en el mundo del broadcast de televisin. Antes de dejar el MPEG-1, es importante hacer notar lo que en realidad incluye la norma y como se logra la interoperatibilidad. La norma define un juego de herramientas, la sintaxis del stream de bits y la operacin del Decoder. No define la operacin del Encoder cualquier dispositivo que produce un stream de bits sintcticamente vlido que pueda ser decodificado por un Decoder que cumpla con esta norma ser un Encoder MPEG vlido. Adems, no define la calidad de la imagen ni la calidad de la codificacin. Esto permite la evolucin de la tecnologa de codificacin sin cambiar la norma y sin condenar a la obsoles- cencia los Decoders existentes. Este modelo es usado en todas las normas MPEG. El xito de esta estrategia es obvia, aunque MPEG-2 se usa para video, MPEG-1 capa 2 audio an se usa como sistema de compresin principal para audio en los sistemas actuales de transmisin DVB.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 30 4.3 MPEG-2 MPEG-1 fue congelada (es decir, los cambios subsiguientes solo se permitieron a nivel editorial) en 1991. En el mismo ao el proceso de MPEG-2 empez y eventualmente se convirti en una norma en 1994. Las metas iniciales fueron simples; haba la necesidad de una norma que pudiera acomodar video con calidad de broadcast. Esto requera la codificacin de imgenes de definicin estndar a tamao completo (704x480 a 29.97 Hz y 704x576 a 25 Hz) y la capacidad de codificar video entrelazado eficientemente. En muchas formas MPEG-2 representa la siguiente erade MPEG. La mayor flexibilidad de MPEG-2 combinada con la disponibilidad incrementada de circui- tos integrados con gran escala de integracin implic que MPEG-2 pudiera usarse en un vasto nmero de aplicaciones. El xito de MPEG-2 se destaca mejor con la muerte de MPEG-3 diseada para televisin de alta definicin. MPEG-3 pronto fue abandonada cuando qued claro que MPEG-2 poda aco- modar esta aplicacin con facilidad. MPEG-2 es, por supuesto, la base tanto para las normas de broadcast ATSC y DVB como del sistema de compresin usado por el DVD. Tambin se permiti que MPEG-2 fuera un blanco mvil. Con el uso de los perfiles y niveles, que se discutirn ms abajo fue posible completar la norma para una aplicacin pero luego moverse para acomodar aplicaciones ms demandantes en una forma evolutiva. Los trabajos para extender MPEG-2 continan en 2002. MPEG-2 es documentada como ISO/IEC 13818, actualmente en 10 partes. Las partes ms importantes de esta norma son:
ISO/IEC 13818-1 Sistemas (transporte y streams de programa), PES, T-STD modelo de Buffer y las tablas PSI bsicas: CAT, PAT, PMT y NIT. ISO/IEC 13818-2 codificacin de video ISO/IEC 13818-3 codificacin de audio ISO/IEC 13818-4 Prueba y conformidad MPEG ISO/IEC 13818-6 transmisin de datos y DSMCC.
Uno de los logros principales de MPEG-2 definido en 13818-1, el stream de transporte, se describe en la Seccin 8. La flexibilidad y robustez de este diseo ha permitido que sea utilizado por muchas aplicaciones incluyendo el transporte de datos de MPEG-4 y MPEG-7. Nota: Los streams de transporte de DVB y ATSC llevan PES de video y audio dentro de agrupaciones de programaque son completamente diferentes a los streams de programa(estos son usados en DVD y CD), Los streams de transporte MPEG normalmente son de relaciones de bits cons- tantes pero los streams de programa normalmente son de relaciones de bit variables.
4.3.1 Perfiles y niveles en MPEG-2 Con ciertas excepciones menores, MPEG-1 fue diseada para una tarea; la codificacin de imgenes de tamao fijo y el audio asociado a una relacin de bits conocida de 1.5 Mbits/seg. Las herramientas y sintaxis de MPEG-1 pueden y se han usado para otros propsitos, pero esos usos estn fuera de la norma y requieren de Encoders y Decoders de propietario, Solo hay un tipo de Decoder que cumple con la norma MPEG-1. En sus inicios haba una meta similar para MPEG-2. Esta norma fue diseada para codificar imgenes para broadcast y sonido, nominalmente los sistemas de televisin entrelazados de 525/60 y 625/50; sin embargo, a medida que progre- saba el diseo se hizo aparente que las herramientas que se estaban desarro- llando eran capaces de manejar muchos tamaos de imagen y un amplio rango de relaciones de bit. Adems, se desarrollaron herramientas ms complejas para sistemas de codificacin escalables. Esto implic que en la prctica no podra haber un Decoder MPEG-2 sencillo. Si un Decoder que cumpliera con la norma tena que ser capaz de manejar streams de bit de alta velocidad codifica- dos usando todas las herramientas posibles ya no podra ser un Decoder eco- nmico para aplicaciones estndar. Como ejemplo simple, un dispositivo capaz de decodificar seales de alta definicin a, digamos, 20 Mbits/seg, sera subs- tancialmente ms caro que uno limitado a las seales de definicin estndar de unos 5 Mbits/seg. Sera una norma muy pobre la que requiriera el uso de un dispositivo caro para una aplicacin simple. MPEG dise una estructura bidimensional de perfiles y niveles para clasificar los streams de bits y Decoders. Los perfiles definen las herramientas que se pueden usar, Por ejemplo, la codificacin bidireccional (cuadros B-) pueden ser usados en el perfil principal pero no en el perfil simple. Los niveles relacionan solo la escala. Un Decoder de alto nivel debe ser capaz de recibir un stream de bits ms rpido y debe tener ms Buffer de Decoder y Almacenes de cuadro ms grandes que un Decoder de nivel principal; sin embargo, el perfil principal a nivel alto (MP@HL) y el perfil principal a nivel principal (MP@ML) usan exacta- mente las mismas herramientas de codificacin/decodificacin y elementos de sintaxis. La Figura 4-1 muestra el pareado de perfiles y niveles que son definidos por MPEG-2 (Perfiles en el eje horizontal, Niveles en el vertical). Hay que hacer notar que no todas las combinaciones son vlidas; solo los pares completados estn definidos en la norma. Es un requerimiento de conformidad con la norma que un Decoder en cualquier Perfil/Nivel debe ser capaz de decodificar los perfiles y niveles ms bajos. Por ejemplo, un Decoder MP@ML debe ser capaz de decodificar streams de bit de perfil principal a nivel bajo (MP@LL) y de perfil simple a nivel principal (SP@ML).
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 31
Figura 4-1 El perfil simple no respalda la codificacin bidireccional y por tanto solo las imgenes I- y P- formarn la salida. Esto reduce el retraso de codificacin y decodificacin y permite un hardware ms simple. El perfil simple solo ha sido definido a nivel principal. El perfil principal est diseado para una gran cantidad de usos. El nivel principal usa una entrada de baja resolucin que solo tiene 352 pixeles por lnea. La mayora de las aplicaciones de broadcast requerirn el subjuego de MPEG MP@ML que respalda la SDTV (Standard Definition TV, Televisin de definicin estndar). El nivel high-1440 es un esquema de alta definicin que duplica la definicin en comparacin con el nivel principal, El nivel alto no solo duplica la resolucin sino que mantiene esa relacin para el formato 16:9 incrementando el nmero de muestras horizontales de 1440 a 1920. En los sistemas de compresin que usan la transformada espacial y la recuanti- zacin es posible producir seales escalables. Un proceso escalable es aqul en el que la entrada da como resultado una seal principal y una seal auxiliar. La seal principal ser puede decodificada sola para dar una imagen de una cierta calidad pero si la informacin de la seal auxiliar se adiciona se puede mejorar algn aspecto de calidad. Por ejemplo, un Coder MPEG convencional, recuantizando fuertemente los coeficientes, puede codificar una imagen con resultados moderados de propor- cin seal a ruido. Sin embargo, si esa imagen es decodificada localmente y substrada pxel a pxel de la original, se tendr como resultado una imagen con ruido de cuantizacin. Esa imagen puede ser comprimida y transmitida como seal auxiliar. Un Decoder simple solo decodificar el stream de bits principal ruidoso pero un Decoder ms complejo puede decodificar ambos streams de bits y combinarlos para producir una imagen con bajo ruido. Este es el principio de la escalabilidad de SNR (Signal-to-Noise Ratio. Relacin seal a ruido).
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 32 Como alternativa, codificando solo las frecuencias espaciales ms bajas en una imagen de HDTV podemos producir un stream de bits principal que un receptor de SDTV puede decodificar. Si la imagen de menor definicin es decodificada localmente y substrada de la imagen original tendremos como resultado una imagen de definicin mejorada. Esta imagen puede ser codificada en una seal auxiliar. Un Decoder adecuado puede combinar las seales principal y auxiliar para recrear la imagen de HDTV. Este es el principio de la escalabilidad espa- cial. El perfil alto respalda tanto la SNR y la escalabilidad espacial as como permite la opcin de muestreo en 4:2:2. El perfil 4:2:2 ha sido desarrollado para mejorar la compatibilidad con el equipo de produccin digital. Este perfil permite la operacin a 4:2:2 sin requerir la complejidad adicional del uso del perfil alto. Por ejemplo, un Decoder HP@ML debe soportar la escalabilidad de SNR que no es un requerimiento para la produccin. El perfil 4:2:2 tiene la misma libertad de estructura del GOP que los otros perfiles pero en la practica se usa comnmente con GOPs cortos haciendo que sea ms sencilla la edicin. La operacin en 4:2:2 requiere una relacin de bits mayor que 4:2:0 y el uso de GOPs cortos requiere una relacin de bits ms alta y pareja para una calidad dada. El concepto de los perfiles y niveles es otro de los desarrollos de MPEG-2 que ha probado ser robusto y extensible; MPEG-4 usa un arreglo mucho ms com- plejo de perfiles y niveles que discutiremos ms adelante. 4.4 MPEG-4 La normalizacin internacional es un proceso lento y los avances tecnolgicos que frecuentemente ocurren pueden incorporarse a una norma que se esta desarrollando. Frecuentemente esto es deseable pero el mejoramiento continuo puede significar que la norma nunca llega a terminarse y ser usual. Para asegu- rar que una norma eventualmente se termine hay reglas estrictas que prohben los cambios sustantivos despus de cierto punto del proceso de normalizacin, As, para el momento en el que la norma se adopta oficialmente frecuentemente hay una acumulacin de mejoramientos deseados y extensiones. Esto pas con MPEG-2. Como se discuti antes, MPEG-3 se comenz y se abandon; enton- ces el siguiente proyecto se convirti en MPEG-4. Actualmente hay dos versio- nes completas de MPEG-4 y se sigue trabajando en otras extensiones. Al principio el enfoque principal de MPEG-fue la codificacin de video y audio a relaciones muy bajas. De hecho, la norma fue explcitamente optimizada para tres rangos de relaciones de bit::
Por debajo de 64 kbits/s. 64 a 384 kbits/s. 384 kbits/s a 4 Mbits/s El desempeo a relaciones de bit bajas permaneci como objetivo principal y algunas ideas muy creativas contribuyeron para ese fin. Tambin se prest mucha atencin a la resistencia a los errores haciendo que MPEG-4 sea muy til para su uso en ambientes propensos a errores como la transmisin a dispo- sitivos personales manuales; sin embargo, otros perfiles y errores usan relacio- nes de bits de hasta 38.4 Mbits/s y an se est trabajando en perfiles y niveles con calidad de estudio usando relaciones de datos de hasta 1.2 Gbits/s. Ms importante, MPEG-4 se ha convertido en mucho ms que otro sistema de compresin, ha evolucionado hacia un nuevo concepto de codificacin multime- dia con poderosas herramientas para interactividad y un vasto rango de aplica- ciones. An la introduccinoficial de esta norma se extiende por 67 pginas, por lo que aqu solo es posible dar una breve introduccin al sistema. 4.4.1 Documentos de la norma MPEG-4 Las partes principales de las normas MPEG-4 son:
ISO/IEC 14496-1 Sistemas ISO/IEC 14496-2 Visual ISO/IEC 14496-3 Audio ISO/IEC 14496-4 Pruebas de conformidad ISO/IEC 14496-6 Marco de trabajo para la integracin o DMIF (Delivery Multimedia Integration Framework) 4.4.2 Codificacin de objetos La desviacin ms significativa de los sistemas de transmisin convencionales es el concepto de los objetos. Diferentes partes de la escena final se pueden codificar y transmitir por separado como objetos de audio y de video que hay que juntar o componer con el Decoder. Diferentes tipos de objeto pueden ser codificados independientemente con las herramientas ms adecuadas para el trabajo. Los objetos pueden generarse independientemente o se puede analizar una escena por separado, por ejemplo, los objetos del background o del fore- ground. En una demostracin muy interesante, la cobertura de video de un partido de football soccer fue procesada para separar la pelota del resto de la escena. El background (la escena sin la pelota) se transmiti como un teaser para atraer audiencia al evento en pay-per-view: cualquier persona poda ver a los jugadores en el campo pero solo aquellos que pagaron podan ver el baln.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 33
Figura 4-2
La aproximacin orientada a objetos nos lleva a tres caractersticas clave de los streams MPEG-4:
Los objetos mltiples pueden ser codificados usando diferentes tcnicas y componerseen el Decoder Los objetos pueden ser de origen natural, como las escenas de una cmara o sintticas como el texto. Las instrucciones en el stream de bits y/o la eleccin del usuario pueden habilitar muchas presentaciones diferentes del mismo stream de bits. El sistema generalizado para la codificacin de objetos en MPEG-4 se muestra en la Figura 4-2. Este diagrama tambin enfatiza las oportunidades de interac- cin con el usuario dentro de los sistemas MPEG-4 una funcin muy podero- sa, particularmente para los diseadores de juegos de video. Esas capacidades no tienen que ser usadas, MPEG-4 proporciona la codifica- cin tradicional de audio y video y mejora MPEG-2 al ofrecer una eficiencia mejorada y resistencia a los errores; sin embargo, la verdadera potencia de MPEG-4 viene de la arquitectura descrita anteriormente, La codificacin de objetos de forma independiente ofrece un nmero de ventajas. Cada objeto puede ser codificado en la forma ms eficiente y se pueden usar diferentes relaciones de escalamiento espacial o temporal (ver 4.4.3) como sea apropiado.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 34
Figura 4-3
4.4.3 Codificacin de audio y video Muchas de las herramientas de codificacin de video en MPEG-4 son similares a las de MPEG-2 pero mejoradas por el mejor uso de la codificacin predictiva y una codificacin de entropa ms eficiente; sin embargo, la aplicacin de las herramientas puede diferir significativamente de las primeras normas. MPEG-4 codifica objetos de video. En el modelo ms simple un video es codifi- cado en una forma muy similar a MPEG-2 pero es descrito como un objeto de video simple con una forma rectangular. La representacin de la imagen es conocida como codificacin de textura. Donde haya ms de un objeto de video, algunos podran tener formas irregulares y generalmente sern ms pequeos que un objeto en background de pantalla completa. Esto significa que solo el rea activa del objeto necesitar ser codificada pero la forma y posicin tambin puede ser representada. La norma incluye herramientas para la codificacin de la forma de objetos rectangulares e irregulares en sus representaciones ya sea binarias o en escala de grises (similar a un canal alpha). Este concepto se muestra en la Figura 4-3. En forma similar, MPEG-4 usa herramientas similares a las de MPEG-1 y MPEG-2 para la codificacin de audio en vivo y AAC ofrece una mayor eficien- cia. Mltiples objetosde audio pueden codificarse por separado y componer- seen el Decoder. Como con el video, los objetos de audio pueden ser naturales o sintticos.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 35
Figura 4-4
4.4.4 Ecalabilidad En el contexto de la compresin de media la escalabilidad implica la habilidad de distribuir contenido a ms de un nivel de calidad dentro del mismo stream de bits. Tanto MPEG-2 como MPEG-4 proporcionan perfiles escalables usando un modelo convencional; el Encoder genera una capa de base y una o mas capas de mejoramiento como se muestra en la Figura 4-4. La(s) capa(s) de mejora- miento pueden ser descartadas para la transmisin o decodificacin si no se dispone de los recursos suficientes. Esta aproximacin funciona pero todas las decisiones acerca de los niveles de calidad tienen que hacerse en el momento de la codificacin y en la prctica el nmero de capas de mejoramiento estn severamente limitadas (usualmente a una).
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 36
Figura 4-5
Versiones posteriores de MPEG-4 incluyen el perfil de escalabilidad de grano fino o FGS (Fine Grain Scalability). Esta tcnica genera un stream de bits sim- ples que representa el nivel de calidad ms alto pero que permite que las ver- siones de menor calidad se puedan extraer en downstream. El FGS usa la codificacin de bit plano mostrado en concepto en la Figura 4-5. Los coeficientes cuantizados son divididos, un bit a la vez, comenzando con el bit ms significa- tivo. Esto proporciona una representacin tosca del coeficiente (s) ms gran- de(s) (y significativo(s). Otras divisiones subsecuentes proporcionan representa- ciones ms exactas de esos coeficientes ms significativos y aproximaciones toscas de los siguientes ms significativos y as sucesivamente. El escalamiento espacial, incluyendo al FGS, puede ser combinado con el escalamiento temporal que permita la transmisin y/o decodificacin de relacio- nes de cuadro ms bajas cuando los recursos sean limitados. Como se mencio- n antes, los objetos pueden ser escalados en forma diferente; podra ser apropiado que retengan toda la resolucin temporal para un objeto importante en el foreground pero actualizar el background como una relacin menor.
4.4.5 Otros aspectos de MPEG-4 MPEG-4 es enorme y los comentarios que se acaban de hacer solo tocan unos pocos de los muchos aspectos de la norma. Hay perfiles de estudio para codifi- cacin de alta calidad, la cual, junto con la codificacin de objetos permitir el almacenamiento estructurado de todos los elementos separados de un video compuesto. Extensiones adicionales de MPEG-4 podran proporcionar an niveles de calidad adecuados para cine digital. La Figura 4-6 muestra los perfiles de MPEG-4 definidos actualmente. (Note que en este diagrama solo se mues- tran los perfiles; generalmente los niveles mltiples son definidos para cada perfil) Algunos de los tipos de objetos definidos dentro de MPEG-4 son interesantes. Un ejemplo es un sprite. Un Sprite es un objeto esttico en el background, generalmente ms grande que la pantalla o el dispositivo de despliegue. Por ejemplo, la accin de un juego de video puede tener lugar al frente de una escena en el background. Si se usa un spriteun background esttico grande puede ser transmitido una vez y a medida que la accin del juego proceda la parte apropiada del background se ver de acuerdo con el movimiento del puerto de vista.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 37
Figura 4-6
MPEG-4 define los perfiles de animacin tanto faciales como del cuerpo. En cada caso se pude usar una cara o cuerpo preestablecida y se enviarn instruc- ciones para animar este objeto. Alternativamente, el objeto preestablecido puede ser modificado por el stream de bits; por ejemplo, una cara especfica puede se transmitida y luego animada. Las instrucciones sofisticadas de anima- cin relacionadas con el lenguaje permitirn que una cara almacenada lea texto en muchos lenguajes. Algunas personas describen MPEG-4 como la norma para juegos de video y ciertamente muchas de las implementaciones son muy tiles para esta industria; sin embargo, an una examinacin superficial de la norma revela tal riqueza de capacidades y profundidad en cada aspecto que las aplicaciones potenciales no tienen fin.
4.4.6 El futuro de MPEG-4 Como se describi anteriormente, MPEG-4 es un juego de normas de amplio rango con una oferta muy rica de capacidades para muchas aplicaciones. Esta es la teora, en la prctica MPEG-4 puede mostrar pocos xitos. En particular muchos observadores esperaban que MPEG-4 rpidamente se convirtiera en el mecanismo de codificacin dominante para el material audio-visual transmitido por Internet y que reemplazara las varias propuestas de codecs de propietario que se usan actualmente. Esto no ha pasado ni tampoco es probable que pase en el futuro prximo. Hay dos razones para esta falla.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 38 La primera es tecnologa y el desempeo resultante MPEG-4 usa tecnologa de compresin de video basada en la norma H.26x desarrollada por la ITU fechada a principios de los 90s. La distribucin de audio y video por medio de Internet es un negocio altamente competitivo y los tres contendientes principales: Apple, Microsoft y RealNetworks, han implementado esquemas de codificacin de propietario que superan al Codec actual de MPEG-4. La otra razn de la falla (a la fecha) de MPEG-4 es la situacin del licenciamien- to de la patente. Hasta principios del 2002, las compaas que queran imple- mentar MPEG-4 no saban que regalas tenan que pagar a los poseedores de la patente. El esquema de licenciamiento propuesto para los niveles bsicos de MPEG-4 ya se public ahora y encontr una fuerte reaccin adversa de parte de la industria. Los trminos del licenciamiento para los niveles ms sofisticados an son desconocidos. Ciertamente la oferta inicial de los trminos de licencia- miento no ha hecho nada por incrementar la implementacin global de la norma. Sin embargo hay esperanzas para el futuro. Un esfuerzo conjunto de ITU y MPEG, conocido como unin del grupo de video o J VT (J oint Video Team) est trabajando en un Codec conocido como H.26L. Citando al ITU, El diseo del H.26L es un Coder de transformada hbrido de movimiento compensado basado en bloques - similar al sprite pero diferente en muchas cosas especficas rela- cionadas con los diseos anteriores El H.26L incrementa significativamente el nmero de tamaos de bloque disponibles y el nmero de imgenes de referen- cia disponibles para hacer la estimacin de movimiento (1/8 de pxel en algunas implementaciones) y esta basado en un tamao de bloque principal de 4x4 en lugar del 8x8 utilizado en la mayora de sistemas MPEG. Se espera que el H.26L muestre mejoramientos substanciales en eficiencia de codificacin y la meta de los participantes es que el nivel de base, adecuado para el streaming de Internet est libre de regalas. La primera etapa del trabajo del J VT se espera que est completo en 2002 y se publique como MPEG-4 Parte 10. 4.5 MPEG-7 Debido a que se cancel MPEG-3 la secuencia real de las normas fue MPEG-1, MPEG-2 y MPEG-4. Algunos participantes del comit queran que la nueva norma fuera MPEG-5; otros fueron atrados por la naturaleza binaria de la secuencia y preferan MPEG-8. Finalmente, se concluy que cualquier secuen- cia simple fallara en sealar la diferencia fundamental del trabajo de MPEG-1 a MPEG-4 y se eligi MPEG-7. MPEG-7 no es tanto acerca de la compresin sino acerca de la metadata, tambin conocida como bits acerca de los bits. La metadata es informacin digital que describe el contenido de otros datos digitales. En el habla moderna, el material de programa o contenido, la imagen en s, los objetos de video, audio o datos que forman la informacin son conocidos como datos de esencia. La metadata le dice al mundo todo lo que necesita saber acerca de lo que est en la esencia. Cualquiera que se ha involucrado con el almacenamiento de informacin ya sean cintas de video, libros, msica, lo que sea, conoce la importancia y la dificultad de catalogar e indexar con exactitud. La informacin almacenada solo es til si se conoce su existencia y si puede ser recuperada de forma oportuna cuando sea necesario. Este problema siempre ha estado con nosotros y ha sido atacado en el dominio analgico por una combinacin de etiquetas, catlogos, tarjetas de ndice, etc. Ms recientemente, la industria del cmputo nos ha dado bases de datos relacionales eficientes y efectivas en costo que permiten que poderosos motores de bsqueda accedan a informacin almacenada en formas notables. Asumiendo que la informacin est presente en una forma en que el motor de bsqueda pueda usarla. Aqu esta el problema verdadero. El mundo est generando nuevos conte- nidos de media con una frecuencia enorme y siempre creciente. Con el incremento en cantidad y la disminucin de costos de la media de almace- namiento digital, ms y ms de ese contenido se puede almacenar. Las redes locales y de rea ancha pueden hacer que el contenido sea accesible y distribuible si se le puede encontrar. Los motores de bsqueda pueden hallar lo que quieran y las bases de datos pueden encadenarse al material mismo pero necesitamos tener toda la informacin de indexacin necesaria dentro de la base de datos en una forma til para el motor de bsqueda. Debemos suponer, gracias al conocimiento de las normas anteriores, que el comit MPEG no se involucrara en exceso con mecanismos para generar datos. MPEG, acertadamente toma como propio el punto de vista de que si crea una estructura normalizada y hay la necesidad de mercado, los huecos tecnol- gicos sern llenados. En normas MPEG previas la sintaxis y el Decoder fueron especificados por la norma. En MPEG-7 solo la sintaxis est normalizada como se muestra en la Figura 4-7. La generacin de la metadata no est especificada como lo son las aplicaciones que pueden utilizarla. MPEG-7 especifica como se debe expresar la metadata. Esto significa que los campos deben ir a una base de datos como se especifica y cualquiera que disee un motor de bsqueda sabe que elementos descriptivos pueden estar presentes y como sern codifi- cados. MPEG-7 define una estructura de descriptores y esquemas de descripcin que pueden caracterizar casi cualquier cosa. En teora al menos, los elementos primitivos como los histogramas de color y las formas pueden ser combinados para representar entidades complejas como caras individuales. Es posible indexar automticamente material de tal forma que la base de datos pueda ser consultada por escenas que muestren, por ejemplo, al Presidente Clinton y al presidente Greenspan de la Reserva Federal de U.S. juntos. Las construcciones no estn confinadas a imgenes. Debe ser posible usar una muestra de voz para buscar por grabaciones o imgenes de Pavarotti o reproducir unas pocas notas en un teclado para encontrar las coincidencias o melodas similares.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 39
Figura 4-7
El rpido avance de los sistemas de almacenamiento y trabajo en red permitirn el acceso a vastas cantidades de contenido digital. A medida que avanza la tecnolo- ga para satisfacer las necesidades de MPEG-7, seremos capaces de indexar y recuperar tems en formas inimaginables tan solo hace unos pocos aos. Entonces tendremos la necesidad de un sistema para controlar el acceso, privacidad y transacciones comerciales asociadas con este contenido. Este es el punto hacia donde est orientado MPEG-21. 4.6 MPEG-21 MPEG-21, de nuevo, difiere en clase de los trabajos anteriores del comit. El concep- to bsico es muy simple aunque de amplio alcance. MPEG-21 busca crear una estructura completa para la administracin y uso de assets digitales incluyendo toda la infraestructura de soporte para las transacciones comerciales y administracin de derechos que deben acompaar esta estructura. El enfoque es dirigido hacia habilitar el uso transparente y creciente de los recursos multimedia por un rango amplio de redes y dispositivos. El alcance del trabajo de MPEG-21 es indicado por los siete elementos estructurales definidos en el borrador del reporte tcnico. 1. Se espera que la declaracin del tem digital establezca una abstraccin unifor- me y flexible y un esquema interoperable para definir los tems digitales.El es- quema debe ser abierto y extensible para cualquiera y todos los tipos de recur- sos de media y esquemas de descripcin y deben soportar una estructura jerr- quica que sea fcil de consultar y navegar. 2. La representacin del tem digital de MPEG-21 es la tecnologa que se usar para codificar el contenido y para proporcionar todos los mecanismos necesarios para sincronizar todos los elementos del contenido. Se espera que esta capa referencie al menos a MPEG-4. 3. La identificacin y descripcin del tem digital proporcionar el marco de trabajo para la identificacin y descripcin de los tems digitales (enlazando todos los elementos del contenido). Probablemente esto incluir los esquemas de descrip- cin de MPEG-7, pero tambin debe incluir [una] nueva generacin de sistemas de identificacin para soportar de forma efectiva, exacta y automatizada la admi- nistracin de eventos y los reportes (transacciones de licencias, reglas de utiliza- cin, monitoreo y seguimiento, etc.).Debe satisfacer las necesidades de todas las clases de usuarios de MPEG-21.
La administracin del contenido y el uso deben definir las interfases y protocolos para el almacenamiento, administracin y descripcin de los tems digitales de MPEG-21. Se debe soportar el archivado y catalogado del contenido mientras se preserve el uso de los derechos y la capacidad de rastrear los cambios de los tems y sus descripciones. Este elemento de MPEG-21 es posible que tambin respalde una forma de comercializacin en la que los consumidores puedan intercambiar informacin personal para el acceso adecuado al contenido y la formalizacin de mecanismos para canales personalesy construcciones similares. La administracin de la propiedad intelectual y la proteccin es una componente esencial. Las controversias actuales que rodean a los archivos de audio en MP3 demuestran la necesidad de nuevos mecanismos de derechos de copia recono- cibles para el mundo digital. Se puede argir que el contenido no tiene valor a menos que est protegido. MPEG-21 se construir sobre los trabajos actuales de MPEG-4 y MPEG-7, pero necesitar extensiones para acomodar nuevos tipos de tems digitales y mecanismos de distribucin. Las terminales y redes MPEG-21 direccionarn la distribucin de tems en un amplio rango de redes y la capacidad de entregar el contenido en un amplio rango de terminales. Conceptualmente una pelcula debera ser distribuible con calidad completa de cine digital a un cine o con baja calidad a una red ms lenta hasta un dispositivo de consumidor (a un precio diferente). En cualquier caso habr algunas restricciones para el tipo y nmero de usos. El usuario no deber darse cuenta de ninguno de los problemas y complejida- des asociadas con la entrega o reproduccin del tem. Finalmente existe la necesidad de un reporte de eventos para normalizar la mtrica e interfases para checar el desempeo de todos los eventos reporta- bles. El ejemplo ms obvio aqu es que si el sistema le permite al usuario tener acceso a un tem protegido, tambin se debe asegurar que se haga el pago apropiado!
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
Un stream elemental es bsicamente la salida en bruto del Encoder y no contiene nada ms que lo necesario para que un Decoder haga la aproxi- macin a la imagen o audio originales. La sintaxis de la seal comprimida es definida en una forma rgida en MPEG de tal forma que los Decoders puedan garantizar que puedan trabajar con eso. El Decoder no es definido excepto en que debe producir de alguna forma la sintaxis adecuada. La ventaja de esta aproximacin es que va de acuerdo con el mundo real en el que es ms probable que haya muchos ms Decoders que Encoders. Normalizando el Decoder se pueden hacer a bajo costo. En contraste, el Encoder puede ser ms complejo y caro sin una gran penalizacin de costos pero con una calidad de imagen potencialmente mejor a medida que se incrementa la complejidad. Cuando el Encoder y el Decoder son diferen- tes en complejidad se dice que el sistema de codificacin es asimtrico. La aproximacin de MPEG tambin permite la posibilidad de que la calidad mejore a medida que los algoritmos de codificacin se refinen al estar produciendo los streams de bits que pueden ser entendidos por los prime- ros Decoders. La aproximacin tambin permite el uso de algoritmos de codificacin de propietario que no necesitan llegar a ser de dominio pblico. 5.1 Sintaxis del stream elemental de Video La Figura 5-1 muestra la construccin del stream elemental de video. La unidad fundamental de informacin de la imagen es el bloque de DCT (Discrete Cosine Transform. Transformada discreta de coseno) que repre- senta un arreglo de pxeles de 8x8 que pueden ser Y, C b o C r . Los coefi- cientes de DC se envan primero y son representados con ms exactitud que los otros coeficientes. Despus se envan los coeficientes restantes y el cdigo de final de bloque o EOB (End Of Block). Los bloques son ensamblados en macrobloques que son las unidades fundamentales de una imagen y que pueden estar compensadas en movi- miento. Cada macrobloque tiene un vector de movimiento bidimensional en el encabezador. En las imgenes B-, los vectores pueden ser retrasados as como adelantados. La compensacin de movimiento puede estar basa- da en campos o cuadros y esto se indica. La escala utilizada para la re- cuantizacin de movimientos tambin se indica. Usando los vectores, el Decoder obtiene informacin acerca de las imgenes anteriores y posterio- res para producir una imagen predicha. Los bloques son transformados en sentido inverso para producir una correccin de la imagen que se adiciona- r a la imagen predicha para producir la salida decodificada. En la codifica- cin 4:2:0 cada macrobloque tendr 4 bloques Y y dos bloques de diferen- cia de color. Para que sea posible identificar que bloque describe que componente los bloques se envan en un orden especificado. Los macrobloques son ensamblados en slices (rebanadas) que siempre deben representar bandas horizontales de imagen de izquierda a derecha. En MPEG, los slices pueden iniciar en cualquier punto y tener un tamao arbitrario pero en ATSC deben iniciar en el extremo izquierdo de la imagen. Pueden existir muchos slices a todo lo ancho de la pantalla. El slice es la unidad fundamental de sincronizacin para la codificacin de longitud variable y la diferencial. Los primeros vectores en un slice se envan en forma absoluta mientras que los vectores restantes se transmiten en forma diferencial. En las imgenes I-, los primeros coeficientes de DC en el slice se envan en forma absoluta y los coeficientes restantes en forma diferen- cial. En las imgenes diferenciales, no se espera correlacin de esos coefi- cientes y esta tcnica no es apropiada.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 41 En el caso de un error de bit en el stream elemental, ya sea la deserializa- cin de los smbolos de longitud variable se romper o los subsecuentes coeficientes diferencialmente codificados estarn incorrectos. La estructura del slice permite la recuperacin proporcionando un punto de resincroni- zacin en el stream de bits. Un nmero de slices son combinados para formar una imagen que esta en la parte activa de un campo o cuadro. El encabezador de la imagen define si la imagen fue codificada como I-, P- o B- e incluye una referencia temporal de tal forma que la imagen pueda ser presentada en el momento adecuado. En el caso de los paneos y tilts, los vectores en cada macro- bloque sern los mismos. Un vector global puede ser enviado para toda la imagen y los vectores individuales entonces se convertirn en diferencias de este valor global. Las imgenes se pueden combinar para producir un GOP que debe co- menzar (en orden de transmisin) con una imagen I-. El GOP es la unidad fundamental de codificacin temporal. En la norma MPEG, el uso de un GOP es opcional pero es una necesidad prctica. Entre las imgenes I-, un nmero variable de imgenes P- y/o B- pueden ser colocadas como se describi en la seccin 2. Un GOP puede ser abierto o cerrado. En un GOP cerrado, las ltimas imgenes B- no requieren la imagen I- del siguiente GOP para decodificar y el stream de bits puede ser cortado al final del GOP. Si se usan los GOPs, muchos de ellos pueden ser combinados para produ- cir una secuencia de video. La secuencia comienza con un cdigo de inicio de secuencia seguido por un encabezador de secuencia y termina con un cdigo de fin de secuencia. Se pueden colocar encabezadores de secuen- cia adicionales en la secuencia. Esta aproximacin permite que la decodifi- cacin comience en cualquier parte de la secuencia como debe ocurrir con la reproduccin de los discos de video digital y cassettes de cinta. El enca- bezador de secuencia especifica el tamao vertical y horizontal de la ima- gen, la relacin de aspecto, el formato de submuestreo de Croma, la rela- cin de imagen, el uso de exploracin progresiva o entrelazada, el perfil, nivel y relacin de bits y las matrices de cuantizacin utilizadas en las imgenes intra e intercodificadas. Sin los datos del encabezador de secuencia, un Decoder no puede enten- der el streams de bits y por tanto los encabezadores de secuencia se convierten en puntos de acceso en los que los Decoders pueden empezar la operacin correcta. El espaciado de los puntos de entrada influye sobre el retraso para la decodificacin correcta que pueda ocurrir cuando el espectador cambia de un canal de televisin al otro.
5.2 Streams elementales de audio Se pueden encajar varios tipos de audio en un mltiplex MPEG-2. Estos tipos incluyen el audio codificado de acuerdo con las capas de MPEG 1, 2, 3, o AC-3. El tipo de codificacin de audio usado debe incluirse en un descriptor que un Decoder leer con el fin de invocar el tipo apropiado de decodificacin. El proceso de compresin de audio es muy diferente del proceso de video. No hay equivalente para los diferentes tipos de cuadro I-, P- y B- y los cuadros de audio contienen la misma cantidad de datos de audio. No hay equivalente de la codificacin bidireccional y los cuadros de audio no son transmitidos de la secuencia. En el audio MPEG-2, el descriptor en el encabezador de la secuencia contiene la capa que se ha usado para comprimir el audio y el tipo de compresin usado (por ejemplo joint stereo), junto con la relacin de muestreo original. La secuencia de audio es ensamblada a partir de un nmero de unidades de acceso o AU (Access Unit) que sern cuadros de audio codificados, Si se usa la codificacin AC-3, como en ATSC, este uso ser reflejado en el encabezador de secuencia. La unidad de acceso de audio (AU) es un cuadro de sincrona AC-3 como se describi en la Seccin 3.7. El cuadro de sincrona AC-3 representa una extensin de tiempo equivalente a 1536 muestras de audio y ser de 32 ms para el muestreo a 48-kHz y 48 ms para 32 kHz.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 42 Seccin 6 Streams elementales paquetizados o PES (Packetized Elementary Streams) Para propsitos prcticos, los streams elementales continuos que transpor- tan audio o video de los compresores necesitan ser divididos en paquetes. Esos paquetes son identificados por encabezadores (headers) que contie- nen el estampado de tiempo para sincronizacin. Los paquetes PES se pueden usar para crear Streams de programa o Streams de transporte. 6.1 Paquetes PES En el PES, un stream elemental interminable es dividido en paquetes de un tamao conveniente para la aplicacin. Este tamao debe ser de unos pocos cientos de kilobytes, aunque esto variar de acuerdo con la aplica- cin. Cada paquete es precedido por un encabezador de paquete de PES. La Figura 6-1 muestra el contenido de un encabezador. El paquete comienza con un prefijo de inicio de cdigo de 24 bits y una ID de stream que identifi- ca el contenido del paquete como audio o video y otros ms identifican el tipo de codificacin de audio. Esos dos parmetros (prefijo de cdigo de inicio e ID de stream) componen el cdigo de inicio de paquete que identifi- ca el inicio de un paquete. Es importante no confundir el paquete en un PES con el paquete mucho menor usado en los streams de transporte que, desafortunadamente, comparten el mismo nombre. Debido a que MPEG solo define el stream de transporte, no el Encoder, un diseador puede elegir construir un Multiplexor que convierta de streams elementales a streams de transporte en un solo paso. En este caso los paquetes PES podran no existir nunca en una forma identificable sino que, en lugar de eso sean presentados lgicamente en el payload (carga til) del stream de transporte. 6.2 Estampado de tiempo Despus de la compresin, las imgenes se sacan de la secuencia debido a la codificacin bidireccional. Estas requieren una cantidad variable de datos y estn sujetas a retrasos variables debido a la multiplexin y trans- misin. Con el fin de mantener el audio y el video juntos, el estampado en tiempo se incorpora peridicamente en cada imagen, Un estampado de tiempo es un nmero de 33 bits que es una muestra de un contador controlado por un reloj de 90-kHz. Este reloj es obtenido divi- diendo el reloj del programa de 27-MHz entre 300. Ya que los tiempos de presentacin estn espaciados equitativamente, no es esencial incluir un estampado de tiempo por cada unidad de presentacin, en lugar de eso, los estampados de tiempo pueden ser interpolados por el Decoder pero no pueden estar ms separados que a 700 ms en los streams de programa o de transporte. El estampado de tiempo indica a que punto particular en el tiempo pertene- ce un acceso particular. El Lip sync se obtiene incorporando estampados de tiempo en los encabezadores de los paquetes PES tanto de audio como de video. Cuando un Decoder recibe un paquete PES seleccionado, deco- difica cada unidad de acceso y lo enva a la RAM. Cuando el contador de tiempo-lnea alcanza el valor del estampado de tiempo, la RAM es leda. Esta operacin tiene dos resultados deseables. El primero es que se obtie- ne una correccin de base de tiempo efectiva en cada stream elemental. Segundo, los streams elementales de audio y video se pueden sincronizar juntos para hacer un programa. 6.3 PTS/DTS Cuando se usa la codificacin bidireccional, se podra tener que decodificar una imagen en algn momento antes de que se presente para que pueda actuar como fuente de datos para una imagen B-, A pesar de eso, por ejemplo, las imgenes pueden ser presentadas en el orden IBBP, aunque se transmitirn en el orden IPBB. Consecuentemente existen dos tipos de estampado de tiempo. El estampado de tiempo de decodificacin o DTS (Decode Time Stamp) indica el tiempo en el que una imagen se debe decodificar mientras que un estampado de tiempo de presentacin o PTS (Presentation Time Stamp) indica cuando se debe presentar a la salida del Decoder. Las imgenes B- se decodifican y presentan simultneamente de tal forma que solo contengan PTS. Cuando se recibe una secuencia IPBB las imge- nes I- y P- deben ser decodificadas antes de la primera imagen B-. Un Decoder solo puede decodificar una imagen a la vez, por tanto, la imagen I- se decodifica y almacena primero. Mientras que se decodifica la imagen P-, la imagen I- decodificada es enviada a la salida para que pueda ser seguida por las imgenes B-.
Figura 6-1
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 43
Figura 6-2
La Figura 6-2 muestra que cuando una unidad de acceso que contiene una imagen I- es recibida tendr tanto DTS como PTS en el encabezador y esos estampados de tiempo estarn separados por un periodo de imagen. Si se est usando la codificacin bidireccional una imagen P- debe seguir y esta imagen tambin tiene estampados de tiempo DTS y PTS pero la separacin entre los dos estampados de tiempo es de tres periodos de imagen para permitir la intermediacin de las imgenes B-. As, si se recibe una secuencia IPBB, la imagen I- estar retrasada por un periodo de ima- gen, P- tres periodos de imagen y B- dos que no estarn retrasadas en lo ms mnimo y la secuencia de presentacin se convertir en IBBP. Claramente, si la estructura del GOP es cambiada de tal forma que haya ms imgenes B- entre I- y P-, la diferencia entre DTS y PTS en las imge- nes P- ser mayor. Las banderas de PTS/DTS en el encabezador de paquete se establece de tal forma que indiquen la presencia de solo el PTS o de ambos estampados de tiempo: PTS y DTS. Los paquetes de Audio pueden contener muchas unidades de acceso y el encabezador del paquete puede contener un PTS. Debido a que los paquetes de audio nunca se transmiten de la secuencia no hay DTS en un paquete de audio.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 44 Seccin 7 Streams de Programa Los streams de programa son una forma de combinar varios streams de paquete PES y son muy ventajosos para aplicaciones de grabacin como el DVD. 7.1 Grabacin vs. Transmisin Para una calidad de imagen dada, la relacin de datos del video comprimi- do variar con el contenido de la imagen. Un canal de relacin de bits variable dar los mejores resultados. En la transmisin, la mayora de canales prcticos son fijos y la relacin de bits total se mantiene constante por medio del uso del stuffing (datos de relleno). En un DVD, el uso del stuffing es un desperdicio de la capacidad de alma- cenamiento; sin embargo, un medio de almacenamiento puede ser alentado o acelerado, ya sea fsicamente o, en el caso de un controlador de disco, cambiando la relacin de las requisiciones de transferencia de datos. Esta aproximacin permite obtener un canal de relacin variable sin penali- zacin en la capacidad. Cando se reproduce un medio, la velocidad puede ser ajustada para mantener el Buffer de datos lleno a aproximadamente la mitad sin importar la relacin de bits que puede cambiar dinmicamente. Si el Decoder lee el Buffer a una relacin creciente tender a vaciarlo y el sistema de control simplemente incrementar la relacin de acceso para restablecer el balance. Esta tcnica solo funciona si el audio y el video fueron codificados con el mismo reloj; de otra forma, se esparcirn por toda la longitud de la grabacin. Para satisfacer esos requerimientos conflictivos los streams de programa y transporte tienen que ser proyectados como alternativas. Un stream de programa funciona bien en un programa simple con relacin de bits variable en un ambiente de grabacin; un stream de transporte funcionar bien en programas mltiples en un ambiente de transmisin de relacin de bits fija. El problema del genlocking a la fuente no ocurre en un reproductor de DVD. El reproductor determina la base de tiempo del video con un genera- dor de pulsos de sincrona local (interno o externo) y obtiene simplemente los datos del disco con el fin de proporcionar imgenes con esa base de tiempo. En transmisin, el Decoder tiene que recrear la base de tiempo en el Encoder o se sufrir de overflow o underflow. As, un stream de transpor- te usar una referencia de reloj de programa o PCR (Program Clock Reference), mientras que un stream de programa no necesitar el reloj de programa. 7.2 Introduccin a los streams de programa Un stream de programa es un mltiplex de paquete PES que transporta muchos streams elementales que fueron codificados usando el mismo reloj maestro o reloj de tiempo de sistema o STC (System Time Clock). Ese stream puede ser de video y sus streams de audio asociados o un programa multicanal de solo audio. El stream de video elemental es dividido en unidades de acceso o AUs, cada uno de los cuales contiene datos comprimidos que describen una imagen. Esas imgenes son identificadas como I-, P-, o B- y cada una lleva un nmero de AU que indica la secuencia de despliegue correcta. Una AU de video se convierte en un paquete de stream de programa. En video, esos paquetes varan en tamao. Por ejemplo, un paquete de imagen I- ser mucho ms grande que un paquete de imagen B-. Las unidades de acceso de audio digital generalmente son del mismo tamao y muchas de ellas son ensambladas en un paquete de stream de transporte, Esos paquetes no deben confundirse con los paquetes de stream de transporte que son ms pequeos y de tamao fijo. Las fronteras de las AUs de audio y video coinciden con el eje del tiempo pero esta falta de coincidencia no es un problema porque cada frontera tiene su propia estructura de estampado de tiempo.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 45 Seccin 8 Streams de transporte Un stream de transporte es ms que solo un mltiplex de muchos paquetes PES. En los streams de programa, los estampados de tiempo son suficien- tes para recrear el eje del tiempo porque el audio y el video estn amarra- dos a un reloj comn. Para transmisin, con una red de datos a distancia hay un requerimiento adicional para recrear el reloj para cada programa en el Decoder. Esto requiere una capa adicional de sintaxis para proporcionar seales PCR. 8.1 La funcin del Stream de transporte El stream de transporte transporta muchos programas diferentes y cada uno puede usar un factor de compresin diferente y una relacin de bits que puede cambiar dinmicamente an cuando la relacin de bits en gene- ral permanezca constante. Este comportamiento es llamado multiplexin estadstica y le permite a un programa que est manejando material difcil robarse ancho de banda de un programa que este manejando material sencillo. Cada PES de video puede tener asociado un nmero diferente de PES de audio y datos. A pesar de esa flexibilidad un Decoder debe ser capaz de cambiar de un programa al siguiente y seleccionar correctamente los canales de audio y datos. Algunos de los programas pueden estar protegidos por lo que solo podran ser vistos por aquellos que paguen una suscripcin o cuota. El stream de transporte debe contener informacin de CA para administrar esa proteccin. El stream de transporte contiene un PSI para manejar esas tareas. La capa de transporte convierte los datos del PES en pequeos paquetes de tamao constante (adicionando bits de relleno si fuera necesario) que estn auto contenidos. Cuando esos paquetes arriban al Decoder, puede haber jitter en la temporalizacin. El uso de la multiplexin por divisin de tiempo tambin causa retraso pero este factor no es fijo debido a que la proporcin del stream de bits asignado a cada programa necesita que no sea fijo. El estampado de tiempo es parte de la solucin pero solo funciona si se dispone de un reloj estable. El stream de transporte debe contener ms datos pertenecientes a la recreacin del reloj estable. La operacin del equipo de produccin de video digital depende fuertemente de la distribu- cin de un reloj de sistema estable para la sincronizacin. Para la produccin de video se usa el genlockpero, a grandes distancias, la distribucin de un reloj separado no es prctica. En un stream de trans- porte, los diferentes programas se pueden haber originado en diferentes lugares que no estn necesariamente sincronizados. Como resultado, el stream de transporte tiene que proporcionar un medio separado de sincronizacin para cada programa. Este mtodo adicional de sincronizacin se llama PCR y recrea un reloj de referencia estable que puede ser dividido para crear una lnea de tiempo en el Decoder de tal forma que el estampado de tiempo para los streams elementales en cada programa se vuelva til. Consecuentemente, una definicin de un programa es un juego de streams elementales que com- parten la misma referencia de tiempo. En un stream de transporte de programa simple o SPTS (Single Program Transport Stream), habr un canal de PCR que recree un reloj de programa para audio y video. El SPTS frecuentemente es usado como comunicacin entre un Coder de audio/video y un Multiplexor.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 46
Figura 8-1
8.2 Paquetes La Figura 8-1 muestra la estructura de un paquete de stream de transporte. El tamao es constante, 188 bytes y siempre est dividido en un encabeza- dor o header y una carga til o payload. La Figura 8-1 muestra el enca- bezador mnimo de 4 bytes. En este encabezador, la informacin ms importante es:
El sync byte. Este byte es reconocido por el Decoder para que el encabeza- dor y el payload (carga til) puedan ser deserializados. El indicador de error de transporte. Este indicador es establecido si la capa de correccin de error que est por encima de la capa de transporte est ex- perimentando una relacin de error de bit o BER bruta (Bit Error Rate) que sea demasiado alta para ser corregible. Indica que el paquete puede conte- ner errores, vea la Seccin 10 - Introduccin a DVB y ATSC para los detalles acerca de la capa de correccin de errores. La identificacin de paquetes o PID (Packet IDentification). Este cdigo de 13 bits se usa para distinguir entre los diferentes tipos de paquetes. Ms adelante se dir ms acerca del PID. El contador de continuidad. Este valor de cuatro bits se incrementado por el Multiplexor a medida que cada nuevo paquete que tenga el mismo PID se enve. Se usa para determinar si cualquiera de los paquetes se pierde, repite o est fuera de la secuencia. En algunos casos se necesita ms informacin de encabezador y si ese es el caso, los bits de control del campo de adaptacin se ajustan para indicar que el encabezador es ms grande que el normal. La Figura 8-1b muestra que cuando esto sucede la longitud extra del encabezador se describe con el cdigo de longitud de campo de adaptacin. Donde se extienda el enca- bezador, la carga til se har ms pequea para mantener una longitud de paquete constante. 8.3 Referencia del reloj de programa o PCR (Program Clock Reference) El Encoder usado para un programa particular tendr un reloj de programa de 27-MHz. En el caso de una entrada SDI (Serial Digital Interface) el reloj de bits puede dividirse entre 10 para producir el reloj de programa de Enco- der. Donde muchos programas se originen en la misma casa de produccin es posible que todos ellos tengan el mismo reloj. En el caso de una entrada de video analgico, el periodo de sincrona horizontal necesitar ser multi- plicado por una constante en un PLL (Phase-Locked Loop o lazo de fase amarrada) para producir 27 MHz.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 47
Figura 8-2
El campo de adaptacin en el encabezador de paquete se usa peridica- mente para incluir el cdigo PCR que permita la generacin de un reloj amarrado al Decoder. Si el Encoder o un Remultiplexor tienen que conmu- tar fuentes, el PCR puede tener una discontinuidad; el contador de conti- nuidad tambin puede ser perturbado. Ese evento es manejado por el indicador de discontinuidad que le dice al Decoder que debe esperar una perturbacin, de otra forma una discontinuidad ser una condicin de error. La Figura 8-2 muestra como el Decoder usa el PCR para recrear una versin remota del reloj de 27-MHz para cada programa. El reloj del Enco- der controla un contador binario que est corriendo constantemente y el valor de esos contadores se muestrea peridicamente y se coloca en los campos de adaptacin del encabezador como PCR. El PCR es un nmero de 42 bits que es representado por una base PCR de 33 bits ms una extensin PCR de 9 bits para proporcionar una resolucin ms alta (El PCR base, como el PTS, es un nmero de 33 bits que es una muestra de un contador controlado por un reloj de 90 kHz). A los paquetes generados por cada encoder se les dan un PID diferente. El Decoder reconoce los paque- tes con el PID correcto para el programa seleccionado e ignora los otros. En el Decoder, un oscilador controlado por voltaje o VCO (Voltage Con- trolled Oscillator) genera un reloj nominal de 27 MHz y esto controlar un contador de PCR local. El PCR local se compara con el PCR del encabe- zador del paquete y la diferencia es el error de fase de PCR. Este error es filtrado para controlar el VCO que eventualmente igualar el conteo del PCR local al del encabezador del PCR. Un filtraje pesado del VCO asegura que el jitter de transmisin del PCR no modula el reloj. El indicador de discontinuidad aplicar un reset al conteo del PCR local y, opcionalmente, puede usarse para reducir el filtraje para ayudar al sistema a amarrarse rpidamente a la nueva temporalizacin. MPEG requiere que los PCR se enven a una relacin de cuando menos 10 PCRs por segundo, mientras que la DVB especifica un mnimo de 25 PCRs por segundo. 8.4 Identificacin de paquete o PID (Packet IDentification) Un campo de 13 bits en el encabezador del paquete de transporte contiene el cdigo de identificacin de paquete o PID (Packet IDentification Code). El PID es usado por el Demultiplexor para distinguir entre los paquetes que contienen diferentes tipos de informacin. La relacin de bits del stream de transporte debe ser constante an cuando la suma de las relaciones de todos los diferentes Streams que contenga pueda variar. Este requerimien- to es manejado por el uso de paquetes nulos. Si la relacin real del payload cae se insertan ms paquetes nulos. Los paquetes nulos siempre tienen la misma PID que es de 8191 (trece unos en la representacin binaria).
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 48
Figura 8-3
En un stream de transporte dado, todos los paquetes que pertenecen a un stream elemental dado tendrn el mismo PID. El demultiplexor puede seleccionar fcilmente todos los datos para un stream elemental dado simplemente aceptando solo los paquetes con el PID adecuado. Los datos para un programa completo pueden ser seleccionados usando las PIDs para streams de video, audio y datos como subttulos o teletexto. El Demul- tiplexor puede seleccionar correctamente los paquetes si puede asociarlos correctamente con el stream elemental al cual pertenece. El Demultiplexor puede hacer esta tarea solo si conoce lo que son las PIDs adecuadas. Esta es la funcin del PSI. 8.5 Informacin especfica del programa (Program Specific Informa- tion) El PSI es transportado por paquetes que tienen PIDs nicas, algunos de los cuales estn normalizados y otros son especificados por la Tabla de aso- ciacin de programa o PAT (Program Association Table), la Tabla de acce- so condicional o CAT (Conditional Access Table) y la Tabla de descripcin del stream de transporte o TSDT (Transport Stream Description Table). Esos paquetes deben ser incluidos peridicamente en cada stream de transporte. La PAT siempre tiene un PID de 0, el CAT siempre tiene un PID de 1 y el TSDT siempre tiene un PID de 2. Esos valores y la PID de paque- te nulo de 8191 son las nicas PIDs fijadas por la norma MPEG. El Demul- tiplexor debe determinar todas las PIDs restantes accesando las tablas apropiadas; sin embargo, hay algunas restricciones en el uso de las PIDs en ATSC y DVB. En esto (y otras cosas), MPEG y DVB/ATSC no son completamente intercambiables, Todos los streams de transporte de DVB y ATSC deben cumplir con la norma MPEG-2 (ISO/IEC 13818-1), pero no todos los streams de transporte MPEG-2 cumplirn con las normas de ATSC (A/65A) o DVB (EN 300 468). Los programas que existan en el stream de transporte estn enlistados en los paquetes (PID =0) de la Tabla de asociacin de programa o PAT (Pro- gram Association Table) que transporta el PID de cada paquete de PMT, La primera entrada en la PAT, program 0, est reservado para datos de red y contiene la PID de los paquetes de la Tabla de informacin de la red o NIT (Network Information Table). El uso de la NIT es opcional en MPEG-2 pero obligatoria en DVB. Las PIDs para los Mensajes de control de derechos o ECM (Entitlement Control Messages) y de los Mensajes de administracin de derechos o EMM (Entitlement Management Messages) estn enlistadas en los paque- tes de la Tabla de acceso condicional o CAT (Conditional Access Table) (PID =1). Como se muestra en la Figura 8-3, las PIDs de los streams elementales de video, audio, y datos que pertenezcan al mismo programa se enlistan en los paquetes de la Tabla de mapa de programa o PMT (Program Map Table). Cada paquete de PMT normalmente tiene su propia PID, pero MPEG-2 no hace que esto sea obligatorio. El nmero de programa dentro de cada PMT nicamente definir cada PMT.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 49 Una Tabla de informacin de red o NIT (Network Information Table) dada contiene ms detalles que solo los del stream de transporte que lo lleva; tambin se incluyen los detalles de otros streams de transporte que puedan estar disponibles en el mismo Decoder, por ejemplo, sintonizando un dife- rente canal de RF o apuntando el plato a un satlite diferente. La NIT puede enlistar un nmero de otros streams de transporte y cada uno debe tener un descriptor que especifique la frecuencia de radio, posicin orbital y as sucesivamente. En DVB, la metadata adicional, conocida como DVB-SI, se incluye y la NIT es considerada como parte de la DVB-SI. Esta operacin es discutida en la Seccin 10 Introduccin a DVB y ATSC. Cuando se discute la materia en general, se usa el trmino PSI/SI. Hasta recibir el primer stream de transporte el demultiplexor debe buscar las PIDs 0 y 1 en los encabezadores del paquete, Todos los paquetes con PID 0 contienen la PAT. Todos los paquetes con PID 1 contienen datos de CAT. Leyendo la PAT, el Demultiplexor puede encontrar las PIDs de la NIT y de cada Tabla de mapeo de programa o PMT (Program Map Table). Encon- trando las PMTs, el Demultiplexor podr encontrar las PIDs de cada stream elemental. Consecuentemente, si la decodificacin de un programa particular se requiere, las referencias a la PAT y luego a la PMT ser todo lo que se necesita para encontrar las PIDs de todos los streams elementales en el programa. Si el programa est encriptado, el acceso al CAT tambin ser necesario. Ya que la demultiplexin es imposible sin el PAT, la velocidad de cerrado es una funcin de que tan frecuentemente los paquetes de PAT son enviados. MPEG especifica un intervalo mximo de 0.5 segundos para los paquetes de PAT y los paquetes de PMT que estn referidos a ellos en los paquetes de PAT. En DVB y ATSC, el NIT puede residir en paquetes que tienen un PID especfico.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 50 Seccin 9 Modulacin digital
Figura 9-1 Los sistemas MPEG codifican y empacan video, audio y otros datos. Para el almacenamiento, el stream de datos resultante puede ser grabado en un disco duro o quiz en DVD. Para otras aplicaciones, los datos MPEG, usualmente en la forma de un stream de transporte, tienen que ser envia- dos de un lugar a otro o a muchos lugares. Los sistemas de televisin usan cable, satlite y transmisin terrestre en varias formas para la contribucin, distribucin y broadcast. Todos esos mecanismos de transporte requieren que los datos sean modulados en alguna portadora. Esta seccin propor- ciona una breve introduccin a los esquemas de modulacin digital que se usan para lograr esto. Esta Seccin discute solo las tcnicas de modulacin, Otros procesos son necesarios para hacer que el stream de datos sea adecuado para la trans- misin y dependern tanto de la modulacin elegida como de las caracte- rsticas del canal. Esas tcnicas se discutirn en la Seccin 10. 9.1 Principios de modulacin Una portadora continua no transporta ninguna informacin a menos que sea modificada en alguna forma por la informacin a transmitir. Una porta- dora puede ser modificada en tres formas, cambiando su amplitud, frecuen- cia o fase. La frecuencia y la fase, por supuesto, estn ntimamente relacio- nadas. Aunque generalmente son tratadas como tipos de modulacin separadas, la distincin se puede volver muy borrosa; algunos sistemas de modulacin en frecuencia son implementados por moduladores de fase.
Figura 9-2 9.2 Modulacin Analgica En el mundo analgico, la amplitud o la frecuencia de una portadora es cambiada (modulada), de acuerdo a la amplitud de una seal de audio o video, usualmente de acuerdo con una ley lineal. La modulacin de fase tambin se usa en los sistemas analgicos, el ejemplo ms obvio es la modulacin de las seales de diferencia de color en una subportadora de color en los sistemas de televisin NTSC y PAL. Esta operacin familiar proporciona un ejemplo til. Podemos pensar en la informacin de color en dos formas. Puede ser expresada como la fase de un ngulo (relacionado con el tinte o hue) ms una amplitud (relacionada con la saturacin) o como los valores de dos seales de diferencia de color, B-Y y R-Y. Si las componentes de diferencia de color son tratadas como valores de x y yen una grfica, las dos representaciones son vistas como ntimamente relacionadas como se ilustra en la Figura 9.1. Esta figura es similar al bien conocido despliegue de un vectorscopio. 9.3 Modulacin de cuadratura La Figura 9.2 muestra como podemos modular una portadora con dos seales diferentes usando la tcnica conocida como modulacin de cua- dratura. Una portadora simple es dividida en dos partes y una de ellas es retrasada por un tiempo equivalente a un cuarto del tiempo de ciclo de la portadora. Esto genera una portadora de la misma frecuencia pero con la fase corrida 90 de la original. Las dos portadoras son moduladas en ampli- tud con una seal apropiada y las dos portadoras moduladas son adiciona- das juntas. Esto genera una seal simple con una amplitud y fase determi- nadas por las amplitudes de las dos seales moduladoras.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 51
Figura 9-3 La demodulacin se logra con un proceso casi idntico; la seal recibida se enva a los dos Demoduladores. En cada Demodulador la seal es multipli- cada por una seal del oscilador local, sincronizada a la seal recibida. Las seales de los dos osciladores locales estn a 90 y cada demodulador recobra un eje de la modulacin de cuadratura. 9.4 Sistemas de Modulacin Digital Simple La mayora de Sistemas de modulacin digital simple usan alguna forma de modulacin de cuadratura; los dos ejes usualmente son designados I y Q. Algunas veces solo un eje de modulacin se usa. Todos los esquemas de modulacin digital representan un compromiso de eficiencia del ancho de banda, robustez y complejidad. La relacin de smbolos es el factor principal para determinar el ancho de banda de la seal transmitida. La relacin de smbolos es la relacin a la cual la modu- lacin se cambia por lo que es la misma que el ancho de banda de las seales moduladoras Algunos sistemas de modulacin digital simples solo llevan un bit de infor- macin por smbolo. En otras palabras, cada smbolo puede representar uno de dos posibles estados que representan un cero o uno binario. En ese caso, la relacin de bits del sistema es el mismo que la relacin de smbolo; sin embargo, otros sistemas tienen muchos estados posibles por cada smbolo por lo que pueden transportar ms de 1 bit de informacin por smbolo. Generalmente el nmero de estados est en potencias de dos por lo que la relacin de bits del sistema es algn entero mltiplo de la relacin de smbolo. Los sistemas de modulacin digital frecuentemente son etiquetados de acuerdo con el tipo de modulacin precedidos por un nmero que represen- ta el nmero de estados por cada smbolo. Por ejemplo, 4QAM describe modulacin de amplitud en cuadratura con cuatro estados posibles por cada smbolo. Cuatro estados que pueden transportar dos bits de informa- cin (00, 01, 10, 11), por lo que la relacin de bits de un sistema 4QAM es del doble de la relacin de smbolo.
Figura 9-4 Los sistemas de modulacin digital ms simples transportan un bit de informacin por smbolo. Cada smbolo tiene dos estados posibles que representan el cero y el uno binarios, Los estados pueden ser creados por modulacin de amplitud, frecuencia o fase, pero la modulacin de fase y frecuencia son las ms comunes. El llaveo (keying) de corrimiento de frecuencia binaria (BFSK o 2FSK) usa una frecuencia de portadora para representar un cero binario y una frecuencia diferente para representar un uno binario, Algunas veces la diferencia de frecuencia es muy pequea y es lograda por un modulador de fase. El llaveo (keying) de corrimiento de fase binaria (BPSK o 2PSK) usa una fase de la portadora (amplitud constante) para representar el cero binario y la fase inversa (180 de corrimiento de fase) para representar un 1 binario. Los posibles estados diferentes de un smbolo usualmente son mostrados en un diagrama de constelacin que muestra las varias combinaciones resultantes de los valores permitidos de las seales moduladoras de I y Q. El diagrama de constelacin para BPSK, mostrado en la Figura 9.3, es muy simple; solo uno de los ejes se usa y solo hay dos valores permitidos. Esos sistemas pueden ser muy robustos; el receptor necesita solo la sufi- ciente seal (o relacin seal a ruido) para determinar cual de los dos posibles estados ha sido transmitido para cada smbolo; sin embargo, no usan el espectro eficientemente; el ancho de banda nominalmente es el mismo que la relacin de bits. Esos sistemas se usan en trayectorias de transmisin muy dificultosas como es la telemetra en el espacio profundo. 9.5 Llaveo (Keying) de corrimiento de fase El BPSK o 2PSK se describi en la Seccin previa. Otras formas de modu- lacin PSK usa ambos ejes, I y Q. El Llaveo de corrimiento de fase cua- ternario (QPSK, tambin conocido como Llaveo de corrimiento de fase en cuadratura) es la ms comn, y usa dos valores en cada eje. El diagrama de constelacin es mostrado en la Figura 9.4. El QPSK tiene cuatro estados posibles por smbolo, por lo que cada uno de ellos transporta dos bits de informacin; un posible mapeo de estados a valores binarios se muestra en la Figura. El QPSK se usa extensamente en comunicaciones por satlite.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 52
Figura 9-5 El 8PSK es menos comn, pero tambin se usa en sistemas de satlite, particularmente en J apn. El diagrama de constelacin se muestra en la Figura 9-5. El 8PSK transporta tres bits de informacin en cada smbolo por lo que la relacin de bits es de tres veces la relacin de smbolos 9.6 Modulacin de amplitud de cuadratura o QAM (Quadrature Ampli- tude Modulation) La modulacin de amplitud de cuadratura o QAM (Quadrature Amplitude modulation) es la base de muchos sistemas de transmisin. Se usan los dos ejes I y Q para la modulacin y dependiendo de la variante particular se permiten dos o ms niveles de amplitud para cada eje. La variante ms simple es 4QAM en la que solo se usan dos valores para cada eje, proporcionando 4 estados posibles para cada smbolo. El diagra- ma de constelacin se muestra en la Figura 9-6, en la que se ver que el 4QAM es idntico al QPSK y transporta dos bits por smbolo.
Figura 9-7
Figura 9-6 El 16QAM usa 4 valores en cada eje proporcionando 16 estados posibles. El sistema 16QAM transporta 4 bits por smbolo. Si 6 valores se permiten para cada eje de modulacin hay un total de 36 estados posibles. Cinco bits pueden ser transportados usando solo 32 estados por lo que 4 de las posibles combinaciones no se usan en 32QAM. El diagrama de constela- cin para 16QAM es mostrado en la Figura 9-7 y para 32QAM se muestra en la Figura 9-8. En 32QAM los cuatro estados de esquina no se usan; esos son los estados que representaran la amplitud ms grande y por tanto, la potencia ms alta del transmisor. Las Figuras 9-7 y 9-8 tambin ayudan a mostrar el compromiso entre la relacin de bits y la robustez. En la presencia de ruido o jitter, el espacia- miento ms pequeo de los estados en el 32QAM (a la misma potencia transmitida) har ms probables los errores de decodificacin. Puesto en otra forma, entre ms estados posibles por smbolo haya, mejor ser la relacin seal a ruido requerida para una relacin de error dada.
Figura 9-8
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 53
Figura 9-9 Cuando se puede garantizar una buena relacin seal a ruido, se pueden usar an mayores densidades de constelacin. 64QAM usa 8 valores en cada eje y transporta 6 bits por smbolo. 64 QAM es el esquema de modu- lacin para cable que ms se usa a nivel mundial ya que proporciona un buen compromiso entre robustez y compatibilidad con infraestructuras de cable heredadas. 256QAM se usa en algunos de los sistemas de televisin por cable ms actuales, tiene 16 valores permitidos por cada eje de modu- lacin y transporta 8 bits por smbolo. 9.7 Modulacin de banda lateral vestigial o VSB (Vestigial Sideband Modulation) Cuando se modula una portadora se generan bandas laterales por arriba y por abajo de la frecuencia de la portadora. Por ejemplo, un sistema QAM con una relacin de smbolos de 3 mega smbolos por segundo tendr bandas laterales inferior y superior de unos 3 MHz de ancho, requiriendo un ancho de banda de canal nominal de 6 MHz.
Figura 9-11
Figura 9-10 Para recuperar la informacin tanto de amplitud como de fase (o ambos ejes de la modulacin en cuadratura), ambas bandas laterales se deben recuperar en el receptor. Los sistemas de banda lateral vestigial eliminan la mayor parte de la banda lateral antes de la transmisin por lo que solo un eje de modulacin podr recuperarse (una interpretacin alternativa es decir que el otro eje de modulacin se usa para suprimir la banda lateral no deseada); 2VSB tiene la misma constelacin que BPSK. La Figura 9-9 muestra los diagramas de constelacin para 4VSB y la Figura 9-10 muestra 8VSB, transportando respectivamente dos y tres bits por smbolo. La modulacin 8VSB la usa en Estados Unidos la norma de televisin digital ATSC. 4VSB fue propuesta originalmente, proporciona 2 bits por smbolo; sin embargo, se encontr que 8VSB, junto con la codificacin Trellis (vea la Seccin 10.6) y la correccin de errores interna convolucional proporciona la misma relacin de datos con un desempeo mejorado de relacin seal a ruido. 9.8 Divisin Multiplexada de frecuencias ortogonalmente codificadas o COFDM (Coded Orthogonal Frequency Division Multiplex) En los sistemas anteriores, una seal de banda base es proporcionada a los moduladores que operan sobre una portadora simple para producir la banda(s) transmitida(s). Una alternativa a un sistema de banda ancha es una que produzca muchas portadoras de banda estrecha con un espaciado cuidadosamente regulado. La Figura 9-11A muestra que una portadora modulada digitalmente tiene un espectro nulo de cada lado. Otra portadora idntica puede ser colocada aqu sin interferencias porque ambas son mutuamente ortogonales como se muestra en la Figura 9-11b. Este es el principio del OFDM (Orthogonal Frequency Division Multiplexing. Multi- plexin de divisin de frecuencia ortogonal). En la prctica, una variante conocida como Multiplexin de divisin de frecuencia ortogonal codificada o COFDM mejora el desempeo dramticamente en condiciones de canal
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 54 que no son las ideales con el uso de la codificacin convolucional Viterbi descrita en la siguiente seccin. La COFDM se usa en el sistema de trans- misin digital de televisin terrestre DVB-T. Cada portadora en un sistema OFDM puede ser modulado con cualquiera de las tcnicas descritas en esta seccin. En la prctica la que generalmen- te se usa es la QAM; 16QAM y 64QAM son las ms comunes. No es nece- sario usar todas las portadoras. Por ejemplo, si se sabe que una parte del canal est sujeto a un alto grado de interferencia, las portadoras afectadas se pueden omitir. El nmero de portadoras en un sistema OFDM puede ser muy grande. DVB-T tiene opciones para 1705 o 6817 portadoras (conocidos como sistemas 2k y 8k). Debido a que el ancho de banda asignado a cada porta- dora es pequeo, la relacin de smbolos es por consiguiente pequea y la longitud de tiempo para transmitir cada smbolo se incrementa. Esta es la clave de la tolerancia del OFDM a la interferencia de trayectorias mltiples. En un sistema de portadora simple, como 8VSB, una relacin de datos alta implica que el tiempo del smbolo sea muy corto. En el caso del sistema de televisin digital ATSC, algunos de los 11 millones de smbolos se transmi- ten cada segundo dndonos una duracin de smbolo de menos de 100 ns. Esto implica que an un retraso muy corto de trayectorias mltiples crear una interferencia intersmbolo ya que la seal retrasada que representa un smbolo llegar durante la recepcin del smbolo subsiguiente. En contraste, un sistema OFDM con cientos de portadoras tendr un tiem- po de smbolo en el orden de cientos de micro segundos (dependiendo de la relacin de datos y la modulacin utilizada). La interferencia Intersmbolo puede ser virtualmente eliminada adicionando deliberadamente una banda de guardaa cada smbolo haciendo que este sea ms largo que lo necesa- rio. Esto reduce la relacin de smbolos pero solo a un grado relativamente pequeo. Por ejemplo, si la duracin nominal del smbolo es de 200 s, una banda de guarda de 50 s reducir la relacin del smbolo en solo 20% y la eliminacin de la interferencia intersmbolo puede permitir que se use una constelacin de orden ms alto, quiz ms que para compensar esa prdi- da. Esta tcnica no es prctica para un sistema de portadora simple de banda ancha. Como ejemplo, la misma banda de guarda de 50 s con un tiempo de smbolo de 100 ns Reducir la relacin de datos a una fraccin de 1%! Esta tolerancia a la interferencia de trayectoria mltiple tambin hace que los sistemas COFDM sean adecuados para redes de frecuencia nica en la que dos o ms transmisores sincronizados emiten la misma seal. Un receptor puede, dependiendo de su localizacin y sistema de antena, recibir seales de ms de un transmisor en diferentes momentos. Si las longitudes de las trayectorias son radicalmente diferentes, la seal principal probable- mente ser mucho mas intensa que la seal secundaria y la interferencia ser mnima. Si las longitudes de las trayectorias y la intensidad de la seal son similares, la banda de guarda evitar la interferencia intersmbolo. Los sistemas COFDM son muy flexibles y pueden ser entonados para llenar una amplia variedad de requerimientos de transmisin pero, como siempre, la incrementada robustez es a costo de la relacin de datos. Hay muchos argumentos acerca de los mritos relativos de los sistemas de portadora simple y de portadoras mltiples pero generalmente se cree que bajo condiciones de canal simple, el COFDM requiere de alguna forma ms potencia que VSB para la misma cobertura a la misma relacin de datos. El COFDM tambin tiene una mayor relacin pico a promedio en el transmisor que puede provocar ms interferencias a otros servicios; sin embargo, muchos creen que en situaciones complejas de trayectorias mltiples como los caones urbanos de la ciudad, el COFDM puede proporcionar una recepcin ms confiable.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 55 9.9 Servicios integrados de transmisin de datos o ISDB (Integrated Services Data Broadcasting) Los Servicios integrados de transmisin de datos o ISDB (Integrated ser- vices data broadcasting) son un desarrollo que usa muchos esquemas de modulacin y han sido desarrollados para los servicios de televisin digital en J apn. Est diseado para respaldar sistemas jerrquicos de muchos niveles. Se puede usar, por ejemplo, para proporcionar simultneamente una recepcin de relacin de datos a mviles bajo condiciones excepcio- nalmente dificultosas, relaciones de datos intermedias (definicin estndar) para la recepcin esttica en la periferia y altas relaciones de datos (quiz para HDTV) para buenas condiciones de recepcin. Hay tres sistemas de modulacin ISDB actualmente en uso en J apn: 9.9.1 Sistema de satlite ISDB-S Lanzado en Diciembre de 2000, ISDB-S le permiti a los broadcasters compartir un transponder de satlite, Tambin es referido como BS-digital o CS-digital cuando el segmento de espacio es un satlite de transmisin o uno de comunicaciones respectivamente. Se pueden usar hasta 8 streams de transporte en una forma que deben acordar quienes comparten el transponder. La relacin de bits agregada depender del ancho de banda del transponder y el modo de modulacin utilizada. Por ejemplo, para un transponder de 34.5 MHz, la relacin mxi- ma incluyendo la correccin de errores adelantada es de 56.610 Mbits/s. La modulacin jerrquica permite variar el modo de modulacin en base a paquete a paquete dentro de un marco de 48 paquetes. Cada paquete es asignado a un spot de modulacin. Se soportan 4 modos de modulacin BSPK (1/2), QPSK (a 7/8) y TC8PSK. El nmero de slotsvara de acuerdo al modo utilizado. 9.9.2 Sistema de cable ISDB-C La caracterstica principal del sistema es que transmite streams de trans- porte mltiples en una portadora 64 QAM simple. El sistema fue desarrolla- do para ser capaz de retransmitir eficientemente la informacin transporta- da en seales ISDB-S. Tpicamente se transmite un mximo de 52.17 Mbits/s de informacin en una portadora BS-digital. La relacin de informa- cin de una seal 64 QAM/6 MHz es de 29.162 Mbits/s. De aqu que cuan- do menos se deben usar dos canales de televisin por cable para retrans- mitir la informacin de una portadora BS simple. El servicio digital BS completo consiste de 4 empresas de broadcast y ocupa aproximadamente 174 MHz incluyendo las bandas de guarda. Usando canales de cable ISDB-C se necesitaran 8 canales de cable para transportar esta informacin mientras que se requeriran 29 canales usando la transmisin convencional por cable de un stream de transporte por portadora. Hay 52 slots de modulacin ms 1 slot ms para el encabezador de sincronizacin TSMF (Transport Stream Multiplexing Frame. Marco de multiplexin del stream de transporte).
9.9.3 Modulacin terrestre ISDB-T El canal ISDB-T est dividido en 13 segmentos (tpicamente 400-500 kHz de ancho), y se usa una transmisin COFDM separada para cada segmen- to. Todos los parmetros que afectan la robustez (nmero de portadoras, longitud de la banda de guarda, tipo de modulacin, codificacin de convo- lucin) pueden elegirse por separado para cada capa de la jerarqua. Por ejemplo, el segmento ms robusto puede usar una banda de guarda ancha, modulacin QPSK y 1/2 codificacin de convolucin. El nivel ms alto podra usar una banda de guarda ms corta, 64QAM y 7/8 de codificacin de convolucin proporcionando muchas veces la relacin de datos del segmento robusto. El segmento central puede ser usado para la recepcin parcial diseada para permitir que un receptor de banda estrecha reciba solo ese segmento. En OFDM normal, el ancho de banda del canal completo representa una capa simple. Las portadoras usadas se espacian por todo el ancho de banda como juegos mltiples de cierta frecuencia. En ISDB-T el ancho de banda del canal de 5.6 MHz se divide en 13 segmentos y cada uno de ellos tiene un ancho de banda de 429 kHz. La transmisin jerrquica de ISDB-T se logra transmitiendo grupos de segmentos OFDM que tienen diferentes parmetros de transmisin. Esos grupos de capas constituyen las capas. En la modulacin no jerrquica se usa el mismo esquema de modulacin para todos los 13 segmentos. 9.9.4 El ISDB en resumen ISDB-S proporciona un medio de aplicar diferentes modos de modulacin a mltiples streams de transporte y transmitirlos en un canal de 34.5 MHz en una sola portadora. ISDB-C proporciona un medio de transmitir mltiples streams de transporte en un canal simple de 6 MHz con una portadora simple pero con un modo de modulacin comn. ISDB-T tiene que ver con hasta las tres tipos de transmisiones del mismo stream de transporte en un simple canal de 6 MHz.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 56 Seccin 10 Introduccin a DVB y ATSC
Figura 10-1
Ya se est usando la compresin MPEG para broadcast y se har ms importante a futuro. Esta seccin discute los requerimientos adicionales para la transmisin digital de televisin de acuerdo a como es implementa- da por las dos normas principales de DTV. 10.1 Una vista general ATSC (Advanced Television Systems Committee. Comit de sistemas de Televisin avanzada) es una organizacin Norteamericana que define las normas para la transmisin digital terrestre. DVB se refiere al Proyecto de Broadcast de video digital y a las normas y prcticas establecidas para el proyecto DVB. Este proyecto originalmente fue Europeo pero produce normas y guas aceptadas en muchas reas del mundo. Esas normas y guas comprenden todos los medios de transmisin incluyendo satlite, cable y terrestre. El broadcast digital tiene diferentes requerimientos de distribucin y trans- misin como se muestra en la Figura 10.1. Las compaas de broadcast producirn streams de transporte que contengan muchos programas de televisin. Los streams de transporte no tienen ninguna proteccin contra errores y para datos comprimidos, el efecto de los errores es muy serio. Los streams de transporte necesitan ser entregados libres de errores a los transmisores, subidas de satlite y cabeceras de cable. En ese contexto, libre de errores implica una relacin de errores de bit o BER (Bit Error Rate) de 1 en 10 -11 o mejor. Esta tarea normalmente es confiada a los operadores de redes de telecomunicaciones quienes usan una capa adicio- nal de correccin de errores como sea necesario (las estrategias de correc- cin de errores se seleccionan en el canal de transmisin). Esta capa debe ser transparente para el lugar de destino. Una compaa de broadcast particular u operador de cable podra no querer todos los programas de un stream de transporte. Muchos stream de transporte pueden ser recibidos y se puede hacer una seleccin de canales para luego codificarlos en un stream de transporte de salida simple usando un remultiplexor. La configuracin puede cambiar dinmicamente. El broadcast en el dominio digital consiste en llevar todo el stream de transporte al espectador. Sin importar si el canal es cable, satlite o terres- tre, el problema es ms o menos el mismo. La metadata que describe la transmisin debe ser codificada en el stream de transporte en una forma normalizada. En DVB, esta metadata es llamada servicio de informacin (DVB-SI) e incluye servicios como teletexto as como los detalles acerca de los programas transmitidos tanto dentro de s mismo como de otras mlti- plex. En broadcast hay mucho menos control sobre la calidad de la seal y el ruido o interferencia es una posibilidad. Esto requiere alguna forma de capa de correccin de errores por adelantado o FEC (Forward Error Correction).
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 57 A diferencia de la FEC usada por los operadores de redes de telecomunicaciones que puede ser de propietario (o normalizado por el Instituto de normas de telecomuni- caciones europeo o ETSI (European Telecommunications Standard Institute), que define la transmisin DVB sobre redes SDH y PDH), la correccin de errores por adelantado o FEC usada en broadcast debe ser normalizada de tal forma que los receptores sean capaces de manejarla. La adicin de la correccin de errores obvia- mente incrementa la relacin de bits en lo que se refiere al transmisor o cable. Des- afortunadamente, una transmisin de datos confiable y econmica por radio y cable requiere ms que la serializacin de los datos. Los sistemas prcticos requieren la codificacin de canal. 10.2 Remultiplexin Es una tarea compleja debido a que un Remultiplexor tiene que dar como salida un streamde bits que fue ensamblado con partes de otros. Los datos requeridos de una entrada dada de streamde transporte pueden ser seleccionados con referencia a la Tabla de asociacin de programa y a las Tablas de mapa de programa que revelarn las PIDs de los programas requeridos. Es posible que la misma PID se haya usado en dos streams de transportes de entrada, las PIDs de uno o ms streams elementales pueden haber cambiado. Los encabezadores de paquete deben transferir la referencia del reloj de programa o PCR (ProgramClock Reference) que permitir que el Decoder final recre un reloj de 27 MHz. Ya que la posicin de los paquetes que contengan la PCR puede ser diferente en la nueva multiplexin, el Remultiplexor podra necesitar editar los valores de PCR para reflejar su nueva posicin en el eje del tiempo. La Tablas de mapa de programa y las Tablas de asociacin de programa necesitarn editarse para reflejar la nueva estructura del streamde transporte como lo harn las Tablas de acceso condicional o CAT (Conditional Access Tables). Si la suma de las relaciones de bit del streamdel programa seleccionado es menor que la relacin de bits de la salida, el Remultiplexor creara paquetes de relleno con PIDs adecuadas; sin embargo, si los streams de transporte vienen de Multiplexores estadsticos, es posible que la relacin de bits instantnea del nuevo streamde transporte exceda la capaci- dad del canal. Esta condicin puede ocurrir si muchos programas seleccionados en diferentes streams de transporte simultneamente contienen una entropa alta. En ese caso la nica solucin es recomprimir y crear coeficientes nuevos ms cortos en uno o ms Streams de bits para reducir la relacin de bits. 10.3 Servicio de Informacin o SI (Information Service) A futuro, la distribucin digital implicar que habr un gran nmero de programas, teletexto y otros servicios disponibles para los espectadores y estos podrn extender- se a un buen nmero de diferentes streams de transporte. Tanto el espectador como el Decoder integrado al receptor o IRD (Integrated Receiver Decoder) necesitarn ayuda para desplegar lo que est disponible y entregar el servicio seleccionado. Esta capacidad requiere de metadata ms all de las capacidades del MPEG-PSI (Pro- gramSpecific Information. Informacin especfica del programa) y es referida como DVB-SI (Service Information. Servicio de Informacin). El DVB-SI es considerado para que incluya al NIT, que es opcional para los streams de transporte MPEG. El DVB-SI est encajado en el stream de transporte como paquetes de transporte adicionales con PIDs nicas y transporta informacin tcnica para IRDs. El DVB-SI tambin contiene informacin de la Gua electrnica de programas o EPG (Electronic ProgramGuide) como la naturaleza de un programa, duracin y el canal en el que puede ser localizado y los pases en los cuales est disponible. Tambin se pueden calificar los programas de tal forma que se pueda ejercer un control paterno. El DVB- SI debe incluir las siguientes tablas adems de la MPEG-PSI: Tabla de informacin de red o NIT (Network Information Table). Informacin en un streamde transporte que describe muchos streams de transporte. La NIT con- tiene informacin relacionada con la organizacin fsica del mltiplex, streams de transporte transmitidos a travs de una red dada y las caractersticas de la misma red. Los streams de transporte son identificados por la combinacin de una ID original de red y una ID de streamde transporte en la NIT. Tabla de descripcin de servicio o SDT (Service Description Table). Cada servicio en un streamde transporte de DVB puede tener un descriptor de servicio y esos descriptores estn ensamblados en la tabla de descripcin de servicio. Un servi- cio puede ser televisin, radio o teletexto. El descriptor de servicio incluye el nom- bre del proveedor del servicio Tabla de informacin de evento o EIT (Event Information Table). La EIT es una tabla para DVB que contiene los nombres de programa, tiempos de ini- cio, duracin, etc. Tabla de hora u fecha o TDT (Time and Date Table). La TDT es una tabla que encaja una hora de UTC y el estampado del tiempo en el streamde transporte. La DVB-SI tambin define otras tablas opcionales incluyendo: Tabla de asociacin de bouquet o BAT (Bouquet Association Table), Tabla de status actual o RST (Running Status Table), Tabla de corrimiento de tiempo o TOT (Time Offset Table) y la Tabla de relleno o ST (Stuffing Table). Tanto ATSC como DVB, usan la Tabla de seccin privada de MPEG-2 para definir tablas nuevas. Este juego de nuevas tablas obligatorias definidas por ATSC en la A/65A es parte del protocolo de programa e informacin del sistema o PSIO (Program and system information protocol). El PSIP de ATSC debe incluir las siguientes tablas adems de la MPEG-PSI: Tabla de canal virtual terrestre o TVCT (Terrestrial Virtual Channel Table) define el mnimo de programas MPEG-2 encajados en el streamde transporte en el cual es transportado el TVCT. Tabla de gua maestra o MGT (Master Guide Table) define el tipo, identificadores de paquete y versiones de todas las tablas PSIP en el streamde transporte, ex- cepto el de la Tabla de hora de sistema o STT (SystemTime Table). Tabla de regin de clasificacin o RRT (Rating Region Table) define el sistema de gua paterna para TV referenciado por cualquier descriptor de asesor de conteni- do transportado dentro del streamde transporte. Tabla de hora del sistema o STT (SystemTime Table) define la fecha y hora actuales. Tabla de informacin de eventos o EIT-n (Event Information Table) define las primeras cuatro tablas e informacin de eventos (EIT-0, EIT-1, EIT-2 y EIT-3) que describen 12 horas de eventos (programas de TV), cada uno con una cobertura de 3 horas e incluyen todos los canales virtuales enlistados en la TVCT. Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 58 10.4 Correccin de errores La correccin de errores es necesaria porque las condiciones en trayecto- rias de transmisin grandes no pueden ser controladas. En algunos siste- mas, la deteccin de errores es suficiente porque puede ser usada para pedir una retransmisin. Claro que esta aproximacin no funcionar con seales en tiempo real como la televisin. En lugar de lo anterior se usa la FEC en la que se adicionan suficientes bits extra, llamados redundancia, a los datos para permitirle al Decoder ejecutar correcciones en tiempo real. La FEC usada en sistemas modernos usualmente est basada en los cdigos de Reed-Solomon o (R-S). Una discusin completa de esto est fuera del alcance de este libro. Brevemente, los cdigos R-S adicionan redundancia a los datos para hacer una palabra de cdigo tal que cuando cada smbolo se use como trmino en un mnimo de dos ecuaciones simul- tneas, la suma (o sndrome) siempre sea cero si no hay errores. Esta condicin de cero se obtiene sin importar los datos y facilita el chequeo de errores. En streams de transporte, los paquetes siempre son de 188 bytes de largo antes de adicionar los datos de correccin de error. La adicin de los 16 bytes de redundancia R-S, producir una longitud de paquete de 204 bytes (en la prctica, los streams de transporte pueden usar paquetes de 204 bytes an cuando no est presente la FEC. El uso de 16 bytes de relleno evita el reclocking del stream cuando se adicione o borre la FEC) En el caso de que el sndrome no sea cero, la resolucin de las ecuaciones simultneas dar como resultado dos valores necesarios para la correccin de errores; la localizacin del error y su naturaleza; sin embargo, si el tamao del error excede la mitad de la cantidad de la redundancia adicio- nada, el error no podr ser corregido. Desafortunadamente en canales de transmisin tpicos, la calidad de la seal es estadstica. Esto significa que mientras que bits simples pueden estar en error debido al ruido, en caso de un gran nmero de bits, conocido como burst, se pueden corromper todos. Esta corrupcin puede deberse a un rayo o a interferencia por equi- po elctrico. No resulta econmico proteger cada palabra de cdigo contra estos bursts porque no ocurren lo suficientemente seguido. La solucin es usar una tcnica conocida como interpolacin. La Figura 10.2 muestra que, cuando se usa la interpolacin, los datos de fuente son codificados con FEC pero antes de la transmisin son enviados a un Buffer en RAM. En la Figura 10-3 se muestra una tcnica posible en la que los datos entran a la RAM en filas y luego se leen en columnas. Despus de esto los datos reordenados son transmitidos. Al momento de la recepcin los datos son regresados a su orden original o se desinterpolan usando una segunda RAM. El resultado del proceso de interpolado es que un burstde errores en el canal despus de la desinterpolacin se convertir en un gran nmero de errores de smbolo simples que son corregibles ms fcilmente. Cuando un error de burst alcanza el tamao mximo corregible, el sistema es vulnerable a errores de bits aleatorios que hacen que las palabras de
cdigo sean incorregibles. El uso de un cdigo interno aplicado despus de la interpolacin y corregido antes de la desinterpolacin puede evitar que entren errores aleatorios a la memoria de desinterpolacin. Como muestra la Figura 10-3, cuando se usa esa aproximacin con una estructura interpolada de bloque, el resultado es un cdigo producto, La Figura 10-4 muestra que la interpolacin tambin puede ser convolucional en la que el arreglo de los datos sea compartida aplicando un retraso diferente a cada fila. La interpolacin cruzado o convolucional tiene la ventaja de que se necesita menos memoria para interpolar o desinterpolar.
Figura 10-2
Figura 10-3
Figura 10-4 Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 59
Figure 10-5
10.5 Codificacin de canal Los datos binarios no son adecuados para la transmisin por muchas razones. Las corridas de bits idnticas hacen que el DC se corra y falte el reloj de bits. No hay control del espectro y el ancho de banda requerido es demasiado grande. En la prctica, los sistemas de radio y cable requieren un esquema de modulacin llamado cdigo de canal. Los esquemas de modulacin digital se discuten en la Seccin 9. La Figura 10-5 muestra la aplicacin de esos principios para un modulador 64QAM. En los esque- mas que se describieron antes, el espectro de la seal transmitida depen- de de la seal. Algunas partes del espectro pueden contener energa alta y provocan interferencias a otros servicios mientras que otras partes del espectro pueden contener poca energa y ser susceptibles de interferen- cia. En la prctica se necesita la aleatorizacin para descorrelacionar el espectro transmitido del contenido de datos. La Figura 10-6 muestra que cuando se usa la aleatorizacin o la dispersin de energa se adiciona una secuencia pseudo aleatoria a los datos seriales antes de que entren al modulador. El resultado es que el espectro transmitido es similar al ruido con estadsticas relativamente estacionarias. Claramente se deber substraer una secuencia idntica y sncrona en el receptor como se mues- tra. La aleatorizacin no se puede aplicar a los patrones de sincrona o podran no ser detectados.
Figure 10-6
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 60
Figure 10-7
10.6 Codificacin interna El cdigo interno de un sistema de FEC est diseado para evitar los errores aleatorios al reducir la potencia del esquema de interpolacin. Un cdigo interno adecuado puede evitar esos errores dando un incremento aparente a la SNR de la transmisin. En la codificacin Trellis, que puede usarse con sealizacin multi nivel, muchos smbolos de nivel mltiple son asociados a un grupo. La forma de onda que resulta de un grupo particu- lar de smbolos se le llama Un trellis. Si cada smbolo puede tener 8 niveles, entonces en tres smbolos puede haber 512 trellises posibles. En la codificacin trellis, los datos son codificados en tal forma que solo ciertas formas de onda de trellis representen datos vlidos. Si solo 64 de los trellises representan datos libres de errores, entonces dos bits de datos por smbolo pueden enviarse en lugar de tres. Los bits restantes es una forma de redundancia ya que otros trellises aparte de los 64 correctos deben deberse a errores. Si un trellis es recibido en el cual el nivel de uno de los smbolos sea ambiguo debido al ruido, la ambigedad puede ser resuelta ya que el nivel correcto debe ser el que da como resultado un trellis vlido. Esta tcnica es conocida como mxima decodificacin pro- bable. Los 64 trellises vlidos deben hacerse tan diferentes como sea posible para hacer que el sistema siga funcionando con una relacin seal a ruido ms pobre. Si el Coder trellis provoca un error, el cdigo externo lo corregir. En la DVB, se puede usar la codificacin convolucional Viterbi. La Figura 10-7 muestra que despus del interpolado los datos son enviados al registro de corrimiento. El contenido de este produce dos salidas que representan diferentes chequeos de paridad de los datos de entrada para que los errores de bit puedan ser corregidos. Claramente habrn dos bits de salida por cada bit de entrada; de aqu, el Coder mostrado es descrito como Coder de relacin. Cualquier relacin entre 1/1 y 1/2 seguir permitiendo que los datos originales se transmitan pero la cantidad de redundancia variar. A la falla en la transmisin de la salida de comple- ta se llama puncturing (perforacin) y permite que se obtenga cualquier balance requerido entre la relacin de bits y la potencia de correccin.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 61
Figure 10-8
Figure 10-9
10.7 Transmitiendo dgitos La Figura 10-8 muestra los elementos de un transmisor digital de ATSC. El Servicio de informacin que describe la transmisin se adiciona al Stream de transporte. Este stream es aleatorizado antes de enrutarlo a un Coder de correccin de error R-S externo que adiciona redundancia a los datos. Un proceso de interpolado convolucional reordena entonces los datos para que los datos adyacentes en el stream de transporte ya no lo sean en la transmisin. Un Coder trellis interno se usar entonces para producir una seal en niveles mltiples para el modulador de banda lateral vestigial o VSB (Vestigial Side Band) La figura 10-9 muestra un transmisor de DVB-T. La informacin de servi- cio se adiciona como antes, despus de la etapa de aleatorizacin para la dispersin de la energa. Antes de la interpolacin se adiciona el chequeo R-S externo de smbolos. Despus de la interpolacin, el proceso interno de codificacin tiene lugar y los datos codificados se envan a un Modula- dor COFDM. A la salida del modulador se le aplicar un proceso de up convertpara producir la salida de RF. En el receptor, el reloj de bits se extrae y usa para controlar los tiempos de todo el sistema. La codificacin de canal se invierte para obtener los datos en bruto ms los errores de transmisin. La codificacin interna corrige los errores aleatorios y puede identificar los errores ms largos para ayudarle al Coder externo despus de la desinterpolacin. La aleato- rizacin se remueve y el resultado es el stream de transporte original. El receptor debe identificar la PAT, el servicio de informacin o SI (Service Information) y la PMT al que la PAT apunta para poder decirle al auditorio que est disponible en el stream de transporte y que el programa selec- cionado pueda ser localizado en el mltiplex.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 62 Seccin 11 Transmisin de datos En la secciones previas se checaron las bases de un stream de transporte MPEG-2 y su aplicacin principal: transportar streams de audio y video comprimidos en una forma similar a las transmisiones analgicas conven- cionales; sin embargo, una de las ventajas principales de un stream de transporte MPEG-2 es que puede transportar datos as como video y audio. Aunque los sistemas de televisin analgicos puedan y transmitan datos, el ancho de banda mximo para estos est severamente limitado comparado con los anchos de banda posibles para los streams de trans- porte. Esta Seccin proporcionar una vista general de los diferentes mtodos proporcionados por MPEG-2 y las variantes regionales (DVB, ATSC y ARIB (Association of Radio Industries and Businesses. Asociacin de industrias y negocios de radio) para encapsular datos dentro de un stream de transporte. La siguiente Seccin, entonces, revisar como son presen- tados los datos al espectador en el set top box (que no cae estrictamente dentro del alcance de MPEG-2). 11.1 Aplicaciones Hay muchos tipos diferentes de aplicaciones para la transmisin de datos en un stream de transporte y cada tipo de aplicacin puede requerir diferentes tipos de datos con diferentes requerimientos de temporaliza- cin. Por ejemplo, el tipo de datos involucrado con enviar trfico por Internet es muy diferentes del necesario para proporcionar una actualiza- cin de firmware para una set top box. Una actualizacin que no sea en tiempo real de la informacin de precios tiene requerimientos de temporalizacin muy diferentes que una aplica- cin de cuestionario en la que las respuestas y preguntas deben ser enviadas con una sincronizacin muy cercana al audio y video. MPEG-2 proporciona una gran variedad de tcnicas diferentes para enviar datos. La eleccin de la tcnica es un compromiso entre la optimizacin del ancho de banda (y de aqu del costo de proporcionar el servicio) al tiempo que llena los requerimientos de temporalizacin de la aplicacin. El tipo de aplicaciones puede agruparse en forma aproximada por sus requerimientos de tiempo real y el nivel de interactividad como se describe en las siguientes secciones.
11.1.1 Datos relacionados con los programas La especificacin base de MPEG-2 no tiene ninguna provisin para un EPG que de informacin acerca de los canales de TV o los programas individuales que se estn transportando en el stream de transporte. Las variantes regionales ATSC, DVB y ARIB han usado la sintaxis de la Tabla privada de MPEG-2 como la de la EIT para proporcionar datos adicionales acerca de los programas. Se requiere que esas tablas se transmitan a intervalos regulares y que den tiempos de inicio, sinopsis y otra informa- cin acerca de los programas y servicios; sin embargo, an este nivel de informacin podra no ser suficiente y por tanto hay un buen nmero de EPGs de propietario que extienden la cantidad de informacin disponible y tambin proporciona funciones como la bsqueda mejorada, canales favoritos y otros servicios aumentados. Esos EPGs mejorados usualmente residen en forma permanente en la set top box y usan una combinacin de la Tabla de informacin estndar y de los formatos de datos de propie- tario. Usualmente esta clase de informacin de programa no es crtica en tiempo y por tanto se usan tcnicas baratas de baja relacin de datos. En muchos casos los datos son diseados de tal forma que se puedan alma- cenar temporalmente en la set top box para que aparezca como disponi- ble inmediatamente al usuario an si el tiempo total real de transmisin es relativamente grande. 11.1.2 Datos de oportunidad Raramente es posible utilizar el ancho de banda completo de un stream de transporte con streams de audio y video no solo por la necesidad de manejar las restricciones complejas de la remultiplexin o la insercin de la tabla. Los sistemas de datos de oportunidad usan esta capacidad extra reemplazando algunos paquetes nulos con datos tiles; sin embargo, el ancho de banda de estos datos no se puede garantizar y puede ser pe- quea de aqu que solo pueda ser usada por aplicaciones sin las restric- ciones de tiempo real. Algunas aplicaciones que usan esta clase da datos pueden ser transfe- rencias de archivos como listas de precios o la distribucin de datos del nivel de acciones va satlite a todas las localidades de una compaa. La nica restriccin es que la transferencia debe tener lugar durante la noche y por tanto usar un ancho de banda corto y por tanto se pueden usar servicios de datos de oportunidad baratos.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 63 11.1.3 Datos de red Una aplicacin muy comn es usar simplemente el stream de transporte de broadcast como portadora de datos de red. En el ms simple de los casos, un enlace de satlite proporcionara una interconexin de muy alto ancho de banda entre dos compaas geogrficamente separadas. Este enlace de red puede ser usada para transportar virtualmente cualquier tipo de protocolo de red; sin embargo, el uso actual ms comn es para descargas de Internet de alta velocidad usando solo el protocolo IP. En este escenario se usa una conexin de Internet de baja velocidad para enviar instrucciones y requisiciones de pgina a un servidor de Internet; sin embargo, el servidor de Internet enrutar entonces cualquier dato pedido a travs del enlace satelital a velocidades mucho mayores que las posibles para una conexin de banda ancha promedio o de ISDN. Una variante de esta aplicacin se usa cuando solo est disponible un canal de slow back. En este caso, por ejemplo, los datos relacionados con el programa de TV actual pueden ser entregados on demandcon la seal transmitida sin que el auditorio se de cuenta que se esta accesando un sitio de Internet. 11.1.4 TV mejorada En una aplicacin de TV mejorada no hay canal de back (respuesta) y por tanto todos los datos requeridos se debern enviar en el stream de transporte que se esta transmitiendo. Aunque esta imposicin obviamente restringe el diseo y rango de una aplicacin an es posible producir un rango muy amplio de juegos, cuestionarios e infomerciales en los que el auditorio podra no darse cuenta que toda la interaccin es solo con la TV. Este es especialmente el caso con material pregrabado en el que es relativamente directo sincronizar los pop-ups de datos como las pregun- tas y respuestas de los cuestionarios con el audio/video. 11.1.5 TV interactiva LA diferencia clave entre la TV mejorada y la interactiva es que esta tiene un canal de respuesta para enviar o recibir datos altamente personaliza- dos. Esto incrementa grandemente el rango de aplicaciones que se pue- den soportar, incluyendo la capacidad de proporcionar una interaccin en tiempo real con otras personas, como es el caso de los juegos multi- jugador o las votaciones as como retroalimentacin realmente personali- zada. Una extensin ms de esto es cuando una conexin de Internet de alta velocidad se combina con un canal de respuesta real. Esto ofrece una integracin transparente de los datos personalizados con la transmisin de televisin adems que tambin permite un VOD real de programacin u otro material. 11.2 Encapsulamiento del contenido La primera etapa en una transmisin de datos es encapsularlos en una forma til para su transmisin en un stream de transporte. Hay una amplia variedad de tipos diferentes de datos y por tanto las normas MPEG-2 proporcionan un buen nmero de diferentes mtodos de encapsulamiento. Las varias normas especficas para cada pas como DVB y ATSC han mejorado an ms las opciones bsicas de MPEG-2 para llenar los reque- rimientos regionales pero todo eso constituye el ncleo de las normas MPEG-2. 11.2.1 Encapsulado de datos MPEG 11.2.1.1 Canalizacin de datos La canalizacin de datos se usa para la distribucin asncrona simple de los datos a un set top box determinado en la red. Su principal aplicacin es enviar datos de propietario en sistemas cerrados en los que el set box al que se le van a enviar ha sido pre programado para buscar datos especficos en ciertas PIDs. Los datos son transportados directamente en el payload o carga til de los paquetes TS de MPEG-2 TS sin ninguna informacin de temporalizacin. Una aplicacin tpica sera una actualiza- cin nocturna de los niveles de stock de un producto a todos los puntos de venta de una regin. 11.2.1.2 Streaming de datos El streaming de datos se usa para la distribucin punto a punto de datos en forma asncrona, sncrona o sincronizada. Los datos son transportados como paquetes PES con un mtodo similar al de los servicios de video y audio, De hecho, el audio y video son ejemplos realmente especficos de un servicio de streaming de datos sncronos. Ya que los paquetes PES son sealizados en las Tablas de servicios de informacin o SI (Service Information), y pueden transportar informacin de temporalizacin, esta aproximacin ser ms flexible que la canalizacin de datos pero en la prctica se usa en una forma similar en sistemas cerrados de propietario.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 64 11.2.1.3 DSMCC - Digital Storage Medium Command and Control (Instruccin y control del medio de almacenamiento digital) La especificacin DSM-CC de MPEG-2 (ISO/IEC 13818-6) proporciona ms formas de transmitir datos en las secciones de una Tabla privada estndar de MPEG-2. Originalmente fue diseada como una forma de respaldar la distribucin de VOD de material de programa en una red con un stream de transporte. El protocolo se ha extendido para ser capaz de manejar tanto la distribucin on-demand (usando el paradigma MPE) as como la distribucin peridica (usando el paradigma del carrusel) de datos en redes mltiples de proveedores 11.2.1.4 MPE Multi-protocol Encapsulation (Encapsulado con proto- colos mltiples) El encapsulado con protocolos mltiples o MPE permite que un datagra- ma de cualquier protocolo de comunicacin se transmita en la Seccin de una Tabla de DSM-CC a travs de un stream de transporte. Un datagra- ma es una estructura lgica que contiene toda la informacin que define los datos; es decir, su tamao y contenido, donde deben ir y como llegar ah. La aplicacin ms comn es el trfico de Internet donde los datagramas de TCP/IP llevan informacin acerca de las direcciones lgicas (IP) de la fuente y el destino (target) as como del Control de acceso a la media o la direccin de MAC (Media Access Control) (una direccin de red nica) del target; sin embargo, el MPE respalda casi todos los tipos de protocolo de red y ciertamente no est restringido a solo los datos de TCP/IP. 11.2.1.5 Carruseles Los carruseles estn diseados para la transmisin peridica de informa- cin en un stream de transporte. Aunque el contenido de un carrusel puede cambiarse como respuesta a una requisicin de un usuario de target, es ms usual que se repita regularmente el carrusel sin importar que haya o no usuarios pendientes del contenido o de que se necesiten datos en ese momento. Un target que necesita un tem de datos especfi- co se espera que aguarde hasta que se retransmita.
Hay dos tipos diferentes de carruseles: los de datos y los de objetos y las principales diferencias entre ellos es que:
Los carruseles de datos solo contienen mdulos de datos de contenido no especificado; depende del target saber que hacer con los datos que recibe. Los carruseles de objeto contienen objetos de datos identificables como imgenes, archivos de texto o archivos ejecutables de aplicaciones y con- tienen un listado de directorio de todos los objetos en el carrusel. Los carruseles de datos frecuentemente se usan para descargar software de sistema nuevo a un set top box mientras que un objeto de carrusel se usa para servicios de compra, EPGs y para enviar aplicaciones y juegos. En ambos tipos de carrusel, los tems se repiten a intervalos peridicos; sin embargo, los objetos de carrusel hacen que sea ms sencillo variar la relacin de repeticin de objetos individuales. Por ejemplo, el EPG para las prximas horas puede repetirse con bastante ms frecuencia que el que se ver el siguiente mes. Las relaciones de repeticin para objetos puede ser una decisin comercial hecha por el proveedor del servicio para maximizar la utilizacin del ancho de banda. Ambos tipos de carrusel estn basados en las extensiones DSM-CC para la especificacin de MPEG-2 ISO13818-6, con extensiones especificas para los sistemas DVB, ARIB y ATSC.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 65
Figure 11-1
11.2.1.6 Carruseles de datos Un carrusel de datos no contiene ningn tem de datos individual o estruc- tura de directorio sino que es una pieza monoltica simple de datos. De- pender del usuario de target saber que son los datos y que hacer con ellos. La estructura se muestra en la Figura 11-1. Un tem simple completo de datos es definido como un mdulo. Los mdulos de transmisin son divididos en uno o ms bloques. Cada bloque se enviar como una Sec- cin en el payload de un mensaje de descarga de bloque de datos o DDB (DownloadDataBlock), que sigue la sintaxis de la tabla privada definida por MPEG. Los mensajes DDB pueden ser enviados en cualquier orden o con cualquier periodicidad de aqu que se necesite un mecanismo para identificar que DDBs pertenecen a que mdulos. Un mensaje de DownloadInfoIndication o DII (Indicacin de informacin de descarga) se usa para enlazar juntos los DDBs a un mdulo. La infor- macin para ms de un mdulo puede estar en un mensaje de DII simple; esto forma un grupo. Usualmente un grupo contendr mdulos de datos relacionados lgicamente. Si hay ms mdulos relacionados que puedan agruparse juntos en un mensaje de DII simple entonces se puede formar un sper grupo de mensajes de DII mltiples. Estos son referenciados por un mensaje de DownloadServerInitiate o DSI (Iniciar descarga de servidor). Un carrusel de datos de una capa contiene un pequeo nmero de mdu- los referenciados en un DII simple. Un carrusel de datos de dos capas contiene mensajes DSI que hacen referencia a uno o ms mensajes de DII. Pueden ser ms pequeos o grandes que un carrusel sencillo. Un uso tpico de un carrusel de dos capas sera para respaldar lenguajes mltiples. Un grupo puede transportar el ejecutable en un mdulo junto con texto en ingls en un segundo mdulo. El segundo grupo puede llevar solo un mdulo simple con solo texto en francs ahorrndose el over- head de repetir el mdulo de aplicacin.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 66
Figure 11-2
11.2.1.7 Carruseles de objetos Los objetos de carrusel se usan para transmitir tems individualmente identificables de datos identificados de un servidor a un receptor. Esos tems son llamados objetos y pueden ser imgenes, archivos de texto, programas, un indicador de PID de un video, un listado de directorio o salida (gateway) de servicio de lo que est disponible en el carrusel. Los objetos relacionados agrupados se envan juntos como una forma de carrusel sencillo desde un dominio de servicio. Los objetos se pueden enviar tan frecuentemente como se requiera y diferentes objetos pueden tener relaciones de repeticin muy diferentes. Una caracterstica clave de los objetos de carrusel es que todos los obje- tos se envan usando el paradigma de BIOP (Broadcast inter-ORB proto- col. Protocolo de transmisin inter-ORB). Los desarrolladores de software convencional han estado usando el ORB (Object Request Brokerage. Corretaje de requisicin de objetos) por muchos aos. El BIOP extiende el sistema bsico para respaldar la identificacin y uso de los objetos en un ambiente de broadcast en diferentes redes de diferentes proveedores de servicio. En esencia, un BIOP es un mtodo para intercambiar informacin acerca de un objeto que se est transmitiendo en el carrusel. El BIOP puede contener el objeto o simplemente puede proporcionar un indicador al objeto. El BIOP tambin puede indicar como usar el objeto, incluyendo proporcionar un enlace a donde descargar el software de aplicacin necesario para usar el objeto. Los objetos de carrusel son similares a los carruseles de datos en tanto que los grupos de objetos se combinan para formar mdulos. La metodo- loga del carrusel de datos bsicos ser entonces usada para transmitir esos datos usando bloques, mdulos y DIIs. La diferencia principal es que el DSI se usa para apuntar directamente al objeto de directorio de la salida (gateway) de servicio que podr entonces usarse para encontrar todos los otros objetos en el carrusel. Este arreglo se muestra en la Figura 11.2.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 67
Figure 11-3
11.2.1.8 Como se transmiten los objetos de los carruseles Una explicacin completa est ms all de los alcances de este documen- to; la siguiente descripcin es una vista general breve y muy simplificada de ese proceso (vea tambin la Figura 11-3). Los objetos directorio, archivo y stream se envan con el mismo mtodo que para los carruseles de datos, es decir, en mdulos divididos en blo- ques. Sern enviados como secciones en el payload de un DownloadDa- taBlock o DDB (Bloque de datos de descarga). Un mensaje de DownloadServerInitiate o DSI (Iniciar descarga de servi- dor) contiene la localizacin de un objeto de directorio especial llamado salida (gateway) de servicio. Los mensajes de DSI son referidos en el SI y por tanto formaran el punto de inicio para desarrollar lo que es un objeto de carrusel especfico. El DSI referencia el DownloadInfoIndication o DII (Indicacin de informacin de descarga) que referencia el DDB que con- tiene el mdulo en el que se enva el objeto de salida (gateway) de servi- cio. Los objetos son referenciados en un objeto de directorio usando las IORs (inter-operable object references. Referencias de objeto interoperable). Estos contienen toda la informacin necesaria para accesar un objeto en el mismo dominio del servicio u otro carrusel de objeto (incluyendo los transportados en otros streams de transporte) El nombre dado a la estructura en el IOR que describe la localizacin de un objeto es llamado perfil de cuerpoque viene en dos sabores: BIOP profile body (Perfil de cuerpo BIOP) Usado solo para objetos dentro de este dominio de servicio. Lite Options Profile Body (Perfil de cuerpo de opciones ligeras) Usado para objetos en otros servidores o streams de transporte. Un IOR puede contener ms de un perfil de cuerpo si el objeto est dis- ponible en ms de un carrusel y el set top box puede elegir el ms f- cil/rpido de accesar. Se usan taps para resolver el problema de que las PIDs usadas para transmitir DIIs, DDBs y streams de video/audio no son conocidas hasta el momento inmediato antes de la transmisin. Dentro del carrusel, todas las referencias a las PIDs solo se hacen en trminos de un tap; las asociacio- nes entre un tap y una PID real se hacen en el SI. Esto simplifica basta- mente la remultiplexin de los streams en diferentes redes.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 68 11.2.1.9 Sincronizacin de datos MPEG-2 Existe la necesidad de que la transmisin de datos est sincronizada en alguna forma siendo programas lo que se transmite. No es prctico en realidad usar la distribucin en tiempo real de un dato como mtodo de sincronizacin excepto en aplicaciones en tiempo real que no sean crti- cas como la actualizacin de marcadores en eventos deportivos en los que unos pocos segundos o ms de error no tiene significado prctico; sin embargo, an un segundo o dos pueden tener un impacto muy grande en, por ejemplo, programas de preguntas en los que revelar las respuestas demasiado antes puede tener consecuencias serias. MPEG-2 proporciona diferentes mecanismos de temporalizacin para diferentes tipos de encapsulamiento de datos. La canalizacin de datos y el MPE no respaldan ninguna forma de mecanismo de temporalizacin aparte de la distribucin casi en tiempo real de los datos. El streaming de datos de paquetes PES pueden contener estampados de tiempo de presentacin o PTS (Presentation Time Stamp) y posiblemente decodificacin de los estampados de tiempo o DTS (Decoding Time Stamp) de los estampados de tiempo para la sincronizacin con el reloj de sistema derivado de los valores de PCR en el stream. El mecanismo es exactamente el mismo para la sincronizacin y decodificacin de audio o video. Los carruseles de datos MPEG-2 no tienen informacin de temporaliza- cin; sin embargo, los carruseles de objetos pueden contener un objeto especial llamado un evento stream que contiene informacin de tempo- ralizacin relacionada con el tiempo de reproduccin normal o NPT (Nor- mal Play Time) de un programa de televisin individual. El NPT no es el mismo que la PCR ya que el reloj del NPT se puede detener, por ejemplo, durante un corte comercial. En otras palabras, el NPT de un programa puede permanecer en total sincronizacin con la lnea de tiempo del programa sin importar de cuando se transmita o como se divida en fun- cin a los cortes comerciales. 11.2.2 Encapsulado de datos DVB DVB ha adoptado los mtodos de encapsulado de la norma MPEG-2 con solo variaciones menores, principalmente para remover posibles ambi- gedades que emergen de las especificaciones originales (EN 301 192). Estas incluyen la especificacin de un formato de MPE ligeramente dife- rente y restricciones impuestas al mximo tamao de paquete de datos PES. DVB tambin ha tomado la responsabilidad de asegurar que no puedan haber ambigedades entre los servicios de datos que usan IORs proporcionando la localizacin nica de las IDs de la red y la del servidor. DVB tambin ha definido dos formatos de streaming de datos PES para el subtitulado y el teletexto en DVB y tiene un formato normalizado para usar los carruseles de datos para transmitir actualizaciones de firmware al set top box (STB). El DVB tambin ha definido un nmero de descriptores de datos y tablas adicionales que se discuten ms abajo en las secciones de sealizacin y anuncios. La ms til de esas adiciones es la capacidad de usar un descriptor para proporcionar una mascarilla simple para las direc- ciones de MAC en un datagrama MPE. Esto permite un respaldo simple para servicios estrechos, multi o de transmisin MPE. 11.2.3 Encapsulado de datos ATSC A/90 La especificacin ATSC A/90 fue escrita hace muchos aos despus que el sistema DVB e incluye algunas diferencias significativas con las normas de DVB y MPEG-2. Primero, la A/90 no usa carruseles de objeto y el sistema CORBA/IOR menos, sino que usa una tabla separada, la Tabla de recursos de red o NRT (Network Resources Table), para proporcionar la informacin de conexin que enlaza un dato referenciado con su locali- zacin real. Aparte de una dudosa simplificacin de la operacin del sistema tambin habilita el soporte directo para las URLs de Internet que no son soportadas por DVB o MPEG. El mecanismo es mostrado en la Figura 11-4. En segundo lugar, la A/90 solo usa carruseles de datos que efectivamente contengan solo un objeto simple. El formato del carrusel de datos se ha extendido para incluir en forma opcional una adaptacin de un encabezador de DSM-CC que puede contener un PTS para habilitar la distribucin de datos sncronos. El concepto de MPEG de NPT dentro de un programa no es soportado. A/90 tambin define tipos de datos adicio- nales incluyendo su propia versin de MPE de DSM-CC as como permitir que a los datos de IP se les haga un streaming usando el formato PES. Tambin soporta una amplia variedad de modelos de temporalizacin para diferentes tipos de datos aparte del DVB.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 69
Figure 11-4
11.2.4 Encapsulado de datos de ARIB La norma japonesa ARIB fue definida a partir de la norma A/90 y es dudosamente el ms simple de todos los sistemas. No respalda la canali- zacin de datos o los carruseles de objetos. En lugar de eso usa el forma- to de carruseles de datos para enviar una o ms entidades imponiendo una estructura de directorio especfica al contenido del carrusel de datos. El ARIB no permite referencias a ninguna entidad que no est referida en el PMT y por tanto no tiene necesidad de CORBA (Common Object Re- quest Broker Architecture. Arquitectura de intermediario de requisicin de objetos comunes) ni de enlaces de tipo NRT. 11.3 Transmisin de contenidos de datos Los servicios de datos primero son encapsulados de acuerdo con la norma nacional o internacional relevante y luego transmitidos a travs de un stream de transporte a un STB; sin embargo, con el fin de usar un servicio de datos, el STB primero debe saber que existe un servicio de datos y cuando estar disponible (anunciarlo). En segundo lugar enton- ces deber ser posible encontrar e identificar las varias componentes del servicio de datos (sealizacin) cuando se est trasmitiendo en realidad. MPEG-2 solo define la PAT y la PMT por lo que todos los anuncios y sealizaciones solo podrn hacerse por la inspeccin del tipo de stream elemental y algunos descriptores muy bsicos. Aunque tiles hay un gran nmero de limitaciones para solo usar la PAT y PMT, no solo que el agendado de los servicios de datos o eventos no es posible. DVB y ATSC han definido tablas adicionales que incrementan significativamente la cantidad de informacin proporcionada acerca de cualquier servicio de datos presente. Note que en todos los casos las PIDs que transmiten datos deben ser sealizadas como presentes con una entrada en por lo menos un PMT.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 70 11.3.1 Anuncio de DVB La DVB considera que los servicios de datos estn asociados con un evento individual (por ejemplo, un programa simple de preguntas) o son parte de un servicio como un canal de deportes. De hecho, se apegan al paradigma de MPEG-2 en el que un servicio de datos es lgicamente indistinguible de un stream de audio o video convencional. Por consiguiente, simplemente ha definido un nmero de descriptores adicionales que son colocados en el EIT o la tabla SDT que anuncia que un servicio de datos o eventos estar disponible. La localizacin real de los servicios de datos y componentes sern entonces sealizados usando las tcnicas que se describen a continuacin. La nica nueva tabla es la Tabla de informacin de la aplicacin que es definida por el uso con solo los servicios MHP. Esta contiene una lista de todas las aplicaciones dentro de un carrusel, un indicador a su clase de boot y opcionalmente permite que las aplicaciones se inicien automti- camente o se cierren al cambiar el canal. 11.3.2 Anuncio de ATSC En contraste con la DVB, la especificacin A/90 trata los eventos de datos y servicios completamente por separado de los servicios de audio y video y ha adicionado un nmero de tablas para soportar ese paradigma. Estas tablas son la Tabla de servicios de datos o DST (Data Services Table), que enlista los servicios de datos que se estn enviando y la Tabla de eventos de datos o DET (Data Event Table). La DET es exactamente anloga a la EIT para la informacin de agendado convencional del pro- grama y usa una sintaxis idntica. Una tercera tabla, la de servicios a largo plazo es similar a la DET pero proporciona informacin de agendado a largo plazo, ms all de los 16 das mximos proporcionado por la DET. 11.4 Presentacin de contenido La etapa final de la transmisin de datos es correr la aplicacin en el STB y presentar la informacin al espectador. Se debe hacer notar que un stream de transporte es completamente agnstico al contenido real que est transportando, asumiendo que, por supuesto, est encapsulado con el protocolo correcto para video, audio o datos. En otras palabras, la siguiente seccin casi est completamente desvinculada de las normas de transmisin de datos de MPEG-2, DVB o ATSC como aplicaciones y los datos son distribuidos por el stream de transporte a utilizar por el STB. 11.4.1 Set Top Box intermediario (Middleware) En algunos casos, como el de los datos de Internet, el ambiente en el que los datos se van a usar es auto definido o relativamente no tiene impor- tancia; sin embargo, en la mayora de los casos, como en los juegos y aplicaciones es crtico que los datos de la aplicacin estn construidos de tal forma que corran adecuadamente en el STB de target. En la mayora de los casos, el STB tendr una interfase de programa de aplicacin o API (Application Program Interface) que correr y que conecta las llamadas de funcin de alto nivel de la aplicacin a los controladores del software que controlan el hardware real en el STB y enlaza los datos en el stream de transporte. Esta capa de software que est entre la aplicacin y los con- troladores es conocida como intermediaria o de middleware. Sin embargo hay una gran variedad de STB en uso en todo el mundo. Su desempeo y caractersticas corren desde cajas muy bsicas que solo podrn decodificar y desplegar una imagen bsica de calidad estndar con las unidades ms modernas con poderosas capacidades de proce- samiento. Algunas unidades modernas tienen integrados de grficos de alto desempeo y corren sistemas operativos completos como Linux o Windows, estn equipados con disco duro para la grabacin de progra- mas, tienen DVD ROMs para la reproduccin de DVDs y pueden correr paquetes de programas convencionales como el Office de Microsoft o Star Office. Una grfica simple diseada para el despliegue en una caja nueva de alto desempeo podra ser que no se pueda desplegar en una unidad ms antigua. Los desarrolladores de aplicaciones podran tener que escribir programas completamente diferentes usando diferentes lenguajes de programacin para cada tipo de set top box, middleware y sistema opera- tivo, algo claramente ineficiente y que incrementa los costos de desarro- llo. Ha habido un buen nmero de intentos de normalizar la cajas o cuando menos su funcionalidad mnima en la que la funcionalidad de la caja claramente es definida y controlada por las empresas de broadcast en una forma muy cerrada. Otra aproximacin ha sido tomada por compaas que proporcionan una solucin completa ofreciendo un middleware junto con las herramientas de desarrollo de aplicaciones para desarrollar los programas adecuados. Esos sistemas estn ms abiertos en tanto que el middleware puede ser licenciado para correr en una variedad de diferentes set top boxes con diferente desempeo o caractersticas en tanto que llenan las funcionali- dades bsicas requeridas.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 71 Un esquema de transmisin de datos de propietario y un servicio interacti- vo de jardn cercado han sido usados ampliamente como sistema inter- activo proporcionando una interactividad real a travs del canal de res- puesta. Otras ofertas de compaas tambin se han usado ampliamente en Europa y las aplicaciones pueden ser distribuidas usando objetos de carrusel estndar aunque hay muchos otros sistemas de propietario. Una norma ms abierta es un ambiente de aplicacin definido por el MHEG (Multimedia Hypermedia Experts Group. Grupo de expertos de hipermedia multimedia). Una variante particular de esto, MHEG-5, est optimizada para aplicaciones de baja memoria y desempeo y algunos set top boxes en particular. MHEG-5 ha tenido cierto xito, notablemente en Inglaterra donde se le usa para transmisiones terrestres a STBs. La tendencia actual es hacia la normalizacin en middleware abierto con una API de programacin claramente definida. Esta tiene el beneficio de que el consumidor puede elegir de entre una amplia variedad de set top boxes mientras que le permite a los desarrolladores de aplicaciones reusar el cdigo. Recientemente ha emergido un nmero de candidatos para una norma global, incluyendo la plataforma de multimedia para el hogar o MHP (Multimedia Home Platform) de la DVB. En USA el Foro de mejoramiento de la televisin avanzada o ATVEF (Advanced Television Enhancement Forum) y el ambiente de software de TV digital o DASE (Digital TV Application Software Environment) son las normas abiertas lderes. 11.4.2 Plataforma DVB de multimedia para el hogar o MHP (Multime- dia Home Platform) La plataforma multimedia para el hogar o (Multimedia Home Platform) define una API de gran amplitud con muchos perfiles y niveles diferentes para permitir diferentes STB de diferentes desempeos, costos y servi- cios. La TV mejorada e interactiva (con canales de respuesta) son sopor- tadas y tambin proporcionan soporte para conexiones a Internet que de otra forma no seran soportados directamente por otras normas de DVB. Las aplicaciones de MHP son distribuidas usando carruseles de objeto estndar de DVB y anunciadas usando la tabla AIT descrita antes. Esto permite que las aplicaciones se auto inicialicen, se pongan en pausa o se detengan y que los recursos sean puestos en cach en forma explcita con el fin de acelerar los tiempos de inicio de las aplicaciones. La norma MHP est basada en tecnologa J ava y comprende un juego de APIs derivadas de normas existentes como J avaTV, HAVI (home audio video interoperability. Interoperatibilidad de audio y video en el hogar) y DAVIC (Digital Audio Visual Council. Consejo audiovisual digital). Las aplicaciones pueden ser de J ava o basadas en HTML y hay un nme- ro de kits de desarrollo de software MHP disponible de diferentes provee- dores. Las aplicaciones tendrn que someterse a una prueba de confor- midad y estar electrnicamente firmadas para asegurar tanto la interope- ratibilidad como la seguridad del sistema. El logo de MHP tambin est protegido y los STBs debern pasar por un proceso de conformidad antes de que puedan ser vendidos con el logo. Las pruebas de interoperatibilidad regular se han llevado a cabo durante los ltimos dos aos para asegurar que todas las aplicaciones de MHP puedan corren en todas las set top boxes MHP de una gran variedad de fabricantes lder. MHP es la norma de facto en Europa y sus servicios oficialmente iniciaron en Finlandia en Agosto del 2001. Hay un gran nme- ro de servicios de prueba actualmente transmitindose en Europa. Ale- mania tambin usar MHP a partir de mediados de 2002 y otros pases harn lo mismo dentro de los siguientes pocos aos despus. Sin embar- go, MHP no es solo una norma Europea ya que ha sido adoptada en todo el mundo. Por ejemplo, es obligatoria en Corea del Sur para la transmisin de datos va satlite y en Australia para la transmisin terrestre. En febre- ro de 2002 la organizacin de plataformas de aplicaciones abiertas para cable o OCAP (Open Cable Applications Platform) de Estados Unidos adopt la MHP como la norma para transmisin de cable digital america- na. Se espera que muchos otros pases y organizaciones adopten el MHP en corto plazo. El impacto global de la MHP no debe ser subestimado. Los lderes actua- les del mercado de servicios de TV interactiva se han comprometido a proporcionar un plug-in MHP para usarlo en su propio middleware de propietario durante 2002, abriendo efectivamente todas sus ser top boxes de propietario a un mercado global. Con algunos pases comprometidos con la MHP en toda Europa ya hay un mercado potencial de casi un billn de espectadores que auguran un buen futuro a esta norma abierta.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 72 11.4.3 ATVEF DASE Algunas veces se dice que la diferencia entre ATVEF (Advanced Television Enhancement Forum. Foro de mejoramiento de la television avanzada) y DASE (DigitalTV application software environment. Ambiente de software de aplicacin de la television digital) es que el primero reco- mienda el uso de HTML pero permite el uso de J ava, mientras que el segundo recomienda J ava y permite HTML; sin embargo, hay otras dife- rencias fundamentales. La especificacin ATVEF fue escrita por un grupo formado por fabricantes de varias industrias con el fin de definir una funcionalidad normalizada que debe ser proporcionada con el fin de permitir que el contenido interactivo corra en set top boxes, receptores basados en PC y TVs interactivas. La especificacin de contenido mejorado o ECS (Enhanced Content Specifi- cation) fue el resultado. La ATVEF ECS define HTML como fundamento para crear contenido de TV interactiva aunque tambin se permite J avaScript. Tambin se requie- re otras funcionalidades bsicas como el uso de grficas en formato de red porttil (.png) como formato de intercambio de imgenes estndar. ATVEF, por tanto, tiene muchas cosas substancialmente en comn con el diseo de pginas de Internet con obvios beneficios para los desarrollado- res de aplicaciones. Una de las fortalezas de ATVEF es que el mecanismo de transporte no est completamente definido o se asume por la norma. Es perfectamente capaz de correr esquemas de transmisin analgicos o digitales, con o sin contenido de video. Esto se logra definiendo un formato de contenido independiente del transporte y por el uso de IP como vnculo de referen- cia. Cualquier esquema de transmisin que use IP, por tanto, podr usar- se. Esto ha permitido que el ATVEF corra en esquemas NTSC as como en streams de transporte MPEG y proporciona un mecanismo simple para una trayectoria de regreso. El ATVEF se est usando en USA en sistemas de televisin tanto analgica como digital. 11.4.4 DASE En contraste, DASE es una especificacin de middleware mucho ms compleja que fue desarrollada por el ATSC en USA. Ya que el ATSC tambin desarroll la norma de transmisin de datos A/90 la especifica- cin DASE proporciona un vnculo al esquema de transmisin A/90 ade- ms de que define la API en la que un aplicacin DASE correr. La norma DASE-1 fue desarrollada como una norma candidata a principios de 2002. DASE incorpora un esquema de sealizacin y un esquema de anuncios as como el contenido de los datos de aplicacin en s, que son llamados datos de esencia. Se permiten dos tipos de datos de esencia junto con el ambiente y funcionalidad que pueden usar:
Datos de esencia declarativos basados en el lenguaje de marcado de texto y scripts .xdml y .xml. Datos de esencia procedurales basados en javatv xlets. Un receptor DASE proporciona un motor para manejar ambos tipos de datos de esencia junto con funcionalidades de ncleo comn como los codecs .jpeg o .png que son compartidos entre los dos sistemas. DASE tambin proporciona enlaces directos al contenido de audio y video que se est transmitiendo y define un nmero de formatos grficos de pantalla para desplegar contenido interactivo, incluyendo resoluciones de HDTV. Las aplicaciones se pueden inicializar, activar, suspender o desinicializar en una forma similar al paradigma del ciclo de vida de una aplicacin MHP. Los recursos se pueden poner en el cach como se requiera. Aunque DASE tiene todo el apoyo de ATSC detrs, es un contendiente relativamente tardo en este campo y por tanto an no ha sido adoptado ampliamente.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 73 Seccin 12 Prueba de MPEG La capacidad de analizar streams de transporte existentes para checar su conformidad es esencial pero esta habilidad debe ser complementada por una habilidad de crear streams de transporte que se sepa que se apegan a las normas. 12.1 Requerimientos para las pruebas Aunque la tecnologa de MPEG difiere dramticamente de la tecnologa que le precede, los requerimientos de prueba son bsicamente los mis- mos. En base a las operaciones, el usuario quiere tener un chequeo simple y regular que asegure que todo est bien. En el caso de una falla, la localizacin de esta necesita ser establecida rpidamente. Para el diseo de equipo, la naturaleza de los problemas necesita ser explorada con algn detalle. Como con las seales de prueba, la aproximacin es combinar la generacin de seales vlidas conocidas para su insercin en un sistema con la capacidad de administrar seales en varios puntos. Una de las caractersticas de MPEG que la aparta del equipo de transmi- sin de video tradicional es la existencia de capas mltiples de informa- cin en las que se espera que cada una de ellas sea transparente para las que estn debajo. Es muy importante ser capaces de establecer en que capa reside una falla para evitar bsquedas infructuosas. Por ejemplo, si el monitor de imagen de un Decoder MPEG est mostrando defectos visibles, estos podran deberse a un buen nmero de posibilidades. Quiz el Encoder est dando problemas y el stream de transporte est entre- gando fielmente la informacin con fallas. Por otro lado, el Encoder podra estar bien pero la capa de transporte podra estar corrompiendo los datos. En DVB, hay an ms capas como las de dispersin de energa, correc- cin de errores e interpolacin. Tal complejidad requerir una aproxima- cin estructurada para encontrar las fallas usando las herramientas ade- cuadas. La discusin del anlisis de protocolo de los datos comprimidos en este Primerpodra ayudar al usuario a derivar esa aproximacin. Leer la discusin de otro aspecto importante de las pruebas para televisin comprimida, Valoracin de la calidad de imagen, tambin podra ser til. Esta ltima discusin se encuentra en la publicacin A Guide to Video Measurements for Compressed Television Systems. (Una gua para las mediciones de video para sistemas de televisin comprimidos) 12.2 Anlisis de un stream de transporte Un stream de transporte MPEG tiene que ser una estructura extremada- mente compleja pero un analizador como el AD953 puede dividir la estruc- tura en una forma lgica de tal forma que el usuario pueda observar cualquier detalle requerido. Muchos tipos generales de anlisis pueden llevarse a cabo en tiempo real en un stream de transporte en vivo; estos incluyen los despliegues de la jerarqua de los programas en el stream de transporte y de la proporcin de la relacin de bits del stream asignado a cada stream.
Un anlisis ms detallado solo es posible si parte del stream de transporte es grabado de tal forma que pueda ser dividido en partes posteriormente. Esta tcnica es conocida como pruebas de tiempo diferido y pueden usarse, por ejemplo, para examinar el contenido de un estampado de tiempo. Cuando se usan las pruebas de tiempo diferido, el analizador del stream de transporte de MPEG estar actuando como un analizador lgico que proporciona herramientas de interpretacin de datos especficas para MPEG. Como con todos los analizadores lgicos, un mecanismo de disparo en tiempo real se requerir para determinar el tiempo o las condi- ciones bajo las cuales la captura tendr lugar. La Figura 12-1 muestra que el analizador contiene una seccin de tiempo real, una seccin de alma- cenamiento y una seccin diferida. En el anlisis en tiempo real, solo la seccin de tiempo real opera y se necesitar que una fuente de seal est conectada. Para la captura se usa una seccin en tiempo real para deter- minar cuando disparar la captura. El analizador incluye herramientas conocidas como filtros que permiten que se aplique el anlisis selectivo antes o despus de la captura. Una vez que la captura est completa, la seccin diferida puede operar sobre los datos capturados y ya no ser necesaria la seal de entrada. Hay una buena analoga con el osciloscopio de almacenaje que puede desplegar la entrada de tiempo real directamente o salvarla para estudiar- la despus.
Figura 12-1
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 74
Figura 12-2 12.3 Vista jerrquica Cuando se analiza un stream de transporte que no sea familiar, la vista jerrquica es un excelente punto de inicio porque habilita una vista grfica de cada componente en el stream. La Figura 12-2 muestra un ejemplo de despliego jerrquico como el proporcionado por el MTX100 de Tektronix. Comenzando en la parte superior izquierda del stream de transporte completo, el stream se divide y se presenta un icono para cada compo- nente del stream. La tabla 12-1 muestra los diferentes conos que la vista jerrquica usa y su significado. El usuario puede ver muy fcilmente cuantos streams de programa estn presentes y el contenido de audio y video de cada uno. Cada icono representa la capa superior de un nmero de anlisis ms bajo y capas de informacin El analizador crea la vista jerrquica usando la PAT y la PMT en los datos de PSI en el stream de transporte. Las PIDs de esas tablas se despliegan debajo de cada icono. Los datos de las PAT y PMT son fundamentales para la operacin de cualquier Demultiplexor o Decoder; si el analizador no puede desplegar una vista jerrquica o despliega una vista la cual obviamente est mal, el stream de transporte a prueba tendr un error de PAT/PMT. Es poco probable que el dems equipo sea capaz de interpre- tar el stream.
Figura 12-3
Figura 12-4 La habilidad de un Demux o Decoder de amarrarse a un stream de transporte depender de la frecuencia con la que los datos de PSI son enviados. La opcin de relacin PSI/SI mostrada en la Figura 12-3 des- plegar la frecuencia de insercin del sistema de informacin. La informa- cin de PSI/SI deber tambin ser consistente con el contenido real en el stream de bits. Por ejemplo, si una PID dada es referida en una PMT debe ser posible encontrar PIDs de ese valor en el stream de bits. La funcin de chequeo de consistencia hace esa comparacin. La Figura 12-4 muestra una consistencia de error de un stream incluyendo dos paquetes no referenciados.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 75 Tabla 12-1. Iconos de la vista jerrquica
Icono Tipo de elemento Paquetes de transporte mltiplex. Este icono representa a todos (paquetes de transporte de 188- y 204- bytes) los que forman el stream. Si visualiza el stream de transporte como un tren, este icono representa cada carro en el tren sin importar su configuracin (por ejemplo, vagn, furgn o silo) y lo que contiene.
Paquetes de transporte de una PID particular (ID de programa). Otros elementos (tablas, relojes, paquetes PES) que son la payloadcontenida dentro de los paquetes de transporte o se construyen a partir de la payload de muchos paquetes de transporte que tienen la misma PID. El nmero de PID aparece debajo del icono. En la vista jerrquica el icono a la derecha de este representa la payloadde los paquetes con esta PID.
Paquetes de transporte que contienen relojes de PCR independientes. La PID aparece debajo del icono.
Secciones PAT (Program Association Table. Tabla de asociacin de programa). Siempre est contenida en los paquetes de transporte de PID 0
Secciones PMT (Program Map Table. Tabla de mapa de programa)
Secciones NIT (Network Information Table. Tabla de informacin de red). Proporciona acceso a las tablas SI a travs de la instruccin PSI/SI del men de seleccin. Tambin se usa para las secciones privadas. Cuando la opcin DVB est seleccionada (en el men de Opciones) este icono tambin puede representar las secciones SDT, BAT, EIT y TDT.
PES (Packetized Elementary Stream. Stream elemental paquetizado). Este icono representa todos los paquetes que, juntos, contienen un stream elemental dado. Los paquetes PES elementales son ensamblados a partir de payloads de muchos paquetes de transporte.
Stream elemental de video
Stream elemental de audio
Stream elemental de datos
Secciones ECM (Entitlement Control Message. Mensaje de control de derechos)
Secciones EMM (Entitlement Management Message. Mensaje de administracin de derechos)
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 76
Figura 12-5 Una tabla de localizacin de MUX puede desplegar grficamente las proporciones del stream de transporte asignado a cada PID o programa. La Figura 12-5 muestra un ejemplo de un despliegue de la tabla de locali- zacin de un MUX. La vista jerrquica y la Tabla de localizacin de MUX muestran el nmero de elementos en el stream de transporte y la propor- cin del ancho de banda asignado. 12.4 Vista interpretada Como una alternativa para checar datos especficos en lugares no especi- ficados es posible analizar datos no especificados en lugares especficos incluso en los paquetes del stream de transporte, las tablas o los paque- tes PES. Este anlisis es conocido como vista interpretada porque el analizador hace un anlisis (parse) y decodifica los datos y luego desplie- ga su significado. La Figura 12-6 muestra un ejemplo de un paquete de transporte MPEG en vista hex as como en vista interpretada. A medida que se cambia el tem seleccionado, el nmero de paquete relacionado con el inicio del stream puede ser desplegado. La Figura 12-7 muestra un ejemplo de una PAT en la vista interpretada.
Figura 12-6
Figura 12-7
12.5 Sintaxis y anlisis de CRC Para embarcar material de programa, el stream de transporte depende completamente del uso exacto de la sintaxis por parte de los Encoders. Sin ajustes correctos de bits de bandera fija, patrones de sincrona, cdi- gos de inicio de paquete y conteos de paquete, un Decoder puede inter- pretar mal el stream de bits. La funcin de chequeo de sintaxis considera todos los bits que no son material de programa y despliega cualquier discrepancia. Las discrepancias espurias pueden deberse a errores de transmisin, las discrepancias consistentes apuntan a un Encoder o Multiplexor con fallas. La Figura 12-8 muestra un error de sintaxis as como un chequeo de redundancia cclica (CRC) faltante.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 77
Figure 12-8 Muchas tablas MPEG tienen adjuntadas checksums o CRCs para la deteccin de errores. El analizador puede recalcular los checksums y compararlos con el checksum original, De nuevo, las inconsistencias espurias de CRC pueden deberse a errores de bits del stream pero los errores consistentes de CRC apuntan a fallas de hardware. 12.6 Filtraje Un stream de transporte contiene una gran cantidad de datos y en condi- ciones reales de falla, es probable que a menos de que exista un proble- ma serio, muchos de los datos son vlidos y quiz solo un stream elemen- tal o un programa est afectado. En ese caso, es ms efectivo probar en forma selectiva lo cual es la funcin del filtraje. Esencialmente, el filtraje le permite al usuario de un analizador ser ms selectivo cuando examine un stream de transporte. En lugar de aceptar cada bit, el usuario puede analizar solo aquellas partes de los datos que llenen ciertas condiciones. Una condicin que resulta del filtraje de los encabezadores de los paque- tes es que solo los paquetes con una PID dada sern analizados. Esta aproximacin hace que resulte sencillo checar la PAT seleccionando PID 0, y de aqu, todos los otros PIDs podrn leerse. Si las PIDs de un stream del que sospechamos se conocen, quiz por ver un despliegue jerrquico, ser sencillo seleccionar una PID simple para el anlisis.
Figure 12-9 12.7 Anlisis de temporalizacin Las pruebas descritas checan la presencia de los elementos correctos y la sintaxis del stream de transporte; sin embargo, para desplegar el audio y video correctamente en tiempo real, el stream de transporte tambin debe entregar una temporalizacin exacta a los Decoders. Esta tarea puede ser confirmada analizando la PCR y los datos de estampado de tiempo. La transferencia correcta de los datos del reloj de programa es vital por- que estos datos controlan la temporalizacin completa del proceso de decodificacin. El anlisis de PCR puede mostrar que, en cada programa, los datos de PCR se envan a una relacin suficiente y con suficiente exactitud para cumplir con las normas. Los datos de PCR de un Multiplexor pueden ser precisos, pero al remulti- plexar se pueden poner los paquetes de un programa dado en un lugar diferente en el eje del tiempo, requiriendo que los datos de PCR sean editados por el Remultiplexor. Consecuentemente, es importante probar la PCR para checar las inexactitudes despus de que los datos son remulti- plexados. La Figura 12-9 muestra un despliegue de PCR que indica las posiciones a las cuales la PCR se recibi con respecto al reloj promedio. En el si- guiente nivel de despliegue, cada PCR puede ser abierta para desplegar los datos de la PCR como se muestra en la Figura 12-10. Para medir inexactitudes, el analizador predice el valor de la PCR usando las PCRs previas y la relacin de bits para producir lo que es llamado la PCR inter- polada. El valor real de la PCR es sustrado de la PCR estimada para dar una estimacin de las inexactitudes.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 78
Figura 12-10 Una aproximacin alternativa mostrada en la Figura 12-11 proporciona un despliegue grfico del intervalo de PCR, jitter, desbalanceo de frecuencia y deriva de la seal que es actualizada en tiempo real. La Figura 12-12 muestra un despliegue de estampado de tiempo para un stream elemental seleccionado. Se muestra ka unidad de acceso, el tiempo de presentacin y donde es apropiado, la hora de decodificacin. En MPEG, el reordenamiento y el uso de diferentes tipos de imagen provocan un retraso y se requiere un Buffering tanto en el Encoder como en el Decoder. Un stream elemental dado debe ser codificado dentro de las restricciones de la disponibilidad del Buffering en el decoder.
Figura 12-12
Figura 12-11 MPEG define un Decoder modelo llamado T-STD (Transport Stream System target decoder. Decoder de target del sistema de stream de transporte); un Encoder o Multiplexor no debe distorsionar el flujo de datos ms all de la capacidad de Bufferingdel T-STD. El stream de transpor- te contiene los parmetros llamados VBV (Video Buffer Verify. Verificar el Buffer de video) que especifica la cantidad de Buffering necesario para un stream elemental dado. El anlisis T-STD despliega grficamente como se ocupa el Buffer para que los sobreflujos y los underflowsse puedan ver fcilmente. La Figura 12-13 muestra un despliegue de Buffering.
Figura 12-13
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 79 La salida de un Compresor/Multiplexor normal es de uso limitado porque no es determinstico. Si el defecto de un Decoder es visto, no hay garanta de que el mismo defecto sea visto en una repeticin de la prueba porque la misma seal de video no dar como resultado el mismo stream de transpor- te. En este caso, un stream de transporte absolutamente repetible es esen- cial para lograr que el defecto se repita para su estudio o rectificacin. El jitter del stream de transporte debe estar entre ciertos lmites pero un Decoder bien diseado debe ser capaz de recuperar programas ms all de ese lmite con el fin de garantizar una operacin confiable. No hay forma de probar esta capaci- dad usando streams de transporte existentes porque, si cumplen con las normas, el Decoder no se estar probando. Si hay una falla, no ser repetible y podra no quedar claro si la falla se debi al jitter o algn otro incumplimiento de las normas. La solucin es generar un stream de transporte que cumpla con las normas en todos los aspectos y luego adicionar una cantidad controlada de inexactitudes para que estas sean conocidas y por tanto sean la nica parte de la seal que no cumpla con las normas. La funcin de editor del AD953 est diseada para crear esas seales. 12.8 Pruebas al stream elemental Debido a la naturaleza flexible del stream de bits MPEG, el nmero de posibilidades y combinaciones que contiene es casi incalculable. Ya que el Encoder no est definido, los fabricantes no estn forzados a usar cada posibilidad; de hecho, por razones econmicas, esto sera improbable. Este hecho hace que hacer pruebas sea muy difcil porque el hecho de que un Decoder trabaje con un Encoder particular no prueba su conformi- dad con las normas. Ese Decoder podra simplemente no usar los modos que causan que el Decoder falle. Una mayor complicacin aparece porque los Encoders no son determins- ticos y no producirn el mismo stream de bits si se repite la entrada de audio o video. Hay pocas oportunidades de que exista el mismo alinea- miento entre las imgenes I-, P- y B-y los cuadros de video. Si un decoder falla en una prueba dada, podra no hacerlo la siguiente vez que se corra la prueba haciendo difcil la localizacin de errores. Una falla con un Encoder dado no determina si la falla est en el Encoder o el Decoder. La dificultad de codificacin depende fuertemente en la naturaleza del mate- rial de programa y cualquier material dado no necesariamente ejercer cada parmetro sobre todo el rango de codificacin. Para hacer pruebas que tengan resultados significativos, se requieren dos herramientas:
Una fuente conocida de seales de prueba que cumplan con las normas y que deliberadamente exploren todo el rango de codificacin. Esas seales deben ser determinsticas para que la falla en un Decoder d sntomas re- petibles. Los streams de bits que cumplen con Sarnoff estn diseados pa- ra ejecutar esta tarea. Un analizador de stream elemental que permita checar la conformidad con las normas de la sintaxis completa de un Encoder.
Figura 12-14
12.9 Streams de bits que cumplen con Sarnoff Esos streams de bits han sido especialmente diseados por la Corpora- cin Sarnoff para probar la conformidad con las normas del Decoder. Estos pueden estar multiplexados en un stream de transporte que alimen- ta un Decoder. No se requiere tener acceso al funcionamiento interno del Decoder. Para evitar la necesidad de un anlisis largo de la salida del Decoder, los streams de bits tienen que ser diseados para crear una imagen plana cuando se completen de tal forma que solo sea necesario conectar un monitor de imagen a la salida del Decoder para verlas. Hay un buen nmero de esas imgenes simples. La Figura 12-14 muestra la pantalla gris de verificacin. El usuario debe examinar la pantalla de verificacin para ver las discrepancias que se desplegarn bien contra el campo gris. Tambin hay algunas imgenes de verificacin que no son grises. Algunas pruebas no darn como resultado una imagen si hay una falla, esas pruebas despliegan la palabra VERIFY en la pantalla cuando se completan. Otras pruebas requieren que el espectador cheque que haya un movimiento suave de un elemento que se mueve por la imagen. Los problemas de temporalizacin o de orden provocarn un jitter visible. El paquete de pruebas de Sarnoff puede ser usado para checar todos los elementos de la sintaxis MPEG a la vez. En una prueba, el stream de bits comienza solo con imgenes I-, adiciona imgenes P- y luego adiciona imgenes B- para probar si se pueden manejar y reordenar correctamente todos los tipos de imgenes de MPEG. La compatibilidad atrasada con MPEG-1 se puede probar. Otras streams de bit hacen pruebas usando un rango de diferentes estructuras de GOP. Hay pruebas que checan la operacin de los vectores de movimiento y hay pruebas que varan el tamao de las slices o la cantidad del relleno.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 80
Figura 12-15 Adems de proporcionar pruebas para el Decoder, los streams Sarnoff tambin incluyen secuencias que causan que un buen Decoder produzca seales de prueba de video estndar para checar los DACs (digital-to- analog converter. Convertidores digital a analgico), niveles de seal y/o Encoders Y/C. Esas secuencias convierten al Decoder en un generador de patrones de prueba de video capaces de producir seales de video convencionales como placas de zonas, rampas y barras de color. 12.10 Anlisis del stream elemental Un stream elemental es la carga til o payload que el stream de trans- porte debe entregar en forma transparente. El stream de transporte lo har ya sea que el stream elemental cumpla o no con las normas. En otras palabras probar un stream de transporte en conformidad simplemen- te significar checar que est entregando streams elementales sin cam- bios. Eso no significa que los streams elementales estn bien ensambla- dos para empezar. La estructura o sintaxis del stream elemental es la responsabilidad del Compresor. Por tanto, probar un stream elemental es esencialmente una forma de prueba del Compresor. Se debe hacer notar que un Compresor puede producir una sintaxis que cumpla con las normas y an as tener una calidad de audio o video pobre; sin embargo, si la sintaxis es incorrec- ta, un Decoder podra no ser capaz de interpretar el stream elemental. Ya que los compresores son algortmicos ms que determinsticos, un stream elemental podra no cumplir con las normas de forma intermitente si algn modo de operacin menos comn no se est implementado ade- cuadamente.
Figura 12-16 Ya que los streams de transporte frecuentemente contienen muchos programas que vienen de diferentes Coders, los problemas de stream elemental tienden a estar restringidos a un programa mientras que los problemas del stream de transporte tienden a afectar a todos los progra- mas. Si los problemas son notados con la salida de un Decoder en parti- cular, entonces las pruebas de conformidad con Sarnoff debern correrse en ese Decoder. Si son satisfactorias, la falla podra estar en la seal de entrada. Si la sintaxis del stream de transporte ya se prob o si otros programas estn trabajando sin fallas, entonces se justificar un anlisis de stream elemental. El anlisis de stream elemental puede iniciar en el nivel superior de la sintaxis y continuar hacia abajo. Los encabezadores de secuencia son muy importantes ya que le dicen al Decoder todos los modos y parme- tros relevantes usados en la compresin. La sintaxis del stream elemental descrito en las secciones 5.1 y 5.2 se deben usar como guas. La Figura 12-15 muestra un encabezador de secuencia y su extensin desplegada en un AD953. A un nivel ms bajo de pruebas, la Figura 12-16 muestra un cuadro B- decodificado junto con los vectores de movimiento sobrepues- tos en la imagen.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 81 12.11 Creando un stream de transporte Siempre que se sospeche de un Decoder es til ser capaces de generar una seal de prueba de calidad conocida. La Figura 12-17 muestra que un stream de transporte debe incluir el PSI (Program Specific Information. Informacin especfica del programa) como PAT, PMT y NIT para descri- bir uno o ms streams de programa. Cada stream de programa debe contener su propio PCR y streams elementales que tengan estampados de tiempo peridicos. Un stream de transporte DVB contendr informacin de servicio adicional como BAT, SDT y Tablas EIT. Un editor PSI/SI habilitar la insercin de cualquier combinacin que cumpla con las normas de PSI/SI en un stream de prueba de cliente. Claramente, cada tem requerir compartir la relacin del stream de transporte disponible. El Multiplexor proporciona un medidor de relacin para desplegar la relacin de bits total utilizada. La parte restante de la relacin de bits es usada insertando paquetes de relleno con PIDs que contengan solo 1sque rechazar el Decoder. 12.12 Generacin de inexactitudes PCR El Decoder MPEG tiene que recrear un reloj continuo usando las mues- tras de reloj en los datos PCR para controlar un PLL (phase-locked loop. Lazo de fase cerrada). El lazo necesita filtraje y amortiguamiento de tal forma que el jitter, en el momento de llegada de los datos al PCR, no cause inestabilidad en el reloj. Para probar el desempeo del PLL, se requiere una seal con inexactitud conocida; de otra forma la prueba no tendra sentido. El AD953 puede generar inexactitudes simuladas para ese propsito. Debido a su genera- dor de referencia, el AD953 tiene circuitos de reloj altamente estables y el jitter real a la salida es muy pequeo. Para crear el efecto del jitter, la temporalizacin de los datos PCR no se cambiar. En lugar de eso, los valores de PCR se modifican de tal forma que el conteo de PCR que contienen es ligeramente diferente del ideal. El valor modificado da como resultado errores de fase en el Decoder que son indistinguibles del jitter real.
Figure 12-17
La ventaja de esta aproximacin es que un jitter de cualquier magnitud se puede adicionar fcilmente a cualquier stream de programa simplemente modificando los datos de PCR y dejando los otros datos intactos. Otros streams de programa en el stream de transporte no necesitan que se les adicione jitter. De hecho, lo mejor podra ser tener un stream de programa estable para usarlo como referencia. Para diferentes pruebas, la base de tiempo puede ser modulada en dife- rentes formas que determine el espectro del error de fase del lazo con el fin de probar el filtraje del lazo. El jitter de onda cuadrada alterna entre valores con los cuales se igualar tarde o temprano. Los valores de jitter senoidal provocan que el error de fase sea una senoidal muestreada. El jitter aleatorio hace que el error de fase sea similar al ruido.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 82 Glosario
AAC Advanced Audio Coding - Codificacin avanzada de audio
AAU Audio Access Unit - Unidad de acceso de audio - Ver Access unit (Unidad de acceso)
AC-3 El esquema de compresin de audio inventado por los Laboratorios Dolby y especificados para la norma de televisin digital del ATSC. En el mundo del equipo de consumidor se le llama Dolby Digital.
Access Unit - Unidad de acceso Los datos codificados para una imagen o bloque de sonido y cualquier relleno (valores nulos) que le siguen.
A/D Convertidor analgico a digital.
AES Audio Engineering Society- Sociedad de ingeniera de audio
Anchor Frame - Cuadro ancla Un cuadro de video que se usa para prediccin. Los cuadros I- y P- generalmente se usan como cuadros de ancla pero los B- - nunca.
ANSI American National Standards Institute - Instituto de normas nacionales americanas
API Application Program Interface - Interfase de programa de aplicacin
ARIB Association of Radio Industries and Businesses - Asociacin de negocios e industrias de radio
Asynchronous Transfer Mode ATM - Modo de transferencia asncrono Un protocolo de seal digital para el eficiente transporte de informacin con relacio- nes continuas y como rfagas en redes digitales de banda ancha. El stream digital ATM consiste de paquetes de longitud fija llamada cells, (celdas) cada una contiene 53 bytes de 8 bits, un encabezador de 5 bytes y una carga til o payloadde 48 bytes de informacin.
ATM Vea Asynchronous transfer mode - Modo de transferencia asncrona
ATSC Advanced Television Systems Committee - Comit de sistemas de television avanzada
ATVEF Advanced Television Enhancement Forum - Foro de mejoramiento de la televisin avanzada)
AU Access Unit - Unidad de acceso
BAT Bouquet Association Table - Tabla de asociacin de bouquet
BER Bit Error Rate - Relacin de errores de bit
BFSK Binary Frequency Shift Keying - Llaveode corrimiento de frecuencia binaria
BIOP Broadcast Inter-ORB Protocol - Protocolo de transmisin Inter-Orb
Bit rate - Relacin de bit La relacin a la cual el stream de bits comprimido es distribuido del canal a la entrada de un decoder.
Block Bloque Un bloque es un arreglo de valores de pxel o coeficientes de DCT, usualmente de 8 por 8 representando informacin de luminancia o cromi- nancia
Bouquet Un grupo de streams de transporte en el que los programas son identificados por la combinacin de la ID de la red y la PID (parte de DVB-SI).
BPSK Binary Phase Shift Keying - Llaveode corrimiento de fase binaria CA - Conditional Access Informacin que indica si un programa tiene scram- bling
CAT Conditional Access Table Tabla de acceso condicional Paquetes que tienen cdigos de PID (vea la Seccin 8 Streams de Transporte) de 1 y que contienen informacin acerca del sistema de scrambling. Vea ECM y EMM.
CD Compact disc Disco compacto
CELP Code Excited Linear Predictive Predictiva lineal excitada por cdigo
Channel Code Cdigo de canal - Una tcnica de modulacin que convierte datos en bruto en una seal que puede ser grabada o transmitida por radio o cable.
CIF Common Interchange Format Formato de intercambio comn Un formato de 352x240 pixeles para video conferencias a 30 fps.
Closed GOP GOP Cerrado Un grupo de imgenes en las que las ltimas imgenes no necesitan datos del siguiente GOP para la codificacin bidireccio- nal. Los GOP cerrados se usan para hacer un punto de divisin en un stream de bits.
Coefficient Coeficiente - Un nmero que especifica la amplitud de una fre- cuencia particular o funcin de base en una transformada
CORBA Common Object Request Broker Architecture Arquitectura del intermediario de requisiciones de objeto comn
COFDM Coded Orthogonal Frequency Division Multiplex Multiplexin por divisin de frecuencia ortogonalmente codificada - Una forma modificada de OFDM. Esquema de modulacin digital que usa un nmero muy grande de portadoras, cada una transportando una relacin de datos muy baja. Usada para DVB-T.
Compression Compresin - Reduccin del nmero de bits usados para representar un tem de datos.
CRC Cyclic Redundancy Check Chequeo de redundancia cclica
DAC Digital-to-Analog Converter Convertidor digital a analgico
DASE DigitalTV Application Software Environment Ambiente de software de aplicacin para TV digital
DAVIC Digital Audio Visual Council Concejo audio visual digital
DCT Discrete Cosine Transform Transformada discreta de coseno
DDB DownloadDataBlock Bloque de datos a descargar
DET Data Event Table Tabla de evento de datos
DFT Discrete Fourier Transform Transformada discreta de Fourier
DII DownloadInfoIndication Indicacin de informacin de descarga
Dolby Digital Vea AC-3
DSI DownloadServerInitiate Iniciar descarga del servidor
DSMCC Digital Storage Media Command and Control Instruccin y control de la media de almacenamiento digital
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 83 DST Data Services Table Tabla de servicios de datos
DTS Decoding Time Stamp Decodificacin del estampado de tiempo - Parte del encabezador PES que indica cuando se ha decodificado una unidad de acceso.
DVB Digital Video Broadcasting Transmisin de video digital - General- mente se refiere al consorcio iniciado por los europeos que une a empresarios de broadcast, fabricantes, cuerpos regulatorios y otros que han creado normas para la distribucin de televisin digital y servicios de datos incluyendo versiones de DVB-C (cable), DVB-S (satlite) y DVB-T (terrestre).
DVB-SI DVB Service Information Servicio de informacin de DVB Infor- macin transportada en un mltiplex de DVB que describe los contenidos de diferentes multiplexes. Incluye NIT, SDT, EIT, TDT, BAT, RST y ST (vea la Seccin 10 Introduccin a DVB y ATSC).
DVC Digital Video Cassette Cassette de video digital
DVD Digital Versatile Disk or Digital Video Disk Disco verstil digital o disco de video digital
Elementary Stream Stream elemental. La salida en bruto de un compresor que lleva una seal simple de audio o video.
ECM Entitlement Control Message Mensaje de control de derechos. Infor- macin de acceso condicional que especifica palabras de control u otros parme- tros de scrambling especficos del stream
ECS Enhanced Content Specification Especificacin de contenido mejora- do
EIT Event Information Table Tabla de informacin de evento Parte de DVB-SI
EMM Entitlement Management Message Mensaje de administracin de derechos Informacin de acceso condicional que especifica un nivel de autori- zacin o servicios de Decoders especficos. Se puede direccionar un solo Deco- der individual o un grupo de ellos
ENG Electronic News Gathering Captura electrnica de noticias Trmino usado para describir el uso de la grabacin de video en lugar de pelcula para la cobertura de noticias
Entropy Coding Codificacin de entropa Codificacin de longitud variable sin prdidas de la representacin digital de una seal para reducir la redundancia
EOB End of Block - Fin de bloque
EPG Electronic Program Guide Gua electrnica de programas Una gua de programas distribuida por la transferencia de datos en lugar de un papel impreso.
ETSI European Telecommunication Standard Institute Instituto de normas europeas de telecomunicaciones
FEC Forward Error Correction Correccin de errores por adelantado Sistema en el que se adiciona redundancia al mensaje para que los errores puedan corregirse dinmicamente en el receptor.
FGS Fine Grain Scalability Escalabilidad de grano fino
GOP Group of Pictures Grupo de imgenes En orden de transmisin un GOP inicia con una imagen I- y termina con la ltima imagen antes de la siguien- te imagen I- .
HAVI Home Audio Video Interoperability- Interoperabilidad de audio y video en el hogar
Huffman coding Codificacin de Huffman Un tipo de codificacin de fuente que usa cdigos de diferentes longitudes para representar smbolos que tienen diferente probabilidad de ocurrencia
IEC International Electrotechnical Comisin- Comisin electrotcnica internacional
Inter-coding Intercodificacin - Compresin que usa la redundancia ente imgenes sucesivas; tambin se le conoce como codificacin temporal
Interleaving Interpolacin - Una tcnica usada para la correccin de errores que rompe las rfagas de errores en muchos errores ms pequeos.
Intra-coding Intracodificacin Tipo de compresin que trabaja completamen- te dentro de una imagen; tambin se le conoce como codificacin espacial
IOR Inter-operable Object Reference Referencia de objeto interoperable
IRD Integrated Receiver Decoder. Receptor-Decodificador integrado. Un receptor de RF combinador con un Decoder MPEG que se usa para adaptar un aparato de TV a las transmisiones digitales
ISDB Integrated Services Data Broadcasting Sistema de transmission digital desarrollado en J apn
ISO International Organization for Standardization - Organizacin interna- cional para la normalizacin
ITU International Telecommunication Union Unin Internacional de tele- comunicaciones
JPEG Joint Photographic Experts Group Grupo de expertos en fotografa
JTC1 Joint Technical Committee of the IEC Reunin tcnica del Comit de la IEC
JVT Joint Video Team Unin del equipo de video
Level Nivel El tamao de la imagen de entrada en uso con un perfil dado (ver Seccin 2 Compresin en video)
MAC Media Access Control Control de acceso de media
Macroblock Macrobloque El rea de la pantalla representada por muchos bloques de DCT de luminancia y diferencia de color que son guiados por un vector de movimiento
Masking Enmascaramiento - Un fenmeno psicoacstico en el que ciertos sonidos no se pueden or en presencia de otros.
MDCT Modified Discreet Cosine Transform Transformada discreta de coseno modificada
MGT Master Guide Table Tabla de gua maestra
MHP Multimedia Home Platform Plataforma multimedia para el hogar.
Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 84 Motion Vector Vector de movimiento - Un par de nmeros que representan el desplazamiento vertical y horizontal de una regin de una imagen de referencia para la prediccin.
MP@HL Main Profile at High Level Perfil principal a nivel alto
MP@LL Main Profile at Low Level - Perfil principal a nivel bajo
MP@ML Main Profile at Main Level - Perfil principal a nivel principal
MPE Multi-protocol Encapsulation Encapsulamiento de protocolos mlti- ples
MPEG Moving Picture Experts Group Grupo de expertos en imgenes en movimiento. Norma ISO/IEC J TC1/SC29/WG11 y las normas desarrolladas por este grupo.
MPEG-LA MPEG License Agreements Acuerdos de licencia MPEG
NIT Network Information Table Tabla de informacin de red. Informacin en un stream de transporte que describe muchos streams de transporte.
NPT Normal Play Time Tiempo normal de reproduccin
NRT Network Resources Table Tabla de recursos de red
Null Packets Paquetes nulos Paquetes de relleno que no transportan datos pero que son necesarios para mantener una relacin de bits constante con una carga til (payload) variable, Los paquetes nulos siempre tienen una PID de 8191 (todos 1s). (Vea Seccin 8 Streams de Transporte).
OCAP Open Cable Applications Platform Plataforma de aplicaciones abiertas de cable
OFDM Orthogonal Frequency Division Multiplexing Multiplexin por divisin de frecuencia ortogonal
ORB Object Request Brokerage Intermediario de requisicin de objetos
PAL Phase Alternate Line Lnea de fase alternada
PAT Program Association Table Tabla de asociacin de programa. Datos que aparecen en paquetes y que tienen un cdigo de PID (vea Seccin 8 Streams de Transporte) de cero que el Decoder MPEG usa para determinar que programas existen en un Stream de Transporte. La PAT apunta a la PMT quien, a su vez. apunta al contenido de video, audio y datos de cada programa
PCM Pulse Code Modulation Modulacin de cdigo de pulso Un trmino tcnico para una forma de onda analgica de fuente, por ejemplo las seales de audio y video, expresadas como muestras peridicas numricas. PCM es una seal digital sin comprimir.
PCR Program Clock Reference Referencia de reloj de programa. La muestra del conteo de reloj del Encoder que se enva en el encabezador del programa para sincronizar el reloj del Decoder
PES Packetized Elementary Stream Stream elemental paquetizado
PID Program Identifier - Identificador de programa Un cdigo de 13 bits en el encabezador de paquete de transporte, PID 0, indica que el paquete contiene un PAT PID. (Ver Seccin 8 Streams de Transporte) PID 1 indica un paquete que contiene CAT. La PID 8191 (todos 1) indica paquetes nulos (relleno). Todos los paquetes que pertenecen al mismo stream elemental tienen la misma PID. PMT Program Map Tables Tablas de mapeo de programa. Las tablas en PAT que apuntan al contenido de video, audio y datos de un stream de transporte.
Packets Paquetes. Es un trmino usado en dos contextos: en los streams de programa, un paquete es una unidad que contiene una o ms unidades de presentacin; en streams de transporte, un paquete es un quantum de datos pequeo de tamao fijo.
Pixel Picture element (algunas veces pel) Elemento de imagen Es la unidad ms pequea de una imagen, representada por una muestra o un juego de muestras como RGB o YC r C b .
Preprocessing Preprocesamiento Procesamiento de la seal de video que ocurre antes de la codificacin MPEG. La reduccin de ruido, downsampling, edicin al corte, identificacin y pulldown 3:2 son ejemplos de preprocesamiento.
Profile Perfil - Especifica la sintaxis de codificacin usada
Program Stream Stream de programa Un stream de bits que contiene video comprimido, video, audio e informacin de temporalizacin.
PS Program Stream Stream de programa
PSI Program Specific Information - Informacin que hace el seguimiento de los diferentes programas en un stream de transporte MPEG y en los streams elementales en cada programa. La PSI incluye PAT, PMT, NIT, CAT, ECM y EMM.
PSI/SI Un trmino general para la combinacin de MPEG PSI y DVB-SI.
PSIP Program and System Information Protocol Protocolo de informacin de programa y sistema
PTS Presentation Time Stamp Estampado de tiempo de presentacin - El tiempo al cual una unidad de presentacin estar disponible para el auditorio.
PU Presentation Unit Unidad de presentacin Una imagen comprimida o bloque de audio.
QAM Quadrature Amplitude Modulation Modulacin en cuadratura de la amplitud. Un sistema de modulacin digital.
QCIF One-quarter-resolution (176x144 pixels) Common Interchange For- mat. Formato comn de intercambio a un cuarto de resolucin (176x144 pixeles) Vea CIF.
QMF Quadrature Mirror Filter Filtro de espejo de cuadratura
QPSK Quaternary Phase Shift Keying (tambin conocido como Llaveo de corrimiento de fase de cuadratura). Llaveo de corrimiento de fase cuaternario. Un sistema de modulacin digital particularmente til para enlaces a satlite.
QSIF One-quarter-resolution Source Input Format - Formato de entrada de fuente a un cuarto de resolucin. Vea SIF.
Quantization Cuantizacin Un paso de procesamiento que aproxima los valores de la seal asignando un valor de entre un nmero de valores predefinidos.
RLC Run Length Coding Codificacin de longitud corrida Un esquema de codificacin que cuenta el nmero de bits similares en lugar de enviarlos indivi- dualmente.
RRT Rating Region Table Tabla de clasificacin de Regin
RST Running Status Table Tabla de estatus de corriendo Una gua de fundamentos de MPEG y anlisis de protocolos Primer
www.tektronix.com/video_audio 85 R-S Reed-Solomon - Es una funcin polinomial usada para la DVB por protec- cin. Hasta 8 bytes dentro de cada paquete de transporte.
SAOL Structured Audio Orchestra Language Lenguaje estructurado de orquesta de audio
Scalability Escalabilidad Una caracterstica de MPEG-2 que proporciona niveles mltiples de calidad proporcionando capas de datos de video. Las capas mltiples de datos permiten que un Decoder complejo produzca una mejor imagen usando ms capas de datos mientras que uno ms simple puede seguir produciendo una imagen usando solo la primera capa de datos.
SDI Serial Digital Interface Interfase digital serial. Norma de interfase de cable coaxial serial diseado para la produccin de seales de video digital
SDK Software Development Kit Paquete de desarrollo de software
SDT Service Description Table Tabla de descripcin de servicio. Una tabla que enlista los proveedores de cada servicio en un stream de transporte.
SDTV Standard Definition Television Televisin con definicin estndar
SI Vea DVB-SI.
SIF Source Input Format Formato de fuente de entrada. Una seal de entrada de media resolucin usada por MPEG-1.
Slice Una secuencia de macrobloques consecutivos.
SMPTE Society of Motion Picture and Television Engineers Sociedad de ingenieros de cine y televisin
SNR Signal-to-Noise Ratio Relacin seal a ruido
SP@ML Simple Profile at Main Level - Perfil simple a nivel principal
SPTS Single Program Transport Stream Stream de transporte de progra- ma simple
ST Stuffing Table Tabla de relleno
STB Set Top Box.
STC System Time Clock Reloj de tiempo de sistema. El reloj comn usado para codificar audio y video en el mismo programa
STT System Time Table Tabla de tiempo de sistema
Stuffing Relleno Datos sin sentido adicionados para mantener constante la relacin de bits.
Syndrome Sndrome Resultado inicial del clculo de chequeo de errores. Generalmente si el sndrome es cero, entonces se asume que no hay error
TCP/IP Transmission Control Protocol/Internet Protocol Protocolo de control de transmission/Protocolo de Internet
TDAC Time Domain Aliasing Cancellation Cancelacin del aliasing en el dominio del tiempo. Una tcnica de codificacin usada en la compresin de audio AC-3.
TDT Time and Date Table Tabla de fecha y hora. Se usa en DVB-SI.
TOT Time Offset Table Tabla de disparidad de tiempo Transport Stream (TS) Stream de transporte Multiplexin de muchos streams de programa que son transportados en paquetes. La demultiplexin se logra con diferentes IDs de paquetes o (PIDs). Ver PSI, PAT, PMT y PCR.
Truncation Truncado Acortamiento de la longitud de palabra de una muestra o coeficiente removiendo los bits de menor orden
T-STD Transport Stream System Target Decoder Decoder de target del sistema de stream de transporte. Un Decoder que tiene una cierta cantidad de Buffer de memoria que se asume que tomar en cuenta un Encoder
TVCT Terrestrial Virtual Channel Table Tabla de canal terrestre virtual
VAU Video Access Unit. Unidad de acceso de video. Una imagen comprimida en un stream de programa
VBV Video Buffer Verify Verificar el Buffer de video
VCO Voltage Controlled Oscillator Oscilador controlado por voltaje
VLC Variable Length Coding Codificacin de longitud variable. Una tcnica de compresin que asigna cdigos cortos a valores frecuentes y cdigos largos a valores infrecuentes.
VOD Video On Demand Video en demanda. Un sistema en el cual los programas de television o las pelculas se transmiten a un solo consumidor cuando lo pide.
VSB Vestigial Sideband Modulation Modulacin de banda lateral vestigial. Un sistema de modulacin digital usado por ATSC.
Wavelet Una transformada que usa una funcin bsica que no es de longitud fija pero que crece ms a medida que se reduce la frecuencia.
Weighting Ponderacin. Un mtodo para cambiar la distribucin del ruido debido al truncado por medio de valores de pre multiplicacin.
Y/C Luminance and chrominance Luminancia y crominancia
Contactos de Tektronix: Asociacin de Naciones del sureste Asitico / Australasia / Pakistn (65) 6356 3900 Austria +41 52 675 3777 Balcanes, Israel, Sud frica y otros pases de ISE +41 52 675 3777 Blgica 07 81 60166 Brasil y Sudamrica 55 (11) 3741-8360 Canad 1 (800) 661-5625 Europa central, Ucrania y el Bltico +41 52 675 3777 Europa central y Grecia +41 52 675 3777 Dinamarca +45 80 88 1401 Finlandia +41 52 675 3777 Francia y frica del Norte +33 (0) 1 69 86 81 81 Alemania +49 (221) 94 77 400 Hong Kong (852) 2585-6688 India (91) 80-22275577 Italia +39 (02) 25086 1 Japn 81 (3) 6714-3010 Luxemburgo +44 (0) 1344 392400 Mxico, Amrica Central y el Caribe 52 (55) 56666-333 Este Medio, Asia y Africa del Norte+41 52 675 3777 Los pases bajos 090 02 021797 Noruega 800 16098 Repblica popular de China 86 (10) 6235 1230 Polonia +41 52 675 3777 Portugal 80 08 12370 Repblica de Corea 82 (2) 528-5299 Rusia y CIS 7 095 775 1064 Sudfrica +27 11 254 8360 Espaa (+34) 901 988 054 Suecia020 08 80371 Suiza +41 52 675 3777 Taiwn 886 (2) 2722-9622 Reino Unido y Eire +44 (0) 1344 392400 USA 1 (800) 426-2200 Para otras reas contacte a Tektronix, Inc. al: 1 (503) 627-7111 ltima actualizacin Junio 15 2005
Para mayor Informacin
Tektronix mantiene una coleccin comprensiva y en constante expansin de notas de aplicacin, notas tcnicas y otros recursos para ayudarles a los ingenieros a trabajar con la tecnologa ms avanzada. Favor de visitar www.tektronix.com
Copyright 2005, Tektronix, Inc. Todos los derechos reservados. Los productos de Tektronix estn protegidos por patentes norteamericanas y extranjeras concedidas y pendientes. La informacin de esta publicacin reemplaza todo el material previamente publicado. Nos reservamos el privilegio de cambiar las especificaciones y precios. TEKTRONIX y TEK son marcas registradas de Tektronix, Inc. Todas los dems nombres referidos son marcas de servicio, marcas de negocio o marcas Registradas por las compaas respectivas