EN - ESPAÑOL - MPEG - Primer - Fundamentos - & - Protocolos - 25W - 11418 - 5 7 PDF

Habilitando la innovacin
Una gua de fundamentos de MPEG y anlisis de protocolos

Primer

www.tektronix.com/video_audio i
Seccin 1 Introduccin a MPEG 1
1.1 Convergencia
1
1.2 Por que es necesaria la compresin
1
1.3 Principios de Compresin 1

1.4 Compresin en aplicaciones de Televisin
2
1.5 Introduccin a la compresin de video digital
3
1.6 Introduccin a la compresin de audio
5
1.7 Streams MPEG
6
1.8 Necesidad de monitoreo y anlisis
7
1.9 Inconvenientes de la compresin
7

Seccin 2 Compresin en Video 8
2.1 Codificacin espacial o temporal? 8
2.2 Codificacin espacial 8
2.3 Ponderacin 10
2.4 Scanning (exploracin) 11
2.5 Codificacin de Entropa 11
2.6 Un Coder espacial 12
2.7 Codificacin temporal 13
2.8 Compensacin de movimiento 14
2.9 Codificacin bidireccional 16
2.10 Imgenes I-, P- y B- 16
2.11 Un compressor MPEG 18
2.12 Pre procesamiento 21
2.13 Wavelets 22

Seccin 3 Compresin de Audio 23
3.1. El mecanismo de audicin 23
3.2. Codificacin sub banda 24
3.3 MPEG Capa 1 25
3.4 MPEG Capa 2 26
3.5 Codificacin de transformada 26
3.6 MPEG Capa 3 27
3.7 Audio MPEG-2 27
3.8 Audio MPEG-4 27
3.9 AC-3 28

Seccin 4 Las normas MPEG 29
4.1. Que es MPEG? 29
4.2 MPEG-1 29
4.3 MPEG-2 30
4.3.1 Perfiles y niveles en MPEG-2 30
4.4 MPEG-4 32
4.4.1 Documentos de la norma MPEG-4 32
4.4.2 Codificacin de objetos 32
4.4.3 Codificacin de audio y video 34
4.4.4 Escalabilidad 35
4.4.5 Otros aspectos de MPEG-4 36
4.4.6 El futuro de MPEG-4 37
4.5 MPEG-7 38
4.6 MPEG-21 39

Primer

www.tektronix.com/video_audio ii
Seccin 5 Streams elementales 40
5.1 Sintaxis del stream elemental de Video 40
5.2 Streams elementales de Audio 41

Seccin 6 Streams elementales paquetizados o PES (Packetized Elementary Streams) 42
6.1 Paquetes PES 42
6.2 Estampado de tiempo 42
6.3 PTS/DTS 42

Seccin 7 Streams de elemental 44
7.1 Grabacin vs. Transmisin 44
7.2 Introduccin a los streams de programa 44

Seccin 8 Streams de transporte 45
8.1 La funcin del Stream de transporte 45
8.2 Paquetes 46
8.3 Referencia del reloj de programa o (Program Clock Reference) 46
8.4 Identificacin de paquete o PID (Packet Identification) 47
8.5 Informacin especfica del programa (Program Specific Information) 48

Seccin 9 Modulacin Digital 50
9.1 Principios de Modulacin 50
9.2 Modulacin Analgica 50
9.3 Modulacin de Cuadratura 50
9.4 Sistemas de Modulacin Digital Simple 51
9.5 Llaveo (Keying) de corrimiento de fase 51
9.6 Modulacin de amplitud de cuadratura o QAM (Quadrature Amplitude Modulation) 52
9.7 Modulacin de banda lateral vestigial o VSB (Vestigial Sideband Modulation) 53
9.8 Divisin Multiplexada de frecuencias ortogonalmente codificadas o COFDM (Coded Orthogonal Frequency Division Multiplex) 53
9.9 Servicios integrados de transmisin de datos o ISDB (Integrated Services Data Broadcasting) 55
9.9.1 Sistema de satlite ISDB-S 55
9.9.2 Sistema de cable ISDB-C 55
9.9.3 Modulacin terrestre ISDB-T 55
9.9.4 El ISDB en resumen 55

Seccin 10 Introduccin a DVB y ATSC 56
10.1 Una vista general 56
10.2 Remultiplexin 57
10.3 Servicio de Informacin o SI (Information Service) 57
10.4 Correccin de errores 58
10.5 Codificacin de canal 59
10.6 Codificacin interna 60
10.7 Transmitiendo dgitos 61

Primer

www.tektronix.com/video_audio iii
Seccin 11 Transmisin de datos 62
11.1 Aplicaciones 62
11.1.1 Datos relacionados con los programas 62
11.1.2 Datos de oportunidad 62
11.1.3 Datos de red 63
11.1.4 TV mejorada 63
11.1.5 TV Interactiva 63
11.2 Encapsulamiento del contenido 63
11.2.1 Encapsulado de datos MPEG 63
11.2.1.1 Canalizacin de datos 63
11.2.1.2 Streaming de datos 63
11.2.1.3 DSMCC - Digital Storage Medium Command and Control (Instruccin y control del medio de almacenamiento digital) 64
11.2.1.4 MPE Multi-protocol Encapsulation (Encapsulado con protocolos mltiples) 64
11.2.1.5 Carruseles 64
11.2.1.6 Carruseles de datos 65
11.2.1.7 Carruseles de objetos 66
11.2.1.8 Como se transmiten los objetos de los carruseles 67
11.2.1.9 Sincronizacin de datos MPEG-2 68
11.2.2 Encapsulado de datos DVB 68
11.2.3 Encapsulado de datos ATSC A/90 68
11.2.4 Encapsulado de datos ARIB 69
11.3 Transmisin de contenido de datos 69
11.3.1 Anuncio de DVB 70
11.3.2 Anuncio de ATSC 70
11.4 Presentacin de contenido 70
11.4.1 Set Top Box intermediario (Middleware) 70
11.4.2 Plataforma DVB de multimedia para el hogar o MHP (Multimedia Home Platform) 71
11.4.3 ATVEF DASE 72
11.4.4 DASE 72

Seccin 12 Prueba de MPEG 73
12.1 Requerimientos para las pruebas 73
12.2 Anlisis de un stream de transporte 73
12.3 Vista jerrquica 74
12.4 Vista interpretada 76
12.5 Sintaxis y anlisis de CRC 76
12.6 Filtraje 77
12.7 Anlisis de temporalizacin 77
12.8 Pruebas al Stream elemental 79
12.9 Streams de bits que cumplen con Sarnoff 79
12.10 Anlisis del stream elemental 80
12.11 Creando un stream de transporte 81
12.12 Generacin de inexactitudes PCR 81

Glosario 82

Primer

www.tektronix.com/video_audio iv

Primer

www.tektronix.com/video_audio v

Primer

www.tektronix.com/video_audio 1
Seccin 1 Introduccin a MPEG

MPEG es una de las tcnicas de compresin de audio y video ms popula-
res debido a que no es una sola norma. En lugar de eso es un rango de
normas tiles para diferentes aplicaciones basadas en principios similares.
MPEG es un acrnimo de Moving Picture Experts Group que es parte del
comit tcnico J TC1, establecido por la ISO (International Standards
Organization u Organizacin electrotcnica internacional) y la IEC (Interna-
tional Electrotechnical comisin o Comisin electrotcnica internacional). La
J TC1 es responsable de la tecnologa de informacin. Dentro de la J TC1, el
subgrupo SG29 es el responsable de la codificacin de la informacin de
audio, imgenes e hipermedia. Hay una buena cantidad de grupos de
trabajo dentro de la SG29, incluyendo el J PEG (J oint Photographic Experts
Group o Grupo de expertos en fotografa) y el grupo de trabajo 11 para la
compresin de imgenes en movimiento. El grupo ISO/IEC J TC1/ SG29/
WG11 es el MPEG.
MPEG puede ser descrito como la interaccin de acrnimos. Como estable-
ce la ETSI, El CAT es un indicador para permitirle al IRD encontrar los
EMMs asociados con los sistemas CA que lo usan. Si puede entender esta
oracin, entonces no necesita este libro!
1.1 Convergencia
Las tcnicas digitales para audio y video han progresado rpidamente por
un buen nmero de razones. La informacin digital es ms robusta y puede
ser codificada para eliminar substancialmente los errores. Esto significa que
las prdidas por generaciones en grabacin y las prdidas por transmisin
pueden ser eliminadas. El disco compacto o CD fue el primer producto para
el consumidor en demostrar esto.
Mientras que el CD tiene una calidad de sonido mejorada con respecto a su
predecesor en vinil, la comparacin en calidad por s misma no es suficien-
te. Lo importante es que la grabacin digital y las tcnicas de transmisin
permiten la manipulacin del contenido hasta un grado que es imposible de
lograr con el analgico. Una vez que el audio y el video son digitalizados, el
contenido quedar en forma de datos. Dichos datos pueden ser manejados
en la misma forma que cualquier otro tipo de datos; por ello, el audio y video
digitales han pasado a ser de la incumbencia de la tecnologa de cmputo.
La convergencia de las computadoras con equipo de audio y video es una
consecuencia inevitable de las invenciones clave de cmputo y la modula-
cin de cdigo de pulso o PCM (Pulse Code Modulation). La media digital
puede almacenar cualquier tipo de informacin por lo que resulta sencillo
utilizar un dispositivo de almacenamiento para cmputo para el video digital.
Las estaciones de trabajo no lineales fueron el primer ejemplo de una
aplicacin de la tecnologa convergente que no tiene un equivalente en el
mundo analgico. Otro ejemplo, multimedia, combina el almacenamiento de
audio, video, grficos, texto y datos en el mismo medio, la multimedia no
tiene equivalente en el dominio analgico.
1.2 Por que es necesaria la compresin
El xito inicial del video digital en aplicaciones de post-produccin se debi
a que los altos costos del video digital fueron sobrepasados por la capaci-
dad de usar capas ilimitadas y su capacidad de efectos; sin embargo, la
produccin normal de video digital genera cerca de 200 megabits por se-
gundo y esta relacin de bits requiere una capacidad extensa para su
almacenamiento y un ancho de banda alto para su transmisin. El video
digital solo puede ser usado en aplicaciones ms amplias si los requeri-
mientos de almacenamiento y ancho de banda pueden ser llenados; ese es
el propsito de la compresin.
La compresin es una forma de expresar el audio y video digitales usando
menos datos. La compresin tiene las siguientes ventajas:
Se necesita una menor cantidad de almacenamiento por cantidad dada de material
de fuente.
Cuando se trabaja en tiempo real, la compresin reduce el ancho de banda nece-
saria; adicionalmente, la compresin permite una transferencia ms rpida que en
tiempo real entre la media, por ejemplo, entre cinta y disco.
Un formato de grabacin comprimido puede usar una menor densidad de
grabacin y esto puede hacer que la grabadora sea menos sensible a
factores ambientales y mantenimiento.
1.3 Principios de Compresin
Hay dos tcnicas fundamentalmente diferentes que pueden ser usadas para
reducir la cantidad de datos usados para transmitir informacin de conteni-
do. En sistemas de compresin prcticos, usualmente se usan combinados,
frecuentemente en formas muy complejas.
La primera tcnica es mejorar la eficiencia de la codificacin. Hay muchas
formas de codificar cualquier informacin dada y la mayora de las repre-
sentaciones de datos de audio y video contienen una cierta cantidad de
redundancia. El concepto de entropa se discute ms abajo.
Muchos trucos de codificacin pueden usarse para reducir o eliminar la
redundancia; los ejemplos incluyen la codificacin de longitud corrida y los
sistemas de codificacin de longitud variable como los cdigos de Huffman,
Cuando se usan adecuadamente esas tcnicas son completamente reversi-
bles por lo que despus de la descompresin los datos sern idnticos a los
de la entrada al sistema. A este tipo de compresin se le llama sin prdida.
Los programas de archivado para computadora como PKZip emplean este
tipo de compresin.
Primer

Obviamente, la compresin sin prdidas es ideal pero desafortunadamente
usualmente no proporciona el grado de reduccin de datos necesario para
aplicaciones de audio y video; sin embargo, debido a que es sin prdidas
puede aplicarse en cualquier punto del sistema y frecuentemente se usa a
la salida de datos de los compresores con prdidas.
Si la eliminacin de la redundancia no reduce los datos tanto como fuera
necesario una parte de la informacin tendr que ser descartada. Los
sistemas de compresin con prdidas logran la reduccin de datos remo-
viendo informacin que sea irrelevante o de menor relevancia. Estas no son
tcnicas generales que puedan ser aplicadas a cualquier stream de datos;
la estimacin de la relevancia solo puede hacerse en el contexto de la
aplicacin, entendiendo lo que los datos representan y como sern usados.
En el caso de la televisin, la aplicacin es la presentacin de imgenes y
sonidos a los sistemas de visin y audicin humanos y los factores huma-
nos deben ser bien entendidos para disear un sistema de compresin
efectivo.
Una parte de la informacin de las seales de video no puede ser percibida
por el sistema de visin humana y por ello ser relevante en este contexto,
Un sistema de compresin que descarta solo informacin irrelevante de la
informacin de la imagen es conocido como visualmente sin prdidas.
1.4 Compresin en aplicaciones de Televisin
Las seales de televisin, analgicas y digitales, siempre han representado
mucha informacin y se han usado tcnicas de reduccin del ancho de
banda desde el principio. Probablemente uno de los primeros ejemplos es el
entrelazado. Para un nmero de lneas dadas y una determinada relacin
de refrescamiento de imgenes, el entrelazado ofrece una reduccin de 2:1
en el ancho de banda requerido. El proceso es con prdidas; el entrelazado
genera artifacts causados por las interferencias entre la informacin verti-
cal y temporal y reduce la resolucin vertical utilizable de la imagen. A pesar
de ello, la mayor parte de lo que es descartado es bastante irrelevante por
lo que el entrelazado represent un cambio simple y muy valioso en su
poca, Desafortunadamente el entrelazado y los artifacts que genera son
muy molestos para los sistemas de compresin digital ms sofisticados,
Mucha de la complejidad del MPEG-2 es producida por la necesidad de
manejar seales entrelazadas y an hay prdidas significativas en eficiencia
de codificacin cuando se le compara con seales en progresivo.
El siguiente pasos evolutivo se dio con el advenimiento del color. Las cma-
ras de color producen seales en RGB por lo que nominalmente hay tres
veces la cantidad de informacin que en una seal monocromtica pero
haba el requerimiento de transmitir seales de color en el mismo canal
usado para la seal monocromtica.

La primera parte de la solucin fue transformar la seal de RGB a una seal
de brillantez (normalmente designada como Y) ms dos seales de dife-
rencia de color, U y V o I y Q. La generacin de la seal de brillantez supu-
so un gran avance hacia la resolucin del problema de compatibilidad con
los receptores monocromticos pero el paso ms importante hacia la reduc-
cin del ancho de banda lleg con las seales de diferencia de color. Estas
destacaron el hecho de que el sistema de visin humana usa sensores que
son sensibles a la brillantez y que pueden ver una imagen de muy alta
resolucin. Otros sensores capturan informacin de color pero a mucha
menor resolucin. El resultado neto es que, dentro de ciertos lmites, una
imagen monocromtica bien definida que represente la brillantez de una
escena sobrepuesta a informacin de color menos definida o borrosa (me-
nor ancho de banda) aparecer como una imagen de color bien definida. No
es posible aprovecharse de esto cuando se usan seales en RGB ya que
cada seal contiene informacin tanto de brillantez como de color; sin
embargo, en el espacio YUV, la mayora de la informacin de brillantez es
transportada en la seal Y y muy poca en las seales de diferencia de color.
Por eso es posible filtrar las seales de diferencia de color y reducir drsti-
camente la informacin a transmitir.
Lo anterior es un ejemplo de eliminacin (en su mayora) de informacin
irrelevante. Bajo las condiciones de diseo de la visin, el sistema visual no
responde significativamente a la informacin de alta frecuencia de las
seales de diferencia de color por lo que pueden ser descartadas. Las
transmisiones de color en NTSC solo transmiten cerca de 500 Hz en cada
seal de diferencia de color pero las imgenes resultan adecuadamente
definidas para muchas aplicaciones.
El paso final en el proceso de reduccin del ancho de banda de NTSC y
PAL es esconder las seales de diferencia de color en partes que no se
usen del espectro de la seal monocromtica. Aunque el proceso no es
estrictamente sin prdidas esto puede ser a travs de incrementar la efi-
ciencia de codificacin de la seal.
Algunas de las tcnicas en el mundo digital son muy diferentes pero se
aplican principios similares. Por ejemplo, MPEG transforma las seales a un
dominio diferente para permitir el aislamiento de informacin irrelevante. La
transformacin a un espacio de diferencia de color an se emplea pero las
tcnicas digitales permiten el filtrado de la seal de diferencia de color para
reducir la resolucin vertical para un mayor ahorro.

Primer


Figura 1-1

La Figura 1-1a muestra que en los sistemas de televisin tradicional, la seal RGB
de la cmara se convierte en las componentes Y, Pb y Pr para la compresin y
codificacin de una seal analgica compuesta par la transmisin. En la Figura 1-
1b se muestra el equivalente moderno. Las seales Y, Pb y Pr son digitalizadas y
transportadas como seales Y, Cb y Cr en su forma SDI en el proceso de produc-
cin antes de ser codificadas para la transmisin en MPEG. Claro que MPEG
puede ser considerada por quien transmite como un reemplazo ms eficiente para
el video en compuesto. Adems, MPEG tiene una mayor flexibilidad debido a que
la relacin de bits requerida puede ser ajustada de acuerdo con la aplicacin. A
relaciones de bits menores MPEG puede ser usado para videoconferencias y
videotelfonos.
La transmisin de video digital o DVB (Digital Video Broadcasting) y las normas de
la ATSC (Advanced Television Systems Committee o Comit de sistemas de
televisin avanzada) (las normas europeas y americanas originadas para la trans-
misin de televisin digital) no seran viables sin la compresin debido a que el
ancho de banda requerido sera demasiado grande. La compresin extiende el
tiempo de reproduccin del DVD (digital video/versatile disk o disco verstil de video
digital) permitiendo contar con pelculas completas en un solo disco. La compresin
tambin reduce el costo del ENG y otras contribuciones de la produccin de televi-
sin. DVB, ATSC y los discos de video digital (DVD) estn basados en la compre-
sin MPEG-2.
En la grabacin de cintas una compresin moderada facilita la tolerancia y adiciona
confiabilidad en Digital Betacam y Digital-S, mientas que en SX, DVC, DVCPRO y
DVCAM, la meta es la miniaturizacin. En servidores de video basados en disco, la
compresin disminuir el costo de almacenamiento. La compresin tambin dismi-
nuye el ancho de banda que permite que ms usuarios tengan acceso al servidor.
Esta caracterstica tambin es importante para aplicaciones de VOD (video on
demand o video en demanda)
1.5 Introduccin a la compresin de video digital
En todo el material de programa real hay dos tipos de componentes de la
seal: aquellas que son nuevos e impredecibles y los que pueden ser
anticipados. Las componentes nuevas son llamadas entropa y es la
informacin real en la seal. El resto es llamado redundancia porque no es
esencial. La redundancia puede ser especial, como la que encontramos en
las grandes reas planas de la imagen en la que los pixeles adyacentes
tienen casi el mismo valor. La redundancia tambin puede ser temporal y
aqu es donde las similitudes entre imgenes sucesivas se usan. Todos los
sistemas de compresin trabajan separando la entropa de la redundancia
en el Encoder. Solo la entropa ser grabada o transmitida y el Decoder
calcular la redundancia de la seal transmitida. La Figura 1-2a (vea la
siguiente pgina muestra este concepto.
Un Encoder ideal extraer toda la entropa y solo esta ser transmitida al
Decoder. Un Decoder ideal entonces reproducir la seal original. En la
prctica, este ideal no puede ser alcanzado. Un Coder ideal sera complejo
y provocara un retraso muy grande con el fin de usar la redundancia tem-
poral. En ciertas aplicaciones como la grabacin o el broadcast, ser acep-
table cierto retraso pero no en videoconferencias. En algunos casos, un
Coder muy complejo sera demasiado caro. De lo anterior se desprende el
hecho de que no haya un sistema de compresin ideal.

Primer


Figura 1-2

En la prctica se necesitar un rango de Coders que tengan un rango
determinado de retrasos de procesamiento y complejidades. La potencia del
MPEG es que no es un formato de compresin simple sino un rango de
herramientas de codificacin normalizadas que pueden ser combinadas en
una forma flexible para satisfacer un rango de aplicaciones. La forma en la
que la codificacin es ejecutada se incluye en los datos comprimidos para
que el Decoder pueda manejar automticamente cualquier cosa que haya
decidido hacer el Coder.
En MPEG-2 y MPEG-4 la codificacin se divide en varios perfiles que tienen
diferente complejidad y cada perfil puede ser implementado a diferente nivel
dependiendo de la resolucin de la imagen de entrada. En la Seccin 4 se
vern con detalle los perfiles y niveles.
Hay muchos formatos diferentes de video digital y cada uno tiene una
relacin de bits diferente. Por ejemplo, un sistema de alta definicin puede
ser de 6 veces la relacin de bits de un sistema de definicin estndar.
Consecuentemente, saber tan solo la relacin de bits de la salida de un
Coder no es muy til, lo que importa es el factor de compresin que es la
relacin entre la relacin de bits de la entrada con respecto a la relacin de
bits comprimidos, por ejemplo 2:1, 5:1 y as sucesivamente.

Desafortunadamente el nmero de variables involucradas hace que sea
muy difcil determinar un factor de compresin til. La Figura 1-2a muestra
esto para un Coder ideal: si se enva toda la entropa la calidad ser buena,
sin embargo, si el factor de compresin es incrementado con el fin de
reducir la relacin de bits no se enviar toda la entropa y la calidad decae-
r. Note que en un sistema comprimido cuando ocurre una perdida de
calidad esto ser brusco (Figura 1-2b). Si la relacin de bits disponible es
inadecuada es mejor evitar esa rea reduciendo la entropa de la imagen de
entrada. Esto puede hacerse mediante el filtrado. La prdida de resolucin
causada por el filtraje es subjetivamente ms aceptable que los artifacts de
compresin.
Para identificar la entropa a la perfeccin un compresor ideal tendra que
ser extremadamente complejo. Un compresor prctico puede ser menos
complejo por razones econmicas y deber enviar ms datos para asegurar
el transporte de toda la entropa. La Figura 1-2b muestra la relacin entre la
complejidad del Coder y su desempeo. Entre mayor sea el factor de com-
presin requerido, ms complejo tendr que ser el Encoder.

Primer

La entropa vara en las seales de video. La grabacin de un locutor dando
las noticias tiene muchas redundancias y es fcil de comprimir. En contraste
es ms difcil comprimir una grabacin con hojas flotando en el aire o la de
un estadio de football que est en movimiento constante por lo que habr
menos redundancia (ms informacin o entropa). En cualquier caso, si toda
la entropa no se enva habr prdida de la calidad. As, podemos escoger
entre un canal de relacin de bits constante con calidad variable o un canal
de calidad constante con relacin de bits variable.
Los operadores de redes de Telecomunicaciones tienden a preferir una
relacin de bits constante por razones prcticas pero se puede usar un
Buffer de memoria para promediar las variaciones de entropa si la dismi-
nucin resultante en retraso es aceptable. Para la grabacin una relacin de
bits variable puede ser ms sencilla de manejar y los DVDs usan una rela-
cin de bits variable usando el Buffering de tal forma que la relacin de
bits permanezca dentro de las capacidades del sistema de disco.
La intracodificacin (intra =dentro) es una tcnica que explota la redundan-
cia espacial o redundancia dentro de la imagen; la nter codificacin (inter =
entre) es una tcnica que explora la redundancia temporal. La Intra codifi-
cacin puede ser usada sola como en la norma J PEG para imgenes
estticas o combinada con la inter codificacin como en MPEG.
La intra codificacin depende de dos caractersticas de las imgenes tpi-
cas. La primera es que no todas las frecuencias espaciales estn presentes
simultneamente y segundo, que entre mayor sea la frecuencia espacial
ser ms probable que la amplitud sea menor. La intra codificacin requiere
el anlisis de las frecuencias espaciales en una imagen. Este anlisis es el
propsito de las transformaciones como las wavelets y el DCT (Discrete
cosine transform. Transformada discreta de coseno).
Las transformadas producen coeficientes que describen la magnitud de
cada frecuencia espacial. Tpicamente, muchos coeficientes sern cero o
cerca de cero y pueden ser omitidos dando como resultado una reduccin
en la relacin de bits.
La inter codificacin depende de encontrar similitudes entre las imgenes
sucesivas. Si una imagen dada est disponible en el Decoder, la siguiente
imagen puede ser creada enviando solo las diferencias en la imagen. Las
diferencias de la imagen se incrementarn cuando se muevan los objetos
pero esta magnificacin puede ser contrarrestada usando la compensacin
de movimiento ya que un objeto en movimiento generalmente no cambia su
apariencia mucho de una imagen a la siguiente. Si el movimiento puede ser
medido una aproximacin ms cercana a la imagen actual puede ser creada
corriendo parte de la imagen previa a una nueva localidad. El proceso de
corrimiento es controlado por un par de valores de desplazamiento vertical y
horizontal (conocidos en conjunto como vector de movimiento) que es
transmitido al Decoder. La transmisin del vector de movimiento requerir
de menos datos que enviar los datos de la diferencia de imagen.
MPEG puede manejar imgenes tanto entrelazadas como no entrelazadas.
Una imagen en algn punto del eje del tiempo es llamada cuadro sin
importar si es un campo o un cuadro. El entrelazado no es ideal como
fuente para la compresin digital ya que por si misma es una tcnica de
compresin. La codificacin temporal se hace ms compleja porque los
pixeles en un campo estn en diferente posicin que los que estn en el
siguiente.
La compensacin de movimiento minimiza pero no elimina las diferencias
entre las imgenes sucesivas. La diferencia de imagen es por s misma una
imagen espacial y puede ser comprimida usando una transformacin basa-
da en la intra codificacin como se describi previamente. La compensacin
de movimiento simplemente reduce la cantidad de datos en las diferencias
de la imagen.
La eficiencia de un Coder temporal crece con la extensin del tiempo sobre
la cual puede actuar. La Figura 1-2c muestra que si se requiere un factor
de compresin alto se debe considerar una extensin de tiempo mayor en la
entrada y por tanto se experimentar un mayor retraso de codificacin.
Claramente, las seales codificadas temporalmente son difciles de editar
ya que el contenido de una imagen de salida dada puede estar basado en
los datos de imagen que fueron transmitidos un poco antes. Los sistemas
de produccin tendrn que limitar el grado de codificacin temporal para
permitir la edicin y esta limitacin a su vez limitar el factor de compresin
disponible.
1.6 Introduccin a la compresin de audio
La relacin de bits de un canal de audio digital en PCM es de tan solo unos
1.5 megabits por segundo, que es cerca del 0.5 % del de la del video digital.
Con esquemas de compresin de video suaves como los de Betacam
Digital, la compresin de audio resulta innecesaria; pero a medida que el
factor de compresin se eleva, resulta importante comprimir tambin el
audio.
La compresin de audio aprovecha dos hechos. El primero es que en las
seales tpicas de audio, no todas las frecuencias estarn presentes simul-
tneamente. Segundo, debido al fenmeno del enmascaramiento, la audi-
cin humana no puede discernir todos los detalles de una seal de audio.
La compresin de audio divide el espectro de audio por medio del filtraje y
las transformadas e incluye menos datos cuando describe bandas en las
cuales el nivel es bajo. Donde el enmascaramiento previene o reduce la
audibilidad de una banda en particular, se necesitarn enviar an menos
datos.

Primer


Figura 1-3
La compresin de audio no es tan fcil de lograr como la compresin de
video debido a la agudeza de la audicin. El enmascaramiento solo funcio-
na adecuadamente cuando la mascarilla y los sonidos a enmascarar coinci-
den espacialmente. La coincidencia espacial siempre estar presente en las
grabaciones monoaurales pero no en las estereofnicas en las que las
seales de bajo nivel an pueden orse si estn en alguna parte del escena-
rio sonoro. Consecuentemente, en los sistemas estreo y surround sound
es permisible un menor factor de compresin para una calidad dada. Otro
factor que complica la compresin de audio es que las resonancias retrasa-
das en altavoces de no muy alta calidad enmascaran los artifacts de com-
presin. Probar un compresor con altavoces baratos nos dar resultados
falsos y las seales que aparentemente son satisfactorias pueden ser
decepcionantes cuando se escuchan en un buen equipo.
1.7 Streams MPEG
La salida de un Coder MPEG simple de audio o video es llamada stream
elemental. Un stream elemental es una seal infinitamente cercana a
tiempo real. Por conveniencia, el stream elemental puede ser dividido en
bloques de datos de tamao manejable que forman un stream elemental
paquetizado o PES (Packetized elementary stream). Esos bloques de datos
necesitan informacin de header para identificar el inicio de los paquetes y
deben incluir un estampado de tiempo debido a que la paquetizacin inte-
rrumpe el eje del tiempo. La Figura 1-3 muestra que un PES de video y un
nmero de PES de audio se pueden combinar para formar un stream de
programa, asumiendo que todos los Coders estn amarrados a un reloj
comn. El estampado de tiempo en cada PES puede usarse para asegurar
el lip-sync entre el video y el audio. Los streams de programa tienen
paquetes de longitud variable con encabezadores. Se pueden usar para
transferencia de datos de y hacia discos duros y pticos que esencialmente
estn libres de errores y en el que se esperan archivos de tamaos arbitra-
rios. Los DVDs usan streams de programa.
Para transmisin y broadcasting digital muchos programas y sus PES asociados
pueden multiplexarse en un stream de transporte simple. Un stream de transpor-
te difiere de los streams de programa en que los paquetes PES se subdividen
an ms en paquetes cortos de tamao fijo y en que se pueden transportar
programas mltiples codificados con diferentes relojes. Esto es posible ya que el
stream de transporte tiene un mecanismo de referencia de reloj de programa o
PCR (Program Clock Reference) que permite la transmisin de relojes mltiples,
uno de los cuales ser seleccionado y regenerado en el Decoder. Un stream de
transporte de programa simple o SPTS (Single Program Transport Stream)
tambin es posible y se le puede encontrar entre un Coder y un Multiplexor. Ya
que el stream de transporte puede amarrar el reloj del Decoder al reloj del
Encoder, el STPS es ms comn que el Stream de programa.
Un stream de programa es ms que solo un Multiplexor de audio y un PES
de video. Adems de audio y video comprimido y datos, un stream de
transporte incluye metadata que describe el stream de bits. Esto incluye la
Tabla de asociacin de programas o PAT (Program Association Table) que
enlista cada programa del stream de transporte.
Cada entrada en la PAT apunta a una Tabla de mapeo de transporte o PMT
(Program Map Table) que enlista los streams elementales que constituyen
cada programa. Algunos programas sern abiertos pero algunos pueden
estar sujetos al acceso condicional (encriptacin) y esta informacin tam-
bin ser transportada por la metadata.
El stream de transporte consiste de paquetes de datos de tamao fijo; cada
uno contiene 188 bytes. Cada paquete transporta un Cdigo de identificador
de programa o PID (Program Identifier Code). Los paquetes del mismo
stream elemental tendrn el mismo PID, de tal forma que el Decoder (o
Demultiplexor) pueda seleccionar el stream(s) elemental que quiera y des-
echar los dems. La enumeracin de continuidad de los paquetes asegura
que cada paquete que sea necesario para decodificar un stream sea recibi-
do. Ser necesario un sistema de sincronizacin efectivo para que los
decodificadores puedan identificar correctamente el inicio de cada paquete
y deserialice el stream de bits en palabras.

Primer

1.8 Necesidad de monitoreo y anlisis
El stream de transporte MPEG es una estructura extremadamente compleja
que usa tablas interrelacionadas e identificadores codificados para separar
los programas y los streams elementales dentro de los programas. Dentro
de cada stream elemental hay una estructura tambin compleja que le
permite al Decoder distinguir entre, por ejemplo, vectores, coeficientes y
tablas de cuantizacin.
Las fallas pueden dividirse en dos categoras muy amplias. En la primera
categora el sistema de transporte entregar correctamente la informacin
de un Encoder/Multiplexor a un Decoder sin errores de bit o jitter adicionado
pero el Encoder/Multiplexor o el Decoder tendr alguna falla. En la segunda
categora, el Encoder/Multiplexor y el Decoder estarn bien pero el transpor-
te de datos de uno a otro ser defectuoso. Es muy importante saber si la
falla est en el Encoder/Multiplexor, el transporte o el Decoder si se quiere
encontrar pronto la solucin.
Los problemas de sincronizacin como las prdidas o la corrupcin de los
patrones de sincrona pueden evitar la recepcin del stream de transporte
completo. Los defectos en el protocolo del stream de transporte pueden
evitar que el Decoder encuentre todos los datos para un programa, quiz se
entregue la imagen pero no as el sonido. La distribucin correcta de los
datos con excesivo jitter puede causar problemas de temporalizacin en el
Decoder.
Si un sistema que est usando un stream de transporte MPEG falla, esta
podra estar en el Encoder, el Multiplexor o en el Decoder. Cmo se puede
aislar la falla? Primero hay que verificar que el stream de transporte cumpla
con las normas de codificacin de MPEG. Si el stream no cumple con ellas,
difcilmente se puede culpar a un Decoder del problema. Si el stream cum-
ple con las normas, podra ser necesario checar el Decoder.
Las herramientas para prueba de video tradicionales: el generador de
seales, el monitor de forma de onda y el vectorscopio no son apropiados
para analizar los sistemas MPEG excepto para asegurar que las seales de
video que entran o salen del sistema MPEG son de la calidad adecuada. En
lugar de lo anterior, un juego de fuentes de seales de prueba MPEG
vlidas ser esencial para probar el equipo receptor y los Decoders. Con un
analizador adecuado, el desempeo de los Encoders, sistemas de transmi-
sin, Multiplexores y Remultiplexores podr estimarse con un alto grado de
confianza. Como reputado proveedor de equipo de prueba de alta calidad
en la industria de video, Tektronix sigue proporcionando soluciones de
prueba y medicin a medida que la tecnologa evoluciona dando a los
usuarios de MPEG la confianza de que los sistemas comprimidos complejos
estn funcionando adecuadamente y permiten un diagnstico rpido an
cuando no estn presentes.
1.9 Inconvenientes de la compresin
La compresin MPEG es con prdidas ya que lo que es decodificado no es
idntico al original. La entropa de la fuente vara y cuando es alta, el siste-
ma de compresin puede dejar artifacts visibles cuando se decodifica. En la
compresin temporal, se asume la redundancia entre imgenes sucesivas.
Cuando el caso no es ese, el sistema puede fallar. Un ejemplo es el video
de una conferencia de prensa en la que los destellos de las cmaras estn
presentes. Las imgenes individuales que contienen los destellos sern
totalmente diferentes de las imgenes inmediatamente anteriores y poste-
riores en los que los artifacts de codificacin pueden volverse muy obvios.
El movimiento irregular o muchos objetos movindose independientemente
en la pantalla requerirn mucho ancho de banda de vector y este requeri-
miento solo puede ser llenado reduciendo el ancho de banda disponible
para los datos de imagen. De nuevo, puede haber artifacts visibles cuyo
valor varia y depende del movimiento. Este problema frecuentemente ocurre
en videos de deportes.
Una cuantizacin poco precisa provocar un conturing de luminancia y
pasterizacin del color. Esto puede verse como sombras manchadas y
bloqueo de reas grandes de color plano. Subjetivamente, los artifacts de
compresin son ms molestos que el deterioro relativamente constante
provocada por los sistemas de transmisin analgicos.
La nica solucin a esos problemas es reducir el factor de compresin.
Consecuentemente, el usuario tendr que hacer un juicio de valor entre la
economa de un factor de compresin alto y el nivel de los artifacts.
Adems de extender el retraso de la codificacin y la decodificacin, la
codificacin temporal tambin produce dificultades para la edicin. De
hecho, un stream de bits MPEG no puede ser editado de forma arbitraria.
Esta restriccin aparece debido a que en la codificacin temporal la decodi-
ficacin de una imagen puede requerir el contenido de una imagen anterior
y este podra no estar disponible. El hecho de que las imgenes puedan
estar fuera de la secuencia tambin complica la edicin.
Si se va a usar una codificacin adecuada las ediciones se pueden hacer
pero solo en puntos de edicin que estn relativamente distantes. Si se
requiere una edicin arbitraria, el stream MPEG deber seguir un proceso
de decodificar-modificar-recodificar que provocar una prdida por genera-
cin.

Primer

Seccin 2 Compresin en Video

Figura 2-1

Esta seccin muestra como la compresin de video est basada en la
percepcin del ojo. Algunas tcnicas habilitadoras importantes como las
transformadas y la compensacin de movimiento son consideradas como
una introduccin a la estructura de un Coder MPEG.
2.1 Codificacin espacial o temporal?
Como se vio en la Seccin 1, la compresin de video puede aprovechar las
redundancias tanto espaciales como temporales, en MPEG, la redundancia
temporal es reducida primero usando las similitudes entre las imgenes
sucesivas. Tanto como sea posible de la imagen actual, esta ser creada o
predicha usando informacin de las imgenes que ya se enviaron. Cuando
se usa esa tcnica solo es necesario enviar una imagen diferencial que
elimina las diferencias entre la imagen actual y la predicha. La imagen
diferencial entonces estar sujeta a la compresin espacial. Como algo
prctico es ms fcil explicar la compresin espacial antes de explicar la
compresin temporal.
La compresin espacial depende de las similitudes entre los pixeles adya-
centes en las reas planas de la imagen y en las frecuencias espaciales
dominantes en reas con patrones. El sistema J PEG usa solo la compre-
sin espacial ya que est diseada para transmitir imgenes estticas
individuales; sin embargo, J PEG puede ser usado para codificar una suce-
sin de imgenes individuales para video. En la aplicacin llamada Motion
J PEG, el factor de compresin no ser tan bueno como si se usara la
codificacin temporal pero el stream de bits ser editable libremente en
base a imagen a imagen.
2.2 Codificacin espacial
El primer paso en la codificacin espacial es hacer un anlisis de las fre-
cuencias espaciales usando una transformada. Una transformada simple-
mente es una forma de expresar una forma de onda en un dominio diferen-
te, en este caso, en el dominio de la frecuencia. La salida de una transfor-
mada es un juego de coeficientes que describen que tanto de una frecuen-
cia dada est presente. Una transformada inversa reproducir la forma de
onda original. Si los coeficientes son manejados con suficiente exactitud, la
salida de la transformada inversa es idntica a la forma de onda original.
La transformada mejor conocida es la Transformada de Fourier. Esta trans-
formada encuentra cada frecuencia de la seal de entrada multiplicando la
forma de onda de la entrada por una muestra de una frecuencia de target
llamada una funcin basee integrando el producto. La Figura 2-1 muestra
que cuando la forma de onda de entrada no contiene la frecuencia de
target, la integral ser 0 pero cuando la contiene la integral ser un coefi-
ciente que describe la amplitud de esa frecuencia componente.
Los resultados sern como los que se describen si la frecuencia componen-
te est en fase con la funcin base; sin embargo, si la frecuencia compo-
nente est en cuadratura con la funcin base, la integral seguir siendo cero
por lo que es necesario hacer dos bsquedas por cada frecuencia con las
funciones base en cuadratura entre s para que cada fase de la entrada sea
detectada.

Primer


Figura 2-2.

La transformada de Fourier tiene la desventaja de requerir coeficientes para las
componentes tanto de seno como de coseno de cada frecuencia. En la transfor-
mada de coseno, la forma de onda de la entrada es una imagen especular en
tiempo consigo misma antes de ser multiplicada por las funciones base. La Figura
2-2 muestra como esta imagen especular cancela todas las componentes senoida-
les y duplica todas las componentes coseno. La funcin de base senoidal es
innecesaria y solo se necesita un coeficiente para cada frecuencia.
La transformada discreta de coseno o DCT (Discrete Cosine Transform) es la
versin muestreada de la transformada de coseno y se usa extensamente en
forma bidimensional en MPEG. Un bloque de 8x8 pixeles es transformado para
convertirse en un bloque de 8x8 coeficientes. Ya que la transformada requiere la
multiplicacin por fracciones, hay una extensin de longitud de palabra que da
como resultado coeficientes que tienen una mayor longitud de palabra que los
valores de pxel. Tpicamente un bloque de pixeles de 8 bit dar como resultado un
bloque de coeficientes de 11 bits. As, un DCT no dar como resultado ninguna
compresin, de hecho provoca lo opuesto; sin embargo, el DCT convierte los
pixeles de la fuente a una forma en la que la compresin es ms simple. La Figura
2-3 muestra los resultados de una transformada inversa de cada uno de los coefi-
cientes individuales de un DCT de 8x8. En el caso de la seal de luminancia, el
coeficiente superior izquierdo es la brillantez promedio o componente de DC de
todo el bloque. Movindose por la fila superior, la frecuencia especial horizontal se
incrementa. Movindose hacia abajo por la columna de la izquierda, la frecuencia
especial vertical se incrementa.
En las imgenes reales, diferentes frecuencias espaciales verticales y horizontales
podrn ocurrir simultneamente y un coeficiente en algn punto dentro del bloque
representar todas las posibles combinaciones horizontal y vertical.
La Figura 2-3 tambin muestra 8 coeficientes como formas de onda horizontales
unidimensionales. Combinando esas formas de onda con varias amplitudes y
cualquier polaridad se pueden reproducir cualquier combinacin de 8 pixeles. As,
combinando 64 pixeles de la DCT en 2D tendremos como resultado el bloque
original de 8x8 pixeles.

Primer


Figura 2-3.
Claro que para imgenes en color, las muestras de diferencia de color
tambin tendrn que manejarse. Los datos de Y, Cb y Cr se ensamblan en
arreglos de 8x8 y se transforman individualmente.
En material de programa, muchos de los coeficientes tendrn valores de 0 o
muy cercanos y por tanto no sern transmitidos. Este hecho da como resul-
tado una compresin significativa que virtualmente es sin prdidas. Si se
necesita un factor de compresin mayor, entonces la longitud de palabra de
los coeficientes que no son 0 deber reducirse. Esta reduccin har dismi-
nuir la exactitud de esos coeficientes e introducir prdidas al proceso. Con
cuidado, las prdidas pueden introducirse en una forma que sea muy poco
visible para el espectador.
2.3 Ponderacin
La Figura 2-4 muestra que la percepcin humana del ruido en las imgenes
no es uniforme sino que est en funcin de la frecuencia espacial: ms
ruido puede ser tolerado a mayor frecuencia espacial; adems, el ruido de
video es enmascarado efectivamente por el detalle fino en la imagen mien-
tras que en las reas planas es altamente visible. El lector debe estar
conciente de que las mediciones tradicionales de ruido son ponderadas
frecuentemente de tal forma que las mediciones tcnicas se relacionen
mejor con el resultado subjetivo.
La compresin reduce la exactitud de los coeficientes y tiene un efecto
similar a usar muestras de longitud de palabra menores en PCM; esto es, el
nivel del ruido se eleva.
En PCM el resultado de acortar la longitud de la palabra es que el nivel del
ruido se eleva por igual a todas las frecuencias. A medida que el DCT divide
la seal en diferentes frecuencias se hace posible controlar el espectro del
ruido. En una forma efectiva los coeficientes de baja frecuencia se repre-
sentarn en una forma ms exacta que los coeficientes de alta frecuencia
por medio de un proceso de ponderacin.
La Figura 2-5 muestra que en el proceso de ponderacin los coeficientes
del DCT son divididos por medio de constantes que son una funcin de una
frecuencia bidimensional. Los coeficientes de baja frecuencia sern dividi-
dos por nmeros pequeos y los coeficientes de alta frecuencia por gran-
des. Despus de la divisin, el resultado ser truncado al entero ms cerca-
no. Esto es una forma de recuantizacin, en ausencia de ponderacin, esta
recuantizacin tendr el efecto de incrementar en forma uniforme el tamao
del paso de cuantizacin pero con la ponderacin se incrementar el tama-
o del paso de acuerdo con el factor de divisin.

Figura 2-4.
Como resultado, los coeficientes que representan frecuencias espaciales
bajas, son recuantizados con pasos relativamente pequeos y sufren de
ruido ligeramente incrementado. Los coeficientes que representan frecuen-
cias espaciales mayores son recuantizados con pasos grandes y sufren de
ms ruido; sin embargo, menos pasos implicarn que se necesiten menos
pasos para identificar el paso y obtener la compresin.
En el Decoder, los ceros de menor orden sern adicionados para regresar
los coeficientes ponderados a su magnitud correcta. Entonces se multiplica-
rn por factores de ponderacin inversos. Muy claramente a frecuencias
altas los factores de multiplicacin sern mayores por lo que el ruido de
recuantizacin ser mayor. Despus de la ponderacin inversa los coefi-
cientes tendrn sus valores de DCT originales ms un error de recuantiza-
cin que ser mayor en alta frecuencia que en baja frecuencia.
Como alternativa al truncado, los coeficientes ponderados pueden ser
alinealmente recuantizados de tal forma que el tamao del paso de cuanti-
zacin incremente la magnitud del coeficiente. Esta tcnica permite factores
de compresin ms altos pero con peores niveles de artifacts.
Claramente, el grado de compresin obtenido y, a su vez, la relacin de bits
de salida obtenida, ser una funcin de la severidad del proceso de recuan-
tizacin. Diferentes relaciones de bit requerirn diferentes tablas de ponde-
racin. En MPEG es posible usar diferentes tablas de ponderacin y la tabla
en uso puede ser transmitida al Decoder para asegurar la decodificacin
correcta.

Primer


Figura 2-5

2.4 Scanning (exploracin)
En material de programa tpico, los coeficientes de DCT ms significativos se
encuentran generalmente en o cerca de la esquina superior izquierda de la matriz.
Despus de la ponderacin los coeficientes de bajo valor pueden ser truncados a 0.
Se puede obtener una transmisin ms eficiente si se envan primero todos los
coeficientes que no son 0 seguido por un cdigo que indique que todo lo restante
es 0. El Scanningo exploracin es una tcnica que incrementa la probabilidad de
lograr ese resultado debido a que enva coeficientes en orden descendiente de
magnitud de probabilidad. La Figura 2-6a muestra que en un sistema no entrela-
zado, la posibilidad de un coeficiente que tenga un valor alto ser ms alto en la
esquina superior izquierda (vea la siguiente pgina) y ms bajo en la esquina
inferior derecha. Una exploracin en zigzagen diagonal a 45 es la mejor secuen-
cia a utilizar.
En la Figura 2-6b, se muestra un patrn de exploracin alternativa que
puede ser usado para Fuentes entrelazadas. En una fuente entrelazada, un
bloque DCT de 8x8 de un campo se extiende por dos veces el rea vertical
de la pantalla por lo que para un detalle de imagen dado, las frecuencias
verticales parecern dos veces ms grandes que las frecuencias horizonta-
les. As, la exploracin ideal para una imagen entrelazada ser en diagonal
que tiene un paso del doble de longitud. La Figura 2-6b muestra que una
frecuencia espacial vertical dada es explorada antes de escanear la misma
frecuencia espacial horizontal.
2.5 Codificacin de Entropa
En video real, no todas las frecuencias espaciales estarn presentes simul-
tneamente por lo que la matriz de coeficientes de DCT contendr trminos
en 0. La recuantizacin incrementar el nmero de ceros eliminando los
valores pequeos.

Primer


Figura 2-6

A pesar del uso del scanning o exploracin, los coeficientes 0 seguirn
apareciendo entre los valores significativos. La codificacin de longitud
corrida o RLC (Run Length Coding) permite manejar esos coeficientes ms
eficientemente. Donde se repiten los valores, como en los strings de ceros
la RLC simplemente transmitir el nmero de ceros en lugar de cada bit
individual.
La probabilidad de ocurrencia de valores de coeficientes particulares en el
video real se puede estudiar. En la prctica, algunos valores ocurren muy
frecuentemente y otros menos. La informacin estadstica se puede usar
para lograr una mayor compresin usando la codificacin de longitud varia-
ble o VLC (Variable Length Coding). Frecuentemente ocurren valores que
son convertidos a palabras de cdigo cortas y los valores infrecuentes se
convierten a palabras de cdigo largas. Para ayudar en la decodificacin
ninguna palabra de cdigo puede ser el prefijo de otra.

2.6 Un Coder espacial
La Figura 2-7 rene todos los conceptos precedentes de codificacin espacial. Se
asume que la seal de entrada es SDI 4:2:2 SDI (Serial Digital Interface o Interfase
serial digital), que puede tener una longitud de palabra de 8 o 10 bits. MPEG usa
solo una resolucin de 8 bit por lo que ser necesaria una etapa de redondeo
cuando la seal SDI contenga palabras de 10 bits. La mayora de los perfiles de
MPEG operan con el muestreo 4:2:0 por lo que ser necesaria una etapa de
filtraje/interpolacin de pasa bajas vertical. El redondeo y el submuestreo de color
introducen una pequea prdida irreversible de informacin y una reduccin pro-
porcional en la relacin de bits. El formato de entrada del rasterexplorado necesi-
tar ser almacenado de tal forma que pueda ser convertido a bloques de 8x8
pixeles.

Figura 2-7
Primer


Figura 2-8

El escenario DCT transforma la informacin de imagen al dominio de la
frecuencia. El DCT por s mismo no logra ninguna compresin. Despus del
DCT los coeficientes son ponderados y truncados proporcionando la prime-
ra compresin significativa. Los coeficientes entonces se exploran en zigzag
para incrementar la probabilidad de que los coeficientes significativos apa-
rezcan pronto en la exploracin. Despus del ltimo coeficiente que no sea
cero, se genera un cdigo de EOB (end of block, fin de bloque).
Los datos de los coeficientes se comprimen an ms por medio de las
codificaciones de longitud corrida o (run-length) y de longitud variable o
(variable-length). En un sistema de relacin de bits variable, la cuantizacin
puede ser fijada pero en un sistema de relacin de bits fija, se usa una
memoria Buffer para absorber las variaciones en las dificultades de la
codificacin. Las imgenes muy detalladas tendern a llenar el Buffer
mientras que las planas permitirn que se vace. Si hubiera peligro de que
el Buffer se desborde los pasos de recuantizacin tendrn que hacerse ms
grandes de tal forma que se eleve el factor de compresin.
En el Decoder el stream de bits se deserializa y la codificacin de entropa
se invierte para reproducir los coeficientes ponderados. Los coeficientes son
colocados en la matriz de acuerdo a la exploracin en zigzag y se aplica la
ponderacin inversa para recrear el bloque de coeficientes de DCT. Des-
pus de la transformada inversa se recrea el bloque de 8x8 pixeles. Para
obtener una salida de raster explorado, los bloques son almacenados en
RAM los cuales sern ledos lnea a lnea. Para obtener una salida 4:2:2 de
datos en 4:2:0 ser necesario un procesamiento de interpolacin vertical
como se muestra en la Figura 2-8.
Las muestras de croma en 4:2:0 son posicionadas a medio camino entre las
muestras de luminancia en los ejes verticales de tal forma que queden
espaciados equitativamente cuando se use una fuente entrelazada.
2.7 Codificacin temporal
La redundancia temporal puede ser explotada por la intercodificacin o
transmitir solo las diferencias entre las imgenes. La Figura 2-9 muestra
que el retraso de una imagen combinado con un substractor puede calcular
las diferencias de imagen.

Figura 2-9
Primer


Figura 2-10

La imagen diferencial es una imagen por derecho propio y se puede com-
primir ms con el Coder especial como ya se describi previamente. El
Decoder invierte la codificacin espacial y adiciona la imagen diferencial a la
imagen previa para obtener la siguiente imagen.
Hay algunas desventajas de este sistema simple. Primero, ya que solo se
envan las diferencias es imposible comenzar a decodificar despus del
inicio de la transmisin. Esta limitacin hace difcil que el Decoder propor-
cione imgenes despus de cambiar de un stream al otro (como ocurre
cuando el espectador cambia de canales). Segundo, si cualquier parte de
los datos de la diferencia es incorrecta, el error en la imagen se propagar
indefinidamente.
La solucin a esos problemas es usa un sistema que no sea completamente
diferencial. La Figura 2-10 muestra que se envan peridicamente imge-
nes completas. Estas imgenes son llamadas imgenes intra codificadas (o
imgenes I-) y se obtienen solo por medio de la compresin espacial. Si hay
un error o un cambio de canal es posible reasumir la decodificacin correcta
en la siguiente imagen I-.
2.8 Compensacin de movimiento
El movimiento reduce las similitudes entre las imgenes e incrementa los
datos necesarios para crear la imagen diferencial. La compensacin de
movimiento se usa para incrementar la similitud. La Figura 2-11 muestra
este principio. Cuando un objeto se mueve por la pantalla de TV puede
aparecer en diferente lugar a cada imagen pero no cambiar mucho su
apariencia. La imagen diferencial puede ser reducida midiendo el movimien-
to en el Encoder. Esta ser enviada al Decoder como un vector. El Decoder
usa el vector para correr parte de la imagen previa a un lugar ms apropia-
do en la nueva imagen.

Figura 2-11

Primer


Figura 2-12

Un vector controla el corrimiento de un rea completa de la imagen que es
conocida como macrobloque. El tamao del macrobloque es determinado
por la codificacin DCT y la estructura del submuestreo de color. La Figura
2-12a muestra que con un sistema 4:2:0 el espaciado vertical y horizontal
de las muestras de color es de exactamente el doble que el de la luminan-
cia. Un bloque DCT simple de 8x8 muestras de color se extiende en la
misma rea que 4 bloques de luminancia 8x8 por lo que esta ser el rea
de imagen mnima que podr ser corrida por un vector. Un macrobloque
4:2:0 contiene 4 bloques de luminancia: un bloque Cb y un bloque Cr.
En el perfil 4:2:2, el color solo es submuestreado en el eje horizontal. La
Figura 2-12b muestra que en 4:2:2, un bloque DCT simple de 8x8 muestras
de color se extiende por dos bloques de luminancia. Un macrobloque 4:2:2
contiene cuatro bloques de luminancia: dos bloques Cb y dos Cr.
El estimador de movimiento trabaja comparando los datos de luminancia de
dos imgenes sucesivas. Un macrobloque en la primera imagen se usa
como referencia. La correlacin entre la referencia y la siguiente imagen se
mide a todos los desplazamientos posibles con una resolucin de medio
pxel en el rango de bsqueda completo. Cuando se encuentra la mayor
correlacin, esta se asume que representa el movimiento correcto.
El vector de movimiento tiene una componente vertical y una horizontal.
Para material de programa tpico, un objeto en movimiento puede extender-
se a travs de un nmero de macrobloques.
Se obtendr un factor de compresin mayor si los vectores se transmiten en
forma diferencial. Cuando un objeto grande se mueve, los macrobloques
adyacentes tienen los mismos vectores y el vector diferencial se hace 0.

Primer

Los vectores de movimiento estn asociados con macrobloques no con
objetos reales en la imagen y habr ocasiones en las que parte del macro-
bloque se mover y parte no. En ese caso es imposible compensar adecua-
damente. Si el movimiento de la parte que se est moviendo es compensa-
do transmitiendo un vector, la parte estacionaria se correr de forma inco-
rrecta y necesitar datos diferenciales para ser corregido. Si no se envan
vectores, la parte estacionaria ser correcta pero los datos diferenciales
sern necesarios para corregir la parte que se est moviendo. Un compre-
sor prctico puede intentar aplicar ambas estrategias y seleccionar la que
requiera de menos datos.
2.9 Codificacin bidireccional
Cuando un objeto se mueve, cancela el fondo en su contorno del frente y lo
revela en el contorno posterior. El fondo revelado requiere que se transmi-
tan nuevos datos debido a que el rea del fondo fue cancelado previamente
y no se puede obtener informacin de una imagen previa. Un problema
similar ocurre si la cmara hace un paneo; nuevas reas sern visibles y no
se sabe nada de ellas. MPEG ayuda a minimizar este problema usando la
codificacin bidireccional que permite que se tome informacin de las
imgenes que estn antes y despus de la actual. Si se revela un fondo
este estar presente en una imagen posterior y la informacin se puede
mover hacia atrs en el tiempo para crear parte de una imagen anterior.
La Figura 2-13 muestra el concepto de codificacin bidireccional. En base a
macrobloques individuales, una imagen con codificacin bidireccional puede
obtener datos con compensacin de movimiento de una imagen previa o
posterior o, incluso, usar un promedio de datos anteriores o posteriores. La
codificacin bidireccional reduce significativamente la cantidad de datos
diferenciales necesarios para mejorar el grado de prediccin posible. MPEG
no especifica como se debe construir un Encoder, solo lo que constituye un
stream de bits que cumple con la norma; sin embargo, un compresor inteli-
gente puede probar las tres estrategias y seleccionar la que proporcione
menos datos a transmitir.
2.10 Imgenes I-, P- y B-
En MPEG, se necesitan tres tipos diferentes de imgenes para respaldar la
codificacin diferencial y la bidireccional para minimizar la propagacin de
errores:
Las imgenes I- son imgenes intracodificadas que no necesitan informa-
cin adicional para decodificarlas; en cambio requieren muchos datos en
comparacin con otros tipos de imgenes y por lo tanto no se transmiten
ms frecuentemente que lo necesario. Consisten principalmente de coefi-
cientes transformados y no tienen vectores. Las imgenes I- son decodifi-
cadas sin referencias a ninguna otra imagen por lo que le permiten al es-
pectador cambiar canales y detienen la propagacin de errores.

Figura 2-13

Las imgenes P- son predichas por adelantado a partir de una imagen
anterior que puede ser una I- o una P-. Los datos de las imgenes P- con-
sisten de vectores que describen donde, en la imagen previa, cada macro-
bloque debe ser tomado y los coeficientes transformados que describen la
correccin o datos diferenciales que deben ser adicionados a ese macro-
bloque. Donde no se puedan encontrar coincidencias para un macrobloque
por la bsqueda de la compensacin de movimiento, los datos intra se
envan para codificar ese macrobloque. Las imgenes P- requieren aproxi-
madamente la mitad de los datos que una imagen I-.
Las imgenes B- se predicen en forma bidireccional de una imagen I- o P-
anterior o posterior. Los datos de las imgenes B- consisten de vectores
que describen en que parte de las imgenes anteriores o posteriores se
deben tomar los datos. Tambin contienen los datos intracodificados que
proporcionan las correcciones necesarias. De nuevo, cuando la bsqueda
de compensacin de movimiento no encuentra coincidencias, los datos
intrase envan para codificar ese macrobloque. La prediccin bidireccional
es muy efectiva por lo que la mayora de los macrobloques en una imagen
B- sern codificados principalmente por vectores de movimiento. Adems,
una imagen B- nunca se usa como referencia para codificar otras imgenes
por lo que no hay posibilidad de errores de propagacin. Esto le permite a
los Encoders usar una recuantificacin ms agresiva para la correccin de
datos. Una imagen B- tpica requiere aproximadamente una cuarta parte de
los datos que una imagen I-.
Hay que hacer notar que una imagen B- no tiene que usar ambas direccio-
nes de la prediccin; en algunas circunstancias solo se emplea una direc-
cin. Esta opcin se puede usar cuando se construyen grupos de imgenes
o GOP (Groups Of Pictures) cerrados.
Primer


Figura 2-14

La Figura 2-14 presenta el concepto de GOP. El GOP representa la estruc-
tura de las imgenes I-, P- y B- en la secuencia. Generalmente la estructura
del GOP se repite en la secuencia pero su longitud y estructura puede
cambiar en cualquier momento. No hay lmites formales para la longitud de
un GOP pero para la transmisin una longitud tpica ser de 12 o 15 imge-
nes.
La naturaleza de la compresin temporal de MPEG implica que el orden de
transmisin de las imgenes no es el mismo que el orden de despliegue.
Una imagen P- en forma natural seguir a una I- o P- a partir de la cual es
predicha, por lo que no habr requerimientos especiales. Sin embargo, una
imagen B- codificada bidirecionalmente no se puede decodificar hasta que
sus dos imgenes de referencia se hayan recibido y decodificado. La Figura
2-14 muestra las imgenes de un GOP en su orden de despliegue en la
parte superior y en la inferior en orden de transmisin.
Note que en el orden de transmisin las imgenes B- siempre siguen a las
dos imgenes de referencia de las que es predicha.
Hay dos tipos de GOP: abiertos y cerrados. Un GOP cerrado no requiere
referencias fuera de l. En el orden de despliegue puede comenzar con una
imagen I- y terminar con una P-. En el orden de transmisin usualmente
habr imgenes B- despus de la ltima imagen P- pero son imgenes que
se desplegarn antes de la ltima imagen P-.
Es posible empezar y/o terminar un GOP cerrado con imgenes B- (en el
orden de despliegue) pero en el caso de iniciar y terminar con imgenes B-
se debe codificar usando una sola direccin de prediccin. Las imgenes B-
al inicio de un GOP cerrado solo deben usar la prediccin retrasada. Las
imgenes B- al inicio de un GOP usado pueden usar solo la prediccin
adelantada, en forma similar a una imagen P- pero las reglas de las imge-
nes B- sern usadas para la recuantizacin, etc.
Un GOP abierto no tiene esas restricciones en los vectores de prediccin.
Por ejemplo, las imgenes B- al final de un GOP pueden usar la prediccin
adelantada de la ltima imagen P- y la prediccin retrasada de la primera
imagen I- del siguiente GOP. Esta estructura es ligeramente ms eficiente
pero las predicciones cualquier frontera de imgenes. Es mucho ms difcil

Figura 2-15

dividir los streams de video y ser ms probable que los eventos como los
cambios de canal causen errores de imagen.
La estructura del GOP puede ser alterada por el Encoder cuando haya
cambios de escena. Las predicciones a travs de los cambios de escena
usualmente fallarn ya que habr grandes cantidades de entropa entre las
dos imgenes a cualquier lado del cambio de escena. Un Encoder puede
elegir detectar el cambio de escena, usar un GOP cerrado que nos lleve al
cambio de escena e iniciar un nuevo GOP (abierto o cerrado) con una
imagen I- para representar la primera imagen de la nueva escena.
Enviar datos de imagen de una secuencia requiere memoria adicional al
Encoder y Decoder y tambin causara retrasos. El nmero de imgenes
codificadas bidirecionalmente entre intra o predichas por adelantado se
deben restringir para reducir el costo y minimizar el retraso si esto resultara
importante.
La Figura 2-15 muestra el compromiso que se debe establecer entre el
factor de compresin y el retraso de codificacin. Para una calidad dada,
enviar solo imgenes I- requerir ms de dos veces la relacin de bits de
una secuencia IBBP.
Primer


Figura 2-16a

2.11 Un compresor MPEG
Las Figuras 2-16a, b y c muestran la estructura de un compensador de
movimiento bidireccional tpico. El video de entrada preprocesado entra a
una serie de almacenes de cuadros a los que se les puede hacer un by-
pass para cambiar el orden de la imagen. Los datos entonces entrarn al
substractor y al estimador de movimiento.
Para crear una imagen I-, el fin del retraso de entrada se selecciona y el
substractor se desactiva de tal forma que los datos pasen directamente para
ser codificados espacialmente (ver Figura 2-16a). La salida de datos del
substractor tambin pasa a un almacn de cuadros que puede contener
muchas imgenes. La imagen I- es mantenida en el almacn.

Primer


Figura 2-16b

Para codificar una imagen P-, se les aplica un bypass a las imgenes B-
del Buffer de entrada para seleccionar la siguiente imagen futura (ver Figura
2-16b). El estimador de movimiento comparar la imagen I- en el almacn
de salida con la imagen P- en el almacn de entrada para crear los vectores
de movimiento adelantados. Los macrobloques de la imagen I- son corridos
por esos vectores para hacer una imagen P- predicha. La imagen P- predi-
cha es substrada de la imagen P- real para producir el error de prediccin
que se codifica espacialmente y se enva junto con los vectores. El error de
prediccin tambin se adiciona a la imagen P- predicha para crear una
imagen P- localmente decodificada que tambin entra al almacn de salida.

Primer


Figura 2-16c

El almacn de salida entonces contendr una imagen I- y una imagen P-.
Una imagen B- del Buffer de entrada podr seleccionarse ahora. El com-
pensador de movimiento comparar la imagen B- con la imagen I- que le
preceda y la imagen P- que le sigue para obtener vectores bidireccionales
(ver Figura 2-16c). La compensacin de movimiento retrasada y adelantada
es ejecutada para producir dos imgenes B- predichas. Estas sern subs-
tradas de la imagen B- actual. En base a macrobloque a macrobloque, los
datos retrasados y adelantados son seleccionados de acuerdo a cuales
representan las diferencias ms pequeas. Las diferencias de la imagen
sern codificadas espacialmente y se envan con los vectores. Cuando
todas las imgenes B- intermedias estn codificadas, se le volver a hacer
un bypass a la memoria de entrada para crear una nueva imagen P-
basada en la imagen P- previa.

Primer


Figura 2-17

La Figura 2-17 muestra un Coder MPEG. La salida del Compensador de
movimiento se codifica espacialmente y los vectores son adicionados en un
Multiplexor. Los datos sintcticos tambin se adicionan, lo que identificar el
tipo de imagen (I-, P-, o B-) y proporcionar otra informacin para ayudar al
Decoder (ver Seccin 5 Streams Elementales). La salida de datos es
puesta en un Buffer para permitir variaciones temporales en relacin de
bits. Si la relacin de bits media es demasiado alta el Buffer tender a
llenarse. Para evitar el sobreflujo la cuantizacin tendr que hacerse en una
forma ms severa. Igualmente, si el Buffermuestra signos de poco flujo se
deber relajar la cuantizacin para mantener la relacin de bits promedio.
2.12 Pre procesamiento
Un Compresor intentar eliminar la redundancia dentro de la imagen y entre
ellas. Cualquier cosa que reduzca la redundancia aparente, que no sea
contenido de imagen, no es deseable. El ruido y el grano de la pelcula son
particularmente problemticos porque en general ocurren en toda la ima-
gen. Despus del proceso de DCT, el ruido dar coeficientes diferentes de
cero y el Coder no podr distinguir esta informacin de los datos genuinos
de imagen. Una cuantizacin ms pesada se requerir para codificar todos
los coeficientes reduciendo la calidad de imagen. El ruido tambin reduce
las similitudes entre las imgenes sucesivas incrementando la diferencia de
datos necesaria.
La subportadora residual en el video decodificado de video compuesto es
un problema serio porque dar como resultado frecuencias espaciales altas
que normalmente estn a bajo nivel en programas en componentes. La
subportadora tambin se alterna en fase de imagen a imagen causando un
incremento en los datos diferenciales. Naturalmente, cualquier artifact de
decodificacin en compuesto que sea visible a la entrada del Coder MPEG
es muy probable que sea reproducido en el Decoder.
Cualquier prctica que provoque movimiento no deseado hay que evitarla.
Los montajes de cmara inestables, adems de darnos una imagen temblo-
rosa incrementarn las diferencias de la imagen y los requerimientos de
transmisin de vectores. Esto tambin pasar con el material de telecine si
el dao de los orificios de la rueda dentada provoca ondulaciones de cinta o
brincos. En general el video que se va a comprimir debe ser de la ms alta
calidad posible. Si no se puede lograr eso entonces ser deseable la reduc-
cin de ruido y otras tcnicas de estabilizacin.
Si se requiere un alto factor de compresin, el nivel de artifacts se puede
incrementar especialmente si la calidad de entrada es pobre. En ese caso lo
mejor podra ser reducir la entropa presentada al Coder usando el pre
filtraje; en l la seal de video estar sujeta a un filtraje bidimensional pasa
bajas con lo que se reducir el nmero de coeficientes necesarios y se
reducir el nivel de los artifacts. La imagen se ver menos definida pero es
preferible a un alto nivel de artifacts.
En la mayora de aplicaciones de MPEG-2 se usa el muestreo 4:2:0 por lo
que se requerir un proceso de downsamplingde croma si la fuente est a
4:2:2. En MPEG-1, la Luminancia y la Croma atraviesan un proceso de
downsamping mayor para producir una imagen de entrada o CIF (Com-
mon Image Format, Formato de imagen comn) que es de solo 352 pixeles
de ancho. Esta tcnica reduce la entropa en un factor mayor. Para una
compresin muy alta se usa el QCIF (Quarter Common Image Format o
Formato de imagen de un cuarto del comn), que es de 176 pixeles de
ancho. El Downsampling es un proceso que combina un filtro pasa-bajas
espacial con un interpolador. El Downsamplingde seales entrelazadas es
problemtico porque el detalle vertical es esparcido por dos campos que se
puede decorrelacionar debido al movimiento.

Primer

Cuando el material de fuente es telecine, la seal de video tiene diferentes
caractersticas que el video normal. En el video a 50 Hz, los pares de
campos representan el mismo cuadro de pelcula y no hay movimiento
entre ellos. As, el movimiento entre los campos se alterna entre cero y el
movimiento entre los cuadros. En el video a 60 Hz se usa un pulldown 3:2
para obtener 60 Hz de pelcula a 24 Hz. Un cuadro se convierte en dos
campos; el siguiente en tres campos y as sucesivamente.
Consecuentemente, un campo de cada cinco es completamente redundan-
te. MPEG maneja mejor el material de cine descartando el tercer campo en
los sistemas 3:2. Un cdigo de 24 Hz en la transmisin alertar al Decoder
que debe recrear la secuencia 3:2 volviendo a leer un almacn de campos.
En el telecine a 50 y 60 Hz los pares de campos son desentrelazados para
crear cuadros y luego el movimiento se mide entre los cuadros. El Decoder
puede recrear el entrelazado leyendo lneas alternadas en el almacn de
cuadros.
Un corte es un evento difcil de manejar para el Compresor porque frecuen-
temente provocar una falla de prediccin casi completa y se requerir una
larga cantidad de correccin de datos. Si se puede tolerar un retraso de
codificacin, un Coder puede detectar los cortes por adelantado y modificar
dinmicamente la estructura del GOP de tal forma que una imagen I- se
inserte para que coincida con el corte. En ese caso el corte es manejado
con muy pocos datos extra. Las ltimas imgenes B- antes del cuadro I- es
casi seguro que usen la prediccin adelantada. En algunas aplicaciones
que no estn en tiempo real, como el masterizado de DVDs un Coder
podra usar dos pasadas para codificar la entrada de video: una pasada
para identificar las dificultades o reas de entropa alta y crear una estrate-
gia de codificacin y una segunda pasada para comprimir en realidad la
entrada de video.
2.13 Wavelets
Todas las transformadas sufren de cierta incertidumbre ya que entre ms
exactamente se conozca el dominio de la frecuencia menos exacto ser el
dominio del tiempo (y viceversa). En la mayora de las transformadas como
la de Fourier de transporte o DFT (Discreet Fourier Transport) y la trans-
formada discreta de coseno o DCT (Discreet Cosine Transform), la longitud
del bloque es fija por lo que el tiempo y la resolucin de frecuencia tambin
sern fijos. Los coeficientes de frecuencia representan valores espaciados
a la misma distancia en una escala lineal. Desafortunadamente, debido a
que los sentidos humanos son logartmicos, la escala uniforme del DFT y
de la DCT nos da una resolucin de frecuencia inadecuada en un extremo y
un exceso de resolucin en el otro.

Figura 2-18
La transformada wavelet no es afectada por ese problema porque su reso-
lucin de frecuencia es una fraccin fija de una octava y por tanto tendr
una caracterstica logartmica. Esto se hace cambiando la longitud del
bloque como una funcin de la frecuencia. A medida que disminuye una
frecuencia, el bloque se har ms largo. As, una caracterstica de la trans-
formada wavelet es que todas las funciones de base contendrn el mismo
nmero de ciclos y estos se escalarn simplemente a lo largo del eje del
tiempo para buscar diferentes frecuencias. La Figura 2-18 contrasta el
tamao fijo de los bloques de DFT/DCT con el tamao variable del wavelet.
Los wavelets son especialmente tiles para la codificacin de audio porque
automticamente se adaptan a los requerimientos en conflicto de la locali-
zacin exacta de los transitorios en tiempo y dan una valoracin exacta de
las frecuencias de los tonos estables.
Para la codificacin de video, las wavelets tienen la ventaja de producir
seales de resolucin escalable casi sin esfuerzo extra. En el video en
movimiento, las ventajas de las wavelets son contrarrestadas por la dificul-
tad de asignar vectores de movimiento a un bloque de tamao variable pero
la dificultad para codificar imgenes fijas o imgenes I- no es nada que
deba preocupar. La codificacin wavelet ha mostrado beneficios particulares
para aplicaciones con muy baja relacin de bits. Los artifacts generados por
una cuantizacin excesiva de los coeficientes de la wavelet aparecen como
smearing, y este es mucho menos objetable que la apariencia de bloques
que provoca una cuantizacin excesiva de los coeficientes de DCT.

Primer

Seccin 3 Compresin de Audio
La compresin de audio con prdidas est completamente basada en las
caractersticas de la audicin humana las cuales deben ser consideradas
antes de que cualquier descripcin de la compresin sea posible. Sorpresi-
vamente, la audicin humana, en particular en estreo, es en realidad ms
crticamente discriminatoria que la visin humana y consecuentemente la
compresin de audio debe ser considerada con cuidado. Como con la
compresin de video, la de audio requiere cierto nmero de diferentes
niveles de complejidad de acuerdo al factor de compresin requerido.
3.1 El mecanismo de audicin
La audicin comprende procesos fsicos en el odo y los procesos nervio-
so/mentales que combinados nos dan la impresin de sonido. La impresin
que recibimos no es idntica a la forma de onda acstica real presente en
el canal auditivo debido a que cierta entropa se pierde. Los sistemas de
compresin de audio que pierden solo la parte de la entropa que se perde-
r por el mismo mecanismo de audicin producirn buenos resultados.
El mecanismo fsico de la audicin est formado por el odo externo, el
medio y el interno. El odo externo comprende el canal auditivo y el tmpa-
no. Este convierte el sonido incidente en una vibracin en una forma muy
similar a como lo hace el diafragma de un micrfono. El odo interno trabaja
censando las vibraciones transmitidas a travs de un fluido. La impedancia
del fluido es mucho mayor que la del aire y el odo medio acta como un
transformador de impedancias de acoplamiento que mejora la transferencia
de potencia.
La Figura 3-1 muestra que las vibraciones se transfieren al odo interno por
medio del estribo que acta en la ventana oval. Las vibraciones en el
fluido en el odo viajan por el caracol, una cavidad espiral en el crneo (se
muestra desenrollado en la Figura 3-1 por claridad). La membrana basilar
est estirada sobre el caracol. La membrana vara en masa y rigidez a lo
largo de su longitud. Al final, cerca de la ventana oval, la membrana es
rgida y ligera por lo que su frecuencia resonante es alta. En el extremo
distante la membrana es pesada y suave y resuena a frecuencias bajas. El
rango de las frecuencias resonantes disponibles determina el rango de
frecuencia de la audicin humana, la cual, en la mayora de la gente es de
20 Hz a 15 KHz.
Diferentes frecuencias a la entrada de sonido harn que diferentes reas de
la membrana vibre. Cada rea tiene diferentes terminaciones nerviosas
para permitir la discriminacin de los tonos. La membrana basilar tambin
tiene pequeos msculos controlados por los nervios que juntos actan
como una clase de sistema de retroalimentacin positiva que mejora el
factor Q de la resonancia.
El comportamiento resonante de la membrana basilar tiene un comporta-
miento exactamente paralelo al de un analizador de transformadas. De
acuerdo con la teora de incertidumbre de las Transformadas, entre mas
exactamente se conozca el dominio de la frecuencia de una seal menos
exactamente se conocer el dominio del tiempo. Consecuentemente, entre
ms capaz sea una transformada de discriminar entre dos frecuencias,
menos capaz ser discriminar entre el tiempo de dos eventos. La audicin
humana ha evolucionado con un cierto compromiso que balancea la incerti-
dumbre de discriminacin en el tiempo y la frecuencia; en el balance, nin-
guna capacidad ser perfecta.
La discriminacin imperfecta de la frecuencia provoca la incapacidad para
separar frecuencias con muy poco espacio entre s. Esta incapacidad es
conocida como enmascaramiento de auditorio, definido como la sensibili-
dad reducida a un sonido en presencia de otro.
La Figura 3-2a (vea la siguiente pgina) muestra que el umbral de audicin
es una funcin de la frecuencia. La mayor sensibilidad estar, no sorpresi-
vamente, en el rango del habla. En la presencia de un tono simple, el
umbral es modificado como se ve en la Figura 3-2b. Note que el umbral se
eleva para tonos de mayor frecuencia y hasta cierto punto a menor fre-
cuencia. En la presencia de un espectro de entrada complejo, como la
msica, el umbral se eleva a casi a todas las frecuencias. Una consecuen-
cia de este comportamiento es que el hissde un cassette de audio anal-
gico solo ser audible durante los pasajes ms tranquilos de la msica.
El Compander usa este principio amplificando las seales de audio de
bajo nivel antes de la grabacin o transmisin y luego las regresa con el
nivel adecuado.

Figura 3-1

Primer


Figura 3-2a
La discriminacin imperfecta del odo es debida a su respuesta resonante. El factor
Q es tal que un sonido dado tienen que estar presente por lo menos 1 milisegundo
antes de que sea audible. Debido a esta respuesta lenta, el enmascaramiento an
puede llevarse a cabo cuando las dos seales involucradas no sean simultneas.
El enmascaramiento adelantado y retrasado ocurre cuando el sonido enmascara-
dor continua enmascarando los sonidos a niveles ms bajos antes y despus de la
duracin real del sonido enmascarado- LA Figura 2-2 muestra este concepto.
El enmascaramiento eleva el umbral de audicin y los Compresores aprovechan
este efecto elevando el ruido de piso lo que permite que la forma de onda de audio
sea expresada con menos bits. El ruido de piso solo puede ser elevado a frecuen-
cias a las cuales hay un enmascaramiento efectivo. Para maximizar el efecto del
enmascaramiento es necesario dividir el espectro de audio en diferentes bandas de
frecuencia para permitir la introduccin de diferentes cantidades de compandingy
ruido en cada banda.

Figura 3-3

Figura 3-2b
3.2 Codificacin sub banda
La Figura 3-4 muestra un Compander divisor de banda. El filtro de divisin de
banda es un juego de filtros de fase lineal de banda estrecha que se sobreponen
entre s y todos tienen el mismo ancho de banda. La salida de cada banda consiste
de muestras que representan una forma de onda. En cada banda de frecuencia la
entrada de audio es amplificada hasta un nivel mximo antes de la transmisin.
Despus de eso, cada nivel regresar a su valor correcto. El ruido captado en la
transmisin es reducido en cada banda si la reduccin de ruido es comparable con
el umbral de audicin. Se puede ver que se puede tolerar mayor ruido en algunas
bandas debido al enmascaramiento. Consecuentemente, en cada banda, despus
del companding, es posible reducir la longitud de las palabras de las muestra.
Esta tcnica logra la compresin debido a que el ruido de cuantizacin introducido
por la prdida de resolucin es enmascarado.

Figura 3-4

Primer


Figura 3-5

La Figura 3-5 muestra un Coder divisor de banda como el que se usa en
MPEG capa 1. La entrada de audio digital es alimentada a un filtro de
divisin de bandas que divide el espectro de la seal en un nmero deter-
minado de bandas. En MPEG este nmero es 32. El eje del tiempo es
dividido en bloques de igual longitud, de nuevo, en MPEG capa 1 hay 384
muestras de entrada, entonces habrn 12 muestras en cada una de las 32
bandas a la salida del filtro. Dentro de cada banda el nivel es amplificado
por multiplicacin para llevar el nivel al mximo. La ganancia requerida es
constante para la duracin del bloque y se transmite un factor de escala
simple con cada bloque para cada banda con el fin de permitir la inversin
del proceso en el Decoder.
La salida del banco de filtros para MPEG capa 1 se analiza usando una
FFT de 512 puntos para determinar el espectro de la seal de entrada. Este
anlisis conduce a un modelo de enmascaramiento que determina el grado
de enmascaramiento que se puede esperar en cada banda. Entre ms
enmascaramiento est disponible, menos exactas necesitarn ser las
muestras en cada banda. La exactitud de la muestra es reducida recuanti-
zando para reducir la longitud de las palabras. Esta reduccin tambin es
constante para cada palabra en una banda pero diferentes bandas pueden
usar diferentes longitudes de palabra. Las longitudes de palabra necesitan
ser transmitidas como un cdigo de asignacin de bits para cada banda
para permitirle al Decoder deserializar adecuadamente el stream de bits.

Figura 3-6
3.3 MPEG Capa 1
La Figura 3-6 muestra un stream de bits de audio en MPEG capa 1. Des-
pus del patrn de sincronizacin y el encabezador hay cdigos de asigna-
cin de 32 bits de 4 bits cada uno. Esos cdigos describen la longitud de la
palabra de las muestras en cada sub banda. Despus vienen los factores
de escala 32 usados para el Companding de cada banda. Esos factores de
escala determinan la ganancia necesaria en el Decoder para regresar el
audio a su nivel correcto. Los factores de escala, a su vez, son seguidos
por los datos de audio de cada banda.

Primer


Figura 3-7

La Figura 3-7 muestra el Decoder de capa 1. El patrn de sincronizacin es
detectado por el Generador de temporalizacin que deserializa la asignacin de
bits y los datos del factor de escala. Los datos de asignacin de bits entonces
permitirn la deserializacin de las muestras de longitud variable. La recuantiza-
cin es invertida y la compresin es invertida por los datos del factor de escala
para regresar cada banda al nivel correcto. Esas 32 bandas separadas son
entonces combinadas en un filtro combinador que produce la salida de audio.
3.4 MPEG Capa 2
La Figura 3-8 muestra que cuando se usa el Filtro de divisin de banda para
controlar el modelo de enmascaramiento, el anlisis espectral no es muy exacto
ya que solo hay 32 bandas y la energa puede estar en cualquier parte de la
banda. El ruido de piso no se puede elevar mucho porque, en el peor de los
casos conocidos, el enmascaramiento no podra operar. Un anlisis espectral
ms exacto permitira un factor de compresin ms alto. En MPEG capa 2, el
anlisis espectral es ejecutado por medio de un proceso separado. En este caso
se usa una FFT (Fast Fourier Transform o Transformada rpida de Fourier) de
1024 puntos trabajando directamente desde la entrada para controlar el modelo
de enmascaramiento. Para resolver las frecuencias ms exactamente, la exten-
sin de tiempo de la transformada se tiene que incrementar lo cual se hace
elevando el tamao del bloque a 1152 muestras.
Mientras que el esquema de compandingde bloque es el mismo que para la
capa 1, no todos los factores de escala se transmiten ya que contienen cierto
grado de redundancia en el material de programa real. El factor de escala de
bloques sucesivos en la misma banda difieren por 2 dB, menos del 10% del
tiempo y la ventaja es aprovechada por esta caracterstica analizando juegos de
tres factores de escala sucesivas.
Cuando el contenido de la sub banda es aproximadamente constante (conocido
como programa estacionario o quasi estacionario), solo un factor de escala de
entre los tres es enviado. A medida que el contenido transitorio se incrementa en
una sub banda determinada dos o tres factores de escala se enviarn. Tambin
se enviar un cdigo de seleccin de factor de escala para permitirle al Decoder
determinar que se va a enviar en cada sub banda. Esta tcnica divide a la mitad
en forma muy efectiva la relacin de bits del factor de escala.

Figura 3-8

3.5 Codificacin de transformada
Las capas 1 y 2 estn basadas en filtros de divisin de banda en los que la seal
sigue siendo representada como una forma de onda sin embargo, la capa 3
adopta una codificacin de transformada similar a la que se usa para la codifica-
cin de video. Como se mencion antes, el odo ejecuta una clase de transfor-
mada de frecuencia al sonido incidente y debido al factor Q de la membrana
basilar, la respuesta no se puede incrementar o reducir rpidamente. Conse-
cuentemente, si una forma de onda de audio es transformada al dominio de la
frecuencia, no es necesario que los coeficientes se enven muy frecuentemente.
Este principio es la base de la codificacin de transformada. Para factores de
compresin ms altos se pueden recuantizar los coeficientes hacindolos
menos exactos. Este proceso produce ruido que ser colocado en frecuencias
en las que el enmascaramiento sea mayor. Uno de los resultados del uso del
Coder de transformada es que el espectro de entrada es conocido con exactitud
por lo que se podr crear un modelo de enmascaramiento preciso.

Primer

3.6 MPEG Capa 3
Este complejo nivel de codificacin en realidad solo es requerido cuando se
necesita el ms alto nivel de compresin. Tiene un alto grado de cosas en
comn con la capa 2. Una transformada discreta de coseno se usa con 384
coeficientes de salida por bloque. Esta salida puede ser obtenida procesando
directamente las muestras de entrada pero en un Coder de niveles mltiples es
posible usar una transformada hbrida incorporando un filtraje a 32 bandas de
las capas 1 y 2 como base. Si se hace esto, las 32 sub bandas del QMF (Qua-
drature Mirror Filter o filtro de espejo de cuadratura) se procesarn adems con
un MDCT (Modified Discreet Cosine Transform, Transformada Discreta de
Coseno modificada) para obtener 384 coeficientes de salida.
Se usan dos tamaos de ventana para evitar el pre eco en los transitorios. La
conmutacin de ventana es ejecutada por el modelo psicoacstico. Se ha
encontrado que el pre eco esta asociado con la entropa en el audio que se
eleva por encima del valor promedio. Para obtener el factor de compresin ms
alto se usa la cuantizacin no uniforme de los coeficientes junto con la codifica-
cin Huffman. Esta tcnica asigna las longitudes de palabra ms cortas a los
valores de cdigo ms comunes.
3.7 Audio MPEG-2
Aunque originalmente fueron designados como niveles de audio MPEG 1, 2 y 3,
los sistemas ahora son conocidos con ms exactitud como MPEG-1 Nivel 1, etc.
MPEG-2 define extensiones para el audio MPEG-1 y un nuevo sistema de
codificacin avanzado.
MPEG-2 permite el uso del muestreo a relaciones ms bajas que MPEG-1. Esto
no es exactamente compatible con lo anterior pero solo requiere tablas adiciona-
les en un Decoder MPEG-1 para la interoperatibilidad.
El audio MPEG-2 BC (compatible con el anterior) proporciona 5.1 canales (5
canales de ancho de banda complete ms un canal de efectos de baja frecuen-
cia y bajo ancho de banda),
MPEG-2 BC tiene un stream de bits MPEG-1 (2 canales) en su ncleo y adicio-
na las extensiones de canales mltiples en un formato que ser ignorado por un
Decoder MPEG-1.
MPEG-2 AAC (Advanced Audio Coding, Codificacin avanzada de audio) es un
sistema ms sofisticado con bancos de filtros de mayor resolucin y herramien-
tas de codificacin adicionales. Ofrece una eficiencia de codificacin significati-
vamente mayor pero no es compatible con lo anterior.

3.8 MPEG-4 Audio
La codificacin MPEG-4 est basada en objetos (vea la seccin 4.4.2). El audio
en MPEG-4 puede representar sonidos naturales o sintticos. Para la codifica-
cin de audio natural, el kit de herramientas de MPEG-4 incluye el MPEG-2 AAC
as como una variedad de otras herramientas. Estas incluyen la codificacin
paramtrica para relaciones de bit muy bajas y una tcnica conocida como
codificacin predictiva lineal excitada por cdigo o CELP (Code Excited Linear
Predictive) para la codificacin de la voz con relaciones de bits de rango medio.
Se respaldan varias formas de escalabilidad incluyendo la escalabilidad del
stream de bits que puede ser aplicada en puntos determinados en el sistema de
transmisin. El uso de la codificacin de objetos permite hacer elecciones en el
punto de decodificacin. Por ejemplo, se puede transmitir un concierto como dos
objetos: orquesta y solista. La decodificacin normal presentar el trabajo com-
pleto pero un instrumentista puede decodificar solo el objeto orquestay ejecu-
tar la parte del solista en vivo. Otras aproximaciones similares pueden permitir
la codificacin de programas de tal manera que el auditorio pueda seleccionar
un modo de mix minuspara eliminar los comentarios de, digamos, un evento
deportivo.
Las capacidades de audio sinttico de MPEG-4 se usarn, sin duda, en forma
extensa en el futuro. Estas incluyen las capacidades de texto a vozy tcnicas
controladas por el resultadoen los que la msica es sintetizada con instrumen-
tos descargados usando el lenguaje estructurado de orquesta de audio o SAOL
(Structured Audio Orchestra Language).

Primer

3.9 AC-3
La tcnica de codificacin de audio AC-3, inventada por los Laboratorios Dolby
se usa con el sistema ATSC en lugar de uno de los esquemas de codificacin
de audio en MPEG. Est documentado como Norma ATSC a/52. Subsecuen-
temente, el AC-3 fue adoptado como una componente opcional de la DVB y por
el sistema de Motorola Digicypher II. AC-3 es un sistema basado en transforma-
das que obtiene una ganancia de codificacin recuantizando los coeficientes de
la frecuencia.
La entrada PCM de un Coder AC-3 es dividida en bloques con ventanas que se
sobreponen como se muestra en la Figura 3-9. Esos bloques contienen 512
muestras cada uno pero debido a la sobreposicin completa hay una redundan-
cia del 100%. Despus de la transformada hay 512 coeficientes en cada bloque
pero debido a la redundancia, esos coeficientes se pueden reducir a 256 coefi-
cientes usando una tcnica llamada cancelacin de aliasing en el dominio del
tiempo o TDAC (Time Domain Aliasing Cancellation.
La forma de onda de la entrada se analiza y si hay un transitorio significativo en
la segunda mitad del bloque, la forma de onda se dividir en dos para evitar el
pre eco. En este caso, el nmero de coeficientes permanece igual, pero la
resolucin de la frecuencia se dividir a la mitad y la resolucin temporal se
duplicar. Se establecer una bandera en el stream de bits para indicarle al
Decoder que se hizo esto.
Los coeficientes son sacados en notacin de punto flotante como una mantisa y
un exponente. La representacin es el equivalente binario de la notacin cientfi-
ca. Los exponentes son efectivamente factores de escalado. El juego de expo-
nentes en un bloque produce un anlisis espectral de la entrada con una exacti-
tud finita en una escala logartmica llamada envolvente espectral. El anlisis
espectral es la entrada al modelo de enmascaramiento que determina el grado
al cual el ruido puede elevarse en cada frecuencia.

Figura 3-9
El modelo de enmascaramiento controla el proceso de recuantizacin que
reduce la exactitud de cada coeficiente redondeando la mantisa. Una proporcin
significativa de los datos transmitidos consiste de valores de mantisa.
Los exponentes tambin son transmitidos pero no directamente ya que contie-
nen redundancias que se pueden explotar. Dentro de un bloque solo el primer
exponente (menor frecuencia) es transmitido en forma absoluta. Los exponentes
restantes se transmiten en forma diferencial y el Decoder adiciona la diferencia
al valor previo. Donde el audio de entrada tenga un espectro suave, los expo-
nentes en muchas bandas de frecuencia pueden ser los mismos. Los exponen-
tes se pueden agrupar en juegos de dos o cuatro con banderas que describan lo
que se ha hecho,
J uegos de 6 bloques se ensamblan en un cuadro de sincrona AC-3. El primer
bloque del cuadro siempre tiene todos los datos de exponentes pero en casos
de seales estacionarias, los ltimos bloques en el marco pueden usar los
mismos exponentes.

Primer

Seccin 4 Las normas MPEG
Las secciones 2 y 3 presentaron las tecnologas de compresin de audio y video
y muchas de las herramientas usadas en las normas MPEG. Esta seccin
examina la historia y estructura de MPEG y la evolucin de varias de las normas
MPEG.
4.1 Que es MPEG?
MPEG es el Grupo de expertos de imgenes en movimiento, un comit al
servicio de la Organizacin Internacional de Normas o ISO (International Stan-
dards Organization) y la Comisin Electrotcnica Internacional o IEC (Internatio-
nal Electrotechnical Commission). La IEC maneja la normalizacin internacional
para las tecnologas elctrica y electrnica; ISO virtualmente maneja todo lo
dems. Al inicio de la edad de la tecnologa de la informacin ISO e IEC forma-
ron un comit tcnico (J TC1) para que se ocupara de las cosas relacionadas
con la IT. El J TC1 tiene un nmero de grupos de trabajo, incluyendo J PEG (J oint
Photographic Experts Group, Grupo de expertos en fotografa) y WG11 que es
MPEG.
El comit fue formado en 1988 bajo el liderazgo del convocante,
Dr. Leonardo Chiariglione de Italia. La concurrencia a las reuniones de MPEG,
normalmente mantenidas 4 veces al ao ha crecido de unos 15 delegados en
1988 a unos 300 en 2002. Establecieron un precedente envidiable de genera-
cin de normas que lograron una adopcin extensa, MPEG-1, MPEG-2 y la
norma de compresin de audio MP3 (MPEG-1 Audio, capa 3). Esta reputacin
fue empaada de alguna forma por MPEG-4, no debido a deficiencias en la
norma sino como resultado del largo retraso para publicar los trminos de la
licencia y la fuerte reaccin adversa a los primeros trminos que eventualmente
se publicaron a principios de 2002.
Se debe hacer notar que MPEG por si misma no juega ningn papel para el
licenciamiento. Como comit de ISO e IEC, requiere que las tecnologas inclui-
das en sus normas sean licenciables bajo trminos razonables y no discrimina-
toriospero no hay una definicin aceptada de razonable. El licenciamiento es
responsabilidad de quienes poseen las patentes relevantes y esto tpicamente
implica muchas organizaciones por todo el mundo que han contribuido a la
investigacin y el desarrollo y quieren ver alguna recompensa.
Para MPEG-2, quienes tienen la patente se agruparon y formaron MPEG-LA
(Grupo MPEG para autorizar licencias). Todas las patentes esenciales son
certificadas por este grupo y son licenciadas como un bloque a cualquier organi-
zacin que quiera implementar las normas. Esto funcion bien para MPEG-2,
pero como se mencion antes, se estn experimentando mayores dificultades
con MPEG-4 y mucha gente responsabiliza a los retrasos en la publicacin de
los trminos de la licencia por la actual falta de xito comercial de MPEG-4
(Esto, por supuesto, puede cambiar. El foro industrial de MPEG-4 est trabajan-
do muy fuerte para encontrar soluciones aceptables para quienes ostentan las
patentes y los usuarios potenciales y revisando las propuestas aparecidas a
mediados del 2002 que son ms factibles de ser aceptadas ms fcilmente).

4.2 MPEG-1
El sistema MPEG-1, ISO/IEC 11172, es la primera norma de compresin para
imgenes en movimiento y fue desarrollada entre 1988 y 1992. Usa transforma-
das de DCT, cuantizacin de coeficientes y codificacin de longitud variable en
una forma similar a J PEG pero tambin incluye la compensacin de movimiento
para la compresin temporal. Ponindola en tres partes tendramos:

Sistema ISO/IEC 11172-1, la estructura mltiplex
ISO/IEC 11172-2, codificacin de video
ISO/IEC 11172-3, codificacin de audio
MPEG-1 represent un logro tcnico excepcional. Fue diseada para comprimir
Streams de imagen con tamaos de imagen SIF, 352x288 (25-Hz PAL) o
352x240 (30Hz NTSC) y el audio asociado a, aproximadamente 1.5 Mbits/s de
relacin de datos comprimidos total. Esta relacin es adecuada para el transpor-
te en circuitos de datos T1 y para la reproduccin desde CD-ROM; corresponde
aproximadamente a la resolucin de una grabadora de video de consumidor.
Una medicin de este logro puede verse comparando los nmeros de un CD de
audio. Un CD de audio normal que transporta dos canales de audio con una
resolucin de 16 bits, con una relacin de muestreo de 44.1 kHz, tiene una
relacin de transferencia de datos de hasta 1.5 Mbit/s.
MPEG-1 comprime el audio y video de tal forma que ambos puedan ser trans-
mitidos con la misma relacin de datos!
El formato CIF es un compromiso entre los formatos Europeo y Americano SIF
(Source Input Format, Formato de fuente de entrada): resolucin espacial para
625 SIF (352x288) y Resolucin temporal 525 SIF (29.97 Hz). Esta es la base
para la videoconferencia.
MPEG-1 puede ser diseada para imgenes CIF y no tiene herramientas para
manejar imgenes entrelazadas por lo que tiene un impacto obviamente peque-
o en el mundo del broadcast de televisin.
Antes de dejar el MPEG-1, es importante hacer notar lo que en realidad incluye
la norma y como se logra la interoperatibilidad. La norma define un juego de
herramientas, la sintaxis del stream de bits y la operacin del Decoder. No
define la operacin del Encoder cualquier dispositivo que produce un stream
de bits sintcticamente vlido que pueda ser decodificado por un Decoder que
cumpla con esta norma ser un Encoder MPEG vlido. Adems, no define la
calidad de la imagen ni la calidad de la codificacin. Esto permite la evolucin de
la tecnologa de codificacin sin cambiar la norma y sin condenar a la obsoles-
cencia los Decoders existentes. Este modelo es usado en todas las normas
MPEG. El xito de esta estrategia es obvia, aunque MPEG-2 se usa para video,
MPEG-1 capa 2 audio an se usa como sistema de compresin principal para
audio en los sistemas actuales de transmisin DVB.

Primer

4.3 MPEG-2
MPEG-1 fue congelada (es decir, los cambios subsiguientes solo se permitieron
a nivel editorial) en 1991. En el mismo ao el proceso de MPEG-2 empez y
eventualmente se convirti en una norma en 1994. Las metas iniciales fueron
simples; haba la necesidad de una norma que pudiera acomodar video con
calidad de broadcast. Esto requera la codificacin de imgenes de definicin
estndar a tamao completo (704x480 a 29.97 Hz y 704x576 a 25 Hz) y la
capacidad de codificar video entrelazado eficientemente.
En muchas formas MPEG-2 representa la siguiente erade MPEG. La mayor
flexibilidad de MPEG-2 combinada con la disponibilidad incrementada de circui-
tos integrados con gran escala de integracin implic que MPEG-2 pudiera
usarse en un vasto nmero de aplicaciones. El xito de MPEG-2 se destaca
mejor con la muerte de MPEG-3 diseada para televisin de alta definicin.
MPEG-3 pronto fue abandonada cuando qued claro que MPEG-2 poda aco-
modar esta aplicacin con facilidad. MPEG-2 es, por supuesto, la base tanto
para las normas de broadcast ATSC y DVB como del sistema de compresin
usado por el DVD.
Tambin se permiti que MPEG-2 fuera un blanco mvil. Con el uso de los
perfiles y niveles, que se discutirn ms abajo fue posible completar la norma
para una aplicacin pero luego moverse para acomodar aplicaciones ms
demandantes en una forma evolutiva. Los trabajos para extender MPEG-2
continan en 2002.
MPEG-2 es documentada como ISO/IEC 13818, actualmente en 10 partes. Las
partes ms importantes de esta norma son:

ISO/IEC 13818-1 Sistemas (transporte y streams de programa), PES, T-STD
modelo de Buffer y las tablas PSI bsicas: CAT, PAT, PMT y NIT.
ISO/IEC 13818-2 codificacin de video
ISO/IEC 13818-3 codificacin de audio
ISO/IEC 13818-4 Prueba y conformidad MPEG
ISO/IEC 13818-6 transmisin de datos y DSMCC.

Uno de los logros principales de MPEG-2 definido en 13818-1, el stream de
transporte, se describe en la Seccin 8. La flexibilidad y robustez de este diseo
ha permitido que sea utilizado por muchas aplicaciones incluyendo el transporte
de datos de MPEG-4 y MPEG-7.
Nota: Los streams de transporte de DVB y ATSC llevan PES de video y audio
dentro de agrupaciones de programaque son completamente diferentes a los
streams de programa(estos son usados en DVD y CD),
Los streams de transporte MPEG normalmente son de relaciones de bits cons-
tantes pero los streams de programa normalmente son de relaciones de bit
variables.

4.3.1 Perfiles y niveles en MPEG-2
Con ciertas excepciones menores, MPEG-1 fue diseada para una tarea; la
codificacin de imgenes de tamao fijo y el audio asociado a una relacin de
bits conocida de 1.5 Mbits/seg. Las herramientas y sintaxis de MPEG-1 pueden
y se han usado para otros propsitos, pero esos usos estn fuera de la norma y
requieren de Encoders y Decoders de propietario, Solo hay un tipo de Decoder
que cumple con la norma MPEG-1.
En sus inicios haba una meta similar para MPEG-2. Esta norma fue diseada
para codificar imgenes para broadcast y sonido, nominalmente los sistemas de
televisin entrelazados de 525/60 y 625/50; sin embargo, a medida que progre-
saba el diseo se hizo aparente que las herramientas que se estaban desarro-
llando eran capaces de manejar muchos tamaos de imagen y un amplio rango
de relaciones de bit. Adems, se desarrollaron herramientas ms complejas
para sistemas de codificacin escalables. Esto implic que en la prctica no
podra haber un Decoder MPEG-2 sencillo. Si un Decoder que cumpliera con la
norma tena que ser capaz de manejar streams de bit de alta velocidad codifica-
dos usando todas las herramientas posibles ya no podra ser un Decoder eco-
nmico para aplicaciones estndar. Como ejemplo simple, un dispositivo capaz
de decodificar seales de alta definicin a, digamos, 20 Mbits/seg, sera subs-
tancialmente ms caro que uno limitado a las seales de definicin estndar de
unos 5 Mbits/seg. Sera una norma muy pobre la que requiriera el uso de un
dispositivo caro para una aplicacin simple.
MPEG dise una estructura bidimensional de perfiles y niveles para clasificar
los streams de bits y Decoders. Los perfiles definen las herramientas que se
pueden usar, Por ejemplo, la codificacin bidireccional (cuadros B-) pueden ser
usados en el perfil principal pero no en el perfil simple. Los niveles relacionan
solo la escala. Un Decoder de alto nivel debe ser capaz de recibir un stream de
bits ms rpido y debe tener ms Buffer de Decoder y Almacenes de cuadro
ms grandes que un Decoder de nivel principal; sin embargo, el perfil principal a
nivel alto (MP@HL) y el perfil principal a nivel principal (MP@ML) usan exacta-
mente las mismas herramientas de codificacin/decodificacin y elementos de
sintaxis.
La Figura 4-1 muestra el pareado de perfiles y niveles que son definidos por
MPEG-2 (Perfiles en el eje horizontal, Niveles en el vertical). Hay que hacer
notar que no todas las combinaciones son vlidas; solo los pares completados
estn definidos en la norma. Es un requerimiento de conformidad con la norma
que un Decoder en cualquier Perfil/Nivel debe ser capaz de decodificar los
perfiles y niveles ms bajos. Por ejemplo, un Decoder MP@ML debe ser capaz
de decodificar streams de bit de perfil principal a nivel bajo (MP@LL) y de perfil
simple a nivel principal (SP@ML).

Primer


Figura 4-1
El perfil simple no respalda la codificacin bidireccional y por tanto solo las
imgenes I- y P- formarn la salida. Esto reduce el retraso de codificacin y
decodificacin y permite un hardware ms simple. El perfil simple solo ha sido
definido a nivel principal.
El perfil principal est diseado para una gran cantidad de usos. El nivel principal
usa una entrada de baja resolucin que solo tiene 352 pixeles por lnea. La
mayora de las aplicaciones de broadcast requerirn el subjuego de MPEG
MP@ML que respalda la SDTV (Standard Definition TV, Televisin de definicin
estndar). El nivel high-1440 es un esquema de alta definicin que duplica la
definicin en comparacin con el nivel principal, El nivel alto no solo duplica la
resolucin sino que mantiene esa relacin para el formato 16:9 incrementando el
nmero de muestras horizontales de 1440 a 1920.
En los sistemas de compresin que usan la transformada espacial y la recuanti-
zacin es posible producir seales escalables. Un proceso escalable es aqul
en el que la entrada da como resultado una seal principal y una seal auxiliar.
La seal principal ser puede decodificada sola para dar una imagen de una
cierta calidad pero si la informacin de la seal auxiliar se adiciona se puede
mejorar algn aspecto de calidad.
Por ejemplo, un Coder MPEG convencional, recuantizando fuertemente los
coeficientes, puede codificar una imagen con resultados moderados de propor-
cin seal a ruido. Sin embargo, si esa imagen es decodificada localmente y
substrada pxel a pxel de la original, se tendr como resultado una imagen con
ruido de cuantizacin. Esa imagen puede ser comprimida y transmitida como
seal auxiliar. Un Decoder simple solo decodificar el stream de bits principal
ruidoso pero un Decoder ms complejo puede decodificar ambos streams de
bits y combinarlos para producir una imagen con bajo ruido. Este es el principio
de la escalabilidad de SNR (Signal-to-Noise Ratio. Relacin seal a ruido).

Primer

Como alternativa, codificando solo las frecuencias espaciales ms bajas en una
imagen de HDTV podemos producir un stream de bits principal que un receptor
de SDTV puede decodificar. Si la imagen de menor definicin es decodificada
localmente y substrada de la imagen original tendremos como resultado una
imagen de definicin mejorada. Esta imagen puede ser codificada en una seal
auxiliar. Un Decoder adecuado puede combinar las seales principal y auxiliar
para recrear la imagen de HDTV. Este es el principio de la escalabilidad espa-
cial.
El perfil alto respalda tanto la SNR y la escalabilidad espacial as como permite
la opcin de muestreo en 4:2:2.
El perfil 4:2:2 ha sido desarrollado para mejorar la compatibilidad con el equipo
de produccin digital. Este perfil permite la operacin a 4:2:2 sin requerir la
complejidad adicional del uso del perfil alto. Por ejemplo, un Decoder HP@ML
debe soportar la escalabilidad de SNR que no es un requerimiento para la
produccin. El perfil 4:2:2 tiene la misma libertad de estructura del GOP que los
otros perfiles pero en la practica se usa comnmente con GOPs cortos haciendo
que sea ms sencilla la edicin. La operacin en 4:2:2 requiere una relacin de
bits mayor que 4:2:0 y el uso de GOPs cortos requiere una relacin de bits ms
alta y pareja para una calidad dada.
El concepto de los perfiles y niveles es otro de los desarrollos de MPEG-2 que
ha probado ser robusto y extensible; MPEG-4 usa un arreglo mucho ms com-
plejo de perfiles y niveles que discutiremos ms adelante.
4.4 MPEG-4
La normalizacin internacional es un proceso lento y los avances tecnolgicos
que frecuentemente ocurren pueden incorporarse a una norma que se esta
desarrollando. Frecuentemente esto es deseable pero el mejoramiento continuo
puede significar que la norma nunca llega a terminarse y ser usual. Para asegu-
rar que una norma eventualmente se termine hay reglas estrictas que prohben
los cambios sustantivos despus de cierto punto del proceso de normalizacin,
As, para el momento en el que la norma se adopta oficialmente frecuentemente
hay una acumulacin de mejoramientos deseados y extensiones. Esto pas con
MPEG-2. Como se discuti antes, MPEG-3 se comenz y se abandon; enton-
ces el siguiente proyecto se convirti en MPEG-4. Actualmente hay dos versio-
nes completas de MPEG-4 y se sigue trabajando en otras extensiones.
Al principio el enfoque principal de MPEG-fue la codificacin de video y audio a
relaciones muy bajas. De hecho, la norma fue explcitamente optimizada para
tres rangos de relaciones de bit::

Por debajo de 64 kbits/s.
64 a 384 kbits/s.
384 kbits/s a 4 Mbits/s
El desempeo a relaciones de bit bajas permaneci como objetivo principal y
algunas ideas muy creativas contribuyeron para ese fin. Tambin se prest
mucha atencin a la resistencia a los errores haciendo que MPEG-4 sea muy
til para su uso en ambientes propensos a errores como la transmisin a dispo-
sitivos personales manuales; sin embargo, otros perfiles y errores usan relacio-
nes de bits de hasta 38.4 Mbits/s y an se est trabajando en perfiles y niveles
con calidad de estudio usando relaciones de datos de hasta 1.2 Gbits/s.
Ms importante, MPEG-4 se ha convertido en mucho ms que otro sistema de
compresin, ha evolucionado hacia un nuevo concepto de codificacin multime-
dia con poderosas herramientas para interactividad y un vasto rango de aplica-
ciones. An la introduccinoficial de esta norma se extiende por 67 pginas,
por lo que aqu solo es posible dar una breve introduccin al sistema.
4.4.1 Documentos de la norma MPEG-4
Las partes principales de las normas MPEG-4 son:

ISO/IEC 14496-1 Sistemas
ISO/IEC 14496-2 Visual
ISO/IEC 14496-3 Audio
ISO/IEC 14496-4 Pruebas de conformidad
ISO/IEC 14496-6 Marco de trabajo para la integracin o DMIF (Delivery
Multimedia Integration Framework)
4.4.2 Codificacin de objetos
La desviacin ms significativa de los sistemas de transmisin convencionales
es el concepto de los objetos. Diferentes partes de la escena final se pueden
codificar y transmitir por separado como objetos de audio y de video que hay
que juntar o componer con el Decoder. Diferentes tipos de objeto pueden ser
codificados independientemente con las herramientas ms adecuadas para el
trabajo. Los objetos pueden generarse independientemente o se puede analizar
una escena por separado, por ejemplo, los objetos del background o del fore-
ground. En una demostracin muy interesante, la cobertura de video de un
partido de football soccer fue procesada para separar la pelota del resto de la
escena. El background (la escena sin la pelota) se transmiti como un teaser
para atraer audiencia al evento en pay-per-view: cualquier persona poda ver a
los jugadores en el campo pero solo aquellos que pagaron podan ver el baln.

Primer


Figura 4-2

La aproximacin orientada a objetos nos lleva a tres caractersticas clave de los
streams MPEG-4:

Los objetos mltiples pueden ser codificados usando diferentes tcnicas y
componerseen el Decoder
Los objetos pueden ser de origen natural, como las escenas de una cmara
o sintticas como el texto.
Las instrucciones en el stream de bits y/o la eleccin del usuario pueden
habilitar muchas presentaciones diferentes del mismo stream de bits.
El sistema generalizado para la codificacin de objetos en MPEG-4 se muestra
en la Figura 4-2. Este diagrama tambin enfatiza las oportunidades de interac-
cin con el usuario dentro de los sistemas MPEG-4 una funcin muy podero-
sa, particularmente para los diseadores de juegos de video.
Esas capacidades no tienen que ser usadas, MPEG-4 proporciona la codifica-
cin tradicional de audio y video y mejora MPEG-2 al ofrecer una eficiencia
mejorada y resistencia a los errores; sin embargo, la verdadera potencia de
MPEG-4 viene de la arquitectura descrita anteriormente, La codificacin de
objetos de forma independiente ofrece un nmero de ventajas. Cada objeto
puede ser codificado en la forma ms eficiente y se pueden usar diferentes
relaciones de escalamiento espacial o temporal (ver 4.4.3) como sea apropiado.

Primer


Figura 4-3

4.4.3 Codificacin de audio y video
Muchas de las herramientas de codificacin de video en MPEG-4 son similares
a las de MPEG-2 pero mejoradas por el mejor uso de la codificacin predictiva y
una codificacin de entropa ms eficiente; sin embargo, la aplicacin de las
herramientas puede diferir significativamente de las primeras normas.
MPEG-4 codifica objetos de video. En el modelo ms simple un video es codifi-
cado en una forma muy similar a MPEG-2 pero es descrito como un objeto de
video simple con una forma rectangular. La representacin de la imagen es
conocida como codificacin de textura. Donde haya ms de un objeto de video,
algunos podran tener formas irregulares y generalmente sern ms pequeos
que un objeto en background de pantalla completa. Esto significa que solo el
rea activa del objeto necesitar ser codificada pero la forma y posicin tambin
puede ser representada. La norma incluye herramientas para la codificacin de
la forma de objetos rectangulares e irregulares en sus representaciones ya sea
binarias o en escala de grises (similar a un canal alpha). Este concepto se
muestra en la Figura 4-3.
En forma similar, MPEG-4 usa herramientas similares a las de MPEG-1 y
MPEG-2 para la codificacin de audio en vivo y AAC ofrece una mayor eficien-
cia. Mltiples objetosde audio pueden codificarse por separado y componer-
seen el Decoder. Como con el video, los objetos de audio pueden ser naturales
o sintticos.

Primer


Figura 4-4

4.4.4 Ecalabilidad
En el contexto de la compresin de media la escalabilidad implica la habilidad de
distribuir contenido a ms de un nivel de calidad dentro del mismo stream de
bits. Tanto MPEG-2 como MPEG-4 proporcionan perfiles escalables usando un
modelo convencional; el Encoder genera una capa de base y una o mas capas
de mejoramiento como se muestra en la Figura 4-4. La(s) capa(s) de mejora-
miento pueden ser descartadas para la transmisin o decodificacin si no se
dispone de los recursos suficientes. Esta aproximacin funciona pero todas las
decisiones acerca de los niveles de calidad tienen que hacerse en el momento
de la codificacin y en la prctica el nmero de capas de mejoramiento estn
severamente limitadas (usualmente a una).

Primer


Figura 4-5

Versiones posteriores de MPEG-4 incluyen el perfil de escalabilidad de grano
fino o FGS (Fine Grain Scalability). Esta tcnica genera un stream de bits sim-
ples que representa el nivel de calidad ms alto pero que permite que las ver-
siones de menor calidad se puedan extraer en downstream. El FGS usa la
codificacin de bit plano mostrado en concepto en la Figura 4-5. Los coeficientes
cuantizados son divididos, un bit a la vez, comenzando con el bit ms significa-
tivo. Esto proporciona una representacin tosca del coeficiente (s) ms gran-
de(s) (y significativo(s). Otras divisiones subsecuentes proporcionan representa-
ciones ms exactas de esos coeficientes ms significativos y aproximaciones
toscas de los siguientes ms significativos y as sucesivamente.
El escalamiento espacial, incluyendo al FGS, puede ser combinado con el
escalamiento temporal que permita la transmisin y/o decodificacin de relacio-
nes de cuadro ms bajas cuando los recursos sean limitados. Como se mencio-
n antes, los objetos pueden ser escalados en forma diferente; podra ser
apropiado que retengan toda la resolucin temporal para un objeto importante
en el foreground pero actualizar el background como una relacin menor.

4.4.5 Otros aspectos de MPEG-4
MPEG-4 es enorme y los comentarios que se acaban de hacer solo tocan unos
pocos de los muchos aspectos de la norma. Hay perfiles de estudio para codifi-
cacin de alta calidad, la cual, junto con la codificacin de objetos permitir el
almacenamiento estructurado de todos los elementos separados de un video
compuesto. Extensiones adicionales de MPEG-4 podran proporcionar an
niveles de calidad adecuados para cine digital. La Figura 4-6 muestra los perfiles
de MPEG-4 definidos actualmente. (Note que en este diagrama solo se mues-
tran los perfiles; generalmente los niveles mltiples son definidos para cada
perfil)
Algunos de los tipos de objetos definidos dentro de MPEG-4 son interesantes.
Un ejemplo es un sprite. Un Sprite es un objeto esttico en el background,
generalmente ms grande que la pantalla o el dispositivo de despliegue. Por
ejemplo, la accin de un juego de video puede tener lugar al frente de una
escena en el background. Si se usa un spriteun background esttico grande
puede ser transmitido una vez y a medida que la accin del juego proceda la
parte apropiada del background se ver de acuerdo con el movimiento del
puerto de vista.

Primer


Figura 4-6

MPEG-4 define los perfiles de animacin tanto faciales como del cuerpo. En
cada caso se pude usar una cara o cuerpo preestablecida y se enviarn instruc-
ciones para animar este objeto. Alternativamente, el objeto preestablecido
puede ser modificado por el stream de bits; por ejemplo, una cara especfica
puede se transmitida y luego animada. Las instrucciones sofisticadas de anima-
cin relacionadas con el lenguaje permitirn que una cara almacenada lea
texto en muchos lenguajes.
Algunas personas describen MPEG-4 como la norma para juegos de video y
ciertamente muchas de las implementaciones son muy tiles para esta industria;
sin embargo, an una examinacin superficial de la norma revela tal riqueza de
capacidades y profundidad en cada aspecto que las aplicaciones potenciales no
tienen fin.

4.4.6 El futuro de MPEG-4
Como se describi anteriormente, MPEG-4 es un juego de normas de amplio
rango con una oferta muy rica de capacidades para muchas aplicaciones. Esta
es la teora, en la prctica MPEG-4 puede mostrar pocos xitos. En particular
muchos observadores esperaban que MPEG-4 rpidamente se convirtiera en el
mecanismo de codificacin dominante para el material audio-visual transmitido
por Internet y que reemplazara las varias propuestas de codecs de propietario
que se usan actualmente. Esto no ha pasado ni tampoco es probable que pase
en el futuro prximo. Hay dos razones para esta falla.

Primer

La primera es tecnologa y el desempeo resultante MPEG-4 usa tecnologa de
compresin de video basada en la norma H.26x desarrollada por la ITU fechada
a principios de los 90s. La distribucin de audio y video por medio de Internet es
un negocio altamente competitivo y los tres contendientes principales: Apple,
Microsoft y RealNetworks, han implementado esquemas de codificacin de
propietario que superan al Codec actual de MPEG-4.
La otra razn de la falla (a la fecha) de MPEG-4 es la situacin del licenciamien-
to de la patente. Hasta principios del 2002, las compaas que queran imple-
mentar MPEG-4 no saban que regalas tenan que pagar a los poseedores de
la patente. El esquema de licenciamiento propuesto para los niveles bsicos de
MPEG-4 ya se public ahora y encontr una fuerte reaccin adversa de parte de
la industria. Los trminos del licenciamiento para los niveles ms sofisticados
an son desconocidos. Ciertamente la oferta inicial de los trminos de licencia-
miento no ha hecho nada por incrementar la implementacin global de la norma.
Sin embargo hay esperanzas para el futuro. Un esfuerzo conjunto de ITU y
MPEG, conocido como unin del grupo de video o J VT (J oint Video Team) est
trabajando en un Codec conocido como H.26L. Citando al ITU, El diseo del
H.26L es un Coder de transformada hbrido de movimiento compensado basado
en bloques - similar al sprite pero diferente en muchas cosas especficas rela-
cionadas con los diseos anteriores El H.26L incrementa significativamente el
nmero de tamaos de bloque disponibles y el nmero de imgenes de referen-
cia disponibles para hacer la estimacin de movimiento (1/8 de pxel en algunas
implementaciones) y esta basado en un tamao de bloque principal de 4x4 en
lugar del 8x8 utilizado en la mayora de sistemas MPEG.
Se espera que el H.26L muestre mejoramientos substanciales en eficiencia de
codificacin y la meta de los participantes es que el nivel de base, adecuado
para el streaming de Internet est libre de regalas. La primera etapa del trabajo
del J VT se espera que est completo en 2002 y se publique como MPEG-4
Parte 10.
4.5 MPEG-7
Debido a que se cancel MPEG-3 la secuencia real de las normas fue MPEG-1,
MPEG-2 y MPEG-4. Algunos participantes del comit queran que la nueva
norma fuera MPEG-5; otros fueron atrados por la naturaleza binaria de la
secuencia y preferan MPEG-8. Finalmente, se concluy que cualquier secuen-
cia simple fallara en sealar la diferencia fundamental del trabajo de MPEG-1 a
MPEG-4 y se eligi MPEG-7.
MPEG-7 no es tanto acerca de la compresin sino acerca de la metadata,
tambin conocida como bits acerca de los bits. La metadata es informacin
digital que describe el contenido de otros datos digitales. En el habla moderna, el
material de programa o contenido, la imagen en s, los objetos de video, audio o
datos que forman la informacin son conocidos como datos de esencia. La
metadata le dice al mundo todo lo que necesita saber acerca de lo que est en
la esencia.
Cualquiera que se ha involucrado con el almacenamiento de informacin ya
sean cintas de video, libros, msica, lo que sea, conoce la importancia y la
dificultad de catalogar e indexar con exactitud. La informacin almacenada
solo es til si se conoce su existencia y si puede ser recuperada de forma
oportuna cuando sea necesario.
Este problema siempre ha estado con nosotros y ha sido atacado en el
dominio analgico por una combinacin de etiquetas, catlogos, tarjetas de
ndice, etc. Ms recientemente, la industria del cmputo nos ha dado bases
de datos relacionales eficientes y efectivas en costo que permiten que
poderosos motores de bsqueda accedan a informacin almacenada en
formas notables. Asumiendo que la informacin est presente en una forma
en que el motor de bsqueda pueda usarla.
Aqu esta el problema verdadero. El mundo est generando nuevos conte-
nidos de media con una frecuencia enorme y siempre creciente. Con el
incremento en cantidad y la disminucin de costos de la media de almace-
namiento digital, ms y ms de ese contenido se puede almacenar. Las
redes locales y de rea ancha pueden hacer que el contenido sea accesible
y distribuible si se le puede encontrar. Los motores de bsqueda pueden
hallar lo que quieran y las bases de datos pueden encadenarse al material
mismo pero necesitamos tener toda la informacin de indexacin necesaria
dentro de la base de datos en una forma til para el motor de bsqueda.
Debemos suponer, gracias al conocimiento de las normas anteriores, que el
comit MPEG no se involucrara en exceso con mecanismos para generar
datos. MPEG, acertadamente toma como propio el punto de vista de que si crea
una estructura normalizada y hay la necesidad de mercado, los huecos tecnol-
gicos sern llenados. En normas MPEG previas la sintaxis y el Decoder fueron
especificados por la norma. En MPEG-7 solo la sintaxis est normalizada como
se muestra en la Figura 4-7. La generacin de la metadata no est especificada
como lo son las aplicaciones que pueden utilizarla. MPEG-7 especifica como se
debe expresar la metadata. Esto significa que los campos deben ir a una base
de datos como se especifica y cualquiera que disee un motor de bsqueda
sabe que elementos descriptivos pueden estar presentes y como sern codifi-
cados.
MPEG-7 define una estructura de descriptores y esquemas de descripcin que
pueden caracterizar casi cualquier cosa. En teora al menos, los elementos
primitivos como los histogramas de color y las formas pueden ser combinados
para representar entidades complejas como caras individuales. Es posible
indexar automticamente material de tal forma que la base de datos pueda ser
consultada por escenas que muestren, por ejemplo, al Presidente Clinton y al
presidente Greenspan de la Reserva Federal de U.S. juntos. Las construcciones
no estn confinadas a imgenes. Debe ser posible usar una muestra de voz
para buscar por grabaciones o imgenes de Pavarotti o reproducir unas pocas
notas en un teclado para encontrar las coincidencias o melodas similares.

Primer


Figura 4-7

El rpido avance de los sistemas de almacenamiento y trabajo en red permitirn el
acceso a vastas cantidades de contenido digital. A medida que avanza la tecnolo-
ga para satisfacer las necesidades de MPEG-7, seremos capaces de indexar y
recuperar tems en formas inimaginables tan solo hace unos pocos aos. Entonces
tendremos la necesidad de un sistema para controlar el acceso, privacidad y
transacciones comerciales asociadas con este contenido. Este es el punto hacia
donde est orientado MPEG-21.
4.6 MPEG-21
MPEG-21, de nuevo, difiere en clase de los trabajos anteriores del comit. El concep-
to bsico es muy simple aunque de amplio alcance. MPEG-21 busca crear una
estructura completa para la administracin y uso de assets digitales incluyendo toda la
infraestructura de soporte para las transacciones comerciales y administracin de
derechos que deben acompaar esta estructura. El enfoque es dirigido hacia habilitar
el uso transparente y creciente de los recursos multimedia por un rango amplio de
redes y dispositivos. El alcance del trabajo de MPEG-21 es indicado por los siete
elementos estructurales definidos en el borrador del reporte tcnico.
1. Se espera que la declaracin del tem digital establezca una abstraccin unifor-
me y flexible y un esquema interoperable para definir los tems digitales.El es-
quema debe ser abierto y extensible para cualquiera y todos los tipos de recur-
sos de media y esquemas de descripcin y deben soportar una estructura jerr-
quica que sea fcil de consultar y navegar.
2. La representacin del tem digital de MPEG-21 es la tecnologa que se usar
para codificar el contenido y para proporcionar todos los mecanismos necesarios
para sincronizar todos los elementos del contenido. Se espera que esta capa
referencie al menos a MPEG-4.
3. La identificacin y descripcin del tem digital proporcionar el marco de trabajo
para la identificacin y descripcin de los tems digitales (enlazando todos los
elementos del contenido). Probablemente esto incluir los esquemas de descrip-
cin de MPEG-7, pero tambin debe incluir [una] nueva generacin de sistemas
de identificacin para soportar de forma efectiva, exacta y automatizada la admi-
nistracin de eventos y los reportes (transacciones de licencias, reglas de utiliza-
cin, monitoreo y seguimiento, etc.).Debe satisfacer las necesidades de todas
las clases de usuarios de MPEG-21.

La administracin del contenido y el uso deben definir las interfases y
protocolos para el almacenamiento, administracin y descripcin de los
tems digitales de MPEG-21. Se debe soportar el archivado y catalogado
del contenido mientras se preserve el uso de los derechos y la capacidad
de rastrear los cambios de los tems y sus descripciones. Este elemento de
MPEG-21 es posible que tambin respalde una forma de comercializacin
en la que los consumidores puedan intercambiar informacin personal para
el acceso adecuado al contenido y la formalizacin de mecanismos para
canales personalesy construcciones similares.
La administracin de la propiedad intelectual y la proteccin es una componente
esencial. Las controversias actuales que rodean a los archivos de audio en MP3
demuestran la necesidad de nuevos mecanismos de derechos de copia recono-
cibles para el mundo digital. Se puede argir que el contenido no tiene valor a
menos que est protegido. MPEG-21 se construir sobre los trabajos actuales
de MPEG-4 y MPEG-7, pero necesitar extensiones para acomodar nuevos
tipos de tems digitales y mecanismos de distribucin.
Las terminales y redes MPEG-21 direccionarn la distribucin de tems en un
amplio rango de redes y la capacidad de entregar el contenido en un amplio
rango de terminales. Conceptualmente una pelcula debera ser distribuible con
calidad completa de cine digital a un cine o con baja calidad a una red ms lenta
hasta un dispositivo de consumidor (a un precio diferente). En cualquier caso
habr algunas restricciones para el tipo y nmero de usos.
El usuario no deber darse cuenta de ninguno de los problemas y complejida-
des asociadas con la entrega o reproduccin del tem.
Finalmente existe la necesidad de un reporte de eventos para normalizar la
mtrica e interfases para checar el desempeo de todos los eventos reporta-
bles. El ejemplo ms obvio aqu es que si el sistema le permite al usuario tener
acceso a un tem protegido, tambin se debe asegurar que se haga el pago
apropiado!

Primer

Seccin 5 Streams elementales

Figura 5-1

Un stream elemental es bsicamente la salida en bruto del Encoder y no
contiene nada ms que lo necesario para que un Decoder haga la aproxi-
macin a la imagen o audio originales. La sintaxis de la seal comprimida
es definida en una forma rgida en MPEG de tal forma que los Decoders
puedan garantizar que puedan trabajar con eso. El Decoder no es definido
excepto en que debe producir de alguna forma la sintaxis adecuada.
La ventaja de esta aproximacin es que va de acuerdo con el mundo real
en el que es ms probable que haya muchos ms Decoders que Encoders.
Normalizando el Decoder se pueden hacer a bajo costo. En contraste, el
Encoder puede ser ms complejo y caro sin una gran penalizacin de
costos pero con una calidad de imagen potencialmente mejor a medida que
se incrementa la complejidad. Cuando el Encoder y el Decoder son diferen-
tes en complejidad se dice que el sistema de codificacin es asimtrico.
La aproximacin de MPEG tambin permite la posibilidad de que la calidad
mejore a medida que los algoritmos de codificacin se refinen al estar
produciendo los streams de bits que pueden ser entendidos por los prime-
ros Decoders. La aproximacin tambin permite el uso de algoritmos de
codificacin de propietario que no necesitan llegar a ser de dominio pblico.
5.1 Sintaxis del stream elemental de Video
La Figura 5-1 muestra la construccin del stream elemental de video. La
unidad fundamental de informacin de la imagen es el bloque de DCT
(Discrete Cosine Transform. Transformada discreta de coseno) que repre-
senta un arreglo de pxeles de 8x8 que pueden ser Y, C
b
o C
r
. Los coefi-
cientes de DC se envan primero y son representados con ms exactitud
que los otros coeficientes. Despus se envan los coeficientes restantes y el
cdigo de final de bloque o EOB (End Of Block).
Los bloques son ensamblados en macrobloques que son las unidades
fundamentales de una imagen y que pueden estar compensadas en movi-
miento. Cada macrobloque tiene un vector de movimiento bidimensional en
el encabezador. En las imgenes B-, los vectores pueden ser retrasados
as como adelantados. La compensacin de movimiento puede estar basa-
da en campos o cuadros y esto se indica. La escala utilizada para la re-
cuantizacin de movimientos tambin se indica. Usando los vectores, el
Decoder obtiene informacin acerca de las imgenes anteriores y posterio-
res para producir una imagen predicha. Los bloques son transformados en
sentido inverso para producir una correccin de la imagen que se adiciona-
r a la imagen predicha para producir la salida decodificada. En la codifica-
cin 4:2:0 cada macrobloque tendr 4 bloques Y y dos bloques de diferen-
cia de color. Para que sea posible identificar que bloque describe que
componente los bloques se envan en un orden especificado.
Los macrobloques son ensamblados en slices (rebanadas) que siempre
deben representar bandas horizontales de imagen de izquierda a derecha.
En MPEG, los slices pueden iniciar en cualquier punto y tener un tamao
arbitrario pero en ATSC deben iniciar en el extremo izquierdo de la imagen.
Pueden existir muchos slices a todo lo ancho de la pantalla. El slice es la
unidad fundamental de sincronizacin para la codificacin de longitud
variable y la diferencial. Los primeros vectores en un slice se envan en
forma absoluta mientras que los vectores restantes se transmiten en forma
diferencial. En las imgenes I-, los primeros coeficientes de DC en el slice
se envan en forma absoluta y los coeficientes restantes en forma diferen-
cial. En las imgenes diferenciales, no se espera correlacin de esos coefi-
cientes y esta tcnica no es apropiada.

Primer

En el caso de un error de bit en el stream elemental, ya sea la deserializa-
cin de los smbolos de longitud variable se romper o los subsecuentes
coeficientes diferencialmente codificados estarn incorrectos. La estructura
del slice permite la recuperacin proporcionando un punto de resincroni-
zacin en el stream de bits.
Un nmero de slices son combinados para formar una imagen que esta
en la parte activa de un campo o cuadro. El encabezador de la imagen
define si la imagen fue codificada como I-, P- o B- e incluye una referencia
temporal de tal forma que la imagen pueda ser presentada en el momento
adecuado. En el caso de los paneos y tilts, los vectores en cada macro-
bloque sern los mismos. Un vector global puede ser enviado para toda la
imagen y los vectores individuales entonces se convertirn en diferencias
de este valor global.
Las imgenes se pueden combinar para producir un GOP que debe co-
menzar (en orden de transmisin) con una imagen I-. El GOP es la unidad
fundamental de codificacin temporal. En la norma MPEG, el uso de un
GOP es opcional pero es una necesidad prctica. Entre las imgenes I-, un
nmero variable de imgenes P- y/o B- pueden ser colocadas como se
describi en la seccin 2. Un GOP puede ser abierto o cerrado. En un GOP
cerrado, las ltimas imgenes B- no requieren la imagen I- del siguiente
GOP para decodificar y el stream de bits puede ser cortado al final del
GOP.
Si se usan los GOPs, muchos de ellos pueden ser combinados para produ-
cir una secuencia de video. La secuencia comienza con un cdigo de inicio
de secuencia seguido por un encabezador de secuencia y termina con un
cdigo de fin de secuencia. Se pueden colocar encabezadores de secuen-
cia adicionales en la secuencia. Esta aproximacin permite que la decodifi-
cacin comience en cualquier parte de la secuencia como debe ocurrir con
la reproduccin de los discos de video digital y cassettes de cinta. El enca-
bezador de secuencia especifica el tamao vertical y horizontal de la ima-
gen, la relacin de aspecto, el formato de submuestreo de Croma, la rela-
cin de imagen, el uso de exploracin progresiva o entrelazada, el perfil,
nivel y relacin de bits y las matrices de cuantizacin utilizadas en las
imgenes intra e intercodificadas.
Sin los datos del encabezador de secuencia, un Decoder no puede enten-
der el streams de bits y por tanto los encabezadores de secuencia se
convierten en puntos de acceso en los que los Decoders pueden empezar
la operacin correcta. El espaciado de los puntos de entrada influye sobre
el retraso para la decodificacin correcta que pueda ocurrir cuando el
espectador cambia de un canal de televisin al otro.

5.2 Streams elementales de audio
Se pueden encajar varios tipos de audio en un mltiplex MPEG-2. Estos
tipos incluyen el audio codificado de acuerdo con las capas de MPEG 1, 2,
3, o AC-3. El tipo de codificacin de audio usado debe incluirse en un
descriptor que un Decoder leer con el fin de invocar el tipo apropiado de
decodificacin.
El proceso de compresin de audio es muy diferente del proceso de video.
No hay equivalente para los diferentes tipos de cuadro I-, P- y B- y los
cuadros de audio contienen la misma cantidad de datos de audio. No hay
equivalente de la codificacin bidireccional y los cuadros de audio no son
transmitidos de la secuencia.
En el audio MPEG-2, el descriptor en el encabezador de la secuencia
contiene la capa que se ha usado para comprimir el audio y el tipo de
compresin usado (por ejemplo joint stereo), junto con la relacin de
muestreo original. La secuencia de audio es ensamblada a partir de un
nmero de unidades de acceso o AU (Access Unit) que sern cuadros de
audio codificados,
Si se usa la codificacin AC-3, como en ATSC, este uso ser reflejado en el
encabezador de secuencia. La unidad de acceso de audio (AU) es un
cuadro de sincrona AC-3 como se describi en la Seccin 3.7. El cuadro
de sincrona AC-3 representa una extensin de tiempo equivalente a 1536
muestras de audio y ser de 32 ms para el muestreo a 48-kHz
y 48 ms para 32 kHz.

Primer

Seccin 6 Streams elementales paquetizados o PES
(Packetized Elementary Streams)
Para propsitos prcticos, los streams elementales continuos que transpor-
tan audio o video de los compresores necesitan ser divididos en paquetes.
Esos paquetes son identificados por encabezadores (headers) que contie-
nen el estampado de tiempo para sincronizacin. Los paquetes PES se
pueden usar para crear Streams de programa o Streams de transporte.
6.1 Paquetes PES
En el PES, un stream elemental interminable es dividido en paquetes de un
tamao conveniente para la aplicacin. Este tamao debe ser de unos
pocos cientos de kilobytes, aunque esto variar de acuerdo con la aplica-
cin.
Cada paquete es precedido por un encabezador de paquete de PES. La
Figura 6-1 muestra el contenido de un encabezador. El paquete comienza
con un prefijo de inicio de cdigo de 24 bits y una ID de stream que identifi-
ca el contenido del paquete como audio o video y otros ms identifican el
tipo de codificacin de audio. Esos dos parmetros (prefijo de cdigo de
inicio e ID de stream) componen el cdigo de inicio de paquete que identifi-
ca el inicio de un paquete. Es importante no confundir el paquete en un
PES con el paquete mucho menor usado en los streams de transporte que,
desafortunadamente, comparten el mismo nombre.
Debido a que MPEG solo define el stream de transporte, no el Encoder, un
diseador puede elegir construir un Multiplexor que convierta de streams
elementales a streams de transporte en un solo paso. En este caso los
paquetes PES podran no existir nunca en una forma identificable sino que,
en lugar de eso sean presentados lgicamente en el payload (carga til)
del stream de transporte.
6.2 Estampado de tiempo
Despus de la compresin, las imgenes se sacan de la secuencia debido
a la codificacin bidireccional. Estas requieren una cantidad variable de
datos y estn sujetas a retrasos variables debido a la multiplexin y trans-
misin. Con el fin de mantener el audio y el video juntos, el estampado en
tiempo se incorpora peridicamente en cada imagen,
Un estampado de tiempo es un nmero de 33 bits que es una muestra de
un contador controlado por un reloj de 90-kHz. Este reloj es obtenido divi-
diendo el reloj del programa de 27-MHz entre 300. Ya que los tiempos de
presentacin estn espaciados equitativamente, no es esencial incluir un
estampado de tiempo por cada unidad de presentacin, en lugar de eso, los
estampados de tiempo pueden ser interpolados por el Decoder pero no
pueden estar ms separados que a 700 ms en los streams de programa o
de transporte.
El estampado de tiempo indica a que punto particular en el tiempo pertene-
ce un acceso particular. El Lip sync se obtiene incorporando estampados
de tiempo en los encabezadores de los paquetes PES tanto de audio como
de video. Cuando un Decoder recibe un paquete PES seleccionado, deco-
difica cada unidad de acceso y lo enva a la RAM. Cuando el contador de
tiempo-lnea alcanza el valor del estampado de tiempo, la RAM es leda.
Esta operacin tiene dos resultados deseables. El primero es que se obtie-
ne una correccin de base de tiempo efectiva en cada stream elemental.
Segundo, los streams elementales de audio y video se pueden sincronizar
juntos para hacer un programa.
6.3 PTS/DTS
Cuando se usa la codificacin bidireccional, se podra tener que decodificar
una imagen en algn momento antes de que se presente para que pueda
actuar como fuente de datos para una imagen B-, A pesar de eso, por
ejemplo, las imgenes pueden ser presentadas en el orden IBBP, aunque
se transmitirn en el orden IPBB. Consecuentemente existen dos tipos de
estampado de tiempo. El estampado de tiempo de decodificacin o DTS
(Decode Time Stamp) indica el tiempo en el que una imagen se debe
decodificar mientras que un estampado de tiempo de presentacin o PTS
(Presentation Time Stamp) indica cuando se debe presentar a la salida del
Decoder.
Las imgenes B- se decodifican y presentan simultneamente de tal forma
que solo contengan PTS. Cuando se recibe una secuencia IPBB las imge-
nes I- y P- deben ser decodificadas antes de la primera imagen B-. Un
Decoder solo puede decodificar una imagen a la vez, por tanto, la imagen I-
se decodifica y almacena primero. Mientras que se decodifica la imagen P-,
la imagen I- decodificada es enviada a la salida para que pueda ser seguida
por las imgenes B-.

Figura 6-1

Primer


Figura 6-2

La Figura 6-2 muestra que cuando una unidad de acceso que contiene una
imagen I- es recibida tendr tanto DTS como PTS en el encabezador y
esos estampados de tiempo estarn separados por un periodo de imagen.
Si se est usando la codificacin bidireccional una imagen P- debe seguir y
esta imagen tambin tiene estampados de tiempo DTS y PTS pero la
separacin entre los dos estampados de tiempo es de tres periodos de
imagen para permitir la intermediacin de las imgenes B-. As, si se recibe
una secuencia IPBB, la imagen I- estar retrasada por un periodo de ima-
gen, P- tres periodos de imagen y B- dos que no estarn retrasadas en lo
ms mnimo y la secuencia de presentacin se convertir en IBBP.
Claramente, si la estructura del GOP es cambiada de tal forma que haya
ms imgenes B- entre I- y P-, la diferencia entre DTS y PTS en las imge-
nes P- ser mayor.
Las banderas de PTS/DTS en el encabezador de paquete se establece de
tal forma que indiquen la presencia de solo el PTS o de ambos estampados
de tiempo: PTS y DTS. Los paquetes de Audio pueden contener muchas
unidades de acceso y el encabezador del paquete puede contener un PTS.
Debido a que los paquetes de audio nunca se transmiten de la secuencia
no hay DTS en un paquete de audio.

Primer

Seccin 7 Streams de Programa
Los streams de programa son una forma de combinar varios streams de
paquete PES y son muy ventajosos para aplicaciones de grabacin como el
DVD.
7.1 Grabacin vs. Transmisin
Para una calidad de imagen dada, la relacin de datos del video comprimi-
do variar con el contenido de la imagen. Un canal de relacin de bits
variable dar los mejores resultados. En la transmisin, la mayora de
canales prcticos son fijos y la relacin de bits total se mantiene constante
por medio del uso del stuffing (datos de relleno).
En un DVD, el uso del stuffing es un desperdicio de la capacidad de alma-
cenamiento; sin embargo, un medio de almacenamiento puede ser alentado
o acelerado, ya sea fsicamente o, en el caso de un controlador de disco,
cambiando la relacin de las requisiciones de transferencia de datos.
Esta aproximacin permite obtener un canal de relacin variable sin penali-
zacin en la capacidad. Cando se reproduce un medio, la velocidad puede
ser ajustada para mantener el Buffer de datos lleno a aproximadamente la
mitad sin importar la relacin de bits que puede cambiar dinmicamente. Si
el Decoder lee el Buffer a una relacin creciente tender a vaciarlo y el
sistema de control simplemente incrementar la relacin de acceso para
restablecer el balance. Esta tcnica solo funciona si el audio y el video
fueron codificados con el mismo reloj; de otra forma, se esparcirn por toda
la longitud de la grabacin.
Para satisfacer esos requerimientos conflictivos los streams de programa y
transporte tienen que ser proyectados como alternativas. Un stream de
programa funciona bien en un programa simple con relacin de bits variable
en un ambiente de grabacin; un stream de transporte funcionar bien en
programas mltiples en un ambiente de transmisin de relacin de bits fija.
El problema del genlocking a la fuente no ocurre en un reproductor de
DVD. El reproductor determina la base de tiempo del video con un genera-
dor de pulsos de sincrona local (interno o externo) y obtiene simplemente
los datos del disco con el fin de proporcionar imgenes con esa base de
tiempo. En transmisin, el Decoder tiene que recrear la base de tiempo en
el Encoder o se sufrir de overflow o underflow. As, un stream de transpor-
te usar una referencia de reloj de programa o PCR (Program Clock
Reference), mientras que un stream de programa no necesitar el reloj de
programa.
7.2 Introduccin a los streams de programa
Un stream de programa es un mltiplex de paquete PES que transporta
muchos streams elementales que fueron codificados usando el mismo reloj
maestro o reloj de tiempo de sistema o STC (System Time Clock).
Ese stream puede ser de video y sus streams de audio asociados o un
programa multicanal de solo audio. El stream de video elemental es dividido
en unidades de acceso o AUs, cada uno de los cuales contiene datos
comprimidos que describen una imagen. Esas imgenes son identificadas
como I-, P-, o B- y cada una lleva un nmero de AU que indica la secuencia
de despliegue correcta. Una AU de video se convierte en un paquete de
stream de programa. En video, esos paquetes varan en tamao. Por
ejemplo, un paquete de imagen I- ser mucho ms grande que un paquete
de imagen B-.
Las unidades de acceso de audio digital generalmente son del mismo
tamao y muchas de ellas son ensambladas en un paquete de stream de
transporte, Esos paquetes no deben confundirse con los paquetes de
stream de transporte que son ms pequeos y de tamao fijo. Las fronteras
de las AUs de audio y video coinciden con el eje del tiempo pero esta falta
de coincidencia no es un problema porque cada frontera tiene su propia
estructura de estampado de tiempo.

Primer

Seccin 8 Streams de transporte
Un stream de transporte es ms que solo un mltiplex de muchos paquetes
PES. En los streams de programa, los estampados de tiempo son suficien-
tes para recrear el eje del tiempo porque el audio y el video estn amarra-
dos a un reloj comn. Para transmisin, con una red de datos a distancia
hay un requerimiento adicional para recrear el reloj para cada programa en
el Decoder. Esto requiere una capa adicional de sintaxis para proporcionar
seales PCR.
8.1 La funcin del Stream de transporte
El stream de transporte transporta muchos programas diferentes y cada
uno puede usar un factor de compresin diferente y una relacin de bits
que puede cambiar dinmicamente an cuando la relacin de bits en gene-
ral permanezca constante. Este comportamiento es llamado multiplexin
estadstica y le permite a un programa que est manejando material difcil
robarse ancho de banda de un programa que este manejando material
sencillo. Cada PES de video puede tener asociado un nmero diferente de
PES de audio y datos. A pesar de esa flexibilidad un Decoder debe ser
capaz de cambiar de un programa al siguiente y seleccionar correctamente
los canales de audio y datos. Algunos de los programas pueden estar
protegidos por lo que solo podran ser vistos por aquellos que paguen una
suscripcin o cuota. El stream de transporte debe contener informacin de
CA para administrar esa proteccin. El stream de transporte contiene un
PSI para manejar esas tareas.
La capa de transporte convierte los datos del PES en pequeos paquetes
de tamao constante (adicionando bits de relleno si fuera necesario) que
estn auto contenidos. Cuando esos paquetes arriban al Decoder, puede
haber jitter en la temporalizacin. El uso de la multiplexin por divisin de
tiempo tambin causa retraso pero este factor no es fijo debido a que la
proporcin del stream de bits asignado a cada programa necesita que no
sea fijo. El estampado de tiempo es parte de la solucin pero solo funciona
si se dispone de un reloj estable. El stream de transporte debe contener
ms datos pertenecientes a la recreacin del reloj estable. La operacin del
equipo de produccin de video digital depende fuertemente de la distribu-
cin de un reloj de sistema estable para la sincronizacin.
Para la produccin de video se usa el genlockpero, a grandes distancias,
la distribucin de un reloj separado no es prctica. En un stream de trans-
porte, los diferentes programas se pueden haber originado en diferentes
lugares que no estn necesariamente sincronizados.
Como resultado, el stream de transporte tiene que proporcionar un medio
separado de sincronizacin para cada programa.
Este mtodo adicional de sincronizacin se llama PCR y recrea un reloj de
referencia estable que puede ser dividido para crear una lnea de tiempo en
el Decoder de tal forma que el estampado de tiempo para los streams
elementales en cada programa se vuelva til. Consecuentemente, una
definicin de un programa es un juego de streams elementales que com-
parten la misma referencia de tiempo.
En un stream de transporte de programa simple o SPTS (Single Program
Transport Stream), habr un canal de PCR que recree un reloj de programa
para audio y video. El SPTS frecuentemente es usado como comunicacin
entre un Coder de audio/video y un Multiplexor.

Primer


Figura 8-1

8.2 Paquetes
La Figura 8-1 muestra la estructura de un paquete de stream de transporte.
El tamao es constante, 188 bytes y siempre est dividido en un encabeza-
dor o header y una carga til o payload. La Figura 8-1 muestra el enca-
bezador mnimo de 4 bytes. En este encabezador, la informacin ms
importante es:

El sync byte. Este byte es reconocido por el Decoder para que el encabeza-
dor y el payload (carga til) puedan ser deserializados.
El indicador de error de transporte. Este indicador es establecido si la capa
de correccin de error que est por encima de la capa de transporte est ex-
perimentando una relacin de error de bit o BER bruta (Bit Error Rate) que
sea demasiado alta para ser corregible. Indica que el paquete puede conte-
ner errores, vea la Seccin 10 - Introduccin a DVB y ATSC para los detalles
acerca de la capa de correccin de errores.
La identificacin de paquetes o PID (Packet IDentification). Este cdigo de
13 bits se usa para distinguir entre los diferentes tipos de paquetes. Ms
adelante se dir ms acerca del PID.
El contador de continuidad. Este valor de cuatro bits se incrementado por el
Multiplexor a medida que cada nuevo paquete que tenga el mismo PID se
enve. Se usa para determinar si cualquiera de los paquetes se pierde, repite
o est fuera de la secuencia.
En algunos casos se necesita ms informacin de encabezador y si ese es
el caso, los bits de control del campo de adaptacin se ajustan para indicar
que el encabezador es ms grande que el normal. La Figura 8-1b muestra
que cuando esto sucede la longitud extra del encabezador se describe con
el cdigo de longitud de campo de adaptacin. Donde se extienda el enca-
bezador, la carga til se har ms pequea para mantener una longitud de
paquete constante.
8.3 Referencia del reloj de programa o PCR (Program Clock Reference)
El Encoder usado para un programa particular tendr un reloj de programa
de 27-MHz. En el caso de una entrada SDI (Serial Digital Interface) el reloj
de bits puede dividirse entre 10 para producir el reloj de programa de Enco-
der. Donde muchos programas se originen en la misma casa de produccin
es posible que todos ellos tengan el mismo reloj. En el caso de una entrada
de video analgico, el periodo de sincrona horizontal necesitar ser multi-
plicado por una constante en un PLL (Phase-Locked Loop o lazo de fase
amarrada) para producir 27 MHz.

Primer


Figura 8-2

El campo de adaptacin en el encabezador de paquete se usa peridica-
mente para incluir el cdigo PCR que permita la generacin de un reloj
amarrado al Decoder. Si el Encoder o un Remultiplexor tienen que conmu-
tar fuentes, el PCR puede tener una discontinuidad; el contador de conti-
nuidad tambin puede ser perturbado. Ese evento es manejado por el
indicador de discontinuidad que le dice al Decoder que debe esperar una
perturbacin, de otra forma una discontinuidad ser una condicin de error.
La Figura 8-2 muestra como el Decoder usa el PCR para recrear una
versin remota del reloj de 27-MHz para cada programa. El reloj del Enco-
der controla un contador binario que est corriendo constantemente y el
valor de esos contadores se muestrea peridicamente y se coloca en los
campos de adaptacin del encabezador como PCR. El PCR es un nmero
de 42 bits que es representado por una base PCR de 33 bits ms una
extensin PCR de 9 bits para proporcionar una resolucin ms alta (El PCR
base, como el PTS, es un nmero de 33 bits que es una muestra de un
contador controlado por un reloj de 90 kHz). A los paquetes generados por
cada encoder se les dan un PID diferente. El Decoder reconoce los paque-
tes con el PID correcto para el programa seleccionado e ignora los otros.
En el Decoder, un oscilador controlado por voltaje o VCO (Voltage Con-
trolled Oscillator) genera un reloj nominal de 27 MHz y esto controlar un
contador de PCR local. El PCR local se compara con el PCR del encabe-
zador del paquete y la diferencia es el error de fase de PCR. Este error es
filtrado para controlar el VCO que eventualmente igualar el conteo del
PCR local al del encabezador del PCR. Un filtraje pesado del VCO asegura
que el jitter de transmisin del PCR no modula el reloj. El indicador de
discontinuidad aplicar un reset al conteo del PCR local y, opcionalmente,
puede usarse para reducir el filtraje para ayudar al sistema a amarrarse
rpidamente a la nueva temporalizacin.
MPEG requiere que los PCR se enven a una relacin de cuando menos 10
PCRs por segundo, mientras que la DVB especifica un mnimo de 25 PCRs
por segundo.
8.4 Identificacin de paquete o PID (Packet IDentification)
Un campo de 13 bits en el encabezador del paquete de transporte contiene
el cdigo de identificacin de paquete o PID (Packet IDentification Code). El
PID es usado por el Demultiplexor para distinguir entre los paquetes que
contienen diferentes tipos de informacin. La relacin de bits del stream de
transporte debe ser constante an cuando la suma de las relaciones de
todos los diferentes Streams que contenga pueda variar. Este requerimien-
to es manejado por el uso de paquetes nulos. Si la relacin real del payload
cae se insertan ms paquetes nulos.
Los paquetes nulos siempre tienen la misma PID que es de 8191 (trece
unos en la representacin binaria).

Primer


Figura 8-3

En un stream de transporte dado, todos los paquetes que pertenecen a un
stream elemental dado tendrn el mismo PID. El demultiplexor puede
seleccionar fcilmente todos los datos para un stream elemental dado
simplemente aceptando solo los paquetes con el PID adecuado. Los datos
para un programa completo pueden ser seleccionados usando las PIDs
para streams de video, audio y datos como subttulos o teletexto. El Demul-
tiplexor puede seleccionar correctamente los paquetes si puede asociarlos
correctamente con el stream elemental al cual pertenece. El Demultiplexor
puede hacer esta tarea solo si conoce lo que son las PIDs adecuadas. Esta
es la funcin del PSI.
8.5 Informacin especfica del programa (Program Specific Informa-
tion)
El PSI es transportado por paquetes que tienen PIDs nicas, algunos de los
cuales estn normalizados y otros son especificados por la Tabla de aso-
ciacin de programa o PAT (Program Association Table), la Tabla de acce-
so condicional o CAT (Conditional Access Table) y la Tabla de descripcin
del stream de transporte o TSDT (Transport Stream Description Table).
Esos paquetes deben ser incluidos peridicamente en cada stream de
transporte. La PAT siempre tiene un PID de 0, el CAT siempre tiene un PID
de 1 y el TSDT siempre tiene un PID de 2. Esos valores y la PID de paque-
te nulo de 8191 son las nicas PIDs fijadas por la norma MPEG. El Demul-
tiplexor debe determinar todas las PIDs restantes accesando las tablas
apropiadas; sin embargo, hay algunas restricciones en el uso de las PIDs
en ATSC y DVB. En esto (y otras cosas), MPEG y DVB/ATSC no son
completamente intercambiables, Todos los streams de transporte de DVB
y ATSC deben cumplir con la norma MPEG-2 (ISO/IEC 13818-1), pero no
todos los streams de transporte MPEG-2 cumplirn con las normas de
ATSC (A/65A) o DVB (EN 300 468).
Los programas que existan en el stream de transporte estn enlistados en
los paquetes (PID =0) de la Tabla de asociacin de programa o PAT (Pro-
gram Association Table) que transporta el PID de cada paquete de PMT, La
primera entrada en la PAT, program 0, est reservado para datos de red y
contiene la PID de los paquetes de la Tabla de informacin de la red o NIT
(Network Information Table). El uso de la NIT es opcional en MPEG-2 pero
obligatoria en DVB.
Las PIDs para los Mensajes de control de derechos o ECM (Entitlement
Control Messages) y de los Mensajes de administracin de derechos o
EMM (Entitlement Management Messages) estn enlistadas en los paque-
tes de la Tabla de acceso condicional o CAT (Conditional Access Table)
(PID =1).
Como se muestra en la Figura 8-3, las PIDs de los streams elementales de
video, audio, y datos que pertenezcan al mismo programa se enlistan en los
paquetes de la Tabla de mapa de programa o PMT (Program Map Table).
Cada paquete de PMT normalmente tiene su propia PID, pero MPEG-2 no
hace que esto sea obligatorio. El nmero de programa dentro de cada PMT
nicamente definir cada PMT.

Primer

Una Tabla de informacin de red o NIT (Network Information Table) dada
contiene ms detalles que solo los del stream de transporte que lo lleva;
tambin se incluyen los detalles de otros streams de transporte que puedan
estar disponibles en el mismo Decoder, por ejemplo, sintonizando un dife-
rente canal de RF o apuntando el plato a un satlite diferente. La NIT puede
enlistar un nmero de otros streams de transporte y cada uno debe tener
un descriptor que especifique la frecuencia de radio, posicin orbital y as
sucesivamente. En DVB, la metadata adicional, conocida como DVB-SI, se
incluye y la NIT es considerada como parte de la DVB-SI. Esta operacin
es discutida en la Seccin 10 Introduccin a DVB y ATSC. Cuando se
discute la materia en general, se usa el trmino PSI/SI.
Hasta recibir el primer stream de transporte el demultiplexor debe buscar
las PIDs 0 y 1 en los encabezadores del paquete, Todos los paquetes con
PID 0 contienen la PAT. Todos los paquetes con PID 1 contienen datos de
CAT.
Leyendo la PAT, el Demultiplexor puede encontrar las PIDs de la NIT y de
cada Tabla de mapeo de programa o PMT (Program Map Table). Encon-
trando las PMTs, el Demultiplexor podr encontrar las PIDs de cada stream
elemental.
Consecuentemente, si la decodificacin de un programa particular se
requiere, las referencias a la PAT y luego a la PMT ser todo lo que se
necesita para encontrar las PIDs de todos los streams elementales en el
programa. Si el programa est encriptado, el acceso al CAT tambin ser
necesario. Ya que la demultiplexin es imposible sin el PAT, la velocidad de
cerrado es una funcin de que tan frecuentemente los paquetes de PAT
son enviados. MPEG especifica un intervalo mximo de 0.5 segundos para
los paquetes de PAT y los paquetes de PMT que estn referidos a ellos en
los paquetes de PAT. En DVB y ATSC, el NIT puede residir en paquetes
que tienen un PID especfico.

Primer

Seccin 9 Modulacin digital

Figura 9-1
Los sistemas MPEG codifican y empacan video, audio y otros datos. Para
el almacenamiento, el stream de datos resultante puede ser grabado en un
disco duro o quiz en DVD. Para otras aplicaciones, los datos MPEG,
usualmente en la forma de un stream de transporte, tienen que ser envia-
dos de un lugar a otro o a muchos lugares. Los sistemas de televisin usan
cable, satlite y transmisin terrestre en varias formas para la contribucin,
distribucin y broadcast. Todos esos mecanismos de transporte requieren
que los datos sean modulados en alguna portadora. Esta seccin propor-
ciona una breve introduccin a los esquemas de modulacin digital que se
usan para lograr esto.
Esta Seccin discute solo las tcnicas de modulacin, Otros procesos son
necesarios para hacer que el stream de datos sea adecuado para la trans-
misin y dependern tanto de la modulacin elegida como de las caracte-
rsticas del canal. Esas tcnicas se discutirn en la Seccin 10.
9.1 Principios de modulacin
Una portadora continua no transporta ninguna informacin a menos que
sea modificada en alguna forma por la informacin a transmitir. Una porta-
dora puede ser modificada en tres formas, cambiando su amplitud, frecuen-
cia o fase. La frecuencia y la fase, por supuesto, estn ntimamente relacio-
nadas. Aunque generalmente son tratadas como tipos de modulacin
separadas, la distincin se puede volver muy borrosa; algunos sistemas de
modulacin en frecuencia son implementados por moduladores de fase.

Figura 9-2
9.2 Modulacin Analgica
En el mundo analgico, la amplitud o la frecuencia de una portadora es
cambiada (modulada), de acuerdo a la amplitud de una seal de audio o
video, usualmente de acuerdo con una ley lineal. La modulacin de fase
tambin se usa en los sistemas analgicos, el ejemplo ms obvio es la
modulacin de las seales de diferencia de color en una subportadora de
color en los sistemas de televisin NTSC y PAL. Esta operacin familiar
proporciona un ejemplo til.
Podemos pensar en la informacin de color en dos formas. Puede ser
expresada como la fase de un ngulo (relacionado con el tinte o hue) ms
una amplitud (relacionada con la saturacin) o como los valores de dos
seales de diferencia de color, B-Y y R-Y.
Si las componentes de diferencia de color son tratadas como valores de x
y yen una grfica, las dos representaciones son vistas como ntimamente
relacionadas como se ilustra en la Figura 9.1. Esta figura es similar al bien
conocido despliegue de un vectorscopio.
9.3 Modulacin de cuadratura
La Figura 9.2 muestra como podemos modular una portadora con dos
seales diferentes usando la tcnica conocida como modulacin de cua-
dratura. Una portadora simple es dividida en dos partes y una de ellas es
retrasada por un tiempo equivalente a un cuarto del tiempo de ciclo de la
portadora. Esto genera una portadora de la misma frecuencia pero con la
fase corrida 90 de la original. Las dos portadoras son moduladas en ampli-
tud con una seal apropiada y las dos portadoras moduladas son adiciona-
das juntas. Esto genera una seal simple con una amplitud y fase determi-
nadas por las amplitudes de las dos seales moduladoras.

Primer


Figura 9-3
La demodulacin se logra con un proceso casi idntico; la seal recibida se
enva a los dos Demoduladores. En cada Demodulador la seal es multipli-
cada por una seal del oscilador local, sincronizada a la seal recibida. Las
seales de los dos osciladores locales estn a 90 y cada demodulador
recobra un eje de la modulacin de cuadratura.
9.4 Sistemas de Modulacin Digital Simple
La mayora de Sistemas de modulacin digital simple usan alguna forma de
modulacin de cuadratura; los dos ejes usualmente son designados I y Q.
Algunas veces solo un eje de modulacin se usa.
Todos los esquemas de modulacin digital representan un compromiso de
eficiencia del ancho de banda, robustez y complejidad. La relacin de
smbolos es el factor principal para determinar el ancho de banda de la
seal transmitida. La relacin de smbolos es la relacin a la cual la modu-
lacin se cambia por lo que es la misma que el ancho de banda de las
seales moduladoras
Algunos sistemas de modulacin digital simples solo llevan un bit de infor-
macin por smbolo. En otras palabras, cada smbolo puede representar
uno de dos posibles estados que representan un cero o uno binario. En ese
caso, la relacin de bits del sistema es el mismo que la relacin de smbolo;
sin embargo, otros sistemas tienen muchos estados posibles por cada
smbolo por lo que pueden transportar ms de 1 bit de informacin por
smbolo. Generalmente el nmero de estados est en potencias de dos por
lo que la relacin de bits del sistema es algn entero mltiplo de la relacin
de smbolo.
Los sistemas de modulacin digital frecuentemente son etiquetados de
acuerdo con el tipo de modulacin precedidos por un nmero que represen-
ta el nmero de estados por cada smbolo. Por ejemplo, 4QAM describe
modulacin de amplitud en cuadratura con cuatro estados posibles por
cada smbolo. Cuatro estados que pueden transportar dos bits de informa-
cin (00, 01, 10, 11), por lo que la relacin de bits de un sistema 4QAM es
del doble de la relacin de smbolo.

Figura 9-4
Los sistemas de modulacin digital ms simples transportan un bit de
informacin por smbolo. Cada smbolo tiene dos estados posibles que
representan el cero y el uno binarios, Los estados pueden ser creados por
modulacin de amplitud, frecuencia o fase, pero la modulacin de fase y
frecuencia son las ms comunes.
El llaveo (keying) de corrimiento de frecuencia binaria (BFSK o 2FSK) usa
una frecuencia de portadora para representar un cero binario y una frecuencia
diferente para representar un uno binario, Algunas veces la diferencia de
frecuencia es muy pequea y es lograda por un modulador de fase.
El llaveo (keying) de corrimiento de fase binaria (BPSK o 2PSK) usa una
fase de la portadora (amplitud constante) para representar el cero binario y
la fase inversa (180 de corrimiento de fase) para representar un 1 binario.
Los posibles estados diferentes de un smbolo usualmente son mostrados
en un diagrama de constelacin que muestra las varias combinaciones
resultantes de los valores permitidos de las seales moduladoras de I y Q.
El diagrama de constelacin para BPSK, mostrado en la Figura 9.3, es muy
simple; solo uno de los ejes se usa y solo hay dos valores permitidos.
Esos sistemas pueden ser muy robustos; el receptor necesita solo la sufi-
ciente seal (o relacin seal a ruido) para determinar cual de los dos
posibles estados ha sido transmitido para cada smbolo; sin embargo, no
usan el espectro eficientemente; el ancho de banda nominalmente es el
mismo que la relacin de bits. Esos sistemas se usan en trayectorias de
transmisin muy dificultosas como es la telemetra en el espacio profundo.
9.5 Llaveo (Keying) de corrimiento de fase
El BPSK o 2PSK se describi en la Seccin previa. Otras formas de modu-
lacin PSK usa ambos ejes, I y Q. El Llaveo de corrimiento de fase cua-
ternario (QPSK, tambin conocido como Llaveo de corrimiento de fase en
cuadratura) es la ms comn, y usa dos valores en cada eje. El diagrama
de constelacin es mostrado en la Figura 9.4. El QPSK tiene cuatro estados
posibles por smbolo, por lo que cada uno de ellos transporta dos bits de
informacin; un posible mapeo de estados a valores binarios se muestra en
la Figura. El QPSK se usa extensamente en comunicaciones por satlite.

Primer


Figura 9-5
El 8PSK es menos comn, pero tambin se usa en sistemas de satlite,
particularmente en J apn. El diagrama de constelacin se muestra en la
Figura 9-5. El 8PSK transporta tres bits de informacin en cada smbolo
por lo que la relacin de bits es de tres veces la relacin de smbolos
9.6 Modulacin de amplitud de cuadratura o QAM (Quadrature Ampli-
tude Modulation)
La modulacin de amplitud de cuadratura o QAM (Quadrature Amplitude
modulation) es la base de muchos sistemas de transmisin. Se usan los
dos ejes I y Q para la modulacin y dependiendo de la variante particular se
permiten dos o ms niveles de amplitud para cada eje.
La variante ms simple es 4QAM en la que solo se usan dos valores para
cada eje, proporcionando 4 estados posibles para cada smbolo. El diagra-
ma de constelacin se muestra en la Figura 9-6, en la que se ver que el
4QAM es idntico al QPSK y transporta dos bits por smbolo.

Figura 9-7

Figura 9-6
El 16QAM usa 4 valores en cada eje proporcionando 16 estados posibles.
El sistema 16QAM transporta 4 bits por smbolo. Si 6 valores se permiten
para cada eje de modulacin hay un total de 36 estados posibles. Cinco bits
pueden ser transportados usando solo 32 estados por lo que 4 de las
posibles combinaciones no se usan en 32QAM. El diagrama de constela-
cin para 16QAM es mostrado en la Figura 9-7 y para 32QAM se muestra
en la Figura 9-8. En 32QAM los cuatro estados de esquina no se usan;
esos son los estados que representaran la amplitud ms grande y por
tanto, la potencia ms alta del transmisor.
Las Figuras 9-7 y 9-8 tambin ayudan a mostrar el compromiso entre la
relacin de bits y la robustez. En la presencia de ruido o jitter, el espacia-
miento ms pequeo de los estados en el 32QAM (a la misma potencia
transmitida) har ms probables los errores de decodificacin. Puesto en
otra forma, entre ms estados posibles por smbolo haya, mejor ser la
relacin seal a ruido requerida para una relacin de error dada.

Figura 9-8

Primer


Figura 9-9
Cuando se puede garantizar una buena relacin seal a ruido, se pueden
usar an mayores densidades de constelacin. 64QAM usa 8 valores en
cada eje y transporta 6 bits por smbolo. 64 QAM es el esquema de modu-
lacin para cable que ms se usa a nivel mundial ya que proporciona un
buen compromiso entre robustez y compatibilidad con infraestructuras de
cable heredadas. 256QAM se usa en algunos de los sistemas de televisin
por cable ms actuales, tiene 16 valores permitidos por cada eje de modu-
lacin y transporta 8 bits por smbolo.
9.7 Modulacin de banda lateral vestigial o VSB (Vestigial Sideband
Modulation)
Cuando se modula una portadora se generan bandas laterales por arriba y
por abajo de la frecuencia de la portadora. Por ejemplo, un sistema QAM
con una relacin de smbolos de 3 mega smbolos por segundo tendr
bandas laterales inferior y superior de unos 3 MHz de ancho, requiriendo un
ancho de banda de canal nominal de 6 MHz.

Figura 9-11

Figura 9-10
Para recuperar la informacin tanto de amplitud como de fase (o ambos
ejes de la modulacin en cuadratura), ambas bandas laterales se deben
recuperar en el receptor. Los sistemas de banda lateral vestigial eliminan la
mayor parte de la banda lateral antes de la transmisin por lo que solo un
eje de modulacin podr recuperarse (una interpretacin alternativa es
decir que el otro eje de modulacin se usa para suprimir la banda lateral no
deseada); 2VSB tiene la misma constelacin que BPSK. La Figura 9-9
muestra los diagramas de constelacin para 4VSB y la Figura 9-10 muestra
8VSB, transportando respectivamente dos y tres bits por smbolo.
La modulacin 8VSB la usa en Estados Unidos la norma de televisin
digital ATSC. 4VSB fue propuesta originalmente, proporciona 2 bits por
smbolo; sin embargo, se encontr que 8VSB, junto con la codificacin
Trellis (vea la Seccin 10.6) y la correccin de errores interna convolucional
proporciona la misma relacin de datos con un desempeo mejorado de
relacin seal a ruido.
9.8 Divisin Multiplexada de frecuencias ortogonalmente codificadas
o COFDM (Coded Orthogonal Frequency Division Multiplex)
En los sistemas anteriores, una seal de banda base es proporcionada a
los moduladores que operan sobre una portadora simple para producir la
banda(s) transmitida(s). Una alternativa a un sistema de banda ancha es
una que produzca muchas portadoras de banda estrecha con un espaciado
cuidadosamente regulado. La Figura 9-11A muestra que una portadora
modulada digitalmente tiene un espectro nulo de cada lado. Otra portadora
idntica puede ser colocada aqu sin interferencias porque ambas son
mutuamente ortogonales como se muestra en la Figura 9-11b. Este es el
principio del OFDM (Orthogonal Frequency Division Multiplexing. Multi-
plexin de divisin de frecuencia ortogonal). En la prctica, una variante
conocida como Multiplexin de divisin de frecuencia ortogonal codificada o
COFDM mejora el desempeo dramticamente en condiciones de canal

Primer

que no son las ideales con el uso de la codificacin convolucional Viterbi
descrita en la siguiente seccin. La COFDM se usa en el sistema de trans-
misin digital de televisin terrestre DVB-T.
Cada portadora en un sistema OFDM puede ser modulado con cualquiera
de las tcnicas descritas en esta seccin. En la prctica la que generalmen-
te se usa es la QAM; 16QAM y 64QAM son las ms comunes. No es nece-
sario usar todas las portadoras. Por ejemplo, si se sabe que una parte del
canal est sujeto a un alto grado de interferencia, las portadoras afectadas
se pueden omitir.
El nmero de portadoras en un sistema OFDM puede ser muy grande.
DVB-T tiene opciones para 1705 o 6817 portadoras (conocidos como
sistemas 2k y 8k). Debido a que el ancho de banda asignado a cada porta-
dora es pequeo, la relacin de smbolos es por consiguiente pequea y la
longitud de tiempo para transmitir cada smbolo se incrementa. Esta es la
clave de la tolerancia del OFDM a la interferencia de trayectorias mltiples.
En un sistema de portadora simple, como 8VSB, una relacin de datos alta
implica que el tiempo del smbolo sea muy corto. En el caso del sistema de
televisin digital ATSC, algunos de los 11 millones de smbolos se transmi-
ten cada segundo dndonos una duracin de smbolo de menos de 100 ns.
Esto implica que an un retraso muy corto de trayectorias mltiples crear
una interferencia intersmbolo ya que la seal retrasada que representa un
smbolo llegar durante la recepcin del smbolo subsiguiente.
En contraste, un sistema OFDM con cientos de portadoras tendr un tiem-
po de smbolo en el orden de cientos de micro segundos (dependiendo de
la relacin de datos y la modulacin utilizada). La interferencia Intersmbolo
puede ser virtualmente eliminada adicionando deliberadamente una banda
de guardaa cada smbolo haciendo que este sea ms largo que lo necesa-
rio. Esto reduce la relacin de smbolos pero solo a un grado relativamente
pequeo. Por ejemplo, si la duracin nominal del smbolo es de 200 s, una
banda de guarda de 50 s reducir la relacin del smbolo en solo 20% y la
eliminacin de la interferencia intersmbolo puede permitir que se use una
constelacin de orden ms alto, quiz ms que para compensar esa prdi-
da. Esta tcnica no es prctica para un sistema de portadora simple de
banda ancha. Como ejemplo, la misma banda de guarda de 50 s con un
tiempo de smbolo de 100 ns Reducir la relacin de datos a una fraccin
de 1%!
Esta tolerancia a la interferencia de trayectoria mltiple tambin hace que
los sistemas COFDM sean adecuados para redes de frecuencia nica en la
que dos o ms transmisores sincronizados emiten la misma seal. Un
receptor puede, dependiendo de su localizacin y sistema de antena, recibir
seales de ms de un transmisor en diferentes momentos. Si las longitudes
de las trayectorias son radicalmente diferentes, la seal principal probable-
mente ser mucho mas intensa que la seal secundaria y la interferencia
ser mnima. Si las longitudes de las trayectorias y la intensidad de la seal
son similares, la banda de guarda evitar la interferencia intersmbolo.
Los sistemas COFDM son muy flexibles y pueden ser entonados para
llenar una amplia variedad de requerimientos de transmisin pero, como
siempre, la incrementada robustez es a costo de la relacin de datos. Hay
muchos argumentos acerca de los mritos relativos de los sistemas de
portadora simple y de portadoras mltiples pero generalmente se cree que
bajo condiciones de canal simple, el COFDM requiere de alguna forma ms
potencia que VSB para la misma cobertura a la misma relacin de datos. El
COFDM tambin tiene una mayor relacin pico a promedio en el transmisor
que puede provocar ms interferencias a otros servicios; sin embargo,
muchos creen que en situaciones complejas de trayectorias mltiples como
los caones urbanos de la ciudad, el COFDM puede proporcionar una
recepcin ms confiable.

Primer

9.9 Servicios integrados de transmisin de datos o ISDB (Integrated
Services Data Broadcasting)
Los Servicios integrados de transmisin de datos o ISDB (Integrated ser-
vices data broadcasting) son un desarrollo que usa muchos esquemas de
modulacin y han sido desarrollados para los servicios de televisin digital
en J apn. Est diseado para respaldar sistemas jerrquicos de muchos
niveles. Se puede usar, por ejemplo, para proporcionar simultneamente
una recepcin de relacin de datos a mviles bajo condiciones excepcio-
nalmente dificultosas, relaciones de datos intermedias (definicin estndar)
para la recepcin esttica en la periferia y altas relaciones de datos (quiz
para HDTV) para buenas condiciones de recepcin. Hay tres sistemas de
modulacin ISDB actualmente en uso en J apn:
9.9.1 Sistema de satlite ISDB-S
Lanzado en Diciembre de 2000, ISDB-S le permiti a los broadcasters
compartir un transponder de satlite, Tambin es referido como BS-digital
o CS-digital cuando el segmento de espacio es un satlite de transmisin o
uno de comunicaciones respectivamente.
Se pueden usar hasta 8 streams de transporte en una forma que deben
acordar quienes comparten el transponder. La relacin de bits agregada
depender del ancho de banda del transponder y el modo de modulacin
utilizada. Por ejemplo, para un transponder de 34.5 MHz, la relacin mxi-
ma incluyendo la correccin de errores adelantada es de 56.610 Mbits/s.
La modulacin jerrquica permite variar el modo de modulacin en base a
paquete a paquete dentro de un marco de 48 paquetes. Cada paquete es
asignado a un spot de modulacin. Se soportan 4 modos de modulacin
BSPK (1/2), QPSK (a 7/8) y TC8PSK. El nmero de slotsvara de acuerdo
al modo utilizado.
9.9.2 Sistema de cable ISDB-C
La caracterstica principal del sistema es que transmite streams de trans-
porte mltiples en una portadora 64 QAM simple. El sistema fue desarrolla-
do para ser capaz de retransmitir eficientemente la informacin transporta-
da en seales ISDB-S. Tpicamente se transmite un mximo de 52.17
Mbits/s de informacin en una portadora BS-digital. La relacin de informa-
cin de una seal 64 QAM/6 MHz es de 29.162 Mbits/s. De aqu que cuan-
do menos se deben usar dos canales de televisin por cable para retrans-
mitir la informacin de una portadora BS simple. El servicio digital BS
completo consiste de 4 empresas de broadcast y ocupa aproximadamente
174 MHz incluyendo las bandas de guarda. Usando canales de cable ISDB-C
se necesitaran 8 canales de cable para transportar esta informacin mientras que
se requeriran 29 canales usando la transmisin convencional por cable de un
stream de transporte por portadora.
Hay 52 slots de modulacin ms 1 slot ms para el encabezador de
sincronizacin TSMF (Transport Stream Multiplexing Frame. Marco de
multiplexin del stream de transporte).

9.9.3 Modulacin terrestre ISDB-T
El canal ISDB-T est dividido en 13 segmentos (tpicamente 400-500 kHz
de ancho), y se usa una transmisin COFDM separada para cada segmen-
to. Todos los parmetros que afectan la robustez (nmero de portadoras,
longitud de la banda de guarda, tipo de modulacin, codificacin de convo-
lucin) pueden elegirse por separado para cada capa de la jerarqua. Por
ejemplo, el segmento ms robusto puede usar una banda de guarda ancha,
modulacin QPSK y 1/2 codificacin de convolucin. El nivel ms alto
podra usar una banda de guarda ms corta, 64QAM y 7/8 de codificacin
de convolucin proporcionando muchas veces la relacin de datos del
segmento robusto.
El segmento central puede ser usado para la recepcin parcial diseada
para permitir que un receptor de banda estrecha reciba solo ese segmento.
En OFDM normal, el ancho de banda del canal completo representa una
capa simple. Las portadoras usadas se espacian por todo el ancho de
banda como juegos mltiples de cierta frecuencia. En ISDB-T el ancho de
banda del canal de 5.6 MHz se divide en 13 segmentos y cada uno de ellos
tiene un ancho de banda de 429 kHz. La transmisin jerrquica de ISDB-T
se logra transmitiendo grupos de segmentos OFDM que tienen diferentes
parmetros de transmisin. Esos grupos de capas constituyen las capas.
En la modulacin no jerrquica se usa el mismo esquema de modulacin
para todos los 13 segmentos.
9.9.4 El ISDB en resumen
ISDB-S proporciona un medio de aplicar diferentes modos de modulacin a
mltiples streams de transporte y transmitirlos en un canal de 34.5 MHz en
una sola portadora.
ISDB-C proporciona un medio de transmitir mltiples streams de transporte
en un canal simple de 6 MHz con una portadora simple pero con un modo
de modulacin comn.
ISDB-T tiene que ver con hasta las tres tipos de transmisiones del mismo
stream de transporte en un simple canal de 6 MHz.

Primer

Seccin 10 Introduccin a DVB y ATSC

Figura 10-1

Ya se est usando la compresin MPEG para broadcast y se har ms
importante a futuro. Esta seccin discute los requerimientos adicionales
para la transmisin digital de televisin de acuerdo a como es implementa-
da por las dos normas principales de DTV.
10.1 Una vista general
ATSC (Advanced Television Systems Committee. Comit de sistemas de
Televisin avanzada) es una organizacin Norteamericana que define las
normas para la transmisin digital terrestre. DVB se refiere al Proyecto de
Broadcast de video digital y a las normas y prcticas establecidas para el
proyecto DVB. Este proyecto originalmente fue Europeo pero produce
normas y guas aceptadas en muchas reas del mundo. Esas normas y
guas comprenden todos los medios de transmisin incluyendo satlite,
cable y terrestre.
El broadcast digital tiene diferentes requerimientos de distribucin y trans-
misin como se muestra en la Figura 10.1. Las compaas de broadcast
producirn streams de transporte que contengan muchos programas de
televisin. Los streams de transporte no tienen ninguna proteccin contra
errores y para datos comprimidos, el efecto de los errores es muy serio. Los
streams de transporte necesitan ser entregados libres de errores a los
transmisores, subidas de satlite y cabeceras de cable. En ese contexto,
libre de errores implica una relacin de errores de bit o BER (Bit Error
Rate) de 1 en 10
-11
o mejor. Esta tarea normalmente es confiada a los
operadores de redes de telecomunicaciones quienes usan una capa adicio-
nal de correccin de errores como sea necesario (las estrategias de correc-
cin de errores se seleccionan en el canal de transmisin). Esta capa debe
ser transparente para el lugar de destino.
Una compaa de broadcast particular u operador de cable podra no
querer todos los programas de un stream de transporte. Muchos stream de
transporte pueden ser recibidos y se puede hacer una seleccin de canales
para luego codificarlos en un stream de transporte de salida simple usando
un remultiplexor. La configuracin puede cambiar dinmicamente.
El broadcast en el dominio digital consiste en llevar todo el stream de
transporte al espectador. Sin importar si el canal es cable, satlite o terres-
tre, el problema es ms o menos el mismo. La metadata que describe la
transmisin debe ser codificada en el stream de transporte en una forma
normalizada. En DVB, esta metadata es llamada servicio de informacin
(DVB-SI) e incluye servicios como teletexto as como los detalles acerca de
los programas transmitidos tanto dentro de s mismo como de otras mlti-
plex.
En broadcast hay mucho menos control sobre la calidad de la seal y el ruido o
interferencia es una posibilidad. Esto requiere alguna forma de capa de correccin de
errores por adelantado o FEC (Forward Error Correction).

Primer

A diferencia de la FEC usada por los operadores de redes de telecomunicaciones
que puede ser de propietario (o normalizado por el Instituto de normas de telecomuni-
caciones europeo o ETSI (European Telecommunications Standard Institute), que
define la transmisin DVB sobre redes SDH y PDH), la correccin de errores por
adelantado o FEC usada en broadcast debe ser normalizada de tal forma que los
receptores sean capaces de manejarla. La adicin de la correccin de errores obvia-
mente incrementa la relacin de bits en lo que se refiere al transmisor o cable. Des-
afortunadamente, una transmisin de datos confiable y econmica por radio y cable
requiere ms que la serializacin de los datos. Los sistemas prcticos requieren la
codificacin de canal.
10.2 Remultiplexin
Es una tarea compleja debido a que un Remultiplexor tiene que dar como salida un
streamde bits que fue ensamblado con partes de otros. Los datos requeridos de una
entrada dada de streamde transporte pueden ser seleccionados con referencia a la
Tabla de asociacin de programa y a las Tablas de mapa de programa que revelarn las
PIDs de los programas requeridos. Es posible que la misma PID se haya usado en dos
streams de transportes de entrada, las PIDs de uno o ms streams elementales pueden
haber cambiado. Los encabezadores de paquete deben transferir la referencia del reloj
de programa o PCR (ProgramClock Reference) que permitir que el Decoder final
recre un reloj de 27 MHz. Ya que la posicin de los paquetes que contengan la PCR
puede ser diferente en la nueva multiplexin, el Remultiplexor podra necesitar editar los
valores de PCR para reflejar su nueva posicin en el eje del tiempo.
La Tablas de mapa de programa y las Tablas de asociacin de programa necesitarn
editarse para reflejar la nueva estructura del streamde transporte como lo harn las
Tablas de acceso condicional o CAT (Conditional Access Tables). Si la suma de las
relaciones de bit del streamdel programa seleccionado es menor que la relacin de
bits de la salida, el Remultiplexor creara paquetes de relleno con PIDs adecuadas; sin
embargo, si los streams de transporte vienen de Multiplexores estadsticos, es posible
que la relacin de bits instantnea del nuevo streamde transporte exceda la capaci-
dad del canal. Esta condicin puede ocurrir si muchos programas seleccionados en
diferentes streams de transporte simultneamente contienen una entropa alta. En
ese caso la nica solucin es recomprimir y crear coeficientes nuevos ms cortos en
uno o ms Streams de bits para reducir la relacin de bits.
10.3 Servicio de Informacin o SI (Information Service)
A futuro, la distribucin digital implicar que habr un gran nmero de programas,
teletexto y otros servicios disponibles para los espectadores y estos podrn extender-
se a un buen nmero de diferentes streams de transporte. Tanto el espectador como
el Decoder integrado al receptor o IRD (Integrated Receiver Decoder) necesitarn
ayuda para desplegar lo que est disponible y entregar el servicio seleccionado. Esta
capacidad requiere de metadata ms all de las capacidades del MPEG-PSI (Pro-
gramSpecific Information. Informacin especfica del programa) y es referida como
DVB-SI (Service Information. Servicio de Informacin). El DVB-SI es considerado
para que incluya al NIT, que es opcional para los streams de transporte MPEG. El
DVB-SI est encajado en el stream de transporte como paquetes de transporte
adicionales con PIDs nicas y transporta informacin tcnica para IRDs. El DVB-SI
tambin contiene informacin de la Gua electrnica de programas o EPG (Electronic
ProgramGuide) como la naturaleza de un programa, duracin y el canal en el que
puede ser localizado y los pases en los cuales est disponible. Tambin se pueden
calificar los programas de tal forma que se pueda ejercer un control paterno. El DVB-
SI debe incluir las siguientes tablas adems de la MPEG-PSI:
Tabla de informacin de red o NIT (Network Information Table). Informacin en
un streamde transporte que describe muchos streams de transporte. La NIT con-
tiene informacin relacionada con la organizacin fsica del mltiplex, streams de
transporte transmitidos a travs de una red dada y las caractersticas de la misma
red. Los streams de transporte son identificados por la combinacin de una ID
original de red y una ID de streamde transporte en la NIT.
Tabla de descripcin de servicio o SDT (Service Description Table). Cada servicio
en un streamde transporte de DVB puede tener un descriptor de servicio y esos
descriptores estn ensamblados en la tabla de descripcin de servicio. Un servi-
cio puede ser televisin, radio o teletexto. El descriptor de servicio incluye el nom-
bre del proveedor del servicio
Tabla de informacin de evento o EIT (Event Information Table). La EIT es
una tabla para DVB que contiene los nombres de programa, tiempos de ini-
cio, duracin, etc.
Tabla de hora u fecha o TDT (Time and Date Table). La TDT es una tabla que
encaja una hora de UTC y el estampado del tiempo en el streamde transporte.
La DVB-SI tambin define otras tablas opcionales incluyendo: Tabla de asociacin
de bouquet o BAT (Bouquet Association Table), Tabla de status actual o RST
(Running Status Table), Tabla de corrimiento de tiempo o TOT (Time Offset Table)
y la Tabla de relleno o ST (Stuffing Table). Tanto ATSC como DVB, usan la Tabla
de seccin privada de MPEG-2 para definir tablas nuevas. Este juego de nuevas
tablas obligatorias definidas por ATSC en la A/65A es parte del protocolo de
programa e informacin del sistema o PSIO (Program and system information
protocol).
El PSIP de ATSC debe incluir las siguientes tablas adems de la MPEG-PSI:
Tabla de canal virtual terrestre o TVCT (Terrestrial Virtual Channel Table) define el
mnimo de programas MPEG-2 encajados en el streamde transporte en el cual
es transportado el TVCT.
Tabla de gua maestra o MGT (Master Guide Table) define el tipo, identificadores
de paquete y versiones de todas las tablas PSIP en el streamde transporte, ex-
cepto el de la Tabla de hora de sistema o STT (SystemTime Table).
Tabla de regin de clasificacin o RRT (Rating Region Table) define el sistema de
gua paterna para TV referenciado por cualquier descriptor de asesor de conteni-
do transportado dentro del streamde transporte.
Tabla de hora del sistema o STT (SystemTime Table) define la fecha y hora
actuales.
Tabla de informacin de eventos o EIT-n (Event Information Table) define las
primeras cuatro tablas e informacin de eventos (EIT-0, EIT-1, EIT-2 y EIT-3) que
describen 12 horas de eventos (programas de TV), cada uno con una cobertura
de 3 horas e incluyen todos los canales virtuales enlistados en la TVCT.
Primer

10.4 Correccin de errores
La correccin de errores es necesaria porque las condiciones en trayecto-
rias de transmisin grandes no pueden ser controladas. En algunos siste-
mas, la deteccin de errores es suficiente porque puede ser usada para
pedir una retransmisin. Claro que esta aproximacin no funcionar con
seales en tiempo real como la televisin. En lugar de lo anterior se usa la
FEC en la que se adicionan suficientes bits extra, llamados redundancia, a
los datos para permitirle al Decoder ejecutar correcciones en tiempo real.
La FEC usada en sistemas modernos usualmente est basada en los
cdigos de Reed-Solomon o (R-S). Una discusin completa de esto est
fuera del alcance de este libro. Brevemente, los cdigos R-S adicionan
redundancia a los datos para hacer una palabra de cdigo tal que cuando
cada smbolo se use como trmino en un mnimo de dos ecuaciones simul-
tneas, la suma (o sndrome) siempre sea cero si no hay errores. Esta
condicin de cero se obtiene sin importar los datos y facilita el chequeo de
errores. En streams de transporte, los paquetes siempre son de 188 bytes
de largo antes de adicionar los datos de correccin de error. La adicin de
los 16 bytes de redundancia R-S, producir una longitud de paquete de 204
bytes (en la prctica, los streams de transporte pueden usar paquetes de
204 bytes an cuando no est presente la FEC. El uso de 16 bytes de
relleno evita el reclocking del stream cuando se adicione o borre la FEC)
En el caso de que el sndrome no sea cero, la resolucin de las ecuaciones
simultneas dar como resultado dos valores necesarios para la correccin
de errores; la localizacin del error y su naturaleza; sin embargo, si el
tamao del error excede la mitad de la cantidad de la redundancia adicio-
nada, el error no podr ser corregido. Desafortunadamente en canales de
transmisin tpicos, la calidad de la seal es estadstica. Esto significa que
mientras que bits simples pueden estar en error debido al ruido, en caso de
un gran nmero de bits, conocido como burst, se pueden corromper
todos. Esta corrupcin puede deberse a un rayo o a interferencia por equi-
po elctrico.
No resulta econmico proteger cada palabra de cdigo contra estos bursts
porque no ocurren lo suficientemente seguido. La solucin es usar una
tcnica conocida como interpolacin. La Figura 10.2 muestra que, cuando
se usa la interpolacin, los datos de fuente son codificados con FEC pero
antes de la transmisin son enviados a un Buffer en RAM. En la Figura 10-3
se muestra una tcnica posible en la que los datos entran a la RAM en filas
y luego se leen en columnas. Despus de esto los datos reordenados son
transmitidos. Al momento de la recepcin los datos son regresados a su
orden original o se desinterpolan usando una segunda RAM. El resultado
del proceso de interpolado es que un burstde errores en el canal despus
de la desinterpolacin se convertir en un gran nmero de errores de
smbolo simples que son corregibles ms fcilmente.
Cuando un error de burst alcanza el tamao mximo corregible, el sistema
es vulnerable a errores de bits aleatorios que hacen que las palabras de

cdigo sean incorregibles. El uso de un cdigo interno aplicado despus de
la interpolacin y corregido antes de la desinterpolacin puede evitar que
entren errores aleatorios a la memoria de desinterpolacin.
Como muestra la Figura 10-3, cuando se usa esa aproximacin con una
estructura interpolada de bloque, el resultado es un cdigo producto, La
Figura 10-4 muestra que la interpolacin tambin puede ser convolucional
en la que el arreglo de los datos sea compartida aplicando un retraso
diferente a cada fila. La interpolacin cruzado o convolucional tiene la
ventaja de que se necesita menos memoria para interpolar o desinterpolar.

Figura 10-2

Figura 10-3

Figura 10-4
Primer


Figure 10-5

10.5 Codificacin de canal
Los datos binarios no son adecuados para la transmisin por muchas
razones. Las corridas de bits idnticas hacen que el DC se corra y falte el
reloj de bits. No hay control del espectro y el ancho de banda requerido es
demasiado grande. En la prctica, los sistemas de radio y cable requieren
un esquema de modulacin llamado cdigo de canal. Los esquemas de
modulacin digital se discuten en la Seccin 9. La Figura 10-5 muestra la
aplicacin de esos principios para un modulador 64QAM. En los esque-
mas que se describieron antes, el espectro de la seal transmitida depen-
de de la seal. Algunas partes del espectro pueden contener energa alta
y provocan interferencias a otros servicios mientras que otras partes del
espectro pueden contener poca energa y ser susceptibles de interferen-
cia. En la prctica se necesita la aleatorizacin para descorrelacionar el
espectro transmitido del contenido de datos. La Figura 10-6 muestra que
cuando se usa la aleatorizacin o la dispersin de energa se adiciona una
secuencia pseudo aleatoria a los datos seriales antes de que entren al
modulador. El resultado es que el espectro transmitido es similar al ruido
con estadsticas relativamente estacionarias. Claramente se deber
substraer una secuencia idntica y sncrona en el receptor como se mues-
tra. La aleatorizacin no se puede aplicar a los patrones de sincrona o
podran no ser detectados.

Figure 10-6

Primer


Figure 10-7

10.6 Codificacin interna
El cdigo interno de un sistema de FEC est diseado para evitar los
errores aleatorios al reducir la potencia del esquema de interpolacin. Un
cdigo interno adecuado puede evitar esos errores dando un incremento
aparente a la SNR de la transmisin. En la codificacin Trellis, que puede
usarse con sealizacin multi nivel, muchos smbolos de nivel mltiple son
asociados a un grupo. La forma de onda que resulta de un grupo particu-
lar de smbolos se le llama Un trellis. Si cada smbolo puede tener 8
niveles, entonces en tres smbolos puede haber 512 trellises posibles.
En la codificacin trellis, los datos son codificados en tal forma que solo
ciertas formas de onda de trellis representen datos vlidos. Si solo 64 de
los trellises representan datos libres de errores, entonces dos bits de
datos por smbolo pueden enviarse en lugar de tres. Los bits restantes es
una forma de redundancia ya que otros trellises aparte de los 64 correctos
deben deberse a errores. Si un trellis es recibido en el cual el nivel de uno
de los smbolos sea ambiguo debido al ruido, la ambigedad puede ser
resuelta ya que el nivel correcto debe ser el que da como resultado un
trellis vlido. Esta tcnica es conocida como mxima decodificacin pro-
bable. Los 64 trellises vlidos deben hacerse tan diferentes como sea
posible para hacer que el sistema siga funcionando con una relacin seal
a ruido ms pobre. Si el Coder trellis provoca un error, el cdigo externo lo
corregir.
En la DVB, se puede usar la codificacin convolucional Viterbi. La Figura
10-7 muestra que despus del interpolado los datos son enviados al
registro de corrimiento. El contenido de este produce dos salidas que
representan diferentes chequeos de paridad de los datos de entrada para
que los errores de bit puedan ser corregidos. Claramente habrn dos bits
de salida por cada bit de entrada; de aqu, el Coder mostrado es descrito
como Coder de relacin. Cualquier relacin entre 1/1 y 1/2 seguir
permitiendo que los datos originales se transmitan pero la cantidad de
redundancia variar. A la falla en la transmisin de la salida de comple-
ta se llama puncturing (perforacin) y permite que se obtenga cualquier
balance requerido entre la relacin de bits y la potencia de correccin.

Primer


Figure 10-8

Figure 10-9

10.7 Transmitiendo dgitos
La Figura 10-8 muestra los elementos de un transmisor digital de ATSC.
El Servicio de informacin que describe la transmisin se adiciona al
Stream de transporte. Este stream es aleatorizado antes de enrutarlo a un
Coder de correccin de error R-S externo que adiciona redundancia a los
datos. Un proceso de interpolado convolucional reordena entonces los
datos para que los datos adyacentes en el stream de transporte ya no lo
sean en la transmisin. Un Coder trellis interno se usar entonces para
producir una seal en niveles mltiples para el modulador de banda lateral
vestigial o VSB (Vestigial Side Band)
La figura 10-9 muestra un transmisor de DVB-T. La informacin de servi-
cio se adiciona como antes, despus de la etapa de aleatorizacin para la
dispersin de la energa. Antes de la interpolacin se adiciona el chequeo
R-S externo de smbolos. Despus de la interpolacin, el proceso interno
de codificacin tiene lugar y los datos codificados se envan a un Modula-
dor COFDM. A la salida del modulador se le aplicar un proceso de up
convertpara producir la salida de RF.
En el receptor, el reloj de bits se extrae y usa para controlar los tiempos
de todo el sistema. La codificacin de canal se invierte para obtener los
datos en bruto ms los errores de transmisin. La codificacin interna
corrige los errores aleatorios y puede identificar los errores ms largos
para ayudarle al Coder externo despus de la desinterpolacin. La aleato-
rizacin se remueve y el resultado es el stream de transporte original. El
receptor debe identificar la PAT, el servicio de informacin o SI (Service
Information) y la PMT al que la PAT apunta para poder decirle al auditorio
que est disponible en el stream de transporte y que el programa selec-
cionado pueda ser localizado en el mltiplex.

Primer

Seccin 11 Transmisin de datos
En la secciones previas se checaron las bases de un stream de transporte
MPEG-2 y su aplicacin principal: transportar streams de audio y video
comprimidos en una forma similar a las transmisiones analgicas conven-
cionales; sin embargo, una de las ventajas principales de un stream de
transporte MPEG-2 es que puede transportar datos as como video y
audio. Aunque los sistemas de televisin analgicos puedan y transmitan
datos, el ancho de banda mximo para estos est severamente limitado
comparado con los anchos de banda posibles para los streams de trans-
porte.
Esta Seccin proporcionar una vista general de los diferentes mtodos
proporcionados por MPEG-2 y las variantes regionales (DVB, ATSC y
ARIB (Association of Radio Industries and Businesses. Asociacin de
industrias y negocios de radio) para encapsular datos dentro de un stream
de transporte. La siguiente Seccin, entonces, revisar como son presen-
tados los datos al espectador en el set top box (que no cae estrictamente
dentro del alcance de MPEG-2).
11.1 Aplicaciones
Hay muchos tipos diferentes de aplicaciones para la transmisin de datos
en un stream de transporte y cada tipo de aplicacin puede requerir
diferentes tipos de datos con diferentes requerimientos de temporaliza-
cin. Por ejemplo, el tipo de datos involucrado con enviar trfico por
Internet es muy diferentes del necesario para proporcionar una actualiza-
cin de firmware para una set top box.
Una actualizacin que no sea en tiempo real de la informacin de precios
tiene requerimientos de temporalizacin muy diferentes que una aplica-
cin de cuestionario en la que las respuestas y preguntas deben ser
enviadas con una sincronizacin muy cercana al audio y video.
MPEG-2 proporciona una gran variedad de tcnicas diferentes para enviar
datos. La eleccin de la tcnica es un compromiso entre la optimizacin
del ancho de banda (y de aqu del costo de proporcionar el servicio) al
tiempo que llena los requerimientos de temporalizacin de la aplicacin.
El tipo de aplicaciones puede agruparse en forma aproximada por sus
requerimientos de tiempo real y el nivel de interactividad como se describe
en las siguientes secciones.

11.1.1 Datos relacionados con los programas
La especificacin base de MPEG-2 no tiene ninguna provisin para un
EPG que de informacin acerca de los canales de TV o los programas
individuales que se estn transportando en el stream de transporte. Las
variantes regionales ATSC, DVB y ARIB han usado la sintaxis de la Tabla
privada de MPEG-2 como la de la EIT para proporcionar datos adicionales
acerca de los programas. Se requiere que esas tablas se transmitan a
intervalos regulares y que den tiempos de inicio, sinopsis y otra informa-
cin acerca de los programas y servicios; sin embargo, an este nivel de
informacin podra no ser suficiente y por tanto hay un buen nmero de
EPGs de propietario que extienden la cantidad de informacin disponible y
tambin proporciona funciones como la bsqueda mejorada, canales
favoritos y otros servicios aumentados. Esos EPGs mejorados usualmente
residen en forma permanente en la set top box y usan una combinacin
de la Tabla de informacin estndar y de los formatos de datos de propie-
tario. Usualmente esta clase de informacin de programa no es crtica en
tiempo y por tanto se usan tcnicas baratas de baja relacin de datos. En
muchos casos los datos son diseados de tal forma que se puedan alma-
cenar temporalmente en la set top box para que aparezca como disponi-
ble inmediatamente al usuario an si el tiempo total real de transmisin es
relativamente grande.
11.1.2 Datos de oportunidad
Raramente es posible utilizar el ancho de banda completo de un stream
de transporte con streams de audio y video no solo por la necesidad de
manejar las restricciones complejas de la remultiplexin o la insercin de
la tabla. Los sistemas de datos de oportunidad usan esta capacidad extra
reemplazando algunos paquetes nulos con datos tiles; sin embargo, el
ancho de banda de estos datos no se puede garantizar y puede ser pe-
quea de aqu que solo pueda ser usada por aplicaciones sin las restric-
ciones de tiempo real.
Algunas aplicaciones que usan esta clase da datos pueden ser transfe-
rencias de archivos como listas de precios o la distribucin de datos del
nivel de acciones va satlite a todas las localidades de una compaa.
La nica restriccin es que la transferencia debe tener lugar durante la
noche y por tanto usar un ancho de banda corto y por tanto se pueden
usar servicios de datos de oportunidad baratos.

Primer

11.1.3 Datos de red
Una aplicacin muy comn es usar simplemente el stream de transporte
de broadcast como portadora de datos de red. En el ms simple de los
casos, un enlace de satlite proporcionara una interconexin de muy alto
ancho de banda entre dos compaas geogrficamente separadas. Este
enlace de red puede ser usada para transportar virtualmente cualquier
tipo de protocolo de red; sin embargo, el uso actual ms comn es para
descargas de Internet de alta velocidad usando solo el protocolo IP. En
este escenario se usa una conexin de Internet de baja velocidad para
enviar instrucciones y requisiciones de pgina a un servidor de Internet;
sin embargo, el servidor de Internet enrutar entonces cualquier dato
pedido a travs del enlace satelital a velocidades mucho mayores que las
posibles para una conexin de banda ancha promedio o de ISDN.
Una variante de esta aplicacin se usa cuando solo est disponible un
canal de slow back. En este caso, por ejemplo, los datos relacionados
con el programa de TV actual pueden ser entregados on demandcon la
seal transmitida sin que el auditorio se de cuenta que se esta accesando
un sitio de Internet.
11.1.4 TV mejorada
En una aplicacin de TV mejorada no hay canal de back (respuesta) y
por tanto todos los datos requeridos se debern enviar en el stream de
transporte que se esta transmitiendo. Aunque esta imposicin obviamente
restringe el diseo y rango de una aplicacin an es posible producir un
rango muy amplio de juegos, cuestionarios e infomerciales en los que el
auditorio podra no darse cuenta que toda la interaccin es solo con la TV.
Este es especialmente el caso con material pregrabado en el que es
relativamente directo sincronizar los pop-ups de datos como las pregun-
tas y respuestas de los cuestionarios con el audio/video.
11.1.5 TV interactiva
LA diferencia clave entre la TV mejorada y la interactiva es que esta tiene
un canal de respuesta para enviar o recibir datos altamente personaliza-
dos. Esto incrementa grandemente el rango de aplicaciones que se pue-
den soportar, incluyendo la capacidad de proporcionar una interaccin en
tiempo real con otras personas, como es el caso de los juegos multi-
jugador o las votaciones as como retroalimentacin realmente personali-
zada.
Una extensin ms de esto es cuando una conexin de Internet de alta
velocidad se combina con un canal de respuesta real. Esto ofrece una
integracin transparente de los datos personalizados con la transmisin
de televisin adems que tambin permite un VOD real de programacin
u otro material.
11.2 Encapsulamiento del contenido
La primera etapa en una transmisin de datos es encapsularlos en una
forma til para su transmisin en un stream de transporte. Hay una amplia
variedad de tipos diferentes de datos y por tanto las normas MPEG-2
proporcionan un buen nmero de diferentes mtodos de encapsulamiento.
Las varias normas especficas para cada pas como DVB y ATSC han
mejorado an ms las opciones bsicas de MPEG-2 para llenar los reque-
rimientos regionales pero todo eso constituye el ncleo de las normas
MPEG-2.
11.2.1 Encapsulado de datos MPEG
11.2.1.1 Canalizacin de datos
La canalizacin de datos se usa para la distribucin asncrona simple de
los datos a un set top box determinado en la red. Su principal aplicacin
es enviar datos de propietario en sistemas cerrados en los que el set box
al que se le van a enviar ha sido pre programado para buscar datos
especficos en ciertas PIDs. Los datos son transportados directamente en
el payload o carga til de los paquetes TS de MPEG-2 TS sin ninguna
informacin de temporalizacin. Una aplicacin tpica sera una actualiza-
cin nocturna de los niveles de stock de un producto a todos los puntos
de venta de una regin.
11.2.1.2 Streaming de datos
El streaming de datos se usa para la distribucin punto a punto de datos
en forma asncrona, sncrona o sincronizada. Los datos son transportados
como paquetes PES con un mtodo similar al de los servicios de video y
audio, De hecho, el audio y video son ejemplos realmente especficos de
un servicio de streaming de datos sncronos. Ya que los paquetes PES
son sealizados en las Tablas de servicios de informacin o SI (Service
Information), y pueden transportar informacin de temporalizacin, esta
aproximacin ser ms flexible que la canalizacin de datos pero en la
prctica se usa en una forma similar en sistemas cerrados de propietario.

Primer

11.2.1.3 DSMCC - Digital Storage Medium Command and Control
(Instruccin y control del medio de almacenamiento digital)
La especificacin DSM-CC de MPEG-2 (ISO/IEC 13818-6) proporciona
ms formas de transmitir datos en las secciones de una Tabla privada
estndar de MPEG-2. Originalmente fue diseada como una forma de
respaldar la distribucin de VOD de material de programa en una red con
un stream de transporte. El protocolo se ha extendido para ser capaz de
manejar tanto la distribucin on-demand (usando el paradigma MPE) as
como la distribucin peridica (usando el paradigma del carrusel) de datos
en redes mltiples de proveedores
11.2.1.4 MPE Multi-protocol Encapsulation (Encapsulado con proto-
colos mltiples)
El encapsulado con protocolos mltiples o MPE permite que un datagra-
ma de cualquier protocolo de comunicacin se transmita en la Seccin de
una Tabla de DSM-CC a travs de un stream de transporte. Un datagra-
ma es una estructura lgica que contiene toda la informacin que define
los datos; es decir, su tamao y contenido, donde deben ir y como llegar
ah.
La aplicacin ms comn es el trfico de Internet donde los datagramas
de TCP/IP llevan informacin acerca de las direcciones lgicas (IP) de la
fuente y el destino (target) as como del Control de acceso a la media o la
direccin de MAC (Media Access Control) (una direccin de red nica) del
target; sin embargo, el MPE respalda casi todos los tipos de protocolo de
red y ciertamente no est restringido a solo los datos de TCP/IP.
11.2.1.5 Carruseles
Los carruseles estn diseados para la transmisin peridica de informa-
cin en un stream de transporte. Aunque el contenido de un carrusel
puede cambiarse como respuesta a una requisicin de un usuario de
target, es ms usual que se repita regularmente el carrusel sin importar
que haya o no usuarios pendientes del contenido o de que se necesiten
datos en ese momento. Un target que necesita un tem de datos especfi-
co se espera que aguarde hasta que se retransmita.

Hay dos tipos diferentes de carruseles: los de datos y los de objetos y las
principales diferencias entre ellos es que:

Los carruseles de datos solo contienen mdulos de datos de contenido no
especificado; depende del target saber que hacer con los datos que recibe.
Los carruseles de objeto contienen objetos de datos identificables como
imgenes, archivos de texto o archivos ejecutables de aplicaciones y con-
tienen un listado de directorio de todos los objetos en el carrusel.
Los carruseles de datos frecuentemente se usan para descargar software
de sistema nuevo a un set top box mientras que un objeto de carrusel se
usa para servicios de compra, EPGs y para enviar aplicaciones y juegos.
En ambos tipos de carrusel, los tems se repiten a intervalos peridicos;
sin embargo, los objetos de carrusel hacen que sea ms sencillo variar la
relacin de repeticin de objetos individuales. Por ejemplo, el EPG para
las prximas horas puede repetirse con bastante ms frecuencia que el
que se ver el siguiente mes. Las relaciones de repeticin para objetos
puede ser una decisin comercial hecha por el proveedor del servicio para
maximizar la utilizacin del ancho de banda.
Ambos tipos de carrusel estn basados en las extensiones DSM-CC para
la especificacin de MPEG-2 ISO13818-6, con extensiones especificas
para los sistemas DVB, ARIB y ATSC.

Primer


Figure 11-1

11.2.1.6 Carruseles de datos
Un carrusel de datos no contiene ningn tem de datos individual o estruc-
tura de directorio sino que es una pieza monoltica simple de datos. De-
pender del usuario de target saber que son los datos y que hacer con
ellos.
La estructura se muestra en la Figura 11-1. Un tem simple completo de
datos es definido como un mdulo. Los mdulos de transmisin son
divididos en uno o ms bloques. Cada bloque se enviar como una Sec-
cin en el payload de un mensaje de descarga de bloque de datos o
DDB (DownloadDataBlock), que sigue la sintaxis de la tabla privada
definida por MPEG. Los mensajes DDB pueden ser enviados en cualquier
orden o con cualquier periodicidad de aqu que se necesite un mecanismo
para identificar que DDBs pertenecen a que mdulos.
Un mensaje de DownloadInfoIndication o DII (Indicacin de informacin
de descarga) se usa para enlazar juntos los DDBs a un mdulo. La infor-
macin para ms de un mdulo puede estar en un mensaje de DII simple;
esto forma un grupo. Usualmente un grupo contendr mdulos de datos
relacionados lgicamente.
Si hay ms mdulos relacionados que puedan agruparse juntos en un
mensaje de DII simple entonces se puede formar un sper grupo de
mensajes de DII mltiples. Estos son referenciados por un mensaje de
DownloadServerInitiate o DSI (Iniciar descarga de servidor).
Un carrusel de datos de una capa contiene un pequeo nmero de mdu-
los referenciados en un DII simple.
Un carrusel de datos de dos capas contiene mensajes DSI que hacen
referencia a uno o ms mensajes de DII. Pueden ser ms pequeos o
grandes que un carrusel sencillo.
Un uso tpico de un carrusel de dos capas sera para respaldar lenguajes
mltiples. Un grupo puede transportar el ejecutable en un mdulo junto
con texto en ingls en un segundo mdulo. El segundo grupo puede llevar
solo un mdulo simple con solo texto en francs ahorrndose el over-
head de repetir el mdulo de aplicacin.

Primer


Figure 11-2

11.2.1.7 Carruseles de objetos
Los objetos de carrusel se usan para transmitir tems individualmente
identificables de datos identificados de un servidor a un receptor. Esos
tems son llamados objetos y pueden ser imgenes, archivos de texto,
programas, un indicador de PID de un video, un listado de directorio o
salida (gateway) de servicio de lo que est disponible en el carrusel.
Los objetos relacionados agrupados se envan juntos como una forma de
carrusel sencillo desde un dominio de servicio. Los objetos se pueden
enviar tan frecuentemente como se requiera y diferentes objetos pueden
tener relaciones de repeticin muy diferentes.
Una caracterstica clave de los objetos de carrusel es que todos los obje-
tos se envan usando el paradigma de BIOP (Broadcast inter-ORB proto-
col. Protocolo de transmisin inter-ORB). Los desarrolladores de software
convencional han estado usando el ORB (Object Request Brokerage.
Corretaje de requisicin de objetos) por muchos aos. El BIOP extiende el
sistema bsico para respaldar la identificacin y uso de los objetos en un
ambiente de broadcast en diferentes redes de diferentes proveedores de
servicio.
En esencia, un BIOP es un mtodo para intercambiar informacin acerca
de un objeto que se est transmitiendo en el carrusel. El BIOP puede
contener el objeto o simplemente puede proporcionar un indicador al
objeto. El BIOP tambin puede indicar como usar el objeto, incluyendo
proporcionar un enlace a donde descargar el software de aplicacin
necesario para usar el objeto.
Los objetos de carrusel son similares a los carruseles de datos en tanto
que los grupos de objetos se combinan para formar mdulos. La metodo-
loga del carrusel de datos bsicos ser entonces usada para transmitir
esos datos usando bloques, mdulos y DIIs. La diferencia principal es que
el DSI se usa para apuntar directamente al objeto de directorio de la
salida (gateway) de servicio que podr entonces usarse para encontrar
todos los otros objetos en el carrusel. Este arreglo se muestra en la Figura
11.2.

Primer


Figure 11-3

11.2.1.8 Como se transmiten los objetos de los carruseles
Una explicacin completa est ms all de los alcances de este documen-
to; la siguiente descripcin es una vista general breve y muy simplificada
de ese proceso (vea tambin la Figura 11-3).
Los objetos directorio, archivo y stream se envan con el mismo mtodo
que para los carruseles de datos, es decir, en mdulos divididos en blo-
ques. Sern enviados como secciones en el payload de un DownloadDa-
taBlock o DDB (Bloque de datos de descarga).
Un mensaje de DownloadServerInitiate o DSI (Iniciar descarga de servi-
dor) contiene la localizacin de un objeto de directorio especial llamado
salida (gateway) de servicio. Los mensajes de DSI son referidos en el SI
y por tanto formaran el punto de inicio para desarrollar lo que es un objeto
de carrusel especfico. El DSI referencia el DownloadInfoIndication o DII
(Indicacin de informacin de descarga) que referencia el DDB que con-
tiene el mdulo en el que se enva el objeto de salida (gateway) de servi-
cio.
Los objetos son referenciados en un objeto de directorio usando las IORs
(inter-operable object references. Referencias de objeto interoperable).
Estos contienen toda la informacin necesaria para accesar un objeto en
el mismo dominio del servicio u otro carrusel de objeto (incluyendo los
transportados en otros streams de transporte)
El nombre dado a la estructura en el IOR que describe la localizacin de
un objeto es llamado perfil de cuerpoque viene en dos sabores:
BIOP profile body (Perfil de cuerpo BIOP) Usado solo para objetos
dentro de este dominio de servicio.
Lite Options Profile Body (Perfil de cuerpo de opciones ligeras) Usado
para objetos en otros servidores o streams de transporte.
Un IOR puede contener ms de un perfil de cuerpo si el objeto est dis-
ponible en ms de un carrusel y el set top box puede elegir el ms f-
cil/rpido de accesar.
Se usan taps para resolver el problema de que las PIDs usadas para
transmitir DIIs, DDBs y streams de video/audio no son conocidas hasta el
momento inmediato antes de la transmisin. Dentro del carrusel, todas las
referencias a las PIDs solo se hacen en trminos de un tap; las asociacio-
nes entre un tap y una PID real se hacen en el SI. Esto simplifica basta-
mente la remultiplexin de los streams en diferentes redes.

Primer

11.2.1.9 Sincronizacin de datos MPEG-2
Existe la necesidad de que la transmisin de datos est sincronizada en
alguna forma siendo programas lo que se transmite. No es prctico en
realidad usar la distribucin en tiempo real de un dato como mtodo de
sincronizacin excepto en aplicaciones en tiempo real que no sean crti-
cas como la actualizacin de marcadores en eventos deportivos en los
que unos pocos segundos o ms de error no tiene significado prctico; sin
embargo, an un segundo o dos pueden tener un impacto muy grande en,
por ejemplo, programas de preguntas en los que revelar las respuestas
demasiado antes puede tener consecuencias serias.
MPEG-2 proporciona diferentes mecanismos de temporalizacin para
diferentes tipos de encapsulamiento de datos. La canalizacin de datos y
el MPE no respaldan ninguna forma de mecanismo de temporalizacin
aparte de la distribucin casi en tiempo real de los datos.
El streaming de datos de paquetes PES pueden contener estampados de
tiempo de presentacin o PTS (Presentation Time Stamp) y posiblemente
decodificacin de los estampados de tiempo o DTS (Decoding Time
Stamp) de los estampados de tiempo para la sincronizacin con el reloj de
sistema derivado de los valores de PCR en el stream. El mecanismo es
exactamente el mismo para la sincronizacin y decodificacin de audio o
video.
Los carruseles de datos MPEG-2 no tienen informacin de temporaliza-
cin; sin embargo, los carruseles de objetos pueden contener un objeto
especial llamado un evento stream que contiene informacin de tempo-
ralizacin relacionada con el tiempo de reproduccin normal o NPT (Nor-
mal Play Time) de un programa de televisin individual. El NPT no es el
mismo que la PCR ya que el reloj del NPT se puede detener, por ejemplo,
durante un corte comercial. En otras palabras, el NPT de un programa
puede permanecer en total sincronizacin con la lnea de tiempo del
programa sin importar de cuando se transmita o como se divida en fun-
cin a los cortes comerciales.
11.2.2 Encapsulado de datos DVB
DVB ha adoptado los mtodos de encapsulado de la norma MPEG-2 con
solo variaciones menores, principalmente para remover posibles ambi-
gedades que emergen de las especificaciones originales (EN 301 192).
Estas incluyen la especificacin de un formato de MPE ligeramente dife-
rente y restricciones impuestas al mximo tamao de paquete de datos
PES. DVB tambin ha tomado la responsabilidad de asegurar que no
puedan haber ambigedades entre los servicios de datos que usan IORs
proporcionando la localizacin nica de las IDs de la red y la del servidor.
DVB tambin ha definido dos formatos de streaming de datos PES para el
subtitulado y el teletexto en DVB y tiene un formato normalizado para usar
los carruseles de datos para transmitir actualizaciones de firmware al set
top box (STB). El DVB tambin ha definido un nmero de descriptores de
datos y tablas adicionales que se discuten ms abajo en las secciones de
sealizacin y anuncios. La ms til de esas adiciones es la capacidad de
usar un descriptor para proporcionar una mascarilla simple para las direc-
ciones de MAC en un datagrama MPE. Esto permite un respaldo simple
para servicios estrechos, multi o de transmisin MPE.
11.2.3 Encapsulado de datos ATSC A/90
La especificacin ATSC A/90 fue escrita hace muchos aos despus que
el sistema DVB e incluye algunas diferencias significativas con las normas
de DVB y MPEG-2. Primero, la A/90 no usa carruseles de objeto y el
sistema CORBA/IOR menos, sino que usa una tabla separada, la Tabla
de recursos de red o NRT (Network Resources Table), para proporcionar
la informacin de conexin que enlaza un dato referenciado con su locali-
zacin real. Aparte de una dudosa simplificacin de la operacin del
sistema tambin habilita el soporte directo para las URLs de Internet que
no son soportadas por DVB o MPEG. El mecanismo es mostrado en la
Figura 11-4. En segundo lugar, la A/90 solo usa carruseles de datos que
efectivamente contengan solo un objeto simple. El formato del carrusel de
datos se ha extendido para incluir en forma opcional una adaptacin de un
encabezador de DSM-CC que puede contener un PTS para habilitar la
distribucin de datos sncronos. El concepto de MPEG de NPT dentro de
un programa no es soportado. A/90 tambin define tipos de datos adicio-
nales incluyendo su propia versin de MPE de DSM-CC as como permitir
que a los datos de IP se les haga un streaming usando el formato PES.
Tambin soporta una amplia variedad de modelos de temporalizacin
para diferentes tipos de datos aparte del DVB.

Primer


Figure 11-4

11.2.4 Encapsulado de datos de ARIB
La norma japonesa ARIB fue definida a partir de la norma A/90 y es
dudosamente el ms simple de todos los sistemas. No respalda la canali-
zacin de datos o los carruseles de objetos. En lugar de eso usa el forma-
to de carruseles de datos para enviar una o ms entidades imponiendo
una estructura de directorio especfica al contenido del carrusel de datos.
El ARIB no permite referencias a ninguna entidad que no est referida en
el PMT y por tanto no tiene necesidad de CORBA (Common Object Re-
quest Broker Architecture. Arquitectura de intermediario de requisicin de
objetos comunes) ni de enlaces de tipo NRT.
11.3 Transmisin de contenidos de datos
Los servicios de datos primero son encapsulados de acuerdo con la
norma nacional o internacional relevante y luego transmitidos a travs de
un stream de transporte a un STB; sin embargo, con el fin de usar un
servicio de datos, el STB primero debe saber que existe un servicio de
datos y cuando estar disponible (anunciarlo). En segundo lugar enton-
ces deber ser posible encontrar e identificar las varias componentes del
servicio de datos (sealizacin) cuando se est trasmitiendo en realidad.
MPEG-2 solo define la PAT y la PMT por lo que todos los anuncios y
sealizaciones solo podrn hacerse por la inspeccin del tipo de stream
elemental y algunos descriptores muy bsicos.
Aunque tiles hay un gran nmero de limitaciones para solo usar la PAT y
PMT, no solo que el agendado de los servicios de datos o eventos no es
posible. DVB y ATSC han definido tablas adicionales que incrementan
significativamente la cantidad de informacin proporcionada acerca de
cualquier servicio de datos presente. Note que en todos los casos las
PIDs que transmiten datos deben ser sealizadas como presentes con
una entrada en por lo menos un PMT.

Primer

11.3.1 Anuncio de DVB
La DVB considera que los servicios de datos estn asociados con un
evento individual (por ejemplo, un programa simple de preguntas) o son
parte de un servicio como un canal de deportes. De hecho, se apegan al
paradigma de MPEG-2 en el que un servicio de datos es lgicamente
indistinguible de un stream de audio o video convencional.
Por consiguiente, simplemente ha definido un nmero de descriptores
adicionales que son colocados en el EIT o la tabla SDT que anuncia que
un servicio de datos o eventos estar disponible. La localizacin real de
los servicios de datos y componentes sern entonces sealizados usando
las tcnicas que se describen a continuacin.
La nica nueva tabla es la Tabla de informacin de la aplicacin que es
definida por el uso con solo los servicios MHP. Esta contiene una lista de
todas las aplicaciones dentro de un carrusel, un indicador a su clase de
boot y opcionalmente permite que las aplicaciones se inicien automti-
camente o se cierren al cambiar el canal.
11.3.2 Anuncio de ATSC
En contraste con la DVB, la especificacin A/90 trata los eventos de datos
y servicios completamente por separado de los servicios de audio y video
y ha adicionado un nmero de tablas para soportar ese paradigma. Estas
tablas son la Tabla de servicios de datos o DST (Data Services
Table), que enlista los servicios de datos que se estn enviando y la Tabla
de eventos de datos o DET (Data Event Table). La DET es exactamente
anloga a la EIT para la informacin de agendado convencional del pro-
grama y usa una sintaxis idntica. Una tercera tabla, la de servicios a
largo plazo es similar a la DET pero proporciona informacin de agendado
a largo plazo, ms all de los 16 das mximos proporcionado por la DET.
11.4 Presentacin de contenido
La etapa final de la transmisin de datos es correr la aplicacin en el STB
y presentar la informacin al espectador. Se debe hacer notar que un
stream de transporte es completamente agnstico al contenido real que
est transportando, asumiendo que, por supuesto, est encapsulado con
el protocolo correcto para video, audio o datos. En otras palabras, la
siguiente seccin casi est completamente desvinculada de las normas de
transmisin de datos de MPEG-2, DVB o ATSC como aplicaciones y los
datos son distribuidos por el stream de transporte a utilizar por el STB.
11.4.1 Set Top Box intermediario (Middleware)
En algunos casos, como el de los datos de Internet, el ambiente en el que
los datos se van a usar es auto definido o relativamente no tiene impor-
tancia; sin embargo, en la mayora de los casos, como en los juegos y
aplicaciones es crtico que los datos de la aplicacin estn construidos de
tal forma que corran adecuadamente en el STB de target. En la mayora
de los casos, el STB tendr una interfase de programa de aplicacin o API
(Application Program Interface) que correr y que conecta las llamadas de
funcin de alto nivel de la aplicacin a los controladores del software que
controlan el hardware real en el STB y enlaza los datos en el stream de
transporte. Esta capa de software que est entre la aplicacin y los con-
troladores es conocida como intermediaria o de middleware.
Sin embargo hay una gran variedad de STB en uso en todo el mundo. Su
desempeo y caractersticas corren desde cajas muy bsicas que solo
podrn decodificar y desplegar una imagen bsica de calidad estndar
con las unidades ms modernas con poderosas capacidades de proce-
samiento. Algunas unidades modernas tienen integrados de grficos de
alto desempeo y corren sistemas operativos completos como Linux o
Windows, estn equipados con disco duro para la grabacin de progra-
mas, tienen DVD ROMs para la reproduccin de DVDs y pueden correr
paquetes de programas convencionales como el Office de Microsoft o Star
Office.
Una grfica simple diseada para el despliegue en una caja nueva de alto
desempeo podra ser que no se pueda desplegar en una unidad ms
antigua. Los desarrolladores de aplicaciones podran tener que escribir
programas completamente diferentes usando diferentes lenguajes de
programacin para cada tipo de set top box, middleware y sistema opera-
tivo, algo claramente ineficiente y que incrementa los costos de desarro-
llo.
Ha habido un buen nmero de intentos de normalizar la cajas o cuando
menos su funcionalidad mnima en la que la funcionalidad de la caja
claramente es definida y controlada por las empresas de broadcast en
una forma muy cerrada.
Otra aproximacin ha sido tomada por compaas que proporcionan una
solucin completa ofreciendo un middleware junto con las herramientas
de desarrollo de aplicaciones para desarrollar los programas adecuados.
Esos sistemas estn ms abiertos en tanto que el middleware puede ser
licenciado para correr en una variedad de diferentes set top boxes con
diferente desempeo o caractersticas en tanto que llenan las funcionali-
dades bsicas requeridas.

Primer

Un esquema de transmisin de datos de propietario y un servicio interacti-
vo de jardn cercado han sido usados ampliamente como sistema inter-
activo proporcionando una interactividad real a travs del canal de res-
puesta. Otras ofertas de compaas tambin se han usado ampliamente
en Europa y las aplicaciones pueden ser distribuidas usando objetos de
carrusel estndar aunque hay muchos otros sistemas de propietario.
Una norma ms abierta es un ambiente de aplicacin definido por el
MHEG (Multimedia Hypermedia Experts Group. Grupo de expertos de
hipermedia multimedia). Una variante particular de esto, MHEG-5, est
optimizada para aplicaciones de baja memoria y desempeo y algunos set
top boxes en particular. MHEG-5 ha tenido cierto xito, notablemente en
Inglaterra donde se le usa para transmisiones terrestres a STBs.
La tendencia actual es hacia la normalizacin en middleware abierto con
una API de programacin claramente definida. Esta tiene el beneficio de
que el consumidor puede elegir de entre una amplia variedad de set top
boxes mientras que le permite a los desarrolladores de aplicaciones
reusar el cdigo. Recientemente ha emergido un nmero de candidatos
para una norma global, incluyendo la plataforma de multimedia para el
hogar o MHP (Multimedia Home Platform) de la DVB. En USA el Foro de
mejoramiento de la televisin avanzada o ATVEF (Advanced Television
Enhancement Forum) y el ambiente de software de TV digital o DASE
(Digital TV Application Software Environment) son las normas abiertas
lderes.
11.4.2 Plataforma DVB de multimedia para el hogar o MHP (Multime-
dia Home Platform)
La plataforma multimedia para el hogar o (Multimedia Home Platform)
define una API de gran amplitud con muchos perfiles y niveles diferentes
para permitir diferentes STB de diferentes desempeos, costos y servi-
cios. La TV mejorada e interactiva (con canales de respuesta) son sopor-
tadas y tambin proporcionan soporte para conexiones a Internet que de
otra forma no seran soportados directamente por otras normas de DVB.
Las aplicaciones de MHP son distribuidas usando carruseles de objeto
estndar de DVB y anunciadas usando la tabla AIT descrita antes. Esto
permite que las aplicaciones se auto inicialicen, se pongan en pausa o se
detengan y que los recursos sean puestos en cach en forma explcita
con el fin de acelerar los tiempos de inicio de las aplicaciones. La norma
MHP est basada en tecnologa J ava y comprende un juego de APIs
derivadas de normas existentes como J avaTV, HAVI (home audio video
interoperability. Interoperatibilidad de audio y video en el hogar) y DAVIC
(Digital Audio Visual Council. Consejo audiovisual digital).
Las aplicaciones pueden ser de J ava o basadas en HTML y hay un nme-
ro de kits de desarrollo de software MHP disponible de diferentes provee-
dores. Las aplicaciones tendrn que someterse a una prueba de confor-
midad y estar electrnicamente firmadas para asegurar tanto la interope-
ratibilidad como la seguridad del sistema.
El logo de MHP tambin est protegido y los STBs debern pasar por un
proceso de conformidad antes de que puedan ser vendidos con el logo.
Las pruebas de interoperatibilidad regular se han llevado a cabo durante
los ltimos dos aos para asegurar que todas las aplicaciones de MHP
puedan corren en todas las set top boxes MHP de una gran variedad de
fabricantes lder. MHP es la norma de facto en Europa y sus servicios
oficialmente iniciaron en Finlandia en Agosto del 2001. Hay un gran nme-
ro de servicios de prueba actualmente transmitindose en Europa. Ale-
mania tambin usar MHP a partir de mediados de 2002 y otros pases
harn lo mismo dentro de los siguientes pocos aos despus. Sin embar-
go, MHP no es solo una norma Europea ya que ha sido adoptada en todo
el mundo. Por ejemplo, es obligatoria en Corea del Sur para la transmisin
de datos va satlite y en Australia para la transmisin terrestre. En febre-
ro de 2002 la organizacin de plataformas de aplicaciones abiertas para
cable o OCAP (Open Cable Applications Platform) de Estados Unidos
adopt la MHP como la norma para transmisin de cable digital america-
na. Se espera que muchos otros pases y organizaciones adopten el
MHP en corto plazo.
El impacto global de la MHP no debe ser subestimado. Los lderes actua-
les del mercado de servicios de TV interactiva se han comprometido a
proporcionar un plug-in MHP para usarlo en su propio middleware de
propietario durante 2002, abriendo efectivamente todas sus ser top boxes
de propietario a un mercado global. Con algunos pases comprometidos
con la MHP en toda Europa ya hay un mercado potencial de casi un billn
de espectadores que auguran un buen futuro a esta norma abierta.

Primer

11.4.3 ATVEF DASE
Algunas veces se dice que la diferencia entre ATVEF (Advanced
Television Enhancement Forum. Foro de mejoramiento de la television
avanzada) y DASE (DigitalTV application software environment. Ambiente
de software de aplicacin de la television digital) es que el primero reco-
mienda el uso de HTML pero permite el uso de J ava, mientras que el
segundo recomienda J ava y permite HTML; sin embargo, hay otras dife-
rencias fundamentales.
La especificacin ATVEF fue escrita por un grupo formado por fabricantes
de varias industrias con el fin de definir una funcionalidad normalizada que
debe ser proporcionada con el fin de permitir que el contenido interactivo
corra en set top boxes, receptores basados en PC y TVs interactivas. La
especificacin de contenido mejorado o ECS (Enhanced Content Specifi-
cation) fue el resultado.
La ATVEF ECS define HTML como fundamento para crear contenido de
TV interactiva aunque tambin se permite J avaScript. Tambin se requie-
re otras funcionalidades bsicas como el uso de grficas en formato de
red porttil (.png) como formato de intercambio de imgenes estndar.
ATVEF, por tanto, tiene muchas cosas substancialmente en comn con el
diseo de pginas de Internet con obvios beneficios para los desarrollado-
res de aplicaciones.
Una de las fortalezas de ATVEF es que el mecanismo de transporte no
est completamente definido o se asume por la norma. Es perfectamente
capaz de correr esquemas de transmisin analgicos o digitales, con o sin
contenido de video. Esto se logra definiendo un formato de contenido
independiente del transporte y por el uso de IP como vnculo de referen-
cia. Cualquier esquema de transmisin que use IP, por tanto, podr usar-
se. Esto ha permitido que el ATVEF corra en esquemas NTSC as como
en streams de transporte MPEG y proporciona un mecanismo simple para
una trayectoria de regreso. El ATVEF se est usando en USA en sistemas
de televisin tanto analgica como digital.
11.4.4 DASE
En contraste, DASE es una especificacin de middleware mucho ms
compleja que fue desarrollada por el ATSC en USA. Ya que el ATSC
tambin desarroll la norma de transmisin de datos A/90 la especifica-
cin DASE proporciona un vnculo al esquema de transmisin A/90 ade-
ms de que define la API en la que un aplicacin DASE correr. La norma
DASE-1 fue desarrollada como una norma candidata a principios de 2002.
DASE incorpora un esquema de sealizacin y un esquema de anuncios
as como el contenido de los datos de aplicacin en s, que son llamados
datos de esencia. Se permiten dos tipos de datos de esencia junto con el
ambiente y funcionalidad que pueden usar:

Datos de esencia declarativos basados en el lenguaje de marcado de texto
y scripts .xdml y .xml.
Datos de esencia procedurales basados en javatv xlets.
Un receptor DASE proporciona un motor para manejar ambos tipos de
datos de esencia junto con funcionalidades de ncleo comn como los
codecs .jpeg o .png que son compartidos entre los dos sistemas. DASE
tambin proporciona enlaces directos al contenido de audio y video que
se est transmitiendo y define un nmero de formatos grficos de pantalla
para desplegar contenido interactivo, incluyendo resoluciones de HDTV.
Las aplicaciones se pueden inicializar, activar, suspender o desinicializar
en una forma similar al paradigma del ciclo de vida de una aplicacin
MHP. Los recursos se pueden poner en el cach como se requiera.
Aunque DASE tiene todo el apoyo de ATSC detrs, es un contendiente
relativamente tardo en este campo y por tanto an no ha sido adoptado
ampliamente.

Primer

Seccin 12 Prueba de MPEG
La capacidad de analizar streams de transporte existentes para checar su
conformidad es esencial pero esta habilidad debe ser complementada por
una habilidad de crear streams de transporte que se sepa que se apegan
a las normas.
12.1 Requerimientos para las pruebas
Aunque la tecnologa de MPEG difiere dramticamente de la tecnologa
que le precede, los requerimientos de prueba son bsicamente los mis-
mos. En base a las operaciones, el usuario quiere tener un chequeo
simple y regular que asegure que todo est bien. En el caso de una falla,
la localizacin de esta necesita ser establecida rpidamente. Para el
diseo de equipo, la naturaleza de los problemas necesita ser explorada
con algn detalle. Como con las seales de prueba, la aproximacin es
combinar la generacin de seales vlidas conocidas para su insercin en
un sistema con la capacidad de administrar seales en varios puntos.
Una de las caractersticas de MPEG que la aparta del equipo de transmi-
sin de video tradicional es la existencia de capas mltiples de informa-
cin en las que se espera que cada una de ellas sea transparente para las
que estn debajo. Es muy importante ser capaces de establecer en que
capa reside una falla para evitar bsquedas infructuosas. Por ejemplo, si
el monitor de imagen de un Decoder MPEG est mostrando defectos
visibles, estos podran deberse a un buen nmero de posibilidades. Quiz
el Encoder est dando problemas y el stream de transporte est entre-
gando fielmente la informacin con fallas. Por otro lado, el Encoder podra
estar bien pero la capa de transporte podra estar corrompiendo los datos.
En DVB, hay an ms capas como las de dispersin de energa, correc-
cin de errores e interpolacin. Tal complejidad requerir una aproxima-
cin estructurada para encontrar las fallas usando las herramientas ade-
cuadas. La discusin del anlisis de protocolo de los datos comprimidos
en este Primerpodra ayudar al usuario a derivar esa aproximacin. Leer
la discusin de otro aspecto importante de las pruebas para televisin
comprimida, Valoracin de la calidad de imagen, tambin podra ser til.
Esta ltima discusin se encuentra en la publicacin A Guide to Video
Measurements for Compressed Television Systems. (Una gua para las
mediciones de video para sistemas de televisin comprimidos)
12.2 Anlisis de un stream de transporte
Un stream de transporte MPEG tiene que ser una estructura extremada-
mente compleja pero un analizador como el AD953 puede dividir la estruc-
tura en una forma lgica de tal forma que el usuario pueda observar
cualquier detalle requerido. Muchos tipos generales de anlisis pueden
llevarse a cabo en tiempo real en un stream de transporte en vivo; estos
incluyen los despliegues de la jerarqua de los programas en el stream de
transporte y de la proporcin de la relacin de bits del stream asignado a
cada stream.

Un anlisis ms detallado solo es posible si parte del stream de transporte
es grabado de tal forma que pueda ser dividido en partes posteriormente.
Esta tcnica es conocida como pruebas de tiempo diferido y pueden
usarse, por ejemplo, para examinar el contenido de un estampado de
tiempo.
Cuando se usan las pruebas de tiempo diferido, el analizador del stream
de transporte de MPEG estar actuando como un analizador lgico que
proporciona herramientas de interpretacin de datos especficas para
MPEG. Como con todos los analizadores lgicos, un mecanismo de
disparo en tiempo real se requerir para determinar el tiempo o las condi-
ciones bajo las cuales la captura tendr lugar. La Figura 12-1 muestra que
el analizador contiene una seccin de tiempo real, una seccin de alma-
cenamiento y una seccin diferida. En el anlisis en tiempo real, solo la
seccin de tiempo real opera y se necesitar que una fuente de seal est
conectada. Para la captura se usa una seccin en tiempo real para deter-
minar cuando disparar la captura. El analizador incluye herramientas
conocidas como filtros que permiten que se aplique el anlisis selectivo
antes o despus de la captura.
Una vez que la captura est completa, la seccin diferida puede operar
sobre los datos capturados y ya no ser necesaria la seal de entrada.
Hay una buena analoga con el osciloscopio de almacenaje que puede
desplegar la entrada de tiempo real directamente o salvarla para estudiar-
la despus.

Figura 12-1

Primer


Figura 12-2
12.3 Vista jerrquica
Cuando se analiza un stream de transporte que no sea familiar, la vista
jerrquica es un excelente punto de inicio porque habilita una vista grfica
de cada componente en el stream. La Figura 12-2 muestra un ejemplo de
despliego jerrquico como el proporcionado por el MTX100 de Tektronix.
Comenzando en la parte superior izquierda del stream de transporte
completo, el stream se divide y se presenta un icono para cada compo-
nente del stream. La tabla 12-1 muestra los diferentes conos que la vista
jerrquica usa y su significado. El usuario puede ver muy fcilmente
cuantos streams de programa estn presentes y el contenido de audio y
video de cada uno. Cada icono representa la capa superior de un nmero
de anlisis ms bajo y capas de informacin
El analizador crea la vista jerrquica usando la PAT y la PMT en los datos
de PSI en el stream de transporte. Las PIDs de esas tablas se despliegan
debajo de cada icono. Los datos de las PAT y PMT son fundamentales
para la operacin de cualquier Demultiplexor o Decoder; si el analizador
no puede desplegar una vista jerrquica o despliega una vista la cual
obviamente est mal, el stream de transporte a prueba tendr un error de
PAT/PMT. Es poco probable que el dems equipo sea capaz de interpre-
tar el stream.

Figura 12-3

Figura 12-4
La habilidad de un Demux o Decoder de amarrarse a un stream de
transporte depender de la frecuencia con la que los datos de PSI son
enviados. La opcin de relacin PSI/SI mostrada en la Figura 12-3 des-
plegar la frecuencia de insercin del sistema de informacin. La informa-
cin de PSI/SI deber tambin ser consistente con el contenido real en el
stream de bits. Por ejemplo, si una PID dada es referida en una PMT debe
ser posible encontrar PIDs de ese valor en el stream de bits. La funcin de
chequeo de consistencia hace esa comparacin. La Figura 12-4 muestra
una consistencia de error de un stream incluyendo dos paquetes no
referenciados.

Primer

Tabla 12-1. Iconos de la vista jerrquica

Icono Tipo de elemento
Paquetes de transporte mltiplex. Este icono representa a todos (paquetes de transporte de 188- y 204- bytes) los que forman el stream. Si
visualiza el stream de transporte como un tren, este icono representa cada carro en el tren sin importar su configuracin (por ejemplo, vagn,
furgn o silo) y lo que contiene.

Paquetes de transporte de una PID particular (ID de programa). Otros elementos (tablas, relojes, paquetes PES) que son la payloadcontenida
dentro de los paquetes de transporte o se construyen a partir de la payload de muchos paquetes de transporte que tienen la misma PID. El nmero
de PID aparece debajo del icono. En la vista jerrquica el icono a la derecha de este representa la payloadde los paquetes con esta PID.

Paquetes de transporte que contienen relojes de PCR independientes. La PID aparece debajo del icono.

Secciones PAT (Program Association Table. Tabla de asociacin de programa). Siempre est contenida en los paquetes de transporte de PID 0

Secciones PMT (Program Map Table. Tabla de mapa de programa)

Secciones NIT (Network Information Table. Tabla de informacin de red). Proporciona acceso a las tablas SI a travs de la instruccin PSI/SI del
men de seleccin. Tambin se usa para las secciones privadas. Cuando la opcin DVB est seleccionada (en el men de Opciones) este icono
tambin puede representar las secciones SDT, BAT, EIT y TDT.

PES (Packetized Elementary Stream. Stream elemental paquetizado). Este icono representa todos los paquetes que, juntos, contienen un
stream elemental dado. Los paquetes PES elementales son ensamblados a partir de payloads de muchos paquetes de transporte.

Stream elemental de video

Stream elemental de audio

Stream elemental de datos

Secciones ECM (Entitlement Control Message. Mensaje de control de derechos)

Secciones EMM (Entitlement Management Message. Mensaje de administracin de derechos)

Primer


Figura 12-5
Una tabla de localizacin de MUX puede desplegar grficamente las
proporciones del stream de transporte asignado a cada PID o programa.
La Figura 12-5 muestra un ejemplo de un despliegue de la tabla de locali-
zacin de un MUX. La vista jerrquica y la Tabla de localizacin de MUX
muestran el nmero de elementos en el stream de transporte y la propor-
cin del ancho de banda asignado.
12.4 Vista interpretada
Como una alternativa para checar datos especficos en lugares no especi-
ficados es posible analizar datos no especificados en lugares especficos
incluso en los paquetes del stream de transporte, las tablas o los paque-
tes PES. Este anlisis es conocido como vista interpretada porque el
analizador hace un anlisis (parse) y decodifica los datos y luego desplie-
ga su significado. La Figura 12-6 muestra un ejemplo de un paquete de
transporte MPEG en vista hex as como en vista interpretada. A medida
que se cambia el tem seleccionado, el nmero de paquete relacionado
con el inicio del stream puede ser desplegado. La Figura 12-7 muestra un
ejemplo de una PAT en la vista interpretada.

Figura 12-6

Figura 12-7

12.5 Sintaxis y anlisis de CRC
Para embarcar material de programa, el stream de transporte depende
completamente del uso exacto de la sintaxis por parte de los Encoders.
Sin ajustes correctos de bits de bandera fija, patrones de sincrona, cdi-
gos de inicio de paquete y conteos de paquete, un Decoder puede inter-
pretar mal el stream de bits. La funcin de chequeo de sintaxis considera
todos los bits que no son material de programa y despliega cualquier
discrepancia.
Las discrepancias espurias pueden deberse a errores de transmisin, las
discrepancias consistentes apuntan a un Encoder o Multiplexor con fallas.
La Figura 12-8 muestra un error de sintaxis as como un chequeo de
redundancia cclica (CRC) faltante.

Primer


Figure 12-8
Muchas tablas MPEG tienen adjuntadas checksums o CRCs para la
deteccin de errores. El analizador puede recalcular los checksums y
compararlos con el checksum original, De nuevo, las inconsistencias
espurias de CRC pueden deberse a errores de bits del stream pero los
errores consistentes de CRC apuntan a fallas de hardware.
12.6 Filtraje
Un stream de transporte contiene una gran cantidad de datos y en condi-
ciones reales de falla, es probable que a menos de que exista un proble-
ma serio, muchos de los datos son vlidos y quiz solo un stream elemen-
tal o un programa est afectado. En ese caso, es ms efectivo probar en
forma selectiva lo cual es la funcin del filtraje.
Esencialmente, el filtraje le permite al usuario de un analizador ser ms
selectivo cuando examine un stream de transporte. En lugar de aceptar
cada bit, el usuario puede analizar solo aquellas partes de los datos que
llenen ciertas condiciones.
Una condicin que resulta del filtraje de los encabezadores de los paque-
tes es que solo los paquetes con una PID dada sern analizados. Esta
aproximacin hace que resulte sencillo checar la PAT seleccionando PID
0, y de aqu, todos los otros PIDs podrn leerse. Si las PIDs de un stream
del que sospechamos se conocen, quiz por ver un despliegue jerrquico,
ser sencillo seleccionar una PID simple para el anlisis.

Figure 12-9
12.7 Anlisis de temporalizacin
Las pruebas descritas checan la presencia de los elementos correctos y la
sintaxis del stream de transporte; sin embargo, para desplegar el audio y
video correctamente en tiempo real, el stream de transporte tambin debe
entregar una temporalizacin exacta a los Decoders. Esta tarea puede ser
confirmada analizando la PCR y los datos de estampado de tiempo.
La transferencia correcta de los datos del reloj de programa es vital por-
que estos datos controlan la temporalizacin completa del proceso de
decodificacin. El anlisis de PCR puede mostrar que, en cada programa,
los datos de PCR se envan a una relacin suficiente y con suficiente
exactitud para cumplir con las normas.
Los datos de PCR de un Multiplexor pueden ser precisos, pero al remulti-
plexar se pueden poner los paquetes de un programa dado en un lugar
diferente en el eje del tiempo, requiriendo que los datos de PCR sean
editados por el Remultiplexor. Consecuentemente, es importante probar la
PCR para checar las inexactitudes despus de que los datos son remulti-
plexados.
La Figura 12-9 muestra un despliegue de PCR que indica las posiciones
a las cuales la PCR se recibi con respecto al reloj promedio. En el si-
guiente nivel de despliegue, cada PCR puede ser abierta para desplegar
los datos de la PCR como se muestra en la Figura 12-10. Para medir
inexactitudes, el analizador predice el valor de la PCR usando las PCRs
previas y la relacin de bits para producir lo que es llamado la PCR inter-
polada. El valor real de la PCR es sustrado de la PCR estimada para dar
una estimacin de las inexactitudes.

Primer


Figura 12-10
Una aproximacin alternativa mostrada en la Figura 12-11 proporciona un
despliegue grfico del intervalo de PCR, jitter, desbalanceo de frecuencia
y deriva de la seal que es actualizada en tiempo real.
La Figura 12-12 muestra un despliegue de estampado de tiempo para un
stream elemental seleccionado.
Se muestra ka unidad de acceso, el tiempo de presentacin y donde es
apropiado, la hora de decodificacin.
En MPEG, el reordenamiento y el uso de diferentes tipos de imagen
provocan un retraso y se requiere un Buffering tanto en el Encoder como
en el Decoder. Un stream elemental dado debe ser codificado dentro de
las restricciones de la disponibilidad del Buffering en el decoder.

Figura 12-12

Figura 12-11
MPEG define un Decoder modelo llamado T-STD (Transport Stream
System target decoder. Decoder de target del sistema de stream de
transporte); un Encoder o Multiplexor no debe distorsionar el flujo de datos
ms all de la capacidad de Bufferingdel T-STD. El stream de transpor-
te contiene los parmetros llamados VBV (Video Buffer Verify. Verificar el
Buffer de video) que especifica la cantidad de Buffering necesario para
un stream elemental dado.
El anlisis T-STD despliega grficamente como se ocupa el Buffer para
que los sobreflujos y los underflowsse puedan ver fcilmente. La Figura
12-13 muestra un despliegue de Buffering.

Figura 12-13

Primer

La salida de un Compresor/Multiplexor normal es de uso limitado porque no
es determinstico. Si el defecto de un Decoder es visto, no hay garanta de
que el mismo defecto sea visto en una repeticin de la prueba porque la
misma seal de video no dar como resultado el mismo stream de transpor-
te. En este caso, un stream de transporte absolutamente repetible es esen-
cial para lograr que el defecto se repita para su estudio o rectificacin.
El jitter del stream de transporte debe estar entre ciertos lmites pero un Decoder
bien diseado debe ser capaz de recuperar programas ms all de ese lmite con
el fin de garantizar una operacin confiable. No hay forma de probar esta capaci-
dad usando streams de transporte existentes porque, si cumplen con las normas,
el Decoder no se estar probando. Si hay una falla, no ser repetible y podra no
quedar claro si la falla se debi al jitter o algn otro incumplimiento de las normas.
La solucin es generar un stream de transporte que cumpla con las normas en
todos los aspectos y luego adicionar una cantidad controlada de inexactitudes
para que estas sean conocidas y por tanto sean la nica parte de la seal que no
cumpla con las normas. La funcin de editor del AD953 est diseada para crear
esas seales.
12.8 Pruebas al stream elemental
Debido a la naturaleza flexible del stream de bits MPEG, el nmero de
posibilidades y combinaciones que contiene es casi incalculable. Ya que
el Encoder no est definido, los fabricantes no estn forzados a usar cada
posibilidad; de hecho, por razones econmicas, esto sera improbable.
Este hecho hace que hacer pruebas sea muy difcil porque el hecho de
que un Decoder trabaje con un Encoder particular no prueba su conformi-
dad con las normas. Ese Decoder podra simplemente no usar los modos
que causan que el Decoder falle.
Una mayor complicacin aparece porque los Encoders no son determins-
ticos y no producirn el mismo stream de bits si se repite la entrada de
audio o video. Hay pocas oportunidades de que exista el mismo alinea-
miento entre las imgenes I-, P- y B-y los cuadros de video. Si un decoder
falla en una prueba dada, podra no hacerlo la siguiente vez que se corra
la prueba haciendo difcil la localizacin de errores. Una falla con un
Encoder dado no determina si la falla est en el Encoder o el Decoder. La
dificultad de codificacin depende fuertemente en la naturaleza del mate-
rial de programa y cualquier material dado no necesariamente ejercer
cada parmetro sobre todo el rango de codificacin. Para hacer pruebas
que tengan resultados significativos, se requieren dos herramientas:

Una fuente conocida de seales de prueba que cumplan con las normas y
que deliberadamente exploren todo el rango de codificacin. Esas seales
deben ser determinsticas para que la falla en un Decoder d sntomas re-
petibles. Los streams de bits que cumplen con Sarnoff estn diseados pa-
ra ejecutar esta tarea.
Un analizador de stream elemental que permita checar la conformidad con
las normas de la sintaxis completa de un Encoder.

Figura 12-14

12.9 Streams de bits que cumplen con Sarnoff
Esos streams de bits han sido especialmente diseados por la Corpora-
cin Sarnoff para probar la conformidad con las normas del Decoder.
Estos pueden estar multiplexados en un stream de transporte que alimen-
ta un Decoder.
No se requiere tener acceso al funcionamiento interno del Decoder. Para
evitar la necesidad de un anlisis largo de la salida del Decoder, los
streams de bits tienen que ser diseados para crear una imagen plana
cuando se completen de tal forma que solo sea necesario conectar un
monitor de imagen a la salida del Decoder para verlas.
Hay un buen nmero de esas imgenes simples. La Figura 12-14 muestra
la pantalla gris de verificacin. El usuario debe examinar la pantalla de
verificacin para ver las discrepancias que se desplegarn bien contra el
campo gris. Tambin hay algunas imgenes de verificacin que no son
grises.
Algunas pruebas no darn como resultado una imagen si hay una falla,
esas pruebas despliegan la palabra VERIFY en la pantalla cuando se
completan. Otras pruebas requieren que el espectador cheque que haya
un movimiento suave de un elemento que se mueve por la imagen. Los
problemas de temporalizacin o de orden provocarn un jitter visible.
El paquete de pruebas de Sarnoff puede ser usado para checar todos los
elementos de la sintaxis MPEG a la vez. En una prueba, el stream de bits
comienza solo con imgenes I-, adiciona imgenes P- y luego adiciona
imgenes B- para probar si se pueden manejar y reordenar correctamente
todos los tipos de imgenes de MPEG. La compatibilidad atrasada con
MPEG-1 se puede probar. Otras streams de bit hacen pruebas usando un
rango de diferentes estructuras de GOP. Hay pruebas que checan la
operacin de los vectores de movimiento y hay pruebas que varan el
tamao de las slices o la cantidad del relleno.

Primer


Figura 12-15
Adems de proporcionar pruebas para el Decoder, los streams Sarnoff
tambin incluyen secuencias que causan que un buen Decoder produzca
seales de prueba de video estndar para checar los DACs (digital-to-
analog converter. Convertidores digital a analgico), niveles de seal y/o
Encoders Y/C. Esas secuencias convierten al Decoder en un generador
de patrones de prueba de video capaces de producir seales de video
convencionales como placas de zonas, rampas y barras de color.
12.10 Anlisis del stream elemental
Un stream elemental es la carga til o payload que el stream de trans-
porte debe entregar en forma transparente. El stream de transporte lo
har ya sea que el stream elemental cumpla o no con las normas. En
otras palabras probar un stream de transporte en conformidad simplemen-
te significar checar que est entregando streams elementales sin cam-
bios. Eso no significa que los streams elementales estn bien ensambla-
dos para empezar.
La estructura o sintaxis del stream elemental es la responsabilidad del
Compresor. Por tanto, probar un stream elemental es esencialmente una
forma de prueba del Compresor. Se debe hacer notar que un Compresor
puede producir una sintaxis que cumpla con las normas y an as tener
una calidad de audio o video pobre; sin embargo, si la sintaxis es incorrec-
ta, un Decoder podra no ser capaz de interpretar el stream elemental. Ya
que los compresores son algortmicos ms que determinsticos, un stream
elemental podra no cumplir con las normas de forma intermitente si
algn modo de operacin menos comn no se est implementado ade-
cuadamente.

Figura 12-16
Ya que los streams de transporte frecuentemente contienen muchos
programas que vienen de diferentes Coders, los problemas de stream
elemental tienden a estar restringidos a un programa mientras que los
problemas del stream de transporte tienden a afectar a todos los progra-
mas. Si los problemas son notados con la salida de un Decoder en parti-
cular, entonces las pruebas de conformidad con Sarnoff debern correrse
en ese Decoder. Si son satisfactorias, la falla podra estar en la seal de
entrada. Si la sintaxis del stream de transporte ya se prob o si otros
programas estn trabajando sin fallas, entonces se justificar un anlisis
de stream elemental.
El anlisis de stream elemental puede iniciar en el nivel superior de la
sintaxis y continuar hacia abajo. Los encabezadores de secuencia son
muy importantes ya que le dicen al Decoder todos los modos y parme-
tros relevantes usados en la compresin. La sintaxis del stream elemental
descrito en las secciones 5.1 y 5.2 se deben usar como guas. La Figura
12-15 muestra un encabezador de secuencia y su extensin desplegada
en un AD953. A un nivel ms bajo de pruebas, la Figura 12-16 muestra un
cuadro B- decodificado junto con los vectores de movimiento sobrepues-
tos en la imagen.

Primer

12.11 Creando un stream de transporte
Siempre que se sospeche de un Decoder es til ser capaces de generar
una seal de prueba de calidad conocida. La Figura 12-17 muestra que un
stream de transporte debe incluir el PSI (Program Specific Information.
Informacin especfica del programa) como PAT, PMT y NIT para descri-
bir uno o ms streams de programa. Cada stream de programa debe
contener su propio PCR y streams elementales que tengan estampados
de tiempo peridicos.
Un stream de transporte DVB contendr informacin de servicio adicional
como BAT, SDT y Tablas EIT. Un editor PSI/SI habilitar la insercin de
cualquier combinacin que cumpla con las normas de PSI/SI en un stream
de prueba de cliente.
Claramente, cada tem requerir compartir la relacin del stream de
transporte disponible. El Multiplexor proporciona un medidor de relacin
para desplegar la relacin de bits total utilizada. La parte restante de la
relacin de bits es usada insertando paquetes de relleno con PIDs que
contengan solo 1sque rechazar el Decoder.
12.12 Generacin de inexactitudes PCR
El Decoder MPEG tiene que recrear un reloj continuo usando las mues-
tras de reloj en los datos PCR para controlar un PLL (phase-locked loop.
Lazo de fase cerrada). El lazo necesita filtraje y amortiguamiento de tal
forma que el jitter, en el momento de llegada de los datos al PCR, no
cause inestabilidad en el reloj.
Para probar el desempeo del PLL, se requiere una seal con inexactitud
conocida; de otra forma la prueba no tendra sentido. El AD953 puede
generar inexactitudes simuladas para ese propsito. Debido a su genera-
dor de referencia, el AD953 tiene circuitos de reloj altamente estables y el
jitter real a la salida es muy pequeo. Para crear el efecto del jitter, la
temporalizacin de los datos PCR no se cambiar. En lugar de eso, los
valores de PCR se modifican de tal forma que el conteo de PCR que
contienen es ligeramente diferente del ideal. El valor modificado da como
resultado errores de fase en el Decoder que son indistinguibles del jitter
real.

Figure 12-17

La ventaja de esta aproximacin es que un jitter de cualquier magnitud se
puede adicionar fcilmente a cualquier stream de programa simplemente
modificando los datos de PCR y dejando los otros datos intactos. Otros
streams de programa en el stream de transporte no necesitan que se les
adicione jitter. De hecho, lo mejor podra ser tener un stream de programa
estable para usarlo como referencia.
Para diferentes pruebas, la base de tiempo puede ser modulada en dife-
rentes formas que determine el espectro del error de fase del lazo con el
fin de probar el filtraje del lazo. El jitter de onda cuadrada alterna entre
valores con los cuales se igualar tarde o temprano. Los valores de jitter
senoidal provocan que el error de fase sea una senoidal muestreada. El
jitter aleatorio hace que el error de fase sea similar al ruido.

Primer

Glosario

AAC Advanced Audio Coding - Codificacin avanzada de audio

AAU Audio Access Unit - Unidad de acceso de audio - Ver Access unit
(Unidad de acceso)

AC-3 El esquema de compresin de audio inventado por los Laboratorios
Dolby y especificados para la norma de televisin digital del ATSC. En el mundo
del equipo de consumidor se le llama Dolby Digital.

Access Unit - Unidad de acceso Los datos codificados para una imagen o
bloque de sonido y cualquier relleno (valores nulos) que le siguen.

A/D Convertidor analgico a digital.

AES Audio Engineering Society- Sociedad de ingeniera de audio

Anchor Frame - Cuadro ancla Un cuadro de video que se usa para prediccin.
Los cuadros I- y P- generalmente se usan como cuadros de ancla pero los B- -
nunca.

ANSI American National Standards Institute - Instituto de normas nacionales
americanas

API Application Program Interface - Interfase de programa de aplicacin

ARIB Association of Radio Industries and Businesses - Asociacin de
negocios e industrias de radio

Asynchronous Transfer Mode ATM - Modo de transferencia asncrono Un
protocolo de seal digital para el eficiente transporte de informacin con relacio-
nes continuas y como rfagas en redes digitales de banda ancha. El stream
digital ATM consiste de paquetes de longitud fija llamada cells, (celdas) cada
una contiene 53 bytes de 8 bits, un encabezador de 5 bytes y una carga til o
payloadde 48 bytes de informacin.

ATM Vea Asynchronous transfer mode - Modo de transferencia asncrona

ATSC Advanced Television Systems Committee - Comit de sistemas de
television avanzada

ATVEF Advanced Television Enhancement Forum - Foro de mejoramiento de
la televisin avanzada)

AU Access Unit - Unidad de acceso

BAT Bouquet Association Table - Tabla de asociacin de bouquet

BER Bit Error Rate - Relacin de errores de bit

BFSK Binary Frequency Shift Keying - Llaveode corrimiento de frecuencia
binaria

BIOP Broadcast Inter-ORB Protocol - Protocolo de transmisin Inter-Orb

Bit rate - Relacin de bit La relacin a la cual el stream de bits comprimido es
distribuido del canal a la entrada de un decoder.

Block Bloque Un bloque es un arreglo de valores de pxel o coeficientes de
DCT, usualmente de 8 por 8 representando informacin de luminancia o cromi-
nancia

Bouquet Un grupo de streams de transporte en el que los programas son
identificados por la combinacin de la ID de la red y la PID (parte de DVB-SI).

BPSK Binary Phase Shift Keying - Llaveode corrimiento de fase binaria
CA - Conditional Access Informacin que indica si un programa tiene scram-
bling

CAT Conditional Access Table Tabla de acceso condicional Paquetes
que tienen cdigos de PID (vea la Seccin 8 Streams de Transporte) de 1 y que
contienen informacin acerca del sistema de scrambling. Vea ECM y EMM.

CD Compact disc Disco compacto

CELP Code Excited Linear Predictive Predictiva lineal excitada por cdigo

Channel Code Cdigo de canal - Una tcnica de modulacin que convierte
datos en bruto en una seal que puede ser grabada o transmitida por radio o
cable.

CIF Common Interchange Format Formato de intercambio comn Un
formato de 352x240 pixeles para video conferencias a 30 fps.

Closed GOP GOP Cerrado Un grupo de imgenes en las que las ltimas
imgenes no necesitan datos del siguiente GOP para la codificacin bidireccio-
nal. Los GOP cerrados se usan para hacer un punto de divisin en un stream de
bits.

Coefficient Coeficiente - Un nmero que especifica la amplitud de una fre-
cuencia particular o funcin de base en una transformada

CORBA Common Object Request Broker Architecture Arquitectura del
intermediario de requisiciones de objeto comn

COFDM Coded Orthogonal Frequency Division Multiplex Multiplexin por
divisin de frecuencia ortogonalmente codificada - Una forma modificada de
OFDM. Esquema de modulacin digital que usa un nmero muy grande de
portadoras, cada una transportando una relacin de datos muy baja. Usada para
DVB-T.

Compression Compresin - Reduccin del nmero de bits usados para
representar un tem de datos.

CRC Cyclic Redundancy Check Chequeo de redundancia cclica

DAC Digital-to-Analog Converter Convertidor digital a analgico

DASE DigitalTV Application Software Environment Ambiente de software
de aplicacin para TV digital

DAVIC Digital Audio Visual Council Concejo audio visual digital

DCT Discrete Cosine Transform Transformada discreta de coseno

DDB DownloadDataBlock Bloque de datos a descargar

DET Data Event Table Tabla de evento de datos

DFT Discrete Fourier Transform Transformada discreta de Fourier

DII DownloadInfoIndication Indicacin de informacin de descarga

Dolby Digital Vea AC-3

DSI DownloadServerInitiate Iniciar descarga del servidor

DSMCC Digital Storage Media Command and Control Instruccin y control
de la media de almacenamiento digital

Primer

DST Data Services Table Tabla de servicios de datos

DTS Decoding Time Stamp Decodificacin del estampado de tiempo -
Parte del encabezador PES que indica cuando se ha decodificado una unidad de
acceso.

DVB Digital Video Broadcasting Transmisin de video digital - General-
mente se refiere al consorcio iniciado por los europeos que une a empresarios de
broadcast, fabricantes, cuerpos regulatorios y otros que han creado normas para
la distribucin de televisin digital y servicios de datos incluyendo versiones de
DVB-C (cable), DVB-S (satlite) y DVB-T (terrestre).

DVB-SI DVB Service Information Servicio de informacin de DVB Infor-
macin transportada en un mltiplex de DVB que describe los contenidos de
diferentes multiplexes. Incluye NIT, SDT, EIT, TDT, BAT, RST y ST (vea la
Seccin 10 Introduccin a DVB y ATSC).

DVC Digital Video Cassette Cassette de video digital

DVD Digital Versatile Disk or Digital Video Disk Disco verstil digital o
disco de video digital

Elementary Stream Stream elemental. La salida en bruto de un compresor
que lleva una seal simple de audio o video.

ECM Entitlement Control Message Mensaje de control de derechos. Infor-
macin de acceso condicional que especifica palabras de control u otros parme-
tros de scrambling especficos del stream

ECS Enhanced Content Specification Especificacin de contenido mejora-
do

EIT Event Information Table Tabla de informacin de evento Parte de
DVB-SI

EMM Entitlement Management Message Mensaje de administracin de
derechos Informacin de acceso condicional que especifica un nivel de autori-
zacin o servicios de Decoders especficos. Se puede direccionar un solo Deco-
der individual o un grupo de ellos

ENG Electronic News Gathering Captura electrnica de noticias Trmino
usado para describir el uso de la grabacin de video en lugar de pelcula para la
cobertura de noticias

Entropy Coding Codificacin de entropa Codificacin de longitud variable
sin prdidas de la representacin digital de una seal para reducir la redundancia

EOB End of Block - Fin de bloque

EPG Electronic Program Guide Gua electrnica de programas Una gua
de programas distribuida por la transferencia de datos en lugar de un papel
impreso.

ETSI European Telecommunication Standard Institute Instituto de normas
europeas de telecomunicaciones

FEC Forward Error Correction Correccin de errores por adelantado
Sistema en el que se adiciona redundancia al mensaje para que los errores
puedan corregirse dinmicamente en el receptor.

FGS Fine Grain Scalability Escalabilidad de grano fino

GOP Group of Pictures Grupo de imgenes En orden de transmisin un
GOP inicia con una imagen I- y termina con la ltima imagen antes de la siguien-
te imagen I- .

HAVI Home Audio Video Interoperability- Interoperabilidad de audio y video
en el hogar

Huffman coding Codificacin de Huffman Un tipo de codificacin de fuente
que usa cdigos de diferentes longitudes para representar smbolos que tienen
diferente probabilidad de ocurrencia

IEC International Electrotechnical Comisin- Comisin electrotcnica
internacional

Inter-coding Intercodificacin - Compresin que usa la redundancia ente
imgenes sucesivas; tambin se le conoce como codificacin temporal

Interleaving Interpolacin - Una tcnica usada para la correccin de errores
que rompe las rfagas de errores en muchos errores ms pequeos.

Intra-coding Intracodificacin Tipo de compresin que trabaja completamen-
te dentro de una imagen; tambin se le conoce como codificacin espacial

IOR Inter-operable Object Reference Referencia de objeto interoperable

IP Internet Protocol Protocolo de Internet

I-pictures Intra-coded Pictures Imgenes intracodificadas

IRD Integrated Receiver Decoder. Receptor-Decodificador integrado. Un
receptor de RF combinador con un Decoder MPEG que se usa para adaptar un
aparato de TV a las transmisiones digitales

ISDB Integrated Services Data Broadcasting Sistema de transmission
digital desarrollado en J apn

ISO International Organization for Standardization - Organizacin interna-
cional para la normalizacin

ITU International Telecommunication Union Unin Internacional de tele-
comunicaciones

JPEG Joint Photographic Experts Group Grupo de expertos en fotografa

JTC1 Joint Technical Committee of the IEC Reunin tcnica del Comit de
la IEC

JVT Joint Video Team Unin del equipo de video

Level Nivel El tamao de la imagen de entrada en uso con un perfil dado (ver
Seccin 2 Compresin en video)

MAC Media Access Control Control de acceso de media

Macroblock Macrobloque El rea de la pantalla representada por muchos
bloques de DCT de luminancia y diferencia de color que son guiados por un
vector de movimiento

Masking Enmascaramiento - Un fenmeno psicoacstico en el que ciertos
sonidos no se pueden or en presencia de otros.

MDCT Modified Discreet Cosine Transform Transformada discreta de
coseno modificada

MGT Master Guide Table Tabla de gua maestra

MHP Multimedia Home Platform Plataforma multimedia para el hogar.

Primer

Motion Vector Vector de movimiento - Un par de nmeros que representan el
desplazamiento vertical y horizontal de una regin de una imagen de referencia
para la prediccin.

MP@HL Main Profile at High Level Perfil principal a nivel alto

MP@LL Main Profile at Low Level - Perfil principal a nivel bajo

MP@ML Main Profile at Main Level - Perfil principal a nivel principal

MPE Multi-protocol Encapsulation Encapsulamiento de protocolos mlti-
ples

MPEG Moving Picture Experts Group Grupo de expertos en imgenes en
movimiento. Norma ISO/IEC J TC1/SC29/WG11 y las normas desarrolladas por
este grupo.

MPEG-LA MPEG License Agreements Acuerdos de licencia MPEG

NIT Network Information Table Tabla de informacin de red. Informacin en un
stream de transporte que describe muchos streams de transporte.

NPT Normal Play Time Tiempo normal de reproduccin

NRT Network Resources Table Tabla de recursos de red

Null Packets Paquetes nulos Paquetes de relleno que no transportan datos
pero que son necesarios para mantener una relacin de bits constante con una
carga til (payload) variable, Los paquetes nulos siempre tienen una PID de 8191
(todos 1s). (Vea Seccin 8 Streams de Transporte).

OCAP Open Cable Applications Platform Plataforma de aplicaciones abiertas
de cable

OFDM Orthogonal Frequency Division Multiplexing Multiplexin por divisin
de frecuencia ortogonal

ORB Object Request Brokerage Intermediario de requisicin de objetos

PAL Phase Alternate Line Lnea de fase alternada

PAT Program Association Table Tabla de asociacin de programa. Datos
que aparecen en paquetes y que tienen un cdigo de PID (vea Seccin 8
Streams de Transporte) de cero que el Decoder MPEG usa para determinar que
programas existen en un Stream de Transporte. La PAT apunta a la PMT quien,
a su vez. apunta al contenido de video, audio y datos de cada programa

PCM Pulse Code Modulation Modulacin de cdigo de pulso Un trmino
tcnico para una forma de onda analgica de fuente, por ejemplo las seales de
audio y video, expresadas como muestras peridicas numricas. PCM es una
seal digital sin comprimir.

PCR Program Clock Reference Referencia de reloj de programa. La muestra
del conteo de reloj del Encoder que se enva en el encabezador del programa
para sincronizar el reloj del Decoder

PES Packetized Elementary Stream Stream elemental paquetizado

PID Program Identifier - Identificador de programa Un cdigo de 13 bits en
el encabezador de paquete de transporte, PID 0, indica que el paquete contiene
un PAT PID. (Ver Seccin 8 Streams de Transporte) PID 1 indica un paquete
que contiene CAT. La PID 8191 (todos 1) indica paquetes nulos (relleno). Todos
los paquetes que pertenecen al mismo stream elemental tienen la misma PID.
PMT Program Map Tables Tablas de mapeo de programa. Las tablas en PAT
que apuntan al contenido de video, audio y datos de un stream de transporte.

Packets Paquetes. Es un trmino usado en dos contextos: en los streams de
programa, un paquete es una unidad que contiene una o ms unidades de
presentacin; en streams de transporte, un paquete es un quantum de datos
pequeo de tamao fijo.

Pixel Picture element (algunas veces pel) Elemento de imagen Es la
unidad ms pequea de una imagen, representada por una muestra o un juego
de muestras como RGB o YC
r
C
b
.

Preprocessing Preprocesamiento Procesamiento de la seal de video que
ocurre antes de la codificacin MPEG. La reduccin de ruido, downsampling,
edicin al corte, identificacin y pulldown 3:2 son ejemplos de preprocesamiento.

Profile Perfil - Especifica la sintaxis de codificacin usada

Program Stream Stream de programa Un stream de bits que contiene video
comprimido, video, audio e informacin de temporalizacin.

PS Program Stream Stream de programa

PSI Program Specific Information - Informacin que hace el seguimiento de
los diferentes programas en un stream de transporte MPEG y en los streams
elementales en cada programa. La PSI incluye PAT, PMT, NIT, CAT, ECM y
EMM.

PSI/SI Un trmino general para la combinacin de MPEG PSI y DVB-SI.

PSIP Program and System Information Protocol Protocolo de informacin
de programa y sistema

PTS Presentation Time Stamp Estampado de tiempo de presentacin - El
tiempo al cual una unidad de presentacin estar disponible para el auditorio.

PU Presentation Unit Unidad de presentacin Una imagen comprimida o
bloque de audio.

QAM Quadrature Amplitude Modulation Modulacin en cuadratura de la
amplitud. Un sistema de modulacin digital.

QCIF One-quarter-resolution (176x144 pixels) Common Interchange For-
mat. Formato comn de intercambio a un cuarto de resolucin (176x144 pixeles)
Vea CIF.

QMF Quadrature Mirror Filter Filtro de espejo de cuadratura

QPSK Quaternary Phase Shift Keying (tambin conocido como Llaveo de
corrimiento de fase de cuadratura). Llaveo de corrimiento de fase cuaternario.
Un sistema de modulacin digital particularmente til para enlaces a satlite.

QSIF One-quarter-resolution Source Input Format - Formato de entrada de
fuente a un cuarto de resolucin. Vea SIF.

Quantization Cuantizacin Un paso de procesamiento que aproxima los
valores de la seal asignando un valor de entre un nmero de valores predefinidos.

RLC Run Length Coding Codificacin de longitud corrida Un esquema de
codificacin que cuenta el nmero de bits similares en lugar de enviarlos indivi-
dualmente.

RRT Rating Region Table Tabla de clasificacin de Regin

RST Running Status Table Tabla de estatus de corriendo
Primer

R-S Reed-Solomon - Es una funcin polinomial usada para la DVB por protec-
cin. Hasta 8 bytes dentro de cada paquete de transporte.

SAOL Structured Audio Orchestra Language Lenguaje estructurado de
orquesta de audio

Scalability Escalabilidad Una caracterstica de MPEG-2 que proporciona
niveles mltiples de calidad proporcionando capas de datos de video. Las capas
mltiples de datos permiten que un Decoder complejo produzca una mejor
imagen usando ms capas de datos mientras que uno ms simple puede seguir
produciendo una imagen usando solo la primera capa de datos.

SDI Serial Digital Interface Interfase digital serial. Norma de interfase de
cable coaxial serial diseado para la produccin de seales de video digital

SDK Software Development Kit Paquete de desarrollo de software

SDT Service Description Table Tabla de descripcin de servicio. Una tabla
que enlista los proveedores de cada servicio en un stream de transporte.

SDTV Standard Definition Television Televisin con definicin estndar

SI Vea DVB-SI.

SIF Source Input Format Formato de fuente de entrada. Una seal de
entrada de media resolucin usada por MPEG-1.

Slice Una secuencia de macrobloques consecutivos.

SMPTE Society of Motion Picture and Television Engineers Sociedad de
ingenieros de cine y televisin

SNR Signal-to-Noise Ratio Relacin seal a ruido

SP@ML Simple Profile at Main Level - Perfil simple a nivel principal

SPTS Single Program Transport Stream Stream de transporte de progra-
ma simple

ST Stuffing Table Tabla de relleno

STB Set Top Box.

STC System Time Clock Reloj de tiempo de sistema. El reloj comn usado
para codificar audio y video en el mismo programa

STT System Time Table Tabla de tiempo de sistema

Stuffing Relleno Datos sin sentido adicionados para mantener constante la
relacin de bits.

Syndrome Sndrome Resultado inicial del clculo de chequeo de errores.
Generalmente si el sndrome es cero, entonces se asume que no hay error

TCP/IP Transmission Control Protocol/Internet Protocol Protocolo de
control de transmission/Protocolo de Internet

TDAC Time Domain Aliasing Cancellation Cancelacin del aliasing en el
dominio del tiempo. Una tcnica de codificacin usada en la compresin de audio
AC-3.

TDT Time and Date Table Tabla de fecha y hora. Se usa en DVB-SI.

TOT Time Offset Table Tabla de disparidad de tiempo
Transport Stream (TS) Stream de transporte Multiplexin de muchos
streams de programa que son transportados en paquetes. La demultiplexin se
logra con diferentes IDs de paquetes o (PIDs). Ver PSI, PAT, PMT y PCR.

Truncation Truncado Acortamiento de la longitud de palabra de una muestra
o coeficiente removiendo los bits de menor orden

T-STD Transport Stream System Target Decoder Decoder de target del
sistema de stream de transporte. Un Decoder que tiene una cierta cantidad de
Buffer de memoria que se asume que tomar en cuenta un Encoder

TVCT Terrestrial Virtual Channel Table Tabla de canal terrestre virtual

VAU Video Access Unit. Unidad de acceso de video. Una imagen comprimida
en un stream de programa

VBV Video Buffer Verify Verificar el Buffer de video

VCO Voltage Controlled Oscillator Oscilador controlado por voltaje

VLC Variable Length Coding Codificacin de longitud variable. Una tcnica
de compresin que asigna cdigos cortos a valores frecuentes y cdigos largos
a valores infrecuentes.

VOD Video On Demand Video en demanda. Un sistema en el cual los
programas de television o las pelculas se transmiten a un solo consumidor
cuando lo pide.

VSB Vestigial Sideband Modulation Modulacin de banda lateral vestigial.
Un sistema de modulacin digital usado por ATSC.

Wavelet Una transformada que usa una funcin bsica que no es de longitud
fija pero que crece ms a medida que se reduce la frecuencia.

Weighting Ponderacin. Un mtodo para cambiar la distribucin del ruido
debido al truncado por medio de valores de pre multiplicacin.

Y/C Luminance and chrominance Luminancia y crominancia

Contactos de Tektronix:
Asociacin de Naciones del sureste Asitico / Australasia / Pakistn (65) 6356 3900
Austria +41 52 675 3777
Balcanes, Israel, Sud frica y otros pases de ISE +41 52 675 3777
Blgica 07 81 60166
Brasil y Sudamrica 55 (11) 3741-8360
Canad 1 (800) 661-5625
Europa central, Ucrania y el Bltico +41 52 675 3777
Europa central y Grecia +41 52 675 3777
Dinamarca +45 80 88 1401
Finlandia +41 52 675 3777
Francia y frica del Norte +33 (0) 1 69 86 81 81
Alemania +49 (221) 94 77 400
Hong Kong (852) 2585-6688
India (91) 80-22275577
Italia +39 (02) 25086 1
Japn 81 (3) 6714-3010
Luxemburgo +44 (0) 1344 392400
Mxico, Amrica Central y el Caribe 52 (55) 56666-333
Este Medio, Asia y Africa del Norte+41 52 675 3777
Los pases bajos 090 02 021797
Noruega 800 16098
Repblica popular de China 86 (10) 6235 1230
Polonia +41 52 675 3777
Portugal 80 08 12370
Repblica de Corea 82 (2) 528-5299
Rusia y CIS 7 095 775 1064
Sudfrica +27 11 254 8360
Espaa (+34) 901 988 054
Suecia020 08 80371
Suiza +41 52 675 3777
Taiwn 886 (2) 2722-9622
Reino Unido y Eire +44 (0) 1344 392400
USA 1 (800) 426-2200
Para otras reas contacte a Tektronix, Inc. al: 1 (503) 627-7111
ltima actualizacin Junio 15 2005

Para mayor Informacin

Tektronix mantiene una coleccin comprensiva y en constante expansin de notas de
aplicacin, notas tcnicas y otros recursos para ayudarles a los ingenieros a trabajar
con la tecnologa ms avanzada. Favor de visitar www.tektronix.com

Copyright 2005, Tektronix, Inc. Todos los derechos reservados. Los productos de Tektronix estn protegidos
por patentes norteamericanas y extranjeras concedidas y pendientes. La informacin de esta publicacin
reemplaza todo el material previamente publicado. Nos reservamos el privilegio de cambiar las
especificaciones y precios. TEKTRONIX y TEK son marcas registradas de Tektronix, Inc. Todas los dems
nombres referidos son marcas de servicio, marcas de negocio o marcas Registradas por las compaas
respectivas

Habilitando la Innovacin

EN - ESPAÑOL - MPEG - Primer - Fundamentos - & - Protocolos - 25W - 11418 - 5 7 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

EN - ESPAÑOL - MPEG - Primer - Fundamentos - & - Protocolos - 25W - 11418 - 5 7 PDF

Cargado por

Copyright:

Formatos disponibles

Habilitando la innovacin

Una gua de fundamentos de MPEG y anlisis de protocolos

También podría gustarte