Está en la página 1de 52

Todo lo que necesita saber sobre el DVD

Prohibida la reproducción total o parcial de este libro, así como su tratamiento informático y transmisión de cualquier forma o medio, sea electrónico; mecánico o fotocopia, sin el permiso previo y por escrito del titular de los derechos.

DERECHOS RESERVADOS © 2000

Producido por:

Editorial Centro Japonés Norte 2, No. 4, Col. Hogares Mexicanos, Edo. de México, C.P. 55040 Te l. (5) 7•87•17•79, fax (5) 7•70•02•14

Clave 1202

ISBN 968-7799-49-8

Director General:

Profr. J. Luis Orozco Cuautle

Director Editorial:

Lic. Felipe Orozco Cuatle

Negociaciones Internacionales y Proyectos Especiales:

Ing. Atsuo Kitaura Kato

Editor responsable:

Lic. Eduardo Mondragón M.

Autor:

Profr. J. Luis Orozco Cuautle

Director Adminsitrativo:

Lic. Javier Orozco Cuautle

Diseño Gráfico:

D.C.G. Norma C. Sandoval R.

Diagramación:

Gabriel Rivero Montes de Oca

C. Sandoval R. Diagramación: Gabriel Rivero Montes de Oca Centro Japonés de Información Electrónica 1. Reseña

Centro Japonés de Información Electrónica

1.

Reseña del DVD-V

1.1

Definición del DVD

2

1.2

Especificaciones básicas del DVD

3

1.3

Características del DVD-V

3

1.4

Especificaciones básicas del DVD-V

4

2 Estructura del disco

2.1 Forma del disco

5

2.2 Tipos de discos

6

2.3 Estructura interna del disco

7

2.4 Disco de doble capa

7

3.Estructura de los recuperadores ópticos

3.1 Tipos de recuperadores

9

3.2 Enfoque y seguimiento

11

4.

Compresión de video en movimiento, basada en MPEG2

4.1 Necesidad de la compresión de video en movimiento

12

4.2 ¿Qué es “MPEG2”?

12

4.3 Diferencias con MPEG1

12

4.4 Perfiles y niveles de MPEG2

13

4.5 Codificación MPEG2

14

 

4.5.1 Muestreo y cuantización

14

4.5.2 Codificación de longitud variable (VLC)

21

4.5.3 Bloque de compensación de movimiento

22

4.5.4 Multiplexado y división de paquetes

29

4.5.5 Tasa de transferencia variable

29

4.5.6 Codificación de corrección de error

30

4.5.7 Modulación 8-16

30

4.6 Estructura de datos de MPEG2

30

4.7 Sincronización de video y audio

31

5.

Formato de los datos

32

6.

DVD de audio

6.1

Dolby digital (AC-3)

34

6.2

Audio MPEG2

36

6.3

Audio PCM lineal

36

7.

Funciones del DVD-Video

7.1

Pantallas de menú

37

7.2

Función de argumento múltiple

38

7.3

Función de ángulos múltiples

39

7.4

Función de control paterno

39

7.5

Función de varios aspectos

40

7.6

Función multi-idioma

41

7.7

Otras funciones

42

8. Protección de derechos de autor

43

9. Glosario de términos técnicos sobre el DVD

44

1. Reseña del DVD

1.1 Definición del DVD

El DVD fue diseñado originalmente como un “disco de video digital”; sin embargo, conforme sus aplicaciones se han ido diversificando con la aparición de distintas mejoras, el concepto del DVD como un “disco versátil digital” (de propósito múltiple) se ha aceptado de forma general. En algunos casos, el término “DVD-V” se usa en vez de simplemente “DVD” para identificar al disco de video digital. El DVD es sólo un DVD, y no hay forma de identificar a qué tipo de disco se aplica, ya que se tienen muchos tipos de DVD dependiendo de su propósito. Vea la tabla 1.1.

Formato de disco

Información grabada / método de grabación

DVD-Video

Video y audio / sólo reproducción

DVD-Audio

Audio / sólo reproducción

DVD-ROM

Datos / sólo reproducción

DVD-RAM / DVD-RW

Datos / se puede grabar

DVD-R (grabable)

Datos / se puede grabar (sólo una vez)

Tabla 1.1: Tipos de disco

Los formatos de DVD anteriores, con excepción del DVD-A, se han estandarizado y se están comercializando en este momento (enero de 1999). Debido a que los estándares comparten grandes porciones del formato bási- co, esto ha permitido el fácil desarrollo de equipo de grabación y reproducción que proporcione compatibilidad entre varios tipos de medios.

DVD L D DVD-V VIDEO CD F D DVD-A CD-G P D DVD-RAM C D
DVD
L
D
DVD-V
VIDEO
CD
F
D
DVD-A
CD-G
P
D
DVD-RAM
C
D
M
D
DVD-R
CD-ROM
DVD-ROM
CD-R
Medios disponibles
Medios disponibles
(reproducción)
Es posible conseguir
la compatibilidad
(grabación)
Compatibilidad baja
Compatibilidad baja

Figura 1.1 Relación entre los medios disponibles y la familia DVD

TODO LO QUE NECESITA SABER SOBRE EL DVD

1.2 Especificaciones básicas del DVD

Como acabamos de ver, la compatibilidad entre los discos de la familia DVD puede conseguirse fácilmente debido a que todos los discos comparten unas especificaciones básicas para el DVD. El formato físico del DVD (especificaciones del DVD) se muestra en la tabla 1.2.

1. Diámetro de disco

2. Grueso de disco

3. Area de programa

4. Longitud de onda del láser : 635/650nm

5. NA de la lente objetivo

6. Separación entre pistas

7. Longitud del pit

: 120cm

:

1.2mm (doble laminación de 0.6mm)

: 24 a 58mm (radio)

:

0.6

: 0.74um

:

0.4 - 1.87um (*)

8. Tipo de pit

: 3T-14T

9. Velocidad de rotación

: 3.49 m/segundo CLV (*)

10. Grabación/modulación

: EFM-plus (conversión de 8 a 16)

11. Corrección de errores

: RS-PC

12. Capacidad de grabación

: 4.7GB (*)

13. Estructura lógica

: Basado en los estándares ISO9660 y UDF

14. Estructura de datos

* El dato se aplica a discos de una cara, capa sencilla.

:

Línea de datos MPEG2

Tabla 1.2. Formato físico del DVD (especificaciones básicas del DVD)

1.3. Características del DVD-V

El DVD-V, contracción de “DVD-Video”, tiene las siguientes características principales. Estas características y des- empeño se han mejorado significativamente, en comparación con los medios convencionales (vea la tabla 1.3):

• Se emplea el estándar internacional de compresión de imagen MPEG2, posibilitando la reproducción de larga duración y de alta calidad.

• La grabación de audio cumple con el sistema de Dolby digital (AC-3), y se ha implementado una reproducción de sonido estereofónica de 5.1 canales (para aplicarse en teatros en casa).

• Se puede conseguir un audio de alta calidad en PCM lineal (para aplicaciones de 96KHz/24 bits).

• Se pueden reproducir múltiples juegos de audio y video en un formato virtual (multi-propósito),
• Se pueden reproducir múltiples juegos de audio y video en un formato virtual (multi-propósito), para obtener
funciones de muchos ángulos, de muchos argumentos, de muchos idiomas, de varios aspectos y de bloqueo
paterno.
DVD-V
LD
VCD
CD
MD
Método de
Digital/
Digital/
Análoga
grabación
MPEG2
MPEG1
Resolución
Video
horizontal
Más de 500
líneas
430 líneas
240 líneas
de rastreo
de rastreo
Tiempo de
133 minutos
120 minutos
74 minutos
reproducción
(máximo de 480) en ambos lados
Dolby
AC-3
Pro Logic
Pro Logic
Cantidad de canales
5.1 canales
2 canales
2 canales
2 canales
2 canales
Audio
48/96KHz
44.1KHz
44.1KHz
PCM lineal
16/20/24 bits
16 bits
16 bits
44.1KHz 16 bits
compresión 1/5)

Tabla 1.3. Comparación del DVD-V con otros medios

1.4 Especificaciones básicas del DVD-V

TEORIA Y SERVICIO ELECTRONICO

Los formatos básicos del DVD-V se muestran en la tabla 1.4. En esta tabla, “sub-video” se refiere al despliegue dinámico de las frases sobrepuestas en la imagen (subtitulado) o al despliegue en pantalla de video (OSD).

Vi deo Audio Sub-Video Estándares Número de líneas : 1 Método de compresión : MPEG2

Video

Audio

Sub-Video

Estándares

Número de líneas

:

1

Método de compresión

:

MPEG2 (MP@ML*) o MPEG1

Tasa de bits

:

9.800 Mb/segundo (máximo) para MPEG2 1.856 MB/segundo (máximo) para MPEG1

Tasa de cuadros

:

24, 25 ó 30 cuadros por segundo

* Vea la sección 4.4, perfiles y niveles, para MP@ML.

Número de líneas *1

:

8 (máximo)

Método de codificación

:

PCM lineal/dolby digital (AC-3) Audio MPEG1/Audio MPEG2

Estándares de líneas de datos:

 

PCM lineal

Dolby AC-3

Audio MPEG1

Audio MPEG2

Frecuencia

48/96KHz

48KHz

48KHz

48KHz

de muestreo

Parámetros

16/20/24

Comprimido

16 bits

Comprimido

de cuantización

Bit

Tasa de bits (variable)

6.144Mbps

32-448Kbps

384Kbps

912Kbps

máximo

máximo

máximo

Cantidad de

8 canales

5.1 canales

2 canales

7.1 canales

canales*

(máximo)

(máximo)

(máximo)

(máximo)

* Número total de canales por línea

Número de líneas

:

32 (máximo)

Método de compresión

:

Corrimiento de longitud*

Area de despliegue

:

720(H) x 478 (V) máximo, (525/60) 720(H) x 573(V) máximo, (625/50)

Número de colores

:

16

* El corrimiento de longitud, que es el método adoptado para la compresión de datos en el CD-I, es aceptable para video en movimiento simple, como los dibujos animados.

Tabla 1.4 Formatos básicos del DVD-V

*1 El concepto básico de “línea” se usa para los datos grabados en el DVD-D. Una línea, como su nombre lo implica, se refiere a las líneas de datos. El número de líneas proporcionadas para el video, el audio y el sub- audio, se muestran en la tabla anterior; estas líneas se graban como un tren de pits en cada pista. A pesar de que estas líneas parecen haber sido grabadas en desorden, cada una de ellas puede tomarse por separado al momento de la reproducción, dado que en realidad están grabadas con un multiplexaje de paquetes (vea el apartado 4.5).

2. Estructura del disco

2.1 Forma del disco

Al igual que el CD (disco compacto), el DVD es un disco de 12 cm de diámetro y contiene pits; sin embargo, aunque el DVD tiene el mismo tamaño de orificio central y la misma posición de inicio de lectura que el CD, difiere en que la distancia desde el centro hasta el área de grabación de señal es de 24mm (en el CD es de 25mm), con objeto de obtener la máxima capacidad de grabación posible.

f 120mm Lectura Area de fijación f 33mm Lectura f 26mm f 15mm Area de
f
120mm
Lectura
Area de fijación
f
33mm
Lectura
f
26mm
f 15mm
Area de grabación
de señal
f
46mm
f
48mm
f 116mm
f
117mm

0.6mm

Area de fijación

Orificio central Superficie de lectura Substratos Capa adhesiva/Capa espaciadora Capa grabada
Orificio central
Superficie de
lectura
Substratos
Capa adhesiva/Capa espaciadora
Capa grabada

Figura 2.1 Forma del disco

El grueso total del disco se ha fijado en 1.2mm, para que sea compatible con el CD; pero los pits se localizan

a una distancia de 0.6mm de la superficie del disco, y éste, en sí mismo, posee una estructura laminada, que se

consigue al laminar 2 capas de resina de 0.6mm de grueso. Esta estructura tiene las siguientes ventajas principa- les:

• Los efectos de inclinación del disco se minimizan, y esto reduce los errores de lectura y mejora la densidad de grabación física.

• Como la distancia de la superficie del disco a los pits es corta, el valor NA de la lente puede incrementarse sin causar distorsiones significativas en la huella del haz (el valor NA de la lente en el DVD es de 0.6 contra los 0.45 del CD)

• Una alta resistencia contra los cambios de temperatura y humedad evita las deformaciones del disc

Grueso del substrato: 1.2mm (CD) Grueso del substrato: 0.6mm (DVD) A' A
Grueso del substrato: 1.2mm (CD)
Grueso del substrato: 0.6mm (DVD)
A'
A

Nota: La diferencia entre las dimensiones A y A’ se incrementa cuando aumenta el grueso del disco.

Figura 2.2 Efectos del grueso del disco en el ángulo de inclinación

TEORIA Y SERVICIO ELECTRONICO

Disco con un grueso 16 de substratode 0.6mm 14 12 10 8 Disco con un
Disco con un grueso
16
de substratode 0.6mm
14
12
10
8
Disco con un grueso
6
de substrato
4
de 1.2mm
2 0.50
0.55
0.60
0.65
Angulo de inclinación
máximo permitido

NA de la lente objetivo

8 7 6 5 4 3 1.2 1.0 0.8 0.6 0.4 Grueso del substrato t
8
7
6
5
4
3 1.2
1.0
0.8
0.6
0.4
Grueso del substrato t (mm)
Capacidad de grabación (GB)

Figura 2.3

El DVD incorpora varias mejoras para incrementar la capacidad de grabación, en aproximadamente 6 veces la de un CD. Estas mejoras se resumen enseguida:

CD DVD Tasa de mejora NA Redundancia de corrección de error Modulación Longitud de onda
CD
DVD
Tasa de mejora
NA
Redundancia de corrección de error
Modulación
Longitud de onda del láser
Separación entre pistas/tamaño
de la huella
Distancia del centro a la posición
inicial de grabación de señal
Capacidad de grabación (bytes)
0.45
0.6
1.78
31%
15.4%
1.24
8-14
8-16
1.06
0.78um
0.65um
1.44
0.92
0.68
1.35
24mm
23mm
1.02
780M
4.7G
6.03

2.2 Tipos de discos

Tabla 2.1

La figura 2.4 muestra los tipos de discos y su capacidad de almacenamiento.

Sin g l e sid e 12cm Doub le sid e Sin g l e
Sin
g
l e
sid e
12cm
Doub le
sid e
Sin g l e
sid e
8cm
D
oub le
sid e

DV D V DV D R OM

Sin

g

l e

la y e r

4

.7G b y te (1 3 3m in )

 
12cm 8cm
12cm
8cm

DVD R

Sin

D

sid e

l e

g

5 Gbyt

3.9

e

 

Doubl

e

la y e r

4 Gbyt

8.5

e (2 4 0 m

in )

 

oub le sid e

7 .9G

b y te

Sin

g

l e

la y e r

D

oub le la y e r

9.4

Gbyt

e (2 6 6 m

in )

1

7 .0 8G b y te (4 8 0m

in )

Sin g l e sid e

Doubl

sid e

e

3 Gbyt

1.2

e

6 Gbyt

2.4

e

Sin

g

l e

la y e r

Doub

le

la y e r

Sin g l e

la ye r

Doub le la y e r

1

. 4 6 G b y te (4 4m in )

. 6 6 G b y te (8 0m in )

2

2 Gbyt

2.9

e (8 8 m

in )

5

.32

G

by te

(160

m

in

)

12cm M 12cm
12cm
M
12cm

Sin g l e sid e

DV D RA

Doub le sid e

2 .6G

b y te

5.2

Gbyt

e

Valores entre paréntesis ( ) indican la longitud máxima de los datos de video almacenados en el disco. La capacidad de almacenamiento del DVD-R se basa en los “estándares de DVD-R, versión 1.0” La capacidad de almacenamiento del DVD-RAM se basa en los “estándares de DVD-RAM, versión 1.0”

Figura 2.4 Tipos de discos y sus capacidades de almacenamiento

TODO LO QUE NECESITA SABER SOBRE EL DVD

2.3 Estructura interna del disco

La estructura de los pits en cada disco se muestra en la figura 2.5. La huella reducida del láser reduce el ancho del pit y la separación entre pistas del disco, e incrementa la capacidad de grabación.

DVD CD LD Separación de pistas Ancho de pit Altura de pit Grueso de la
DVD
CD
LD
Separación de pistas
Ancho de pit
Altura de pit
Grueso de la capa de resina
0.74um
1.6um
1.6um
0.30um
0.50um
0.40um
0.10um
0.10um
0.10um
0.60mm
1.20mm
1.25mm
0.4µm 1.6µm 0.5µm Pit 0.3mm pit width 1.60µm 1.2mm 0.74µmm 1.25mm 0.6mm resin sheet track
0.4µm
1.6µm
0.5µm
Pit
0.3mm
pit width
1.60µm
1.2mm
0.74µmm
1.25mm
0.6mm
resin sheet
track pitch
0.1µm
0.1µm
0.1µm
pit height

Reflecting film

DVD (una capa, una cara)

CD

LD

Figura 2.5. Estructura interna del disco

2.4 Disco de doble capa

2.4.1 Estructura

La estructura interna de un disco de una cara y dos capas se muestra en la figura 2.6. Los discos de doble capa se producen laminando 2 hojas de resina hechas de un substrato de policarbonato de 0.6mm de grueso, con una película translúcida insertada entre las mismas. Comparados con los discos de una capa, los de doble capa difieren en especificaciones básicas, como se muestra en la tabla 2.2.

Pelicula protectora transparente

Approx.10µm

Luz láser
Luz láser

Approx.0.05µm

Apprpx.40µm

Approx.

Capa reflectora metálica (2 a capa)

Capa transparente

0.05mm

Capa reflectora translucida (1 a capa)

Approx.0.6µm

(600µm)

Substrato de policarbonato

Figura 2.6. Estructura de un disco de una cara, dos capa Una cara, una capa
Figura 2.6. Estructura de un disco de una cara, dos capa
Una cara, una capa
Una cara, doble capa
Largo mínimo del pit
0.4um
0.44um
Largo máximo del pit
1.87um
2.05um
Velocidad lineal fiducial
3.49m/seg
3.84m/seg
Capacidad de almacenamiento
4.7GB
8.5GB

Tabla 2.2

TEORIA Y SERVICIO ELECTRONICO

2.4.2 Métodos de lectura y escritura

Mientras la luz láser se refleja en los pits de la primera capa, la luz láser remanente se transmite a través de la segunda capa. La luz transmitida, después de reflejarse en la película de reflexión (los pits de la primera capa), se transmite a través de la película translúcida una vez más, y regresa al recuperador (vea la figura 2.7). Como en el caso de los discos de doble capa, la luz láser se refleja en o se transmite a través de la película translúcida; la eficiencia de detección del haz disminuye, comparada con la de los discos de una capa. Los discos de doble capa, por tanto, tienen alrededor de 10% menos densidad de grabación que los de una capa, y con esto se mantiene un desempeño básico (en los discos de doble capa, la separación entre pistas es mayor que en los de una capa).

Rango focal Capa reflectora (atras) Absorción de la capa intermedia Luz reflejada detectada Luz reflejada

Rango focal

Capa reflectora (atras)

Absorción de la capa intermedia Luz reflejada detectada Luz reflejada inefectiva Luz que incide
Absorción de la
capa intermedia
Luz reflejada
detectada
Luz reflejada
inefectiva
Luz que incide

Capa translúcida (Frente)

inefectiva Luz que incide Capa translúcida (Frente) Reproducción en el lado de la película translúcida

Reproducción en el lado de la película translúcida

(Frente) Reproducción en el lado de la película translúcida Reproducción en el lado de la película

Reproducción en el lado de la película reflectora

Figura 2.7. Estado del haz de reproducción en un disco de doble capa

Para el tipo de disco de doble capa se tienen los métodos de grabación de “paso de pista paralela” o “paso de pista opuesta”, y su selección se deja a los propósitos del desarrollador de software. Vea la figura 2.8

Lectura final (2) (1) Lectura inicial Lectura final (2) Lectura inicial (1)
Lectura final
(2)
(1)
Lectura inicial
Lectura final
(2)
Lectura inicial
(1)

a. Paso de pista paralela

b. Paso de pista opuesta

Figura 2.8. Métodos de grabación de discos de doble capa

3. Estructura de los recuperadores ópticos

3.1 Tipos de recuperadores

El DVD debe tener un recuperador compatible con el de los CD; sin embargo, como se ha discutido antes en este documento, el DVD tiene un espesor de apenas la mitad del de un CD; así que la óptica no se podría enfocar, en caso de que el recuperador de un DVD se usara sin cambios en un CD. Por lo tanto, para asegurar la compatibi- lidad con el recuperador de un CD, la lente objetivo utilizada para DVD tiene una estructura distinta a la del recuperador de un CD o un LD.

3.1.1. Tipo de recuperador con lente dual (cambio de lente)

En un mismo recuperador se montan dos lentes objetivo: uno para usarse en DVD y otro para CD; pueden cambiarse para emplear la lente especial, dependiendo del disco insertado (DVD o CD). Ambas lentes se locali- zan en un chasis, el cual, para cambiar entre una y otra, se desliza accionado por bobinas e imanes.

0.6mm Lente DVD Imán de seguimiento Montura de la lente Lente CD Bobina de seguimiento
0.6mm
Lente DVD
Imán de seguimiento
Montura de la lente
Lente CD
Bobina de seguimiento
Lente CD
Lente DVD
(a) Durante la reproducción de un DVD
(Tracking)
Cambio de lente
Lente CD
1.2mm
Montura de la lente
Bobina de
seguimiento
Montura de la lente
Imán de seguimiento
Lente CD
Lente DVD
(b) Durante la reproducción de un CD

Figura 3.1. Recuperador tipo de lente dual

3.1.2 Recuperador de tipo de lente bifocal

Este recuperador utiliza una lente capaz de crear dos puntos de enfoque al mismo tiempo. Se añade un holograma en el centro de la lente bifocal, de modo que sólo la luz láser que pase a través del mismo pueda ser difractada. Entonces, la luz láser que pasa a través del holograma, y aquella que pasa por la porción normal de la lente, crearán dos puntos de enfoque; esto permite que se utilicen para dos tipos de discos, aunque tengan gruesos distintos. Vea la figura 3.2.

DVD CD Luz transmitida (luz de orden O) Luz difractora (luz de orden 1) Luz
DVD
CD
Luz transmitida
(luz de orden O)
Luz difractora
(luz de orden 1)
Luz láser
Luz láser
Holograma
Patrón holográfico
(b) Reproducción de CD
(a) Reproducción de DVD
Reproducción de DVD
Reproducción de CD
0.6mm
1.2mm
1.2mm
Luz transmisora
Luz difracada
Luz reflejada dell haz
para CD
Luz reflejada por el haz
para DVD
Fotodetector
Fotodetector
aCD
rea
eaar
DDV

Figura 3.2. Recuperador del tipo de lente bifocal

TEORIA Y SERVICIO ELECTRONICO

3-1-3 Recuperador de tipo de disparador de cristal líquido

El recuperador de tipo de disparador de cristal líquido tiene unos paneles pequeños de cristal líquido enfrente de la lente, los cuales actúan como disparador de la misma. El disparador se apaga (se abre) durante la reproduc- ción de un DVD, y se enciende (se cierra) durante la reproducción de un CD. Como la acción de encendido o apagado del disparador cambia el radio de apertura aparente de la lente, el diámetro de la huella de luz varía; con esto, la distancia focal también cambia. Vea la figura 3.3.

DVD CD Lente DVD Disparador de cristal líquido Luz láser Laser light (a) Reproducción DVD
DVD
CD
Lente DVD
Disparador
de cristal líquido
Luz láser
Laser light
(a) Reproducción DVD
(Disparador de cristal
líquido abierto)
(a) Reproducción CD
(Disparador de cristal líquido cerrado)

Figura 3.3. Recuperador de tipo de disparador de cristal líquido

TODO LO QUE NECESITA SABER SOBRE EL DVD

3.2 Enfoque y seguimiento

En los DVD se usa un recuperador de tipo de un solo haz, y no del tipo de tres haces (que es común en los CD). En los discos de doble capa, cuando la luz láser atraviesa la primera película para llegar hasta la segunda capa, o a la inversa (o sea, cuando la luz que se ha reflejado en la segunda capa pasa a través de la primera película), ocurre un fenómeno de reflexión irregular en la película transparente; y si se usara un recuperador de tipo de tres haces, la luz láser reflejada no llegaría a los fotodetectores.

3.2.1 Mecanismo de enfoque

Fotodiodo Disco Lente ovjetivo Holograma
Fotodiodo
Disco
Lente ovjetivo
Holograma
Enfocado Holograma
Enfocado
Holograma

Lente objetivo muy cerrado del disco

Lente objetivo muy lejos del disco

Fotodiodo de 4 segmentos

Figura 3.4. Servomecanismo de enfoque basado en holograma

3.2.2 Mecanismo de seguimiento

Light spot Pit B)
Light spot
Pit
B)

A)

Las e r ligh t

Light spot Pit B) A) Las e r ligh t Pit A) La diferencia de fase
Light spot Pit B) A) Las e r ligh t Pit A) La diferencia de fase

Pit

A) La diferencia de fase entre la izquierda y la derecha del haz (la diferencia en la longitud de la parte óptica) es nula.

Posición de la huella

B) La diferencia de fase entre la izquierda y la derecha del haz es equivalente a la diferencia en la altura del pit.

Señal de seguimiento basada en la diferencia de fase

Figura 3.5. Servomecanismo de seguimiento basado en diferencia de fase

4. Compresión de video en movimiento, basada en MPEG2

4.1 Necesidad de la compresión de video en movimiento

Para el DVD-V, las frecuencias de muestreo están fijadas como sigue:

Señal de luminancia (Y): 13.50MHz

Señales de diferencia de color (Cb, Cr): 6.75MHz

Como estas señales están cuantizadas linealmente en 8 bits, la tasa de transmisión de datos es la siguiente:

(13.50M + 6.75M) x 8 bits = 162Mbps

Sin embargo, como la tasa de transmisión de datos debe reducirse a aproximadamente 1.4Mbps para almace- nar los datos en un CD de tipo normal, sólo alrededor de 34 segundos de video pueden ser grabados y reprodu- cidos en este medio. Para obtener una mayor capacidad de grabación de alrededor de 4.7GB (37.6Gbits), la distancia entre pistas y la longitud del pit se han reducido; pero aun y cuando se grabaran 162Mbps de datos intactos, sólo se podrían grabar alrededor de 4 minutos. Por eso se utiliza una tecnología de compresión compa- tible con MPEG2, para permitir la grabación de video de hasta 133 minutos; para ello se comprime la cantidad de datos en un rango de 30:1 hasta 80:1, dependiendo del tipo de video seleccionado.

4.2 ¿Qué es “MPEG2”?

MPEG, siglas en inglés de “Grupo de Expertos de Imágenes en Movimiento”, es el nombre de un grupo de expertos responsable de la estandarización. Ocasionalmente, MPEG también significa los estándares estableci- dos por este grupo. También, en forma colectiva, MPEG se refiere a los esquemas de codificación que fueron establecidos como un estándar internacional por la ISO/IEC, con el propósito de aplicarlo no sólo a medios de almacenamiento como el DVD o el CD de video, sino también para su transmisión al aire y para comunicaciones. En el DVD se emplea el esquema MPEG2, el cual incorpora toda la tecnología convencional de compresión de imágenes (vea la tabla 4.1).

H.261 Compresión de video en movimiento (para uso en teleconferencias)

de video en movimiento (para uso en teleconferencias) JPEG Compresión de imágenes congeladas (para uso de

JPEG Compresión de imágenes congeladas (para uso de FAX a color o cámaras)

MPEG1 Compresión de video en movimiento tipo CD-ROM (para uso en CD de video)

MPEG2 Mejora de la calidad de imagen, procesamiento multimedia (para uso de TV digital y DVD)

Tabla 4.1. Historia de la tecnología de compresión de imágenes.

4.3 Diferencias con MPEG1

La tecnología de compresión de video, que fue desarrollada para permitir una tasa de transmisión lo suficiente- mente baja para que un video equivalente al de televisión normal se reprodujera en una ventana de 325 puntos (horizontal) x 240 puntos (vertical) usando un reproductor de CD-ROM de velocidad normal, se denominó MPEG1. En tanto, la tecnología MPEG2 se desarrolló para la grabación y reproducción de video en movimiento de alta calidad a una resolución de 720 puntos (horizontal) x 480 puntos (vertical), lo cual se consiguió agregando las siguientes funciones principales:

• Procesamiento de video entrelazado (Predicción de campo y DCT de campo)

• Refuerzo del modo de predicción (Primera predicción dual)

• Funciones de escalabilidad (espacio, SNR y tiempo). Su descripción se omite en este documento, debido a que estas funciones no se utilizan en el DVD.

• Mejoramiento de la eficiencia de compresión de la información espacial (pasos de cuantización no lineal y rastreo alternado)

Las diferencias principales en el desempeño entre MPEG1 y MPEG2 se listan en tabla 4.2.

TODO LO QUE NECESITA SABER SOBRE EL DVD

MPEG-2 MPEG-1 (Para CD de video) (para DVD-V) Tasa de compresión de datos Aproximadamente 1/100
MPEG-2
MPEG-1
(Para CD de video)
(para DVD-V)
Tasa de compresión
de datos
Aproximadamente 1/100
Appr o x. 1/30
to 1/80
Tasa de transmisión
de datos
1.15 2 Mbp s (max.)
3
to 4 Mbps (ave.)
10 Mb ps (ma x.)
720
x 480 puntos
Resolución:
52 5/
6 0
352
x 240 puntos
(704 x 480)
720
x 576 puntos
62 5/5 0
352
x 288 puntos
(704 x 480)
entrelazado
Método de rastreo
No entrelazado
Tiempo máximo
de grabación
74 minutos
133 minutos
(Una cara, una capa)

Tabla 4.2. Comparación entre el desempeño del MPEG-1 y del MPEG-2

4.4 Perfiles y niveles de MPEG2

En el MPEG2, el concepto de “perfil y nivel” se emplea para asegurar la compatibilidad con varios tipos de medios. Como se especifica en la tabla 4.3, se han fijado hasta ahora 5 tipos de “perfiles” y 4 tipos de “niveles”. Los “perfiles” denotan una combinación de funciones permisibles para una posible aplicación, y los ”niveles” indican las capacidades de procesamiento de las funciones combinadas (calidad de servicio como la resolución). O sea que los “perfiles” y “niveles” se usan para realizar definiciones, de modo que cuando se use MPEG2 las funciones y la calidad de servicio sean combinadas apropiadamente para evitar la necesidad de asignar más funciones que aquellas que realmente se han requerido. Para el DVD, se emplea “MP@ML” (perfil principal/nivel principal).

Profile Sim ple Main S NR ∗ Spatial High ( H. pi xel x fram
Profile
Sim ple
Main
S
NR ∗
Spatial
High
( H.
pi
xel
x fram e freq uency)
Level
s x V. pi xel
s
(1 92 0x10 80 x30 or
1920 x1152x2 5)
High
MP @HL
U.S. Dig ital
HDT V(A TV)
HP @HL
High-144 0
(144 0x1080 x30 or
1920 x1152x2 5)
MP@H14 40
SSP@h 1440
EC Digital
HD TV
HP@ H14
Main
(720 x480x29 .97 or
720x5 76x25)
SP@ML
Digital trans-
mission
/CA T V
MP@ML
DVD - / Di gital
sat ellite broad-
SNP@M P
HP@ ML
c
as t
Low
(3 52 x288 x29 .97)
SNP@L L
Comp on ent cod ing
4:2:0
4:2
:0
4:2:0
4
:2:0
Others
4 :2:0 a nd
4:2:2
Scalability
Non e
None
SNR
only
S pace and
SNR
Space and
SNR
Tabla 4.3. Perfiles y niveles de MPEG2

*SNR: Tasa de señal y ruido (aquí, significa que se usa la escalabilidad de SNR)

4.5 Codificación MPEG2

TEORIA Y SERVICIO ELECTRONICO

La compresión (codificación) de video en movimiento compatible con MPEG2 se describe enseguida.

A na log (Y , C b , C r ) v ide o s
A na log
(Y , C b , C r )
v ide
o s igna
ls
S am p ling
/Q uan t iz ing
(D iffe r e n t ia l )
DC T
(Q uan tiz ing s tep
con
tro
l) Re-
q u a nt
at
iz
io
n
(P ic tu re typ e c o n t ro l )
In ve rse
q uan t iza t ion
(I )( P
)
(R e a r B )
(Fro
n t/r
e a r B
)
In v e r s e D C T
Mem ory 1
Sy nth
e sizin
g
+
Mem ory 2
Enc o d ing co n tro
l
VL C
(P i c tu re t y p e i n f o r m a t i o n )
(DCT
co e ffic
ien t)
VL C
(Q uan tiz ing s tep in fo rm a tion )
(M o t ion ve c to r quan t it y )
Mu lt ip lexin
g
D a ta vo lum
e ch e ck
(A C e n c o d in g )
(E
S )
(Syn c informa
tio
n
)
(S ub -p ic tu re en cod
ing )
(E S )
(E S )
Sp li t t in
g
in to pa
c k
ts
S p litt ing in to pa ck ts
S p litt ing in to pa ck ts
(P E S )
(P E S )
(P E S )
(C u t t in g )
M u lt ip le x ing
E rro r co rre c t ion code
8 -16
conve rs io n
(E S )

Figura 4.1. Sistema de codificación de MPEG2

4.5.1 Muestreo y cuantización

Bajo MPEG2, el componente Y de la señal de luminancia y los componentes Cb y Cr de señal de diferencia de color son muestreados. Normalmente se asignan 8 bits por pixel en cada señal, para obtener una información de 24 bits en total; pero frecuentemente se reduce la información de crominancia, aprovechando que los seres humanos no son muy sensitivos a los colores. A un método de codificación que no reduzca ninguna información de crominancia, se le llama “codificación de componentes 4:4:4”; la codificación que reduce la información de crominancia a la mitad en dirección horizontal, se denomina “codificación de componentes 4:2:2”; y la codifica- ción que reduce la información de crominancia a la mitad tanto en dirección horizontal como en vertical, se llama “codificación de componentes 4:2:0”. Los métodos de codificación de componentes que acabamos de mencionar, se definen usando los perfiles de MPEG2; y en el DVD se aplica una codificación de componentes 4:2:2.

• Codificación de componentes 4:4:4

Como no hay reducción de información de crominancia, los componentes de señal Y, Cb y Cr se muestrean a

13.5MHz y se cuantizan en 8 bits.

• Codificación de componentes 4:2:2

Como la información de crominancia se reduce a la mitad en dirección horizontal, el componente de señal Y se

muestrea a 13.5MHz, y los componentes Cb y Cr a 6.7MHz (13.5MHz/2) Todos son cuantizados a 8 bits. Este método de codificación es llamado “4:2:2”, porque si decimos que la frecuencia de muestreo de Y es de 4, la de Cb y Cr sería de 2.

TODO LO QUE NECESITA SABER SOBRE EL DVD

• Codificación de componentes 4:2:0

Este método de codificación se emplea en el DVD. Aunque la reducción de la información de crominancia horizontal es la misma que en la codificación de componentes 4:2:2, ni Cb ni Cr se muestrean en cada rastreo; esto se hace para reducir a la mitad la información de crominancia vertical. Esto es, la cantidad de información correspondiente a las señales de diferencia de color se reduce a 1/4 compa- rada con la señal de luminancia. Pero cuando se ve cada línea, la tasa entre las tres señales en términos de que la cantidad de información se alterna entre 4:2:0 y 4:0:2. Normalmente, este método de codificación se llama “4:2:0”.

Campoimpar Campo par Líneas de rastreo 2 Número de lineas rastreadas 4 1 6 3
Campoimpar
Campo par
Líneas de
rastreo
2
Número de
lineas rastreadas
4
1
6
3
0.074µsec
8
5
7
: Posición de la muestra
de la señal Y
1/60sec
: Posición de la muestra
de la señal de diferencia
de color

Figura 4.2 Codificación de componentes 4:2:0

(1) Formato de nivel principal Como se mencionó al principio de esta sección (4.4), en el DVD se emplea “MP@ML” (perfil principal/nivel principal). Este “nivel principal” fija el formato de la pantalla para su codificación.

(Definición de las líneas totales)

El número de líneas menos el equivalente al periodo de borrado vertical es como sigue:

NTSC: 525 – 38 = 487 líneas

PAL: 625 – 50 = 575 líneas

Sin embargo, como se debe considerar la compatibilidad entre NTSC y PAL, el número de líneas se define como de 480 para NTSC y de 576 para PAL, de modo que la siguiente expresión se mantenga:

NTSC (líneas totales por total de cuadros) = PAL (líneas totales por total de cuadros).

(Definición de los pixeles horizontales totales)

Para asegurar la compatibilidad entre NTSC y PAL, el número de pixeles horizontales también se define como

sigue, de acuerdo con las líneas de NTSC/PAL:

(480 + 576)/2 x 4/3 = 704 pixeles

TEORIA Y SERVICIO ELECTRONICO

(MB: macro-bloque)

Al igual que MPEG1, MPEG2 también divide un cuadro en porciones de 16x16 pixeles, llamados MB (macro bloques). Estos bloques son la unidad fundamental de compresión. La figura 4.3 muestra el formato de un cuadro. Para NTSC, un cuadro tiene 44MB en dirección horizontal y 30MB en dirección vertical.

704p ixe ls 44M B s MB (1 6b y1 6p ix e ls )
704p ixe ls
44M
B s
MB (1 6b
y1
6p
ix e ls )
48 0 ( 576
) li ne
s
30 ( 36
) MB s

(): F or P AL o nly

Figura 4.3. Formato de un cuadro

Cada MB, que consiste en 16x16 pixeles, posteriormente se divide en sub-bloques de 8x8 pixeles. Estos sub- bloques se requieren para la operación del DCT, descrito más adelante en este documento. Como un pixel de imagen reúne un componente de luminancia y componentes de crominancia, los pixeles se dividen en señales de luminancia y señales de diferencia de color para formar un sub-bloque.

(Sub-bloque de señal de luminancia)

Cada MB, que consiste en 16x16 pixeles, se divide posteriormente en 4 sub-bloques de 8x8 pixeles.

(Sub-bloques de señal de diferencia de color)

Dado que se emplea una codificación de componentes de 4:2:0, como ya se mencionó antes en este documento, cada MB de 16x16 pixeles se divide posteriormente tanto en dirección horizontal como en vertical para formar 8x8 pixeles. Entonces, la cantidad de infor- mación de crominancia se reduce a 1/4 comparada con la de la señal de luminancia; y como resultado, se crean 4 sub-bloques de señal de luminancia y 2 sub-bloques de señal de diferencia de co- lor para cada MB. Vea la figura 4.5

16 /2

16 /2 : Información de crominancia
16 /2
: Información de
crominancia

Figura 4.4. Entrelazado de la señal de crominancia

Sub-bloque de señal de luminancia

8 MB (Macro-bloque) Cr=R-Y Cr Y Cb Y 8 8 x4 16 8 Sub-bloque de
8
MB
(Macro-bloque)
Cr=R-Y
Cr
Y
Cb
Y
8
8 x4
16
8
Sub-bloque de señal
8
de diferencia de color
16
Cb=B-Y
8
Figura 4.5. Configuración de macro-bloques

TODO LO QUE NECESITA SABER SOBRE EL DVD

(2) DCT (Transformación de coseno discreto) [Compresión de información basada en la correlación de despliegue a despliegue (espacial)]

La figura 4.6 muestra un ejemplo de la curva de distribución de potencia de una señal de video. La señal de TV normal (señal NTSC) tiene componentes de frecuencia desde DC hasta aproximadamente 4.2MHz, y en la curva se puede ver que la mayor potencia está distribuida en las frecuencias bajas. La tecnología para la compresión de información em- pleando dicha característica de la señal de video es llamada DCT. Más específicamente, los pasos (a) y

(c)

se ejecutan en tal orden para realizar el DCT. El proceso de describe en este orden.

(dB) pAm udelit
(dB)
pAm
udelit

0

4M

Frecuencia (Hz)

Figura 4.6. Ejemplo de curva de distribución de potencia de señal de video

(a)

(b)

(c)

División de una imagen en sub-bloques de 8x8 pixeles (subdivisión de MB)

Convertir la información de cada sub-bloque dividiendo su frecuencia (proceso DCT)

Dividir los coeficientes post-conversión por un divisor (paso de cuantización), y redondear el resultado (recuantización)

(2-1) Subdivisión de MB Cada MB consiste en 16x16 pixeles, y es dividido en sub-bloques de 8x8 pixeles para pasar al proceso DCT (figura 4.7). Bajo MPEG2, las funciones DCT de campo se añaden a las imágenes entrelazadas que se van a procesar. La subdivisión de una imagen entrelazada desde un MB en sub-bloques, se consigue usando el método mostrado en la figura 4.7(b). La diferencia entre una imagen compensada en movimiento y la imagen de entrada también se dirige al proceso DCT. Cuatro sub-bloques de señal de luminancia y dos bloques de señal de diferen- cia de color son sujetos a operaciones aritméticas DCT.

 
8 8 8 A B A B 8 8 C D 8 C D MB
8
8
8
A
B
A
B
8
8
C
D
8
C
D
MB (16 x 16)

(a) Modo DCT de cuadro

8

 

Sub-bloque

Sub-bloque

 

x4

8

x4

 
 

Mitad izquierda de las líneas impares

 

Mitad derecha de las líneas impares

 
 

8

8

 

Sub-block

8 8
8
8

8

8 8 MB (16 x 16)
8
8
MB (16 x 16)

8

8

8

Sub-block

 

x4

Mitad izquierda de las líneas pares

Mitad derecha de las líneas pares

x4

Figura 4.7. DCT de cuadro y DCT de campo

TEORIA Y SERVICIO ELECTRONICO

(2-2) Proceso DCT Se puede considerar que las funciones del proceso DCT son como un filtro divisor de frecuencia para la imagen (señales análogas). Cuando se realiza el proceso DCT en un área cuadrada específica de una imagen, ésta puede disolverse en imágenes de alta frecuencia para expresar una resolución a partir de la imagen promedio de baja frecuencia dentro del área original. A este proceso DCT vertical/horizontal se le llama “DCT secundario”. El procedimiento DCT más específico se muestra más adelante.

1- Un sub-bloque de información de imagen puede disolverse en 64 (8) tipos de patrones, realizando el proce- so DCT. La figura 4.8 muestra la distribución de patrón de imagen de un sub-bloque, obtenida por la disolvencia DCT horizontal. Como el sub-bloque tiene 8 pixeles en dirección horizontal, se puede disolver en un máxi- mo de 8 tipos de componentes de frecuencia. La figura 4.8 indica que conforme el valor se vuelve más grande de 1 a 8, la frecuencia se incrementa.

Los ocho patrones obtenidos por una división posterior de cada uno de los patrones divididos en frecuencia en una dirección vertical, son los 8 por 8 patrones formados por la disolvencia DCT secundaria.

Más bajo Frecuencia horizontal Más alto 1 2 3 4 5 6 7 8
Más bajo
Frecuencia horizontal
Más alto
1
2
3
4
5
6
7
8

Figura 4.8. Patrón de disolvencia horizontal

2. La figura 4.9 es una curva de distribución de los coeficientes DCT, que han sido obtenidos del DCT secun- dario. Los coeficientes DCT denotan los niveles de disolvencia de los patrones (brillo y densidad de color). El coeficiente en el extremo superior izquierdo, denota el nivel promedio del sub-bloque; y todos los demás coeficientes denotan los cambios desde el nivel promedio. En otras palabras, el valor en el extremo supe- rior izquierdo es el valor de DC del despliegue, y los otros valores denotan niveles de frecuencia.

Más bajo Frecuencia horizontal Más alto 321 12 -4 1 1 0 0 0 -20
Más bajo
Frecuencia horizontal
Más alto
321
12
-4
1
1
0
0
0
-20
9
0
0
0
000
0
2
1
1
0
0
0
0
2
0
0
0
0
2
2
0
Más bajo
Frecuencia vertical
Más alto
0
0
0
1
0
0
0
0
1
2
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

Figura 4.9. Ejemplo de coeficientes DCT

Se debe notar aquí que cuando el proceso DCT se realiza, las muestras de datos se concentran en los componentes de baja frecuencia, para hacer a los componentes de alta frecuencia casi nulos.

TODO LO QUE NECESITA SABER SOBRE EL DVD

(2-3) Recuantización El proceso DCT es una transformación realizada sólo a coeficientes concentrados (niveles). Con este proceso por sí solo, sin embargo, la información no puede ser comprimida; para conseguirlo, se requiere de una recuantización, descrita más abajo. La figura 4.10 muestra un ejemplo de recuantización de los componentes de señal correspondientes a los coeficientes DCT. Primero, los coeficientes DCT se multiplican por un parámetro de cuantización predetermina- do, para minimizar los errores de cuantización; a continuación los componentes de alta frecuencia que corres- ponden a los coeficientes DCT pasan por un ajuste de nivel (LPF) para su recuantización, basado en la matriz de cuantización que ha sido determinada por sus componentes de frecuencia particulares. Con esto, la precisión de la cuantización DCT también puede ser cambiada.

Valor promedio

Espectro de fuente

Coeficientes DCT 320 333 317 321 DCT 12 -4 301 330 321 -20 9 0
Coeficientes
DCT
320
333
317
321
DCT
12 -4
301
330
321
-20
9 0
321
319
322
0 -2
1

La coeficiente DCT se multiplica por un parametrto de cuantización (en este ejemplo 4) para minimizar los errores de cuantización

Datos diferenciales del valor promedio

Cuantización: operación de divición basada en matrices de cuantización Espectro cuantizado 160 3 -1 (LPF)
Cuantización:
operación de divición
basada en matrices
de cuantización
Espectro cuantizado
160 3
-1
(LPF)
-5
0
2
00
0
Matriz de cuantización
8
16
19
Los datos determinados de
16
16
22
la distribución de potencia
de la señal (existen varias
matrices de cuantización)
19
22
26

Figura 4.10. Ejemplo de recuantización

Ejemplo: Los datos sombreados en esta figura 4.10 se muestran enseguida.

Espectro de la fuente

(301)

1) DCT 2) Cuantización Coeficiente DCT -20
1) DCT
2) Cuantización
Coeficiente DCT
-20

Matriz de cuantización

(16)

Espectro de cuantización

(-5)

1) 321 (valor promedio) – 301 (espectro de la fuente) = -20 (coeficiente DCT) 2) –20 x 4 (parámetro de cuantización)/16 (matriz de cuantización) = -5 (espectro de cuantización)

TEORIA Y SERVICIO ELECTRONICO

(2-4) Exploración en zigzag o exploración alternada Las exploraciones en zigzag se realizan en niveles de patrones cuantizados, a partir de componentes de más baja frecuencia a los de más alta frecuencia (en este orden). Vea la figura 4.11

Más bajo Frecuencia horizontal Más alto Más bajo Frecuencia horizontal Más alto 1 2 6
Más bajo Frecuencia horizontal
Más alto
Más bajo Frecuencia horizontal
Más alto
1
2
6
1
5
3
2
5
6
3
4
4
8
8
61
61
62
63
62
63
64
64
8
8
Más bajo Frecuencia vertical
Más alto
Más bajo Frecuencia vertical
Más alto

(a) Exploración en Zigzag

(b) Exploración alternada

Figura 4.11. Exploración en zigzag y exploración alternada

Codificación eficiente de ceros continuos

Cuando la codificación se va a iniciar desde los componentes de baja frecuencia (ceros continuos), el sistema funciona en la siguiente secuencia para mejorar la eficiencia del codificado:

1. Las señales de nivel “cero” en altas frecuencias se detectan desde el espectro cuantizado.

2. La longitud de la señal de nivel “cero”(longitud de carrera de ceros) y una señal de nivel “no-cero” (valor de nivel) se integran en un paquete.

3. Todos los “ceros” desde un nivel hasta el final se convierten en un código “fin-del-bloque” (EOB).

4. Finalmente, se asigna un código para el paquete mencionado arriba.

Ejemplo: suponga que como se muestra en la figura 4.12, se ha obtenido el espectro cuantizado . Los datos se agrupan en paquetes en el orden de exploración de zigzag, como sigue:

(0, 160), (1, -5), (2, -1)

EOB

Las longitudes de carrera cero agrupados y los números no-ceros se codifican asignando bits.

y los números no-ceros se codifican asignando bits. 160 0 -1 -5 0 0 0 0
160 0 -1 -5 0 0 0 0 0 Figura 4.12. Ejemplo de espectro cuantizado
160
0
-1
-5
0
0
0
0
0
Figura 4.12. Ejemplo de
espectro cuantizado

Como el estado de concentración de los coeficientes DCT puede diferir de acuerdo con la naturaleza particular del sub-bloque, se asignan más bits a los coeficientes que poseen una potencia más concentrada y menos bits a los coeficientes que tengan potencia menos concentrada. Entonces, la información puede comprimirse eficientemente.

TODO LO QUE NECESITA SABER SOBRE EL DVD

4.5.2 Codificación de longitud variable (VLC)

[compresión de información basada en las probabilidades de aparición de concentración de código]

La cuantización basada en el proceso DCT y sus correspondientes vectores de movimiento, obviamente difieren de la probabilidad de aparición de sus datos. Esta característica puede ser utilizada para reducir la información, asignando un código más corto a los datos con más alta probabilidad de aparecer y un código mayor para los datos con menores probabilidades. Este método se llama “codificación de longitud variable” (VLC), o codificación entrópica. La codificación de longitud variable comprime la información combinando los códigos de Haffmann y de longi- tud de carrera. Este método de combinación es una de las técnicas de compresión de información en donde se utiliza la probabilidad de aparición de un dato.

(1) ¿Qué es la codificación de longitud variable?

Suponga que por ejemplo tenemos una línea de números decimales “0, 1, 2, 3”. Cuando se convierten en

binarios, esta línea de datos se convierte en “00, 01, 10, 11” y su longitud de código promedio es de 2 bits.

A

esta longitud de bits se le llama “codificación de longitud fija”.

Si

la frecuencia a la que se usan los códigos de arriba (esto es, su probabilidad de aparición) es más alta en

secciones específicas, entonces, como se muestra en la tabla 4.4, los números decimales “0”, “1”, “2”, “3”, etc. al ser convertidos en su equivalente binario, se codifican como: “0”, “10”, “110”, “111”, etc. respectiva- mente. Este método es una codificación de longitud variable.

Número decimal

Probabilidad de aparición

Código

Longitud de código

0

0

.6

0

1

1

0

.2

10

2

2

0

.1

110

3

3

0

.1

111

3

Tabla 4.4. Probabilidades de aparición y código de longitud variable de los datos fuente

Si, como se muestra en la tabla 4.4, las probabilidades de aparición de los datos fuente son mayores en secciones específicas, la cantidad de información para obtener la codificación de longitud variable puede calcu- larse como sigue:

Longitud promedio del código = (0.6 x 1) + (0.2 x 2) + (0.1 x 3) + (0.1 x 3) = 1.6 bits

Y el volumen de datos puede ser reducido gracias a la codificación de longitud variable.

4.5.3 Bloque de compensación de movimiento

TEORIA Y SERVICIO ELECTRONICO

[compresión de información basada en la correlación de pantalla a pantalla]

(1) Concepto de codificación predictiva

Una imagen de televisión o video consiste en 30 cuadros por segundo (NTSC); mas cuando se comparan los cuadros adyacentes, la mayoría de ellos en realidad contienen la misma imagen. Por lo tanto, sólo los cambios entre los cuadros (secciones diferenciales) serán grabados para cada uno de ellos y todas las demás secciones libres de cambios se grabarán una sola vez. Estas secciones sin cambio, luego se combi- nan con las secciones diferenciales para reproducir la imagen original. Entonces, la cantidad de información que debe grabarse se reduce significativamente. A la predicción de la imagen actual a partir de una imagen previa y a la codificación de sus diferencias, se les llama “codificación predictiva” (figura 4.13).

En el MPEG real se adopta una codificación predictiva bidireccional, en la que la imagen actual se predice con base en las imágenes previas y posteriores. Este método de codificación se describe más adelante.

A B A- B
A
B
A- B

Normalmente, las secciones A y B se graban al mismo tiempo; pero en realidad, como am-

bas tienen mucho en común, su diferencia da como resultado A-B. Durante la reproducción, esta sección (A-B) se combina con A para producir B. Esto hace innecesario grabar la mayor parte de B, esto es, la montaña que se ve en la figura.

Figura 4.13. Codificación predictiva

(2) Concepto de compensación de movimiento

Cuando sólo cambia la posición de un objeto dentro de una imagen en el tiempo, los datos del objeto se usan tal cual, y únicamente se transmiten las cantidades de su cambio (vectores de movimiento). Este método permite que la imagen original sea reproducida (decodificada) con menos datos. Este método se llama “compensación de movimiento”, y se puede combinar con la codificación predictiva, descrita antes, para conseguir una compresión de datos eficiente.

Cuadro previo Cuadro actual P osición en el cuadro actual V ector de movimiento P
Cuadro previo Cuadro actual P osición en el cuadro actual V ector de movimiento P
Cuadro previo Cuadro actual P osición en el cuadro actual V ector de movimiento P

Cuadro previo

Cuadro actual

Posición en el cuadro actual

Vector de movimiento

Posición en el cuadro previo

Durante el proceso real, una pantalla se di- vide en bloques y, como un “vector de mo- vimiento” para su codificación, se calcula qué tanto se ha movido y en qué dirección, la sección que se está procesando.

Figura 4.14. Compensación de movimiento

TODO LO QUE NECESITA SABER SOBRE EL DVD

(3)Concepto de predicción bidireccional

La compensación de movimiento descrita anteriormente (predicción basada en vectores de movimiento), da la información que indica la cantidad de cambio en la pantalla actual a partir de la pantalla anterior. Sin embargo, bajo MPEG1 y MPEG2 también se proporciona la información que denota la cantidad de cambio para la pantalla futura, a fin de mejorar la precisión. A esto se le llama “predicción bidireccional”. La estructura del grupo de imágenes (GOP) que consiste en fotos I, fotos P y fotos B, se toma para implementar la predicción bidireccional.

Despliegue pasado Despliegue actual Despliegue futuro El despliegue actual se predice de despliegues pasados y
Despliegue pasado
Despliegue actual
Despliegue futuro
El despliegue actual se predice
de despliegues pasados y futuros
Despliegue actual predicho

Figura 4.15. Predicción bidireccional

(4) Estructura GOP

Bajo MPEG, las imágenes se manejan como una unidad “foto”. En MPEG1, una foto se maneja como un cuadro; y en MPEG2, puede manejarse como un campo en su lugar (la primera se llama “estructura de cuadros”, y la segunda “estructura de campos”). Como se lista en la tabla 4.5, MPEG proporciona tres tipos de fotos para conseguir la codificación predictiva que se usa en la compresión de movimiento.

Tipo de imagen

Descripción

Fotos I (también llamados “cuadros I” en la estructura de cuadros, o “campos I” en la estructura de campos)

- Significa “foto codificada internamente”. Se usan pantallas que se codifican usando sólo su información, y que se crean sin predicción bidireccional.

- Por lo menos una de estas fotos se incluye en un GOP, para permitir el acceso aleatorio

 

- Los efectos de compresión se producen por DCT

Fotos P (también llamados “cuadros P” en la estructura de cuadros, o “campos P” en la estructura de campos)

- Significa “Foto codificada predictivamente”

- Las pantallas se crean prediciendo las fotos I ó P decodificadas recientemente.

- Se requiere de por lo menos un cuadro de memoria

- El volumen de datos es de ˚ ó 1/3 del de una foto

- Los efectos de compresión se producen por predicción directa/inversa

Fotos B (también llamados “cuadros B” en la estructura de cuadros, o “campos B” en la estructura de campos)

- Significa “foto en codificación predictiva bidireccional”

- Las pantallas se obtienen de predicciones bidireccionales

- Una pantalla se crea a partir de 4 fotos I ó P decodificadas recientemente (dos pasadas y dos futuras).

- El volumen de datos es de 1/5 ó 1/6 del de una imagen

 

- Los efectos de compresión se producen por predicción bidireccional.

Tabla 4.5. Fotos

TEORIA Y SERVICIO ELECTRONICO

Una gran parte de la imagen se crea prediciendo las pantallas inmediatamente posteriores y anteriores; así que la información completa no puede ser obtenida con una foto por sí sola. Para crear la información completa, se deben combinar muchas imágenes. A la estructura resultante se le llama “estructura GOP” (grupo de imágenes). El GOP normalmente consta de alrededor de 15 imágenes; por lo menos una de ellas es una foto I que contiene información completa, lo que permite el acceso aleatorio. El GOP debe incluir una foto I antes de que la pantalla que se desee pueda ser llamada en un acceso aleatorio (figura 4.16).

S/H ∗ GOP S / H GOP S / H GOP DAT A DATA DATA
S/H ∗
GOP
S / H
GOP
S / H
GOP
DAT A
DATA
DATA
Fin de
secuencia
Pict.1
Pict.2
Pict.3
Pict.N
∗:S / H =
DATA
DATA
DATA
DATA
Encabezado de
secuencia
Se asigna un tipo I,P,B, a cada foto
Un GOP incluye por lo menos una foto I para permitir que
otras fotos se reproduscan en ella
Ejemplo de la estructura de tipos de fotos en GOP N=15 M=3 M=3 BB I
Ejemplo de la estructura de tipos de fotos en GOP
N=15
M=3
M=3
BB
I
B
B
P
B
B
P
B
B
P
B
B
P

Nota: El número de fotos en el GOP se identifica como “N“ y el periodo en el cual las fotos I ó P aparecen se llama “M“. En el ejemplo arriba, como el GOP consiste de 15 fotos, N es 15; y como el periodo de aparición de fotos I ó P es de 3, M es 3.

Figura 4.16. Datos GOP consistentes en imágenes

TODO LO QUE NECESITA SABER SOBRE EL DVD

(5) Predicción bidireccional para la estructura de cuadros

La cantidad de información puede comprimirse en el rango de 1/30 a 1/80 de su valor original, aplicando la

codificación predictiva bidireccional. Las pantallas comprimidas (cuadros) se explican enseguida; vea la figura 4.17.

1. Cuadros I La primera pantalla se comprime con un DCT, una recuantización y un VLC. Esta pantalla puede ser creada incluso con información de las pantallas previas o posteriores. La información se comprime en el rango de 1/ 10 a 1/20 por el DCT y la recuantización, y en un rango de 2/3 a 1/2 por el VLC.

2. Cuadros B La segunda pantalla se crea con la información diferencial promedio entre la primera y la tercera pantalla. La información se comprime a 1/2 por la compensación de movimiento, y en un rango de 2/3 a 1/2 por el VLC.

3. Cuadros P La tercera pantalla se crea con la información diferencial relativa a la primera pantalla. Como sucede con la segunda pantalla mencionada arriba, la tercera pantalla tiene su información comprimida a 1/2 por la compen- sación de movimiento, y en un rango de 2/3 a 1/2 por el VLC.

F B i d i r ec t i ona ll y DC T -
F
B
i d i r ec t i ona ll y
DC T -
p r o ed r w i c a ti r d v e -
p
r ed i ct i v e
ba
s ed
c
o m p re ssi on
c
o m p r e ss i on
c o m
p re ss i on
1/ 6 0 s e c
Thi s di spl a y can
be crea ted fro m
1/ 30sec
the fr a me be fo
las t .
re
(3r d di spl ay)
1/ 3 0 s e c
Th
is
di s p
la
y ca
n
P - f r a m e
B - f r a m e
I - f r a m e
be cr e at e d f r o m
3 r dd i sp
la y
t
he aver age
(2nd di spl ay)
dif f er e nt i al
i nf or m at i o n b et w e e n
Half di spl ay
2nd
di s pl a y
t
he pre
v io
s frame
u
(e v e n lin
e
s on
ly
)
an
d the ne x t fra
m
e .
( 1st di s pl a y)
Half di spl ay
(odd li nes onl y)
be cr eat ed wi t hou
Th
is
di s p
la
y ca
n
1st di s pl ay
pr evi o us or ne xt
t
Fi el d s t r u c ur e
Fr a me s t r u c t ur e
Tr ansf or med
di
s pl a y i nf or m at i o n

Figura 4.17. Predicción bidireccional en la estructura de cuadro en caso de que M=2.

(6) Predicción bidireccional en la estructura de campos

Como sucede con la estructura de cuadros, la estructura de campos tiene su información comprimida en el rango de 1/39 a 1/80 de su valor original. Las pantallas comprimidas (campos) se explican enseguida en el orden de su procesamiento (figura 4.18).

1. Campo I1 La primera pantalla se comprime con DCT, recuantización y VLC. Esta pantalla puede crearse incluso sin la información de pantallas previas o posteriores. La cantidad de información se comprime en el rango de 1/10 a 1/20 por el DCT y la recuantización, y en el rango de 2/3 a 1/2 por el VLC.

2. Campo P1 Este campo se crea a partir de las predicciones “hacia adelante”, basadas en el campo I1. La información diferencial entre la primera y segunda pantallas está contenida en el campo P1. La cantidad de información comprimida es de alrededor de 1/2 por la predicción hacia delante, y posteriormente se comprime en el rango de 2/3 a 1/2 por el VLC.

3. Campo P2 Este campo se crea con la predicción “hacia delante”, basada en los campos I1 y P1. La información diferen- cial entre la primera, segunda y tercera pantallas está contenida en el campo P2. La cantidad de información se comprime alrededor de 1/2 por la predicción hacia delante, y luego se vuelve a comprimir en el rango de 2/3 a 1/2 por el VLC.

TEORIA Y SERVICIO ELECTRONICO

4. Campo P3 Este campo se crea con la predicción “hacia delante”, basada en los campos P1 y P2. La información diferen- cial entre la segunda, quinta y sexta pantallas está contenida en el campo P3. La cantidad de información se comprime alrededor de 1/2 por la predicción hacia delante, y luego se vuelve a comprimir en el rango de 2/3 a 1/2 por el VLC.

5. Campo B1 Este campo se crea con las predicciones bidireccionales basadas en los campos I1, P1, P2 y P3. La informa- ción diferencial entre la primera, segunda, tercera, quinta y sexta pantallas está contenida en el campo B1. La cantidad de información se comprime alrededor de 1/2 por la predicción hacia delante, y luego se vuelve a comprimir en el rango de 2/3 a 1/2 por el VLC.

6. Campo B2 Este campo se crea con las predicciones bidireccionales basadas en los campos I1, P1, P2 y P3. La informa- ción diferencial entre la primera, segunda, cuarta, quinta y sexta pantallas está contenida en el campo B2. La cantidad de información se comprime alrededor de 1/2 por la predicción hacia delante, y luego se vuelve a comprimir en el rango de 2/3 a 1/2 por el VLC.

Antes de la compresión 1/60sec 1/60sec 6 o despliegue 5 o despliegue 4 o despliegue
Antes de la compresión
1/60sec
1/60sec
6 o despliegue
5 o despliegue
4 o despliegue
3 er despliegue
1 er despliegue
(medio despliegue,
solo líneas pares)
2 o despliegue
(medio despliegue,
solo líneas pares)
4)
3)
6 o despliegue
(solo líneas pares
6)
5)
5 o despliegue
(solo líneas impares)
Campo o P3
2)
6
despliegue
3 er despliegue
(solo líneas impares)
Campo P2
5 o despliegue
Campo B2
4 o despliegue
er Campo B1
3
despliegue
1 er despliegue
(solo líneas impares)
Campo I1
Campo P1
4 o despliegue
(solo líneas pares
2 o despliegue
(solo líneas pares
1 er
despliegue
2 o despliegue
Compresión
Despliegue de líneas pares
Despliegue de líneas impares
(no comprimidos)
(no comprimidos)

Figura 4.18. Predicción bidireccional para la estructura de campo

TODO LO QUE NECESITA SABER SOBRE EL DVD

(7) Modos de predicción

En la sección anterior se ha descrito la predicción bidireccional para las estructuras de cuadro y de campo. Se

tienen tres modos de predicción bidireccional: uno es la predicción de cuadro, otro es la predicción de campo y el último es la predicción de doble prima (que pertenece a la predicción de campo). Todas las pantallas predichas se crean en unidades de MB.

a. Modos de predicción en la estructura de cuadro La predicción de campo usa dos vectores de movimiento (MVs), y la predicción de cuadro sólo uno. En ambos modos la codificación predictiva se ejecuta en unidades MB. Vea las figuras 4.19a y 4.19b. La predicción de doble prima utiliza cuatro MV (figura 4.19c). La predicción de doble prima es un modo de predicción muy poderoso, que sólo puede usarse cuando M=1; es el nuevo modo adoptado por MPEG2.

usarse cuando M=1; es el nuevo modo adoptado por MPEG2. Vector de 16 Cambio de líneas
Vector de 16 Cambio de líneas movimiento 1 impares/pares (MV 1) 8 Vector de 16
Vector de
16
Cambio de líneas
movimiento 1
impares/pares
(MV 1)
8
Vector de
16
16
16 movimiento
Medio marco-bloque
de 16 x 8 líneas impares
obtenidas del vector MV 1
(MV)
16
16
16
Vector de
16
movimiento 2
Macro-bloque
Macro-bloque
(MV 2)
8
Medio marco-bloque
de 16 x 16 obtenido
del vector de movimientoMV
Medio marco-bloque
de 16 x 8 líneas impares
obtenidas del vector MV 2
(a) Predicción de campo
(b) Predicción de cuadro
Vector de
movimiento
16
MV4
(MV 1)
1/60sec
8
Valor promedio
MV3
Medio marco-bloque
de 16 x 8 líneas impares
obtenidas del vector MV 1
16
8
4 o Campo
(solo líneas pares)
Cambio de líneas
Vector de
movimiento
impares/pares
16
Medio
1/60sec
MV2
macro-bloque
8
(MV 2)
MV
de líneas
impares
16
2 o Cuadro
MV1
3 er Campo
(solo líneas impares)
1/30sec
Medio marco-bloque
de 16 x 8 líneas impares
obtenidas del vector MV 2
16
1/60sec
Vector de
movimiento
(MV 3)
16
8
Macro-bloque
Valor promedio
2 o Campo
(solo líneas pares)
Medio marco-bloque
de 16 x 8 líneas impares
obtenidas del vector MV 3
16
8
Vector de
movimiento
16
Medio
macro-bloque
(MV 4)
8
1 er Cuadro
de líneas
pares
1 er Campo
(solo líneas impares)
Medio marco-bloque
de 16 x 8 líneas impares
obtenidas del vector MV 4
MV: Vector de movimiento
Las predicciones se basan en los vectores MV1-MV4
(c) Predicción de doble prima
Figura 4.19. Tres modos de predicción para la estructura de cuadro

TEORIA Y SERVICIO ELECTRONICO

b. Modos de predicción en la estructura de campo En la figura 4.20 se da un vistazo operacional a cada modo de predicción. Nota: La predicción de cuadro no puede usarse en la estructura de campo.

16 16 16 Combinación de líneas impares/pares 8 Vector de movimiento (Solo MV 1 ó
16
16
16
Combinación de líneas
impares/pares
8
Vector de movimiento
(Solo MV 1 ó MV 2)
Vector de movimiento 1
16
16
(MV
1)
16
16
Macrobloque
16
(a) Predicción de campo parala estructura
8
Macrobloque
Vector de movimiento 2
(MV
2)
MV2
1/60seg
(b) Predicción de campo parala estructura de campo 16 x 8
MV1
3 er campo
(solo líneas impares)
16
Valor promedio
Vector de movimiento 1
16
(MV
1)
16
1/60seg
2 o campo
(solo líneas pares)
16
16
Macrobloque
Vector de movimiento 2
(MV 2)
16
tiempodenscursoTr

1 er campo (solo líneas impares)

Las predicciones se basan en MV 1 y MV 2.

(c) Predicción de doble prima

Figura 420. Modo de predicción para la estructura de campo

TODO LO QUE NECESITA SABER SOBRE EL DVD

4.5.4 Multiplexado y división de paquetes

La multiplexión de paquetes se usa para grabar los datos en el DVD. El multiplexado de paquetes se refiere a la división de los datos de audio en pequeños paquetes y a su posterior multiplexación; esto se hace añadiendo un encabezado de paquete que incluye detalles de información tales como los tipos de datos y el número de líneas. Un diagrama conceptual de la multiplexión de paquetes puede verse en la figura 4.21.

Paquetes Multiplexado V-4 Líneas de video V-5 V-3 Líneas deaudio (Hasta 8 unidades) A-4 A-1
Paquetes
Multiplexado
V-4
Líneas de video
V-5
V-3
Líneas deaudio
(Hasta 8 unidades)
A-4
A-1
S-2
V-3
V-1
A-2
Grabación en disco
A-3
Líneas de sub-titulos
(Hasta 32 unidades)
S-5
S-4
S -3

Cada línea de datos se divide en paquetes de tamaño fijo (división de paquetes)

Un encabezado de paquete, consistente en tipo de línea e información de base de tiempo, se graba en el disco ( multiplexado)

Figura 4.21. Concepto de multiplexión de paquetes

4.5.5 Tasa de transferencia variable

Cuando las imágenes se comprimen bajo los estándares MPEG2, se necesita una tasa de transferencia de alrededor de 6Mbps para obtener un nivel de calidad de imagen igual al de la televisión aérea; sin embargo, una escena donde un objeto se mueve rápidamente requiere de una tasa de transferencia mayor; y por el contrario, una imagen casi fija no requiere de una tasa de transferencia tan alta. Esto implica que cuando se usa un CD de video u otro medio convencional con tasa de transferencia fija, se puede tener video innecesario y/o video que no alcance todo su proceso. La tasa de transferencia para CD de video es de 1.15Mbps fija. En el DVD se usa un esquema de tasa de transferencia variable, donde los datos se graban a una tasa de transferencia correspondientes al volumen de datos en un momento particular. La tasa de transferencia promedio en esta caso es de 3.5Mbps, con un valor máximo de 9.8Mbps. Este esquema permite que la capacidad de grabación del disco se utilice al máximo.

Volumen de dato Tasa de transferencia fija Tasa de transferencia variable Tiempo No se puede
Volumen de dato
Tasa de transferencia fija
Tasa de transferencia variable
Tiempo
No se puede procesar
Volumén de datos
Volumen de dato
Tasa
fija
Tasa
variable
Tiempo
No necesario
Tiempo
Componente que ni es innecesario
ni imposible de procesar

Figura 4.22. Tasa de transferencia fija y tasa de transferencia variable

4.5.6 Codificación de corrección de error

TEORIA Y SERVICIO ELECTRONICO

Un método de codificación de producto Reed-Solomon (RS-PC) se ha adoptado para corregir los errores en el DVD. En comparación con el código Reed-Solomon entrelazado y cruzado (CIRC) que se emplea en los CD, el RS-PC posee una capacidad mejorada de corrección de errores y además reduce la redundancia de datos.

4.5.7 Modulación 8-16

Se ha adoptado el método EFM-plus (modulación 8-16) para la grabación de datos en el disco DVD. Al igual que en el método EFM (modulación 8-14) usado en los CD, la modulación 8-16 se realiza para incrementar la canti- dad de datos que pueden ser grabados en una pista. Comparado con el método EFM (modulación 8-14), el EFM-plus (modulación 8-16) mejora la densidad de grabación en alrededor de 6%. La razón es que en el método EFM de los CD se necesitan 3 bits de enlace, lo que hace un total de 17 bits; mientras, en EFM-plus estos bits de enlace no son necesarios.

4.6 Estructura de datos de MPEG2

Como sucede en el MPEG1, los datos de imagen de MPEG2 tienen una estructura de 6 capas, incluyendo una capa de secuencia y una capa de bloque (figura 4.23). Una pantalla de datos se comprime dividiéndola en rebanadas, y luego subdividiendo cada rebanada en macro-bloques o bloques. La pantalla posee fotos I, B y P, las cuales se combinan en una capa GOP.

1) Capa de secuencia SH GOP SH GOP SH GOP SH GOP 2) Capa GOP
1) Capa de secuencia
SH
GOP
SH
GOP
SH
GOP
SH
GOP
2) Capa GOP
I
B
B ∼∼∼∼∼∼∼∼∼∼∼∼
B P
P B
B P
3) Capa de imágen
4) Capa rebanada
MB
MB
MB
MB
MB
MB
MBMB
MB
∼∼∼∼∼∼∼
5) Capa de macrobloque
Cr
Cb
Y
6) Capa de bloque
8
8
8

Figura 4.23. Estructura de datos de MPEG2

*SH: En la figura de arriba, SH es la abreviatura en inglés de “encabezado de secuencia”. El SH contiene informa- ción específica sobre el formato de pantalla y otros factores. Los puntos principales especificados por el SH se muestran a continuación.

Punto principal (abreviatura)

Largo en bits

Punto principal (abreviatura)

Largo en bits

Código de encabezado de secuencia (SHC)

32 bits

Tasa de bits (BRV)

18 bits

Ta maños vertical/horizontal (HSV/VSV)

12 bits cada uno

Tasa de cuadros (FRC)

4

bits

Razón de aspecto (ARI)

4 bits

Perfil/nivel (PALI)

8

bits

TODO LO QUE NECESITA SABER SOBRE EL DVD

4.7 Sincronización de video y audio

Se deben comprender los siguientes dos puntos cuando se sincronicen el audio y el video en MPEG2:

1. Adicionar información de temporización, a fin de decodificar/reproducir a las unidades de acceso para el audio y el video. Esta información se llama “estampas de tiempo”. Nota: Aquí, las unidades de acceso se refieren a las unidades de decodificación y reproducción; en el caso del video, esto significa una imagen; y en el caso del audio, un cuadro de imagen.

2. La información llamada SCR se vuelve la base de tiempo para las estampas de tiempo. En la figura 4.24 se muestra un diagrama esquemático de los decodificadores de referencia para MPEG2.

Data

stream

Picture delay memory STD Video butter decoder Audio STD butter decoder System decoder STC
Picture
delay
memory
STD
Video
butter
decoder
Audio
STD
butter
decoder
System
decoder
STC

Video output

Audio output

*STD (Decodificador de objetivo de sistema) Esta unidad toma tan sólo los datos indicados de la línea consistente en audio y video. *STC (reloj de tiempo de sistema) El sistema MPEG2 posee un reloj de referencia en el extremo transmisor y otro en el extremo receptor del sistema, los cuales deben sincronizarse. El lado transmisor multiplexa al SCR (descrito más adelante en esta sección) dentro de la línea; y transmite el SCR hacia el lado receptor, para enviar las señales de reloj codificadas. El lado receptor debe crear la referencia correspondiente al SCR, y la referencia se llama “reloj de tiempo del sistema”. *Codificador de sistema Esta unidad sincroniza el audio y el video, controlando la lectura de los datos decodificados de los seguidores mientras se comparan los PTS/DTS de audio y video (descritos más adelante) con el STC.

Figura 4.24. Diagrama esquemático de los decodificadores de referencia de MPEG2.

4.7.1 Estampas de tiempo

Hay dos tipos de estampas de tiempo: PTS, que incluye la información de manejo de tiempo en la reproducción y salida; y DTS, la cual incluye la información de manejo de tiempo en la decodificación.

1) PTS (Estampa de tiempo de presentación)

Cuando el STC, que actúa como una referencia para el sistema MPEG2, coincide con el PTS, la unidad de

acceso correspondiente es reproducida y expedida.

2) DTS (Estampa de tiempo de decodificación)

Como se describió antes en este documento, el sistema MPEG2 suministra tres tipos de fotos, las cuales difieren en el orden de decodificación y en el orden de reproducción y expedición. Por lo tanto, se añade un DTS como la información que indica el tiempo (orden) de decodificación. Si la información DTS y PTS son iguales, sólo se añadirá esta última.

4.7.2 SCR (referencia de reloj de sistema)

El SCR es la información usada para calibrar el STC, el cual actúa como la referencia en tiempo, o para fijar al STC en el valor deseado en el codificador dentro de la unidad de decodificación del sistema MPEG; éste incluye los decodificadores de audio y video. El SCR se envía en 6 bytes; y cuando llega el sexto byte, el STC se fija al valor del SCR. La frecuencia de reloj del sistema para el SCR/STC es de 27MHz.

5. Formato de los datos

Los discos especiales para la reproducción en DVD contienen datos comprimidos de video y de audio. Se asigna un número específico de bits basado en ciertas reglas para cada tipo de dato; ambos poseen una estructura de datos bloque por bloque. El formato de datos de los discos se muestra en la figura 5.1.

*1 Bloque ECC (código de corrección de error) = 16 sectores *1 sector = 26 cuadros (4,836 bytes) *1 cuadro = 188 bytes (datos: 172 bytes, PO: 10 bytes, SYNC: 4 bytes) *1 sector de datos (sector de datos de usuario) = 12 paquetes de datos (datos principales: 2,048 bytes, ID: 4 bytes, IDE: 2 bytes, CPR MAI: 6 bytes, EDC: 4 bytes)

ID: 4 bytes, IDE: 2 bytes, CPR MAI: 6 bytes, EDC: 4 bytes) 1ECC bl ock(
1ECC bl ock( 16 sectors) 12 13 14 15 0 1 2 3 45 6
1ECC bl ock( 16 sectors)
12 13 14 15
0
1
2
3
45
6
7
8
9 10 11 12 13 14 15
0
1
23
4 56
1sectors (26
frames
)
2fra m e s
24frames
PI
0
1
2
3
4
5
6
7
8
16
17 18
19
20 21
22
23
PI
0 1
SYNC
4
10
1fra m e
172 byt es
S
PO
Data
1fra m e
1fra m e
"Dat
a structur
e
"
(12
s ets of data: 2,064 byte s )
Dat a sect
or
0
12
34
5
6
7
8
9
A
B
4
2
6 b ytes
2048 b ytes
4
EDC
ID IDE CPR MAI
Main data
EDC ID IDE CPR MAI
Main
data
Figura 5.1. Formato de datos

En un DVD, un sector tiene 4,836 bytes de longitud y el tiempo de reproducción por sector es de 1/678 de segundo (alrededor de 1.48ms). La longitud del entrelazado para el ACIRC (corrección de errores) se crea sepa- rando los bloques ECC en uno, luego mezclando cada bloque de datos, y grabando éstos en el disco. La repro- ducción se consigue ordenando el estado mezclado de los datos de acuerdo con las reglas de grabación, y luego regresándolos a su forma original.

TODO LO QUE NECESITA SABER SOBRE EL DVD

5.1 Estructura de un sector de datos

Un sector de datos consiste en 2,064 bytes. A continuación se muestra en detalle:

*ID (datos de identificación)

4 bytes

*IED (ID del código de detección de error)

2 bytes

*CPRMAI (Información de manejo de derechos de autor)

6 bytes

*EDC (Código de corrección de error)

4 bytes

*Datos principales (datos de usuario)

2,048 bytes

1) ID (datos de identificación)

La ID consta de cuatro bytes, y contiene los datos que identifican el tipo de disco y el número de sector. Los datos de identificación se graban en la posición del primer byte, y los tres bytes restantes se asignan a los datos del número de sector. A continuación se muestra un desglose de los datos de identificación.

*Tipo de formato

Formato tipo CLV (disco de sólo lectura, disco grabable) o formato tipo zonificado (disco reescribible)

*Método de seguimiento *Razón de reflexión del disco

Seguimiento de pits e información de seguimiento de grupos Información de la razón de reflexión del disco. Este punto indica si la cantidad de reflexión excede un 40% de la salida total de potencia láser como referencia.

*Tipo de área

Información de identificación de área de disco. Este punto identifica si los datos pertenecen al área de datos, al área de lectura inicial, al área de lectura final o al área intermedia del disco

*Tipo de datos

Tipo de datos que están grabados. Datos para uso en reproducción o área de no-grabación.

*Posición de la capa

Identifica si los datos leídos están en la primera o en la segunda capa del disco.

2) IED (código de detección de error)

El IED es un código de identificación de error constituido por dos bytes. En la estructura de datos real, el IED no existe por sí solo; en su lugar, se incorpora como parte de la función de ID como datos auxiliares para corregir un posible error en el ID.

3) CPRMAI (Información de manejo de derechos de autor)

El CPRMAI son datos cuya intención es evitar la violación de los derechos de autor, y tiene 6 bytes de datos en un sector de datos. Estos datos normalmente se graban en el área de lectura inicial y en las áreas de datos de audio / video del disco; no se graban en su porción central o en el área de lectura final. De los 6 bytes, sólo se reservan dos para el área de lectura inicial y uno para las áreas de datos de video / audio; los bytes restantes no se usan en la actualidad.

*Area de lectura inicial

*Area de datos de video / audio

1 byte para validar/invalidar la modificación de derechos de autor 1 byte para el código de área de disco

1 byte para validar/invalidar la modificación de derechos de autor

4) EDC (Código de detección de errores)

El EDC es un código de detección de errores en un sector de datos, y consiste en cuatro bytes. Este código se da al final de un sector de datos.

6. DVD de audio

TEORIA Y SERVICIO ELECTRONICO

Tres tipos de sistemas de audio se proporcionan para el DVD: Dolby digital (AC-3), audio
Tres tipos de sistemas de audio se proporcionan para el DVD: Dolby digital (AC-3), audio MPEG2 y PCM lineal.
Como se ve en la tabla 6.1, la forma en que estos sistemas de audio serán usados difiere entre NTSC y PAL.
La selección de un sistema de audio dentro del rango de los tres propuestos se deja a elección del creador del
software.
NTSC (525/60)
PAL (625(50)
Obligado
Ambos (Dolby digital AC-3 y PCM
lineal) o cualquiera de ellos
Ambos (Audio MPEG2 y PCM lineal)
o cualquiera de ellos
Opcional
Audio MPEG2
Dolby digital AC-3

Tabla 6.1. Sistemas de audio

6-1 Dolby digital (AC-3)

El sistema de Dolby digital (AC-3*) se monta en el DVD-V y en los reproductores de LD, como un sistema de sonido estereofónico capaz de reproducir escenas vívidas cercanas a la realidad. El sistema AC-3 es un sistema de 6 canales, consistente en 5 canales convencionales tipo Dolby Pro-Logic (canales L, R, estéreo x 2 y central), y 1 canal LFE para sonidos de muy baja frecuencia. Pero de modo general a este sistema se le llama “sistema de 5.1 canales”, debido a que el canal de muy baja frecuencia se maneja como si fuera 0.1 canal. A continuación se ve un diagrama a bloques del sistema AC-3. *AC-3: Codificación de audio No. 3 *LFE: Efecto de baja frecuencia

DIG ITAL AC-3 AC-3 CROSSO VER DSP IC 6-C H D/ A DETECTOR DI GITAL
DIG
ITAL
AC-3
AC-3
CROSSO
VER
DSP IC
6-C H
D/ A
DETECTOR
DI GITAL
I/ F
I/F
BITST REAM
SEL ECT OR
VOLU M E
BALA NCE
DECODER
FILT ERS
CONVERT
OR
CONT RO LS
2Ch STERE
O/
D/ A
6-2ch
PRO
LOGIC
CONV E RTO R
CONV E RTO R
AM P
CIRCUIT
CIRCUIT
USER
SYST E M
CO NTRO LS
CO NT R O L L ER
ANALOG
OUT
AV AMP (A C-3 DECODER)
DVD PLA YE R

Figura 6.1. Diagrama a bloques del sistema AC-3

Por lo general, el circuito decodificador AC-3 no se monta en los reproductores de DVD; lo usual es montar un amplificador que sí tenga el decodificador AC-3, en combinación con el reproductor de DVD, para obtener este efecto de sonido estereofónico (nuestro modelo XD-DV500 sí tiene un decodificador AC-3).

(Características del sistema AC-3)

1. Como cada uno de los datos de los 6 canales de audio estéreo se graba en medios independientes, la separa- ción de canales es estructuralmente infinita. Esto hace posible la reproducción de escenas vívidas cercanas a la realidad, para orientar la imagen exactamente como lo desea el creador del software, y reproducir el movi- miento del sonido en alta fidelidad (figura 6.2).

TODO LO QUE NECESITA SABER SOBRE EL DVD

Sistema de sonido Dolby (AC-3) de 5.1 canales

Sistema de audio Dolby pro-logic convencional

Bocina frontal (Canal L) Bocina central Bocina frontal (Canal R) Bocina frontal (Izquierda) Bocina central
Bocina frontal
(Canal L)
Bocina central
Bocina frontal
(Canal R)
Bocina frontal
(Izquierda)
Bocina central
Bocina frontal
(derecha)
Sub-woofer
(m ax:120Hz)
Bocina trasera (canal L)
Bocina trasera (canal R)
Bocina trasera (monoactual)
Bocina trasera (monoactual)

Se obtiene una alta calidad de sonido en banda

completa (3Hz-20KHz) con audio estereofónico

El audio estereofónico es monoaural, y los tonos agudos solo se obtienen hasta 7 KHz

Figura 6.2. Efectos de sonido estéreo en AC-3

2. La reproducción es posible con una salida de sonido estéreo a frecuencias de 20KHz o más (en el caso de sistemas convencionales, hasta 7KHz)

3. Como no se genera sonido estéreo en su interior, el decodificador AC no requiere de circuitos tipo matriz o de retardo (algunos tipos específicos de amplificadores contienen un circuito de retardo para ajuste fino).

4. Los 6 canales de datos de señal se pueden convertir en señales Dolby Pro-Logic o en estéreo de 2 canales dentro del decodificador, permitiendo que incluso un sistema que no maneje el Dolby digital pueda reproducir los sonidos Dolby estéreo convencionales y/o los sonidos estéreo de 2 canales. Vea la siguiente descripción.

(Circuito AC-3/análogo en el DVD-V)

Este circuito puede conmutar la configuración de canales, independientemente de que el amplificador esté dise- ñado para AC-3 o para especificaciones de 2 canales estéreo o Dolby Pro-Logic estéreo. Como los 6 canales de datos de señal se graban de forma independiente, el software de tipo AC-3 permite que los sonidos AC-3 se reproduzcan sólo cuando el amplificador traiga montado un decodificador AC-3. Esto significa que las señales de los 6 canales se deben convertir en señales de 2 canales, antes de su salida. Por lo tanto, se incluye un circuito AC-3/análogo para realizar esta conversión a la salida. La composición básica del circuito se muestra enseguida.

6ch Ρ 2c h ANALOG D/ A OUT CO NV E RTO R CONVE R
6ch Ρ 2c h
ANALOG
D/ A
OUT
CO NV E RTO R
CONVE
R T OR
DIG ITAL
SIGNAL
DI G ITA
I/ F
L
DIG
ITA
L
AC- 3
DET ECTO R
OUT
CPU

Figura 6.3

TEORIA Y SERVICIO ELECTRONICO

Bajo las especificaciones del DVD, la conmutación del circuito AC-3/análogo se hace por la activación de un interruptor de función. Al mismo tiempo, como el circuito AC-3 no se requiere para la reproducción de un CD, el interruptor de función se cambia de forma automática al convertidor de 2 canales, independientemente de la posición del interruptor manual. El convertidor de 2 canales convierte las señales de 6 canales en señal de 2 canales, y a este proceso se le llama “mezcla reductiva”. Este proceso reproduce el sonido de 2 canales, a partir de los sonidos de los 6 canales independientes; para ello, mezcla las señales de sonido estéreo, central y de muy baja frecuencia con las seña- les de sonido L y R principales. Estas señales se combinan como sigue:

Canal L: Principal L, estéreo L, central y de muy baja frecuencia Canal R: Principal R, estéreo R, central y de muy baja frecuencia

Cuando las señales se mezclan en forma reductiva y sus sonidos respectivos se mezclan tal cual, la distorsión obtenida de sus diferencias de nivel y balance dará como resultado una muy baja calidad de audio. Por esta razón el circuito AC-3/análogo controla el nivel de mezcla en un rango desde 0 hasta 30dB, para obtener una conversión de sonido balanceada. Igualmente, la información de nivel de mezclado está incorporada en los datos del disco; basándose en ella, el circuito realiza dicha conversión.

6.2 Audio MPEG2

El sistema de audio MPEG2 se incluye con funciones añadidas necesarias para conseguir un audio digital de alta calidad, al tiempo que se mantiene una alta compatibilidad con el audio MPEG1. Aunque las especificaciones básicas y la operación del sistema de audio MPEG2 son muy similares a las del audio MPEG1, se le han añadido las siguientes 3 funciones:

Nota: Remítase a la Guía Técnica “CD de video” para mayores detalles sobre el audio MPEG.

1) Canales múltiples (MC) Se añaden 4 canales a los dos convencionales (L y R): C (central), LS (trasero izquierdo), RS (trasero dere- cho) y LFE (muy baja frecuencia), que ayudan a lograr la reproducción de sonido en modo 5.1. 2) Idioma múltiple (ML) Se proporciona un máximo de 7 canales para audio secundario, adicionales al audio de canales múltiples. 3) Baja frecuencia de muestreo (LSF) Se añaden las frecuencias de muestreo de 24KHz, 22.05KHz y 16KHz a las convencionales (32KHz, 44KHz y 48KHz), lo que permite una mejoría en el radio de compresión debido a la baja tasa de bits.

6.3 Audio PCM lineal

Para el DVD-V se ha adoptado el sistema de audio PCM lineal, el cual no requiere ninguna compresión de datos. Bajo este sistema, se dispone de 2 frecuencias de muestreo y 3 tipos de cantidades de bits de cuantización; todo esto puede combinarse libremente. Vea la tabla 6.2. La tasa de bits máxima utilizable para el audio PCM lineal, está limitada a 6.144Mbps por línea; y se puede grabar un máximo de 8 canales de audio multi-canal dentro de este límite.

*Tasa de bits por línea

Frecuencia de muestreo

Parámetro de cuantización

Cantidad máxima de canales utilizables (tasa de bits*)

 

16

bits

8

canales (6.144Mbps)

48KHz

20

bits

6

canales (5.760Mbps)

24

bits

5

canales (5.760Mbps)

 

16

bits

4

canales (6.144Mbps)

96KHz

20

bits

3

canales (5.760Mbps)

24

bits

2

canales (4.608Mbps)

Tabla 6.2 Especificaciones del audio PCM lineal

TODO LO QUE NECESITA SABER SOBRE EL DVD

7. Funciones del DVD-Video

7-1 Pantallas de menú

El sistema DVD proporciona dos tipos de pantallas de menú: una pantalla especifica las funciones del reproduc- tor de DVD, y la otra especifica y selecciona al detalle el contenido del software.

7-1-1 Pantalla de menú del reproductor de DVD (pantalla de configuración inicial)

La pantalla de menú del reproductor de DVD especifica la configuración inicial del reproductor. Esta pantalla fija el dispositivo de acuerdo con las conexiones con equipo externo; además, asigna las prioridades de idioma, selecciona los modos de audio, etc. Sin embargo, como la configuración de esta pantalla depende de los paque- tes de software en DVD, no refleja necesariamente la operación de reproducción. La figura 7.1 muestra la panta- lla de menú (pantalla de configuración inicial) del DX-DV500U, y su despliegue detallado.

Menú (japonés) Menú (inglés) - Idioma en pantalla: Selecciona el idioma del mensaje guía que

Menú (japonés)

Menú (inglés)

- Idioma en pantalla:

Selecciona el idioma del mensaje guía que se desplegará en la pantalla del televisor. Para este modelo, los mensajes pueden desplegarse en japonés o inglés.

- Aparato de TV al que se conecta Aquí se especifica la forma de la pantalla del televisor al que se conecta el equipo. Vea el apartado 7.5.

- Idioma para el audio Se pueden especificar las preferencias con respecto al idioma del audio deseado.

- Idioma del despliegue de frases cinemáticas sobrepuesto Se pueden especificar las preferencias acerca del idioma de las frases cinemáticas que serán desplegadas.

- Idioma del menú de disco Selecciona el idioma del menú almacenado en el disco.

- Bocinas conectadas Especifica el número y tipo de bocinas o de equipo de audio conectado. Con esto se optimiza el número de canales que se usará en la reproducción. Vea “Características del sistema AC-3” dentro del apartado 6.1.

- Restricciones de audio / video Selecciona el uso o no del control de bloqueo por parte de los padres. Vea el apartado 7-4.

- Salida digital Las señales de salida digital pueden fijarse a AC-3 ó PCM lineal.

Figura 7.1. Ejemplo de menú

TEORIA Y SERVICIO ELECTRONICO

7.1.2 Pantalla de menú de software del DVD

La pantalla del menú contenido en el paquete de software del DVD, permite al usuario seleccionar el video, el audio, la imagen secundaria, los datos de multi-ángulo, etc. de los títulos contenidos en el disco. El menú se compone como sigue: (vea la figura 7-2)

1. Menú de selección del título*

6. Menú raíz

6. Menú raíz

6. Menú raíz

6. Menú raíz

*El “título” es la unidad más grande de datos de video o música contenidos en un disco DVD. En un paquete de software normal, un título significa una parte del trabajo. Los datos dentro de un “título” se dividen en “capítulos”, “pistas”, “historias”, “escenas”, etc. El uso de los elementos de la composición se deja totalmente a los autores del paquete de software.

2. Menú de selección de capítulo* 3. Menú de selección de pista de audio 4.
2. Menú de selección de capítulo*
3. Menú de selección de pista
de audio
4. Menú de selección de pista
de sub-títulos
5. Menú de selección de ángulos
Figura 7.2. Composición de los menús.
Selección por
el usuario
Historia 1
Inicio
Historia 2
Historia 3
Selección por
el usuario
Historia 4
Selección por
el usuario

1:

Un título se selecciona durante una pausa en el disco, o dentro del “Auto Set Start” (inicio automático del equipo, discutido más tarde). Sin embargo, esta función sólo es válida cuando un disco contiene dos o más títulos.

2: a 5:

6:

Los menús dentro del título seleccionado se vuelven elegibles.

A un menú que permite la selección de menús desde el “2” hasta el “5” durante la operación de reproducción, se le llama “menú raíz”. Este menú se despliega llamando al menú durante la operación de reproducción.

Las funciones anteriores no son necesariamente requeridas en todo el software tipo DVD-V. El uso de los menús se deja completamente a los autores del software.

7.2 Función de historia múltiple

La función de historia múltiple permite al usuario seleccionar libremente la forma en que se van a desarrollar las historias grabadas previamente en el software del DVD. Esta selección es posible en el menú de título, del cual ya hablamos. Se deja completamente en manos del creador del software del DVD qué es lo que se dará en la función de historia múltiple, e incluso si la función se usará en realidad.

Figura 7.2. Diagrama conceptual de la función de historia múltiple

TODO LO QUE NECESITA SABER SOBRE EL DVD

7.3 Función de ángulo múltiple

La función de ángulo múltiple permite que el usuario seleccione de forma libre el ángulo de cámara entre varios que previamente han sido grabados en tiempo real. Se pueden grabar hasta 9 ángulos distintos de cámara. Esta función incluye una función de reproducción “sin costuras”*, lo que permite la reproducción sin interrupciones de video durante un cambio de ángulo. Se deja en manos del autor del software en DVD el número de ángulos que se usarán en el sistema de ángulos múltiples, o incluso si la función se usará o no.

Angulo 1

Angulo 3

Ang le 1 An g le 2 Ang le 4 Ang le 3
Ang le 1
An g le 2
Ang le 4
Ang
le 3

Angulo 2

Angulo 4

El usuario puede seleccionar cualquier ángulo entre aquellos que han sido grabados, y cambiar el modo para una reproducción “sin costuras”.

4
4

El software grabado con ángulos múltiples, normalmente está marcado con un número como el que se muestra a su izquierda. Este número indica el número de ángulos grabados.

Figura 7.3. Diagrama conceptual de la función de ángulo múltiple

7.4 Función de control paterno

La función de control paterno permite que un reproductor seleccione y reproduzca de forma automática el conte- nido de audio y video que sea permitido a la audiencia, de acuerdo con un nivel de control especificado por los padres. El reproductor compara los datos del nivel de control paterno contenido en el software con el nivel de control especificado por el usuario (el nivel superior que se permite reproducir), y reproduce el contenido adecua- do. Debido a que esta función es opcional, no necesariamente se incluye en todos los reproductores. La aplicación del control paterno depende de cada país. En Japón, los niveles se clasifican como se muestra en la figura 7-1 (niveles propuestos).

Nivel para padres

Clasificación

Restricciones

8

   

7

Clasificación X

No recomendable para menores de 18 años

6

   

5

   

4

Restringida

No recomendable para ado- lescentes o menores

3

   

2

   

1

General

Para todo público

TEORIA Y SERVICIO ELECTRONICO

Un reproductor de DVD reproduce el contenido de software, de acuerdo con el nivel de control paterno. El reproductor reproduce sólo las porciones permitidas, y se salta las porciones restringidas o las reemplaza con contenido alternativo. Esta función se prepara con una función de reproducción “sin costuras”, como se discutió antes. La figura 7.5 muestra un ejemplo de la operación del nivel de control paterno fijado a “3”.

Title 1 Level 4 (Restricted scene) a. Si el nivel de control paterno está registrado
Title 1 Level 4 (Restricted scene)

Title 1

Level 4

(Restricted scene)

Title 1 Level 4 (Restricted scene)

a. Si el nivel de control paterno está registrado por título:

— Toda la porción del título 1 queda restringida. Scene 1 Scene 2 Scene 3
— Toda la porción del título 1 queda restringida.
Scene 1
Scene 2
Scene 3
Scene 4
Scene 5
Level 1
Level 4
Level 4
Level 4
Level 1
(Restricted scene)

b. Si el nivel de control paterno está registrado para cada escena y se especifican escenas alternativas:

— Las escenas restringidas se reemplazan con escenas alternativas.

 
         
   
         
   
         

Scene 1

Scene 1’

 

Scene 2

Scene 2’

 

Scene 3

Level 4

 

Level 1

Level 4

 

Level 1

Level 4

(Restricted scene)

(Restricted scene)

(Restricted scene)

(Alternative scene)

(Alternative scene)

c. Si el nivel de control paterno está registrado para cada escena y no se especifican escenas alternativas:

— Las escenas restringidas de nivel 4 o superior son saltadas.

Figura 7.5. Función de restricción por control paterno (cuando el nivel de control paterno se fija en “3”).

7.5 Función de aspecto múltiple

Cuando se reproduce una pantalla de video 16:9 apretada (una pantalla de video 16:9 comprimida horizontal- mente en una pantalla 4:3) en un televisor con pantalla 4:3, esta última puede convertirse en una pantalla “letterboxed” o en una pantalla “pan-scan” (figura 7.6). La conversión puede especificarse con la pantalla de menú (pantalla de configuración inicial), que se discutió previamente.