Está en la página 1de 11

Gestión de Datos – UTN – F.R.M.

INTRODUCCION AL CD-ROM

Cátedra: Gestión de Datos


Profesor: Santiago Pérez
Año: 2006
Bibliografía:
Conceptos Fundamentales de Estructuras de Archivos. FOLK.
(Edición en Inglés)

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-1-
Gestión de Datos – UTN – F.R.M.

3.4. Introducción al CD-ROM.

CD-ROM es una abreviatura para “Compact Disk, Read Only Memory” (Disco
compacto, memoria de sólo lectura). Es un disco de audio que contiene datos
digitales más que sonido digital. El CD-ROM es comercialmente interesante porque
contiene muchos datos y puede ser reproducido a bajo costo. Un solo disco puede
contener más de 600 Mb de datos. Eso es aproximadamente 200.000 páginas
impresas, suficiente para almacenar 400 libros del tamaño de este. Las copias
pueden ser impresas de un disco maestro a casi un dólar por copia.

El CD-ROM es de sólo lectura (o, se escribe una sola vez) de la misma manera
que un CD de audio una vez que ha sido grabado no puede ser cambiado. Es un
medio publicitario usado para distribuir información a muchos usuarios, más que
almacén de datos y medio alternativo como los discos magnéticos. El CD-ROM se
ha transformado en el medio preferido para distribución de todo tipo de software y la
publicación de bases de datos de información como directorios telefónicos, códigos
postales e información demográfica. Además hay muchos productos en CD-ROM
que distribuyen datos textuales tales como índices bibliográficos, resúmenes,
diccionarios y enciclopedias, a menudo con imágenes digitalizadas almacenadas en
el disco. También son usados para publicar información en video y por supuesto,
audio digital.

3.4.1. Breve reseña del CD-ROM.

El CD-ROM es el descendiente de la tecnología de video-discos en las últimas


décadas de 1960 y 1970, antes del advenimiento de la video-casetera (VCR)
hogareña. El objetivo fue almacenar película en video. Diferentes compañías
desarrollaron numerosos métodos para almacenar señales de video, incluyendo el
uso de una aguja para responder mecánicamente a sendas en un disco, similar a
como lo hace el disco de vinilo. La industria de productos del consumidor gastó una
gran cantidad de dinero desarrollando diversas tecnologías, incluyendo distintos
enfoques de almacenamiento óptico; luego gastaron años peleando sobre cuál
enfoque debería convertirse en el estándar. El formato sobreviviente es uno llamado
LaserVision. Para el tiempo en que surgió LaserVision como un ganador, la
competencia no sólo había gastado grandes cantidades de dinero sino que habían
perdido grandes oportunidades de mercado. Estas duras lecciones se pusieron en
uso en el desarrollo subsiguiente del CD de audio y del CD-ROM.

En el medio había gran interés de utilizar los discos de LaserVision más que
para grabar películas. El formato de LaserVision soporta tanto grabar en Velocidad
Lineal Constante (CLV) maximizando la capacidad de almacenamiento como en el
formato de Velocidad Angular Constante que facilita un rápido rendimiento de
búsqueda. Utilizando el formato CAV el acceso rápido a formas individuales de
video, permitió que un número de organizaciones como el MIT MediaLab, produjera
un prototipo de video de discos interactivos que podían ser usados tanto para
enseñar como para entretener.

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-2-
Gestión de Datos – UTN – F.R.M.

A principios de 1980, un gran número de firmas comenzaron a buscar la


posibilidad de almacenar digitalmente, información textual en discos de LaserVision.
Los datos almacenados en LaserVision están en forma analógica, esto es,
almacenar señales de video análogas. Distintas firmas surgieron con diferentes
maneras de decodificar información digital de forma analógica para que pudiera ser
almacenada en el disco. Las habilidades demostraron en los prototipos distribuidos a
pequeña escala que los resultados fueron impresionantes. El disco de video tiene un
buen número de características de rendimiento que lo hacen técnicamente un medio
más deseable que el CD-ROM. En particular, se pueden construir dispositivos que
busquen más rápidamente y distribuyan información desde el disco a altas
velocidad. Perolas reminiscencias de las disputas anteriores sobre el formato físico
del videodisco, hizo que cada uno de los pioneros en el uso del disco LaserVision
como periférico de computadora tuviera esquemas de codificación y técnicas de
corrección de error incompatibles. No había un formato estándar y ninguna de las
firmas era lo suficientemente grande para imponer su formato sobre los otros en el
mercado. Los compradores potenciales estaban asustados por la falta de un
estándar y consecuentemente el mercado nunca creció.

Durante este mismo período, Sony y Phillips comenzaron a trabajar en una


forma de almacenar música en discos ópticos. Más que almacenar la música en la
forma analógica usada en los videodiscos, ellos desarrollaron un formato de datos
digital. Phillips y Sony habían aprendido duras lecciones en las costosas batallas por
la estandarización de los videodiscos. Esta vez ellos trabajaron con otros
reproductores en la industria de productos para el consumidor para desarrollar un
sistema de licencias que resultó en la emergencia del CD de audio ampliamente
aceptado, el formato estándar fue establecido tan pronto como los primeros discos y
reproductores fueron presentados. El CD de audio apareció en Estados Unidos a
principios de 1984. El CD-ROM que es un formato de datos digital fue construido
sobre el CD de audio estándar, surgiendo inmediatamente después. El primer
dispositivo de CD-ROM disponible comercialmente apareció en 1985.

No es sorprendente que las firmas que estaban tratando de distribuir datos


digitales en discos de LaserVision vieran en el CD-ROM una amenaza para su
existencia. Ellos reconocieron, de todos modos, que el CD-ROM prometía proveer lo
que ellos siempre habían evitado en el pasado un formato físico estándar. Cualquier
persona con un dispositivo de CD-ROM tenía garantizado que pudiera encontrar y
leer un sector en cualquier disco elaborado por cualquier firma. Como medio de
almacenamiento para ser usado en publicidad, la estandarización en este nivel
fundamental es esencial.

Lo que sucedió a continuación es destacable considerando la historia de la


estandarización y la cooperación entre industrias. Las firmas que habían estado
trabajando en distribuir datos de computadora reconocieron que un formato físico
estándar, como el provisto por el CD-ROM, no era suficiente. Un formato físico
estándar significaba que todo el mundo sería capaz de leer sectores en cualquier
parte del disco. Pero las aplicaciones de computadora no trabajan en términos de
sectores, ellos almacenan datos en archivos. Logrando un acuerdo acerca de
encontrar sectores, con futuros acuerdos acerca de cómo organizar sectores en
archivos era como llegar a un acuerdo en un alfabeto sin llegar a un acuerdo de

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-3-
Gestión de Datos – UTN – F.R.M.

cómo organizar las letras en las palabras de una página. Más adelante en 1985, las
firmas que emergieron de la industria de datos digitales y de videodiscos, todas
relativamente pequeñas, se juntaron junto a otras firmas más grandes para
adentrarse en la industria del CD-ROM y trabajar en un sistema de archivos
estándar que pudiera ser construido en base al formato del CD-ROM. En un extraño
despliegue de cooperación, las diferentes firmas, grandes y pequeñas, resolvieron
las principales características de un sistema de archivos estándar para el verano de
1986; ese trabajo se volvió un estándar oficial e internacional para organizar
archivos en CD-ROM.

La industria del CD-ROM es todavía joven, a pesar de que en el pasado a


comenzado a demostrar signos de madurez se está alejando de la concentración en
problemas como el formato de los discos acercándose más a las aplicaciones de
CD-ROM. Más que enfocarse en un medio aislado, los vendedores están viendo la
posibilidad de habilitar este mecanismo para nuevos sistemas. Mientras se
encuentren más usos en más amplias aplicaciones, el CD-ROM parece un medio de
publicidad de tecnología óptica que se quedará con nosotros por largo tiempo.

Los dispositivos de CD-ROM re-grabables hacen posible a los usuarios


almacenar información en CD. El costo del dispositivo y el costo de los CD grabables
vírgenes logran que esta tecnología sea muy atractiva para backups.
Desafortunadamente, mientras la velocidad de los lectores de CD ha aumentado
sustancialmente a 12X (12 veces la velocidad del CD de audio) como se logra con el
actual estándar, los grabadores de CD no trabajan más rápido que 2X, o sea, cerca
de 300 Kb por segundo.

La última nueva tecnología para el CD es el DVD, lo que significa Disco de


Video Digital o Disco Versátil Digital. La corporación Sony ha desarrollado DVD para
el mercado de video, especialmente para la televisión de alta definición, pero el DVD
también está disponible para almacenar archivos. La densidad de ambos, pistas y
bits, ha aumentado para producir un aumento en la capacidad de almacenamiento
de 7 veces más. El DVD también está disponible en un medio de 2 capas (sus 2
lados) que producen 10 Gb por disco.

3.4.2. El CD-ROM como un problema de estructura de archivos.

El CD-ROM presenta interesantes problemas en su estructura de archivos


porque es un medio con grandes fortalezas y debilidades. Las fortalezas del CD-
ROM incluyen su alta capacidad de almacenamiento, su bajo costo y su durabilidad.
La clave de su debilidad es el rendimiento de búsqueda en el CD-ROM es muy baja,
a menudo toma de medio segundo a un segundo por búsqueda. En la introducción
de este libro comparamos el acceso a memoria y el acceso al disco magnético y
mostramos que si el acceso a memoria es lo mismo a que te lleve 20 segundos
buscar algo en el índice de este libro, lo equivalente en el disco llevaría 58 días, o
casi 2 meses. Con el CD-ROM esta analogía es estira y el acceso al disco sería de
más de ¡2 años y medio! Este tipo de rendimiento, o la falta de él, hace que el diseño
de la estructura de archivos sea una cuestión crítica para las aplicaciones de CD. El
CD-ROM provee una prueba excelente de nuestra habilidad para integrar y adaptar
los principios que hemos desarrollado en los capítulos anteriores de este libro.

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-4-
Gestión de Datos – UTN – F.R.M.

3.5. Organización física del CD-ROM.

El CD-ROM es el hijo del CD de audio. En esta instancia, el impacto de la


herencia es fuerte, con aspectos tanto positivos como negativos. Comercialmente, el
parentesco con el CD de audio es completamente responsable de la viabilidad del
CD-ROM. Esto es porque el mercado del CD de audio es tan grande que hace
posible que estos discos sean de tan bajo costo. De la misma manera, los avances
en el diseño y la disminución en los costos para hacer un CD de audio afectan el
rendimiento y el precio de los dispositivos de CD-ROM. Otros medios de disco
ópticos sin los beneficios de este parentesco no han tenido experiencia en el éxito
comercial del CD-ROM.

De la misma manera, utilizar la capacidad de fabricación asociada con el CD de


audio significa adherir a la organización fundamental física del CD de audio. Los CD
de audio están diseñados para reproducir música, no para proveer un rápido acceso
aleatorio a los datos. Esto beneficia al CD ya que adquiere gran capacidad de
almacenamiento y moderada tasa de transferencia de datos contra un rendimiento
decente (o básico) de búsqueda. Si una aplicación requiere un rendimiento bueno de
acceso aleatorio, ese rendimiento tiene que surgir de un esfuerzo en el diseño de la
estructura de archivos; ni surgirá de nada inherente al medio.

3.5.1. Leyendo surcos y llanos.

El CD-ROM está impreso de un disco maestro. El maestro se forma usando los


datos digitales que queremos codificar, encendiendo y apagando rápidamente un
poderoso láser. El disco maestro, que está hecho de vidrio, tiene una cubierta que
es modificada por el rayo láser. Cuando la cubierta está desarrollada, las áreas
golpeadas por el rayo láser se transforman en surcos a lo largo de la pista seguida
por el rayo. Las áreas lisas que no son modificadas por el láser se llaman llanos. Las
copias hechas del disco maestro retienen este patrón de surcos y pistas.

Cuando leemos la copia impresa de un disco, enfocamos el rayo láser sobre la


pista mientras se mueve bajo la lente óptica. Los surcos reflejan la luz, pero los
llanos reflejan más de esa luz de vuelta al lente. Este patrón alternado de baja y alta
intensidad refleja la luz como la señal usada para reconstruir la información digital
original. Este esquema codificado usado por esta señal no es simplemente un
problema de llamar surcos a los 1 y llanos a los 0. En vez de esto, los 1 están
representados por la transición del surco al llano y viceversa. Cada vez que la
intensidad de la luz cambia obtenemos un 1. Los 0 están representados por la
cantidad de tiempo entre las transiciones; mientras más larga sea la transición, más
ceros obtenemos.

Si pensamos acerca de este esquema de código, nos damos cuenta de que no


es posible tener dos unos adyacentes. Los unos están siempre separados por ceros.
De hecho, debido a la resolución de la lente óptica, debe haber por lo menos 2 ceros
entre cada par de unos. Esto significa que el patrón crudo de 1 y 0 debe ser
traducido para obtener un patrón de 8 bits de unos y ceros que formen el byte del

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-5-
Gestión de Datos – UTN – F.R.M.

dato original. El esquema de traducción es hecho mediante una tabla de búsqueda,


que transforma los 8 bits del dato original en 14 bits expandidos que pueden ser
representados en los surcos y llanos de los CD; el proceso de lectura transforma
esta traducción. La Figura 3.12. muestra una porción de los valores de la tabla de
búsqueda. Los lectores que hayan prestado atención a las especificaciones para los
reproductores de CD pueden haber encontrado el término EFM Encoding. EFM se
entiende como “Eight to Fourteen Modulation” (Modulación de 8 a 14) y se refiere a
este esquema de traducción.

Figura 3.12. Una porción de la tabla codificada en EFM.

Valor Bits Originales Bits Traducidos


0 00000000 01001000100000
1 00000001 10000100000000
2 00000010 10010000100000
3 00000011 10001000100000
4 00000100 01000100000000
5 00000101 00000100010000
6 00000110 00010000100000
7 00000111 00100100000000
8 00001000 01001001000000

Es importante darse cuenta que desde que se representan los ceros en los
datos codificados en EFM y la duración de tiempo entre las transiciones, nuestra
habilidad para leer los datos depende del movimiento de los surcos y llanos bajo la
lente óptica a una velocidad constante y precisa. Como veremos más adelante, esto
afecta la capacidad de búsqueda de la unidad de CD-ROM.

3.5.2. CLV en vez de CAV.

Los datos en un CD-ROM están almacenados en una pista espiral única que
gira por casi 3 millas (4,8 km.) desde el centro hasta el lado exterior del disco. Este
patrón espiral es parte de la herencia que le dejó el CD de audio al CD-ROM. Para
datos de audio, que requieren mucho espacio de almacenamiento, queremos
empaquetar los datos en el disco lo más apretadamente posible. Ya que
reproducimos datos de audio a menudo desde el principio hasta el fin sin
interrupción, la búsqueda por lo tanto no es importante. Como muestra la Figura
3.13. el patrón espiral atiende a estas necesidades. El sector hacia los bordes
externos del disco tiene la misma cantidad de espacio que el sector hacia el centro
del disco. Esto significa que podemos escribir todos los sectores a la densidad
máxima permitida por el medio de almacenamiento. Ya que leer los datos requiere
que estos pasen bajo el dispositivo de la lente óptica a un promedio constante, la
densidad constante de datos implica que el disco tiene que girar más lentamente
cuando estamos leyendo los bordes externos que cuando estamos leyendo hacia el
centro. Esto es porque el espiral está en un Formato de Velocidad Constante (CLV):
mientras buscamos hacia el centro cambiamos el promedio de rotación del disco por
lo tanto la velocidad lineal del espiral pasa el dispositivo de la lente y permanece
igual.

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-6-
Gestión de Datos – UTN – F.R.M.

En contraste, la conocida Velocidad Angular Constante (CAV) mostrada en la


Figura 3.13., con sus pistas concéntricas y sectores en forma de porciones de torta,
escribe los datos menos densamente en las pistas externas que en las pistas hacia
el centro. De esta manera perdemos capacidad de almacenamiento en los espacios
externos pero tenemos la ventaja de girar el disco a la misma velocidad para todas
las posiciones de la cabeza lectora. Dado el arreglo de sectores mostrado en la
figura, una rotación lee 8 sectores, no importa donde estemos posicionados en el
disco. Más adelante una marca de tiempo colocada en el disco hará más fácil
encontrar el inicio del sector.

El formato CLV es responsable, en gran parte, por el pobre rendimiento de


búsqueda en los dispositivos de CD-ROM. El formato CAV provee límites definidos a
la pista y una marca de pulso para encontrar el inicio de sector. Pero el formato CLV
provee una manera no directa de saltar a una ubicación específica. Parte del
problema esta asociado con la necesidad de cambiar la velocidad rotacional
mientras buscamos a lo largo del disco. Para leer información direccionada que esté
en un disco junto a los datos del usuario, necesitamos mover los datos bajo la lente
óptica a la velocidad correcta. Pero para saber como adaptar esa velocidad,
necesitamos ser capaces de leer la información direccionada para saber donde
estamos. ¿Cómo hace el mecanismo de control del dispositivo para resolver esto?
En la práctica la respuesta siempre involucra adivinar y descubrir la velocidad
correcta a través del ensayo y el error. Esto lleva tiempo y hace más lento el
rendimiento de búsqueda.

Figura 3.13. Grabaciones en formato CLV y CAV.

El lado positivo, del formato CLV es que contribuye a la gran capacidad de


almacenamiento del CD-ROM. Mientras que con el formato CAV, el CD-ROM tendría
sólo una leve mejoría de la que tiene hoy en día.

3.5.3. Direccionamiento.

El uso de la organización CLV significa que el uso del conocido método cilindro,
pista y sector, para la identificación de la dirección de un sector no funciona en el
CD-ROM. En vez de esto usamos un esquema de direccionamiento de sector que

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-7-
Gestión de Datos – UTN – F.R.M.

está relacionado con las raíces del CD-ROM como un dispositivo de reproducción de
audio. Cada segundo del tiempo de reproducción de CD está dividido en 27
sectores, cada uno de los cuales contiene 2 Kb de datos. De acuerdo con el
estándar original de Sony/Phillips un CD puede ser usado como audio o como CD-
ROM, y contiene por lo menos una hora de reproducción. Esto significa que el disco
es capaz de contener al menos 540.000 Kb de datos.

60 minutos X 60 segundos/minuto X 75 sectores/segundo = 270.000 sectores

De hecho, ya que es posible poner más de 70 minutos de tiempo de


reproducción en un CD, la capacidad del disco es mayor a 600 Mb.

Direccionamos un sector determinado refiriéndonos al minuto, segundo y sector


de reproducción. Por lo tanto, el sector 44 en el segundo 22 y el minuto 16 de
reproducción, sería direccionado con los 3 números 16:22:34.

3.5.4. Estructura de un sector.

Es interesante ver cómo el diseño fundamental del disco compacto,


inicialmente intentaba distribuir información, y ha sido en vez adaptado para
almacenamiento de datos de computadora. Esta investigación ayudará a responder
la siguiente pregunta: si el disco compacto es capaz de almacenar un cuarto de
millón de páginas impresas, ¿Por qué contiene sólo una hora de Roy Orbison?

Cuando necesitamos almacenar sonido necesitamos almacenar un patrón de


onda en forma digital. En la Figura 3.14. se muestra una onda. A cualquier momento
dado en el tiempo la onda tiene una amplitud específica. Digitalizamos la onda
midiendo la amplitud a intervalos muy frecuentes y almacenando dichas mediciones.
Por lo tanto, la pregunta de cuánto espacio de almacenamiento necesitamos para
representar una onda digitalmente se transforma en 2 preguntas más: ¿Cuánto
espacio necesita cada muestra de amplitud y con qué frecuencia necesitamos
muestras?

Figura 3.14. Muestra digital de una onda.

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-8-
Gestión de Datos – UTN – F.R.M.

Figura 3.15. El efecto del muestreo con menos del doble de frecuencia de la onda.

El CD usa 16 bits para almacenar cada medida de amplitud; eso significa


que la “regla” que usamos para medir la altura de la onda tiene 65.536
gradaciones diferentes. Para aproximar la onda cuidadosamente a través del
muestreo digital, necesitamos tomar las muestras con un promedio que es más
de dos veces la frecuencia de la más alta frecuencia que queremos capturar.
Esto tiene sentido si miramos la onda en la Figura 3.15. Allí se puede ver que la
muestra que es menor que dos veces la frecuencia de la onda, pierde
información acerca de la variación del patrón de la onda. Los diseñadores de
discos compactos de audio seleccionaron una frecuencia de muestreo de 44.1
kilohertz, o 44.100 veces por segundo, pudiendo registrar sonidos con un rango
de frecuencias cercano a los 20 kilohertz (20.000 ciclos por segundo), lo que se
acerca a la onda de sonido más alta que la gente puede escuchar.

Por lo tanto, si tomamos una muestra de 16 bits o 2 bytes, con una


frecuencia de muestreo de 44.100 veces por segundo, necesitamos almacenar
88.200 bytes por segundo. Ya que queremos almacenar sonido estéreo,
necesitamos el doble de esto, necesitamos 176.400 bytes por segundo. Así se
puede ver porqué una hora de Roy Orbison ocupa tanto espacio.

Si se dividen los 176.400 bytes por segundo de capacidad de


almacenamiento del CD en 75 sectores por segundo, se obtienen 2.352 bytes
por sector. El CD-ROM divide el sector crudo de almacenamiento como se
muestra en la Figura 3.16. para proveer de 2 Kb de datos de almacenamiento
para el usuario, también junto con información direccional, detección de error e
información para corrección de error. La información para corrección de error
es necesaria porque aunque los CD de audio contienen corrección de error por
redundancia, no es adecuado con las necesidades de almacenamiento de
datos de una computadora.

La corrección de errores de audio resultaría en un promedio de un byte


incorrecto por cada dos discos. La información de corrección de error adicional
almacenada dentro de los 2.352 bytes por sector disminuye este promedio de
error a un error incorregible cada 20.000 discos.

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-9-
Gestión de Datos – UTN – F.R.M.

12 bytes de 4 bytes para 2.048 bytes de 4 bytes de 8 bytes nulos. 276 bytes de
sincronismo. identificación información. detección de corrección de
del sector. error. error.

Figura 3.16. Estructura del sector del CD-ROM.

3.6. Fortalezas y debilidades del CD-ROM.

Como decimos a lo largo de este libro, el buen diseño de los archivos es la


respuesta a la naturaleza del medio, haciendo uso de las fortalezas y disminuyendo
las debilidades. Comenzamos entonces catalogando fortalezas y debilidades del
CD-ROM.

3.6.1. Rendimiento de búsqueda.

La principal debilidad del CD-ROM es el rendimiento en acceso aleatorio. La


tecnología del disco magnético actual es tal que el tiempo promedio para el acceso a
datos aleatorios, combinando tiempo de búsqueda y la demora rotacional, es cerca
de 30 mseg. En un CD-ROM este promedio de acceso toma 500 mseg y puede
tomar hasta un segundo o más. Claramente nuestras estrategias de archivos deben
evitar las búsquedas en extremo más todavía que en los discos magnéticos.

3.6.2. Tasa de transferencia de datos.

Un dispositivo de CD-ROM lee 70 sectores, o 150 Kb de datos por segundo.


Esta tasa de transferencia de datos es parte de la definición fundamental del CD-
ROM; no puede ser cambiada sin dejar atrás las ventajas comerciales del CD de
audio estándar. Es una tasa de transferencia modesta, casi 5 veces más rápida que
la tasa de transferencia de los discos flexibles, y un orden de magnitud más lento o
inferior que la de los buenos discos Winchester. Lo inadecuado de la tasa de
transferencia de datos se hace presente cuando estamos descargando grandes
cantidades de información. La tasa de transferencia es lo suficientemente rápida en
relación al desempeño de búsqueda del CD-ROM, lo que incentiva a diseñar una
organización de datos en bloque; leyendo la mayor cantidad de datos posibles en
cada búsqueda con la esperanza de que se puedan evitar al máximo la cantidad de
búsquedas.

3.6.3. Capacidad de almacenamiento.

Un CD-ROM contiene más de 600 Mb de datos. Aunque es posible usar esta


área de almacenamiento de manera muy rápida, particularmente si se están
almacenando imágenes, 600 Mb es mucho cuando se trata de aplicaciones de texto.
Si se decide bajar 600 Mb de texto con un módem de 2400 baudios, tomará 3 días
de transmisión constante de datos, asumiendo que las condiciones de transmisión
no contengan ningún error. Muchas bases de datos de texto típicos y documentos o
Traducción: Prof. Patricia Iglesias
Javier Escudero y José Pérez Iglesias
-10-
Gestión de Datos – UTN – F.R.M.

colecciones publicadas en CD-ROM usan sólo una fracción de la capacidad del


disco.

Los beneficios del diseño surgen a partir de la gran capacidad que nos habilita
para construir índices y otras estructuras de soporte que pueden ayudar a superar
las limitaciones asociadas con el pobre rendimiento de búsqueda del CD-ROM.

3.6.4. Acceso de Sólo Lectura.

Desde el punto de vista del diseño, el hecho de que el CD-ROM sea un medio
publicitario, un dispositivo de almacenamiento que no puede ser cambiado luego de
ser fabricado, provee ventajas significativas. No tendremos que preocuparnos nunca
por la actualización. Esto no sólo simplifica la estructura de los archivos sino que
también significa que vale la pena optimizar nuestras estructuras de índices y otros
aspectos de la organización de archivos. Sabemos que nuestros esfuerzos para
optimizar el acceso no se perderán luego, en un futuro, con adiciones o
eliminaciones.

3.6.5. Lectura y escritura asimétricas.

Para la mayoría de los medios, los archivos son escritos y leídos usando el
mismo sistema de computadoras. A menudo, leer y escribir son interactivos y por lo
tanto están retenidos por la necesidad de proveer respuesta rápida a los usuarios. El
CD-ROM es diferente. Creamos los archivos para ser ubicados en el disco una vez;
luego distribuimos el disco y después accedemos a él miles, e incluso millones de
veces. Estamos en una posición de otorgar poder de cómputo sustancial a la tarea
de organizar y crear archivos, aún cuando el disco será usado en sistemas con
mucha menos capacidad. De hecho podemos usar extensivamente el método de
procesamiento por lotes en grandes computadoras para tratar de proveer sistemas
que se desempeñaran mejor en pequeñas máquinas. Hacemos inversiones en
estructuras de archivo diseñadas cuidadosa e inteligentemente sólo una vez; de
manera que los usuarios puedan disfrutar de los beneficios de esta inversión una y
otra vez.

Traducción: Prof. Patricia Iglesias


Javier Escudero y José Pérez Iglesias
-11-