Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Profesional de La Informacion-1 PDF
El Profesional de La Informacion-1 PDF
10, n 11
ARTCULOS
SISTEMAS DE INFORMACIN
Bosch, Mela. Documentos y lenguaje de marcado: conceptos, problemas y tendencias. En: El profesional de la informacin, 2001, noviembre, v. 10,
n. 11, pp. 4-9.
Introduccin: una gran solucin y 8879 en 1986 con el nombre de standard generalized
grandes problemas markup language (sgml).
El desarrollo de los lenguajes de marcado cambi Su desarrollo no se produjo de manera anecdtica,
el panorama de la estructuracin de documentos, a pe- ya que la historia ha marcado dos de las caractersticas
sar de que no era su objetivo inicial. En la dcada de de sgml: est pensado para sistemas de oficina, es de-
los aos 80 se plante como una forma de asegurar la cir, para documentos corporativos, y est orientado al
transferencia de datos manteniendo aspectos de pre- procesamiento de datos. Ms concretamente dentro de
sentacin. este mbito, al intercambio.
Sgml fue desarrollado en sus orgenes (1969) por
Si se observa la portada de la norma ISO 8879 los
Charles Goldfarb con el nombre de general markup
descriptores indican claramente su contenido: Data
language (gml), y tena como objetivo facilitar el in-
processing, Documentation, Logical structure, Pro -
tercambio de documentos en IBM. Permite definir es-
gramming (computers), Artificial languages, Pro -
tructuras tipificadas de documentos a partir de las re-
gramming languages (ISO, 1986).
glas que los rigen, las cuales son expresadas fsica-
mente en los documentos por medio de marcas (sea- Sgml es, por lo tanto, un lenguaje artificial til pa-
les o cdigos convenidos). Fue adoptado rpidamente ra representar la organizacin lgica de documentos a
para la circulacin de documentos por el Departamen - efectos de procesamiento y programacin. En los aos
to de Defensa de EUA y por la Oficina de Publicacio - siguientes apareci como la gran solucin para la
nes Oficiales de la Comunidad Europea, ambos clien- transferencia de datos documentales con una arquitec-
tes de IBM (Bryan, 1998). En una meterica gestin tura lgica determinada. Sin embargo, a la vez se ge-
(ya que ni siquiera fue previamente autorizado como neraron grandes problemas: de estndares de descrip-
estndar americano), ISO lo lanz como la norma ISO cin y de mercado de software.
Mela Bosch, Profesora e investigadora de la Universidad Nacional de La Plata y profesora de la Universidad
Fecha de recepcin 13-09-01 Nacional de Mar del Plata, Argentina.
Aceptacin definitiva: 2-11-01 euris@sinectis.com.ar
Antes de puntualizar sobre estos temas agregamos proceso; de donde surge el tema de qu es lo que se
una reflexin: tal y como puede deducirse de lo que se describe y para qu, producindose as un efecto de re-
ha comentado hasta ahora sobre su origen, y segn nos troalimentacin sobre el lenguaje. Este punto nos con-
hace notar Winograd (de forma pionera hace ms de duce al primero de los problemas que estamos anali-
18 aos), el problema de la descripcin y representa- zando.
cin de las estructuras conceptuales en medios infor-
mticos estuvo ligado y determinado por las necesida- Problemas de estndares de
des de proceso. Era ms importante lograr similitud descripcin
con el lenguaje de las mquinas que con el de las per-
sonas: In designing a programming language there Por lo que puede deducirse de todo lo comentado
are two potentially conflicting sources of criteria or - hasta ahora, el objetivo de sgml de permitir la transmi-
ganization (things can be classed as alike because they sin de datos determina la forma de descripcin. La
are implemented with the same underlying mechanism, ventaja es que se permite establecer grupos de cdigos
or because they have similarity for the language user). propios segn la caracterstica de la estructura docu-
In most programming languages, the balance lies to - mental. Esto da origen a varias lneas de cambios den-
wards the implementation side (Winograd, 1983, p. tro del lenguaje de marcado:
417). Sintaxis concreta.
Subconjuntos.
El desarrollo de los lenguajes
de marcado cambi el panora- Extensiones.
ma de la estructuracin de do-
1. Sintaxis concreta. En el campo de la lingsti-
cumentos, a pesar de que no
ca se denomina sintaxis a las reglas que definen el sig-
era su objetivo inicial nificado de los cdigos y a los nombres reservados
usados por un lenguaje en particular. Al tratarse de un
Esto nos lleva a una discriminacin conceptual
lenguaje de descripcin, sgml necesita ajustarse al ob-
ms general: los lenguajes, a los que definimos como
jeto de su descripcin y, a la vez, mantener consisten-
conjuntos de smbolos normalizados para la represen-
cia en cdigos y denominaciones. La forma de lograr-
tacin y comunicacin, se dividen en: naturales, con-
lo es por medio de dos tipos de sintaxis: la abstracta y
trolados y artificiales.
la concreta.
Los primeros son los que se crean en un contexto
La primera es usada para especificar cmo deben
social y convencional por conjuntos de individuos. In-
ser escritas tanto las declaraciones de sgml como las de
cluyen tanto las lenguas de las comunidades humanas
tipo de documento. Por otra parte, nos encontramos con
como las formas de comunicacin animal (an hay
el conjunto de reglas utilizadas para definir cmo de-
muchos que discuten su valor y otorgan slo al ser hu-
ben ser codificados documentos especficos. Una for-
mano la capacidad de poseer lenguaje). Por su parte,
ma particular de sintaxis concreta, llamada en ingls re -
los controlados son porciones del lenguaje natural nor-
ference concrete syntax, fue definida de manera expl-
malizados para fines especficos: entre stos se en-
cita en la ISO 8879. Su objetivo es suministrar una re-
cuentran los lenguajes documentales y las ontologas.
ferencia para que las sintaxis concretas eventuales la
Finalmente los artificiales son conjuntos de smbolos
tomen como base. Se conoce como international re -
arbitrarios tambin para fines concretos, incluyndose
ference version (IRV) y contiene los siguientes puntos:
entre ellos: los de programacin destinados al pro-
cesamiento y los lenguajes de descripcin, como Cdigos que deben ser ignorados (shunned cha -
sgml, cuyo objetivo es la interpretacin por parte de racter number identification).
lenguajes de programacin (Isasi, 1997).
El conjunto bsico de caracteres baseset defini-
sta es una mera simplificacin expositiva que nos dos por la norma ISO 646.
permitir avanzar operativamente en el desarrollo de
este trabajo; no ignoramos que existen formas combi- Cdigos ascii homologados.
nadas complejas como los lenguajes de transcripcin, La ampliacin de ese conjunto descset.
los de restricciones y los lenguajes grficos, entre
otros. Cdigos de caracteres de funciones (function
character identification).
Es importante no olvidar que con sgml nos encon-
tramos ante un lenguaje de naturaleza artificial cuya Reglas de denominacin para cuando se crean
meta es la descripcin de informacin para facilitar su entidades o etiquetas (naming rules declaration).
Conjunto de delimitadores alternativos de mar- Adems, nos encontraremos con otras dtds que res-
cado (delimiters declaration). ponden a iniciativas con fines especficos, como Sgml
initiative in health care (Hl7 health level-7 and
Convenciones de denominacin de declaracio-
sgml/xml) o National Center for Biotechnology Infor -
nes (reserved name use).
mation (Ncbi), de la National Library of Medicine y de
Las cantidades permitidas para el anidamiento los National Institutes of Health (Cover, 2000).
de elementos y entidades.
Un importante esfuerzo comn es la dtd de tei (text
Esta sintaxis es asumida automticamente por los encoding initiative) financiada por varias universida-
sistemas que procesan sgml. Para ello es necesario in- des y la UE, cuyo objetivo es construir una referencia
dicarlo de la siguiente forma: syntax public iso 8879- universal para la codificacin de textos (Tei, 2001).
1986//syntax reference//en
Existen tambin otras dtds valiosas para el profe-
A esta sintaxis pueden agregarse esquemas propios sional de la informacin como ead (encoded archival
de codificacin. La sintaxis concreta de referencia de- description) para documentos corporativos y de archi-
be ser entonces conocida y comprendida por sus usua- vo, mantenida por la Network Development and Marc
rios potenciales, sean humanos o mquinas. Los cam- Standards Office de la Library of Congress (LoC) jun-
bios en las opciones por defecto se deben hacer de to con la Society of American Archivists. Esta norma
acuerdo con ciertas reglas, declarando pblicamente est en directa relacin con la especfica de marc:
(es decir de forma explcita) sus variantes (Bryan, marc dtd (machine readable cataloging document type
1998). definition).
Existen tres formas de especificar las variedades
de sintaxis concreta en un documento: El problema de la descripcin
y representacin de las estruc-
a. Por medio del uso de la opcin switches: se in-
turas conceptuales en medios
dican puntualmente diferencias de la sintaxis concreta
informticos estuvo ligado y
de referencia o de cualquier otra que se utilice. Permi-
te establecer pares de caracteres que pueden ser cam- sobredeterminado por las ne-
biados. Por ejemplo, si se quiere indicar que en lugar cesidades de proceso
de usar [ ] (cdigos ascii 91 y 93, homologados ISO 2. Subconjuntos. Pueden ser ms simplificados o
646) se prefiere utilizar: { } (cuya codificacin es ms completos que las sintaxis concretas. Lo impor-
123 y 125) se hara siguiendo el procedimiento que a tante es que toman aspectos de la sintaxis abstracta. El
continuacin se expone: ms conocido es html, con versiones sucesivas que
syntax public iso 8879-1986//syntax reference//en aparecen de forma continua y cuyo formato de inter-
cambio se encuentra definido por la norma ISO 9069.
switches 91 123
Existe tambin la ISO 10744, que desarrolla el hy -
93 125
permedia/time-based structuring language conocido
b. Declarando pblicamente que se usa una varian- como HyTime. Se trata de un subconjunto con una sin-
te de sintaxis concreta: taxis propia que permite la representacin en hiperme-
dia vinculada a la evolucin temporal. Incorpora tc-
syntax public iso 8879-1986//syntax prueba//sp
nicas que permiten asociar informacin adicional sin
Con esto se informa que se emplea una sintaxis lla- que haya sido almacenada como parte del documento
mada prueba y que recoge el juego de caracteres en es- fuente. HyTime puede referenciar cualquier texto, ima-
paol. sta, de nueva creacin, debe estar redefinida gen, efecto sonoro o rea espacial dentro de una publi-
cubriendo todos los aspectos de la IRV mencionada cacin multimedia.
anteriormente, asumiendo algunos puntos concretos y
Un aspecto destacable es que hace posible que las
modificando un grupo particular que incluye, por
direcciones de informacin se almacenen de manera
ejemplo, entidades o elementos (Bryan, 1998). Con
independiente al sistema, lo que posibilita la gestin
esto se elaboran sintaxis concretas orientadas a usos de
automatizada de ficheros. De esta forma se usa para
algunas reas temticas y organizaciones.
verificar y cambiar direcciones cuando un documento
c. Produciendo declaraciones de tipo de documen- se reestructura o es transferido a una nueva ubicacin.
to (dtd) que engloban las variantes de sintaxis respec-
Esta norma define formas arquitectnicas de docu-
to a la bsica de sgml.
mentos, que en realidad no son ms que reglas para
Las dtds estn normalizadas siguiendo la ISO crear y procesar los componentes de stos. Se definen
12082, que determina un marco de trabajo general. cuatro tipos de formas arquitectnicas en la ISO/IEC
10744:1997: de elementos, de atributos, de entidad de de nivel 3, por ejemplo, porque tiene restricciones pa-
datos y de atributos de datos. ra anidar etiquetas. Estas limitaciones, como ya indi-
camos con anterioridad, estn en la IRV, de manera
As pues, se constituyen los architectural form de -
que hay que indicarlo cada vez que se modifican las
finition requirements (afdr), es decir los requerimien-
restricciones y la sintaxis bsica, o bien declarar una
tos de arquitectura, cuyas especificaciones se pueden
dtd con todos los cambios.
encontrar en el anexo 1 de ISO/IEC 10744:1997. Su
uso se declara as: Xml no requiere una dtd, pero es necesario realizar
otras especificaciones y declaraciones. Por ejemplo, se
<!afdr iso/iec 10744:1997>
debe sealar quines son los usuarios: navegadores,
Existen, adems, aplicaciones de HyTime, como etc. Tambin en forma de declaraciones se deben indi-
smdl (standard music description language, ISO/IEC car elementos, atributos, entidades, as como anotacio-
DIS 10743:1995). nes para especificar datos externos.
3. Extensiones. La fundamental es xml, que puede Aunque se ha logrado normalizar la parte de xml
entenderse como un dialecto de sgml (se suele usar el correspondiente para libros, artculos y series con la
trmino dialecto porque contempla alteraciones estruc- norma ISO 12083, el problema es que en este momen-
turales respecto del lenguaje madre). Es una versin to nos encontramos en medio de una gran nmero y
extremadamente simplificada de sgml (algo as como proliferacin de variantes. Adems, el subconjunto
un sgml genrico) que admite el procesamiento en web html se origina con extensiones que cambian segn las
de objetos, algo que no es posible hacer en html. Per- ofertas de productos. Esto nos lleva a los problemas
mite definir objetos como entornos de realidad virtual, que analizaremos en el siguiente punto.
movimiento, seales olfativas, etc.
En realidad es un metalenguaje, ya que permite a Problemas del mercado de software
su vez crear subconjuntos. De hecho se est reescri- Si bien es posible codificar textos sgml en cual-
biendo todo html en xml. En esencia lo que permite es quier editor de texto, la tarea artesanal es muy lenta y
una forma flexible, pero normalizada, de aadir eti- susceptible de que se produzcan errores. Se utilizan
quetas a los documentos. En html, que tal y como he- tres tipos de software para sgml: editores, analizadores
mos visto es un subconjunto, las etiquetas son acota- (parsers) y visualizadores (browsers).
das y tienen una semntica especfica para la navega- El editor es el que permite redactar dtds de docu-
cin hipertextual. Por su parte, sgml es excelente y mentos. La gama oscila desde los ms sencillos free-
completo, pero a la hora de implementar la navegacin ware software gratuito hasta los ms complejos
resulta complicado dado que los enlaces son artesa- que permiten convertir texto procedente de otro ori-
nales. Xml no sustituye a ste, que s puede gestionar gen; otros integran hojas de estilo y entremezclan sus
documentos xml, favoreciendo la funcionalidad de na- posibilidades con anlisis y visualizacin.
vegacin y la manipulacin de diferentes objetos no
slo textuales. El analizador o parser compara las reglas de edi-
cin con la sintaxis concreta o la dtd. Trabajan a la par
La web semntica brindar que el editor o sobre documentos una vez compues-
tos para verificar o modificar el marcado. Algunos
contenido significativo a las
pueden trabajar con hojas de estilo dsssl (document
pginas de la Red, creando un
style semantics and specification language, ISO
ambiente donde agentes de 10179) y spdl (standard page description language,
software puedan fcilmente ISO 10180). Las primeras permiten agregar abundan-
efectuar tareas sofisticadas tes detalles tipogrficos mientras que la segunda est
ms orientada a la impresin.
En su aspecto formal xml se nutre de reglas de pro-
duccin lgicas para interpretar la sintaxis y permite Finalmente los visualizadores o browsers permiten
su compilacin. Define una regla bsica y establece el recorrer el documento en toda su arborescencia. El l-
valor de cada uno de los elementos. der en el mercado es SoftQuad, con Xmetal, cuya ver-
sin de prueba puede ser descargada de la web.
En cuanto a sgml, los valores ya estn establecidos
en la sintaxis abstracta de sgml o en las dtd. Este len- El panorama de editores, analizadores y visualiza-
guaje, al haber sido concebido para describir docu- dores es amplio y confuso. Se crean subconjuntos, sin-
mentos de texto, estipula la forma de organizacin, o taxis concretas y dtds de acuerdo con la conveniencia
sea, no slo la sintaxis sino la estructura. Por lo tanto de las empresas, no existiendo adems compatibilidad
no es posible poner un ttulo de nivel 1 despus de uno total entre ellos. Los ms populares resultan los edito-
res html que permiten disear pginas web, entre los se de una pgina a otra, puedan fcilmente efectuar ta-
cuales encontramos FrontPage, de Microsoft, y Com - reas sofisticadas para usuarios. Segn ellos no ser una
poser, de Netscape. Tienen la ventaja de que no es ne- red separada sino una extensin de la actual en la que
cesario conocer los lenguajes de marcado, pero no sue- la informacin tenga un significado definido, permi-
len ser totalmente compatibles entre ellos y con otros tiendo que mquinas y personas puedan trabajar en co-
editores. operacin. Estos autores nos dicen que para que la web
semntica sea operativa los ordenadores deben tener
En cuanto a xml estamos en plena efervescencia.
acceso estructurado a colecciones de informacin y
Su importancia estriba en que permite encapsular ins-
conjuntos de reglas de inferencia que ellos pueden usar
trucciones de programacin, ya sea VBScript o Java
para conducir al razonamiento automatizado.
applets, compilar controles ActiveX y hasta lenguajes
antiguos como Cobol. Tambin tiene capacidades de En el documento mencionado se indica que los sis-
edicin, anlisis y visualizacin, pero como adems temas de representacin de conocimiento (tal y como
cuenta con posibilidades de programacin, requiere un se denomina esta tecnologa) han sido centralizados,
lenguaje especial para modelar los datos. Es aqu don- requiriendo que todos compartan exactamente la mis-
de aparece document object model (dom) con adapta- ma definicin de conceptos. Por otra parte limitan el ti-
ciones para Explorer y Netscape. Microsoft desarroll po de preguntas que pueden formularse y, para evitar
com (component object model) para el desarrollo de tales problemas, estos modelos de representacin han
aplicaciones con xml. tenido un propio y limitado conjunto de reglas para ha-
En esta babel en la que nos encontramos, xml em- cer inferencias sobre sus datos.
pieza a ser la lingua franca que permitir crear y com- En cambio los autores dicen que el desafo de la
partir documentos. Pero an estamos lejos de esa si- web semntica est en proveer un lenguaje que expre-
tuacin: las ofertas de software se multiplican, los pro- se tanto los datos como una lgica para darles sentido
ductos son costosos y la capacitacin que requieren es de diferente origen y forma, valindose para ello de
grande (Conallen, 2001). tres tecnologas: xml, resource description framework
(rdf) y las ontologas.
La web semntica, un futuro
Xml, sobre el que ya hablamos, es importante en
La pregunta para los profesionales de la informa-
su doble carcter de metalenguaje de descripcin que
cin es saber qu lugar les cabe en este panorama de
permite crear etiquetas, tanto propias como estndar, y
estructuracin de la informacin documental. Su posi-
a la vez como lenguaje de especificacin de puntos de
cin puede estar, sin duda, en el apoyo que puedan
ejecucin de porciones de software o programas com-
prestar a los desarrolladores, trabajando en la defini-
pletos que pueden hacer uso de ellas.
cin de dtds y sintaxis concretas adaptadas a las nece-
sidades de cada corpus de informacin. En este senti- Rdf (marco de descripcin de recursos) es el
do, el estudio y capacitacin en este contexto es indis- complemento de xml. El documento que estamos rese-
pensable. Pero otro punto donde sern de inestimable ando nos indica acertadamente el etiquetado genrico
valor es en el desarrollo de la web semntica. xml, que permite agregar marcas arbitrarias a los do-
Con el uso de los lenguajes de marcado, los siste- cumentos, las cuales no proveen semntica. Su signifi-
mas informticos en la www realizan tareas de rutina cado podra ser expresado por el rdf, que son conjun-
y tambin otras ms expertas, siempre y cuando se tra- tos de tros constituido cada uno de ellos por el su-
te de trabajar dentro de las pginas web. Sin embargo jeto, verbo y predicado de una frase elemental y que
no se tiene an un procedimiento fiable para procesar pueden escribirse usando etiquetas de xml.
la semntica. Por esta razn se producen avances en lo En sntesis, tal como plantean estos autores, rdf es
que se est llamando web semntica. un lenguaje de metadatos genrico que ofrece una ma-
En los prrafos que siguen haremos una resea co- nera natural para describir la mayora de los objetos
mentada del artculo de Berners-Lee, Hendler y Las- procesados. Cada sujeto y cada predicado son identifi-
sila titulado The semantic web, a new form of web cados por el universal resource identifier (uri) re-
content that is meaningful to computers will unleash a cordemos que url es el tipo ms difundido de uri.
revolution of new possibilities, publicado en Scienti - Volviendo a lo que se resea en el artculo que nos
fic American en mayo de 2001, desde la perspectiva de
ocupa y que estamos comentando, los verbos podrn
inters para el profesional de la informacin.
ser identificados tambin por uris, permitiendo definir
Segn estos autores, la web semntica brindar otros nuevos simplemente definiendo un uri para ellos.
contenido significativo a las pginas de la Red, crean- De esta forma, los autores nos hacen notar que el len-
do un ambiente donde agentes de software, movindo- guaje natural puede usar un mismo trmino para signi-
ficar algo distinto, segn el contexto, y utilizar un uri los lenguajes naturales, artificiales y controlados. En
diferente para cada concepto especfico. Los tros de este contexto las ontologas se sitan dentro de los len-
rdf forman redes de informacin entre objetos cone- guajes controlados. Es fcil ver la vinculacin entre
xos, y dado que stos usan uris para codificar datos en ellas y los lenguajes documentales, pues muchos de
un documento, se asegura que los conceptos no son sus fines son similares.
simplemente palabras sino que las vinculan a una defi-
Es importante destacar que la inteligencia artifi-
nicin nica que todos pueden encontrar en el web.
cial, despus de aos de lucha con el procesamiento
Los uri an no se encuentran muy difundidos y no del lenguaje natural, parece haber optado como solu-
lo estarn, creemos, hasta que una norma ISO los ge- cin global el uso de los lenguajes controlados.
neralice, algo que, esperamos, ocurra en breve. Sin
embargo, coincidimos con Berners-Lee en que esto La incgnita es si los profesionales de la informa-
no evita la superposicin, pues dos recursos, por ejem- cin seremos capaces de ampliar nuestras miras desde
plo dos bases de datos en lnea, pueden usar diferentes la tradicional representacin de informacin concebi-
identificadores para lo que de hecho es el mismo con- da para recuperacin en un sistema automatizado y
cepto. asumiremos trabajos para enfocar la representacin de
conocimiento en la web.
Los sistemas informticos deben disponer de un
mecanismo que permita descubrir tales significados Bibliografa
comunes para cualquier base de datos a la que se co-
necten. En este caso interesa encontrar una forma de Berners-Lee, T.; Hendler, J.; Lassila, O. The semantic web, a new
representar semntica comn en estructuras diferentes. form of web content that is meaningful to computers will unleash a revo-
lution of new possibilities. En: Scientific American, 2001, mayo. Consul-
Berners-Lee, Hendler y Lassila confan en que la tado en: 2001.
solucin a este problema se puede encontrar en el ter- http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html
cer componente bsico de la web semntica:
Bryan, M. Sgml: an authors guide. New York: Addison-Wesley, 1998.
Las ontologas. Este trmino tiene su origen en
la filosofa, y la definicin ms general en el contexto Conallen, J. Building web applications with UML. Boston: Addison-
Wesley, 2000.
de los sistemas informticos es el de la especificacin
de una conceptualizacin. Cover, R. Sgml/xml applications in cross-domain and multi-disciplinary
enterprises. Oasis. Consultado en: 2001.
Cada uno de los conceptos es expresado en una red http://www.oasis.org
terminolgica que define sus atributos. Por ejemplo ti-
pos de datos y sus comportamientos tales como rela- Cover, R. Publicly available software for sgml/xml/dsssl. Consultado en:
ciones con otros conceptos. Adems, tienen una forma 2001.
http://www.oasis.org
de establecer el alcance de estos atributos y comporta-
mientos por medio de reglas, permitiendo que la onto- Ead (Encoded archival description). Consultado en: 2001.
loga deduzca, o por lo menos proponga, a qu clase o http://www.loc.gov/ead/
categora puede pertenecer cada nuevo concepto que
se ingresa. International Standards Organization. IS0 8879 standard generalized
markup language. Ginebra: 1986.
Sintticamente una ontologa tiene una taxonoma
de conceptos que define clases de objetos o concep- International Standards Organization. ISO/IEC 10744 hypermedia/time-
based structuring language. Ginebra: 1997.
tos y relaciones entre ellos junto a un conjunto de
reglas de inferencia. Segn estos autores, puede facili- Isasi, P.; Martnez, P.; Borrajo, D. Lenguajes, gramticas y autmatas.
tar el funcionamiento de la web para mejorar la exac- New York: Addison-Wesley, 1997.
titud de la recuperacin, ya que el programa adquiere
capacidad para realizar la bsqueda slo en las pginas Jacquesson, A.; Rivier, A. Bibliothques et documents numriques. Paris:
Electre, 1999.
que se refieren al concepto preciso y, a la vez, funcio-
na tambin cuando la respuesta no radica en una nica Marc dtd, machine readable cataloging document type definition. Consul-
pgina. Adems, con las ontologas comienzan a sur- tado en: 2001.
gir soluciones a los problemas terminolgicos en la http://www.loc.gov/marc/marcdtd/marcdtdback.html
web. El significado de trminos o de cdigos xml usa-
TEI guidelines for electronic text encoding and interchange: interchange,
dos en una pgina puede ser definido desde sta a una 2001. Consultado en: 2001.
ontologa. http://etext.lib.virginia.edu/TEI.html
Dejamos ahora la resea del documento sobre la Winograd. T. Language as a cognitive process. New York: Addison-Wes-
web semntica y retomamos la reflexin inicial sobre ley, 1983.
Clsicos universales
Por disponer Bimicesa de tra-
ducciones a lenguas espaolas de
Alfieri, Apuleyo, Aristteles,
Balzac, Baudelaire, Bossuet, By-
ron, Camoens, Chejov, Condi-
llac, Dante, Descartes, Dickens,
Diderot, Dumas, Erasmo, Fne-
lon, Goethe, Goldoni, Hume,
Catlogo general Kant y Voltaire, stos figuran en
Un ejemplo lo encontramos
con la entrada Shakespeare, Wi-
lliam que permite localizar la obra
completa del autor en su lengua
original, incluso algunas piezas
dramticas traducidas al espaol,
tal como A buen fin no hay mal
principio, en la versin ya clsica
de Luis Astrana Marn. Con acer-
tado criterio la Biblioteca ha elegi-
do la traduccin del Hamlet que Ejemplo de una lista de autores
public en 1798 Leandro Fernn-
dez de Moratn, que intenta salvar www.tech.mit.edu/Shakespeare/Co ple (7 bits de cifrado), formato su-
las numerosas escabrosidades de la medy/asyoulikeit/asyoulikeit.html ficiente para textos en ingls sin
obra y ofrecer un texto adecuado al ees, tildes ni diresis; otros dos a
www.tech.mit.edu/Shakespeare/asy
gusto ilustrado del escritor madri- An unsocial socialist y a The per -
oulikeit/index.html
leo y sus lectores. fect wagnerite, tambin del Guten -
Esta labor de reparar enlaces berg. Un nuevo vnculo nos condu-
Por supuesto podemos consul- rotos no siempre puede ser realiza- ce a Pygmalion, ste del Proyecto
tar los originales ingleses. Por da de manera automtica, por lo Bartleby, de la Universidad de Co -
ejemplo, As you like it, al cual se que a veces es posible encontrarse lumbia en Nueva York; otro, a una
accede mediante un vnculo espe- con estos errores. versin en cataln de la misma
cfico. El problema es que el enla- En la misma lnea, en la entra- obra (en html) y a una breve se-
ce ha sido cambiado en el host y da Shaw, Bernard, encontramos cuencia de vdeo de un momento
descubrimos, tras la correspon- un vnculo roto a Man and Super - de la representacin de este Pigma -
diente inquisicin, que debera ser man; otro, operativo, al libro Misa - li por Dagoll Dagom (Grup de te -
actualizado al que vemos a conti- lliance, ofrecido en este caso por el atre). Es posible visualizarlo tam-
nuacin en segundo lugar. Proyecto Gutenberg, en ascii sim- bin a travs de dos versiones: una
para mdems (de menos resolu-
cin en pantalla) y otra para cone-
xiones ms rpidas de tipo Adsl.
Como puede verse, las posibilida-
des son variadas.
Otras secciones de la Bibliote -
ca, tambin en desarrollo, son:
1. Biblioteca de autor: en ella
encontramos, adems de clsicos
imprescindibles como Leopoldo
Alas, Fray Bartolom de las Ca-
sas, Miguel de Cervantes Saave-
dra, Garcilaso de la Vega, Garci-
laso de la Vega, El Inca, Luis de
Gngora y Argote, San Juan de
la Cruz, Sor Juana Ins de la
Cruz, Fray Luis de Len, Fran-
cisco Lpez de Gmara, Jos
Lista de ttulos por materia Mart, Tirso de Molina, Francis-
co de Quevedo, Santa Teresa de La dificultad para acceder a mu- dos mediante signos corporales pa-
Jess, Juan Valera y Lope de Ve- chas publicaciones peridicas de ra sordomudos a travs de vdeos);
ga, a un grupo de escritores en su mbito hispnico hace muy intere- de voces (textos recitados por rap-
mayora hispanoamericanos del si- sante la oferta de Bimicesa. Hay, sodas, asimismo en vdeo), etc.
glo XX como Roberto Arlt, Al- no obstante, revistas mucho ms
En resumen, un proyecto (que
fredo Bryce Echenique, Mario completas como por ejemplo los
ya es en parte realidad) de acerca-
Benedetti, Dulce Mara Eloinaz, Anales galdosianos.
miento a los textos clsicos hisp-
Oliverio Girondo, ngel Gonz-
3. Tesis doctorales: proceden nicos que con frecuencia puede re-
lez, Nicols Guilln, Nancy Mo-
de muchos departamentos univer- sultar imprescindible para estudio-
rejn, Gonzalo Rojas, Alfonsina
sitarios de habla espaola y actual- sos y para el pblico interesado en
Storni y Arturo Uslar Pietri.
mente esta seccin se encuentra en la materia, pues la Cervantes Vir -
Podemos conocer sus biograf- desarrollo. Las obras, difciles a tual ofrece muchos libros que, por
as, as como una seleccin de sus veces de publicar en volumen, se su antigedad o su rareza, son dif-
obras a veces recitadas por ellos ofrecen en formato pdf. Como me- ciles de encontrar incluso en bi-
mismos lo que, aadido a fotogra- dida complementaria de apoyo a su bliotecas pblicas o universitarias.
fas y vdeos, hacen de esta seccin lectura, el visualizador necesario Materialmente, la pgina del portal
una autntica galera multimedia. para este formato est disponible est bien confeccionada y sus me-
Las fotos se visualizan en el nave- para descarga desde un enlace de ns conducen con facilidad a todos
gador de internet que utilicemos, esta seccin. los apartados y opciones. Como
pero el sonido y el vdeo requieren contrapunto comentar la disponibi-
del Reproductor de Windows Me - 4. Miscelnea: incluye una se- lidad de un servicio semanal gra-
dia que puede descargarse gratuita- rie de obras correspondientes a es- tuito de novedades incorporadas a
mente desde un vnculo de la Bi - tudios crticos, actas de congresos Bimicesa que slo requiere de una
blioteca. sobre temas hispnicos, homenajes direccin de correo electrnico pa-
a hispanistas y otras obras colecti- ra recibir peridicamente las nue-
2. Hemeroteca: incluye revis- vas. Tambin en formato html. vas incorporaciones.
tas culturales y cientficas como
por ejemplo: Hispania, publica- No acaban ah las posibilida- http://www.cervantesvirtual.com
cin oficial de la Association of Te - des. Adems de mltiples enlaces a
achers of Spanish and Portuguese portales de inters, como por ejem- Notas
of America, encontrndose accesi- plo a bibliotecas de todo el mundo, 1. Sabido, Vicente. El Proyecto Gutenberg.
bles en formato html los cuatro n- a proyectos de edicin electrnica En: Information world en espaol, 1996, octu-
meros que aparecieron en 1995. Es y a instituciones relacionadas con bre, n. 48, pp. 16-18.
de suponer que la disponibilidad la lengua y la cultura en espaol, la Vicente Sabido. Departamento de
de ste y otros muchos ttulos ir Cervantes Virtual ofrece una bi- Filologa Espaola, Universidad de
creciendo con el tiempo, pues lo blioteca de la historia; otra de im- Granada.
que existe es a veces algo escaso. genes; de signos (textos expresa- vsabido@ugr.es
Para suscriptores individuales (no escribir ningn nombre de institucin; indicar slo la direccin particular):
Deseo suscribirme a EL PROFESIONAL DE LA INFORMACIN durante un ao al precio especial de 9.990 pesetas +4% IVA / Eur 60 /
Dfl 137 / US$ 135. A los pagos realizados desde pases distintos de Espaa se les aplicar el IVA o VAT local.
* El valor expresado en dlares incluye el correo areo a Amrica.
Se adjunta a este boletn un cheque nominal (en florines holandeses) a nombre de Swets & Zeitlinger .
Pago por transferencia en pesetas a la cuenta n 0049 4700 33 2511824235 a nombre de Swets & Zeitlinger , del Banco Santander Central
Hispano, P de Gracia, 5. 08007 Barcelona, Tel.: 934 011 100. Adjunto fotocopia del resguardo.
Nombre:......................................................................................................................................................
Institucin:..................................................................................................................................................
Dpto:................................................................ NIF institucional:..............................................................
Enve este boletn a: