Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Se puede tratar de averiguar la estructura de un documenEl lenguaje de marcas ms extendido es el HTML (Hyto de esta clase buscando pistas en el texto. Por ejemplo, el
perText Markup Language, Lenguaje de marcado de hittulo puede ir precedido de varios saltos de lnea, y estar
pertexto), fundamento del World Wide Web (entramado
ubicado centrado en la pgina. Varios programas pueden
de comunicacin de alcance mundial).
deducir la estructura del texto basndose en esta clase de
Los lenguajes de marcado suelen confundirse con datos, aunque el resultado suele ser bastante imperfecto.
lenguajes de programacin. Sin embargo, no son lo mismo, ya que el lenguaje de marcado no tiene funciones
aritmticas o variables, como s poseen los lenguajes de 1.2 Marcado de procedimientos
programacin. Histricamente, el marcado se usaba y se
usa en la industria editorial y de la comunicacin, as co- El marcado de procedimientos est enfocado hacia la
mo entre autores, editores e impresores.
presentacin del texto, sin embargo, tambin es visible
Un ejemplo de cmo funciona el lenguaje de marcado para el usuario que edita el texto. El programa que reprepuede observarse en el dictado de viva voz de un docu- senta el documento debe interpretar el cdigo en el mismo orden en que aparece. Por ejemplo, para formatear un
mento a una persona que lo transcribe a mquina:
ttulo, debe haber una serie de directivas inmediatamente
antes del texto en cuestin, indicndole al software instrucciones tales como centrar, aumentar el tamao de la
fuente, o cambiar a negrita. Inmediatamente despus del
ttulo deber haber etiquetas inversas que reviertan estos
Ponga estilo de carta. ponga comillas, ponga
efectos. En sistemas ms avanzados se utilizan macros o
maysculas, Estimado Juan, ponga dos puntos,
pilas que facilitan el trabajo.
aparte, sangra, ponga primera letra mayscuAlgunos ejemplos de marcado de procedimientos son
nro, tro, TeX. Este tipo de marcado se ha usado extensivamente en aplicaciones de edicin profesional, ma-
la, te escribo esta carta, ponga negrillas, de forma muy urgente, cierre negrilla, ya que no me
has enviado... etc".
1
HISTORIA
1.3
Marcado descriptivo
2.1 Principales
El marcado descriptivo o semntico utiliza etiquetas paGML --> SGML --> XML --> Dialectos
ra describir los fragmentos de texto, pero sin especiXML
car cmo deben ser representados, o en qu orden. Los
lenguajes expresamente diseados para generar marcado
descriptivo son el SGML y el XML.
2.2 Documentos en general
Las etiquetas pueden utilizarse para aadir al contenido
cualquier clase de metadatos. Por ejemplo, el estndar 2.3 Tecnologas de internet
Atom, un lenguaje de sindicacin, proporciona un mtodo para marcar la hora actualizada, que es el dato fa- 2.4 Lenguajes especializados
cilitado por el editor de cundo ha sido modicada por
Grcos 2D: SVG, CGM, VML, InkML.
ltima vez cierta informacin. El estndar no especica
cmo se debe representar, o siquiera si se debe repre Grcos 3D: VRML/X3D, STEP.
sentar. El software puede emplear este dato de mltiples
maneras, incluyendo algunas no previstas por los disea Matemtica: MathML y OpenMath.
dores del estndar.
Msica: LilyPond y MusicXML.
Una de las virtudes del marcado descriptivo es su exibilidad: los fragmentos de texto se etiquetan tal como son,
Taxonoma: DITA
y no tal como deben aparecer. Estos fragmentos pueden
utilizarse para ms usos de los previstos inicialmente. Por
Finanzas: eXtensible Bussiness Reporting Languaejemplo, los hiperenlaces fueron diseados en un princige, Financial products ML.
pio para que un usuario que lee el texto los pulse. Sin
Geomtica: Geography ML.
embargo, los buscadores los emplean para localizar nuevas pginas con informacin relacionada, o para evaluar
Aeronutica: Spacecraft ML.
la popularidad de determinado sitio web.
Multimedia: Synchronized Multimedia Integration
El marcado descriptivo tambin simplica la tarea de reLanguage.
formatear un texto, debido a que la informacin del formato est separada del propio contenido. Por ejemplo, un
fragmento indicado como cursiva (<i>texto</i>), puede
emplearse para marcar nfasis o bien para sealar palabras en otro idioma. Esta ambigedad, presente en el
marcado presentacional y en el procedimental, no puede
soslayarse ms que con una tediosa revisin a mano. Sin
embargo, si ambos casos se hubieran diferenciado descriptivamente con etiquetas distintas, podran representarse de manera diferente sin esfuerzo.
El marcado descriptivo est evolucionando hacia el marcado genrico. Los nuevos sistemas de marcado descriptivo estructuran los documentos en rbol, con la posibilidad
de aadir referencias cruzadas. Esto permite tratarlos como bases de datos, en las que el propio almacenamiento
tiene en cuenta la estructura, no como en los grandes objetos binarios (blobs) como en el pasado. Estos sistemas
no tienen un esquema estricto como las bases relacionales, por lo que a menudo se las considera bases semiestructuradas.
Voz: VoiceXML.
Mensajera instantnea: XMPP.
Videojuegos: BulletML, COLLADA.
3 Historia
Los lenguajes de marcas se llaman as por la prctica tradicional de marcar los manuscritos con instrucciones de
impresin en los mrgenes. En la poca de la imprenta,
esta tarea ha correspondido a los marcadores, que indicaban el tipo de letra, el estilo y el tamao, as como la
correccin de errores, para que otras personas compusieran la tipografa. Esto condujo a la creacin de un grupo
de marcas estandarizadas.[1] Con la introduccin de las
computadoras, se traslad un concepto similar al mundo
de la informtica.
3.3
3.1
Orgenes
3.2
El primer lenguaje que diferenci claramente la estructura de la presentacin fue ciertamente el Scribe, desarrollado por Brian Reid y descrito en 1980 en su tesis doctoral.[3] Scribe era revolucionario por varios motivos, no
solo porque separaba el estilo de las propias marcas del
documento, tambin por el control gramtico del empleo
de elementos descriptivos. Scribe inuy en el desarrollo
de los lenguajes posteriores.
Otro de los principales estndares de publicacin es TeX,
creado y mantenido por Donald Knuth en los aos 70 y
80. TeX se centra en la estructura detallada del texto y la
descripcin de las fuentes, fundamentalmente en el campo de las publicaciones matemticas especializadas. Esto
oblig a Knuth a dedicar un tiempo considerable en el
estudio de la tipografa. Sin embargo, TeX requiere amplios conocimientos para ser utilizado, por lo que slo ha
cuajado en entornos acadmicos, en los que es el estndar
de facto en varias disciplinas cientcas. El software ms
extendido para el empleo de TeX es LaTeX.
CARACTERSTICAS
ticamente cuando Sir Tim Berners-Lee, que haba apren- mental de este lenguaje en que logra un equilibrio entre
dido SGML de su compaero en el CERN Anders Ber- simplicidad y exibilidad.
glund, utiliz la sintaxis SGML para crear el HTML.
El XML fue ideado en principio para entornos semiEste lenguaje era similar a cualquier otro creado a partir estructurados, como textos y publicaciones. Uno de los
del SGML, sin embargo result extraordinariamente sen- ejemplos ms claros es el XHTML, la redenicin del
cillo, tanto que el DTD no se desarroll hasta ms tarde. HTML en clave XML, con las ventajas que ello supone.
DeRose[5] argumenta que la exibilidad y escalabilidad Sin embargo pronto se observ que sus virtudes podan
del marcado HTML fue uno de los principales factores, ser tiles en campos bien distintos. Los lenguajes basajunto con el empleo de URLs y la distribucin libre de dos en XML tienen aplicaciones incontables, como en la
navegadores, del xito de la World Wide Web.
transaccin de datos entre servidores, intercambio de inEl HTML es hoy da el tipo de documento ms emplea- formacin nanciera, frmulas y reacciones qumicas, y
do en el mundo. Su sencillez era tal que cualquier persona un largo etctera.
poda escribir documentos en este formato, sin apenas necesidad de conocimientos de informtica. Esta fue una de
las razones de su xito, pero tambin condujo a un cierto
caos. El crecimiento exponencial de la web en los aos
90 produjo documentos en cantidades ingentes pero mal
estructurados, problema agravado an ms por la falta de
respeto por los estndares, por parte de diseadores web
y fabricantes de software.
3.5
La madurez: el XML
3.6 Tendencias
Las nuevas tendencias estn abandonando los documentos con estructura en rbol. Los textos de la literatura
antigua suelen tener estructura de prosa o de poesa:
versculos, prrafos, etc. Los documentos de referencia
suelen organizarse en libros, captulos, versos y lneas. A
menudo se entremezclan unos con otros, por lo que la estructura en rbol no se ajusta a sus necesidades. Los nuevos sistemas de modelado superan estos inconvenientes,
como el MECS, diseado para la obra de Wittgenstein, o
las TEI Guidelines, LMNL, y CLIX.
La Iniciativa de codicacin de textos o Text Encoding
Initiative (TEI) ha publicado multitud de guas[8] para la
codicacin de documentos de inters en humanidades y
ciencias sociales, desarrollados durante aos de trabajo
colaborativo internacional. Estas directrices se han empleado en innumerables proyectos de catalogacin de documentos histricos, trabajos acadmicos, etc.
Los lenguajes de marcado son la herramienta fundamental en el diseo de la web semntica, aquella que no solo
permite acceder a la informacin, sino que adems dene su signicado, de forma que sea ms fcil su procesamiento automtico y se pueda reutilizar para distintas aplicaciones.[9] Esto se consigue aadiendo datos adicionales a los documentos, por medio de dos lenguajes
El XML fue desarrollado por el World Wide Web Conexpresamente creados: el RDF (Resource descriptin fra[6]
sortium, mediante un comit creado y dirigido por Jon
mework-Plataforma de descripcin de recursos) y OWL
[7]
Bosak. El objetivo principal era simplicar el SGML
(Web Ontology Language-Lenguaje de ontologas para la
para adaptarlo a un campo muy preciso: documentos en
web), ambos basados en XML.
internet.
El nuevo lenguaje se extendi con rapidez, ya que todo
documento XML es a su vez SGML. Los programas y
documentos creados para y con SGML podan convertirse casi automticamente al nuevo lenguaje. El XML
simplic radicalmente la complejidad del SGML, facilitando el aprendizaje y la implementacin del nuevo estndar. Se solucionaron adems viejos problemas, como
los surgidos de la internacionalizacin, y la imposibilidad
de validar un documento sin schema. El acierto funda-
4 Caractersticas
4.1 Texto plano
Una de las principales ventajas de este tipo de codicacin es que puede ser interpretada directamente, dado que son archivos de texto plano. Esto es una ventaja
5
evidente respecto al los sistemas de archivos binarios, que
requieren siempre de un programa intermediario para trabajar con ellos. Un documento escrito con lenguajes de
marcado puede ser editado por un usuario con un sencillo editor de textos, sin perjuicio de que se puedan utilizar
programas ms sosticados que faciliten el trabajo.
Al tratarse solamente de texto, los documentos son
independientes de la plataforma, sistema operativo o
programa con el que fueron creados. Esta fue una de las
premisas de los creadores de GML en lo aos 70, para no
aadir restricciones innecesarias al intercambio de informacin. Es una de las razones fundamentales de la gran
aceptacin que han tenido en el pasado y del excelente
futuro que se les augura.
4.2
Compacidad
Las instrucciones de marcado se entremezclan con el propio contenido en un nico archivo o ujo de datos. Este
es un ejemplo en diferentes lenguajes de marcas:
aplicaciones aprovechan la sencillez y potencia del lenguaje XML. Esto ha permitido que se pueda combinar varios lenguajes de marcas diferentes en un nico archivo, como en el caso de XHTML+SMILy de
XHTML+MathML+SVG.[10]
5 Referencias
[1] Signos de correccin
[2] Conferencia titulada The Separation of Information Content of Documents from their Format, celebrada en Ottawa
en septiembre de 1967.
[3] Reid, Brian. Scribe: A Document Specication Language and its Compiler. Pittsburgh:Ph.D. thesis, CarnegieMellon University., tambin disponible como informe tcnico, CMU-CS-81-100.
[4] Referencia del estndar 8879 en la web del ISO
[5] DeRose, Steven J. (1997). The SGML FAQ Book. Boston:
Kluwer Academic Publishers. ISBN 0-7923-9943-9.
6 Bibliografa
4.3
Facilidad de procesamiento
Las organizaciones de estndares han venido desarrollando lenguajes especializados para los tipos de documentos de comunidades o industrias concretas. Uno de los
primeros fue el CALS, utilizado por las fuerzas armadas
de EE.UU. para sus manuales tcnicos. Otras industrias
con necesidad de gran cantidad de documentacin, como las de aeronutica, telecomunicaciones, automocin
o hardware, ha elaborado lenguajes adaptados a sus necesidades. Esto ha conducido a que sus manuales se editen nicamente en versin electrnica, y despus se obtenga a partir de sta las versiones impresas, en lnea o en
CD. Un ejemplo notable fue el caso de Sun Microsystems,
empresa que opt por escribir la documentacin de sus
productos en SGML, ahorrando costes considerables. El
responsable de aquella decisin fue Jon Bosak, que ms
tarde fundara el comit del XML.
4.4
Flexibilidad
Aunque originalmente los lenguajes de marcas se idearon para documentos de texto, se han empezado a utilizar en reas como grcos vectoriales, servicios web,
sindicacin web o interfaces de usuario. Estas nuevas
James H. Coombs, Allen H. Renear, Steven J. DeRose (1995). Markup Systems and the Future of
Scholarly Text Processing. Detroit, Estados Unidos: Universidad de Michigan. Consultado el 2006..
Originalmente publicado en 1987, introdujo conceptos hoy ampliamente utilizados, y sent las bases
para el desarrollo de los lenguajes descriptivos.
A. Fernndez-Valmayor, A. Navarro, B. FernndezManjn y J. L. Sierra. Lenguajes de programacin,
lenguajes de marcado y modelos hipermedia: una
visin interesada de la evolucin de los lenguajes informticos. Madrid: Universidad Complutense de
Madrid. ISSN 1139-8736 : 1139-8736 |issn= incorrecto (ayuda). Consultado el 2006..
Carolina Garca Catao y David Arroyo Menndez (2002). Biblioteca Digital y Web Semntica
(BiblioWeb de SinDominio edicin). Consultado el
2006.. Aplicacin de los lenguajes de marcas para
una biblioteca digital. Disponible bajo GFDL.
Goldfarb, Charles F. (1996). The Roots of SGML
-- A Personal Recollection. Consultado el 2006..
Goldfarb, Charles F. The SGML Handbook. Oxford
University Press. ISBN 0-19-853737-9.
Enlaces externos
Organizaciones de estndares:
Lenguajes de marcas segn el World Wide
Web Consortium (W3C)
International Organization for Standardization
(ISO)
Artculos:
Tesis doctoral sobre Hipertexto y lenguajes de
marcas. Mara Jess Lamarca Lapuente. UCM
Dos artculos de Tim Berners-Lee: Metadata
Architecture y Semantic Web Road map
Eventos:
Sitio web de la conferencia Extreme Markup
Languajes
ENLACES EXTERNOS
8.1
Text
Lenguaje de marcado Fuente: http://es.wikipedia.org/wiki/Lenguaje%20de%20marcado?oldid=80258610 Colaboradores: Oblongo, Sabbut, ManuelGR, Tony Rotondas, Bigsus, Triku, Sms, Tostadora, B1mbo, Jsanchezes, Barcex, Renabot, Boticario, Peejayem, Emijrp,
Rembiapo pohyiete (bot), Orgullobot~eswiki, RobotQuistnix, Chobot, Yrbot, Vitamine, Echani, Martini 001, Jesuja, Chlewbot, Nihilo, BOTpolicia, CEM-bot, Ignacio Icke, Pacovila, Rastrojo, Antur, Ingenioso Hidalgo, Thijs!bot, Neustradamus, JAnDbot, Raimundo
Pastor, TXiKiBoT, Cronos x, ColdWind, Mekatroniko, Jtico, Biasoli, Cinevoro, VolkovBot, Nicoguaro, Josell2, Matdrodes, Muro Bot,
C h a n-Wiki, Gerwekkkkkk, Jmvgpartner, SieBot, PaintBot, Loveless, Drinibot, Bigsus-bot, BOTarate, SPZ, BuenaGente, Antn Francho, DragonBot, Eduardosalg, Intimalai, AVBOT, MastiBot, SubSevenMoRpHeEuS, Peti610bot, Argentumm, Madalberta, Luckas-bot,
Nallimbot, Ptbotgourou, FariBOT, SuperBraulio13, D'ohBot, Jerowiki, PatruBOT, TjBot, EmausBot, AVIADOR, Mentorlch, JackieBot,
Jon499, MerlIwBot, KLBot2, CsarGuti, MetroBot, Ninrouter, Tximitx, Leitoxx, Addbot, AlichiaUruguay, Jarould y Annimos: 47
8.2
Images
Archivo:Artculo_bueno.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/e/e5/Art%C3%ADculo_bueno.svg Licencia: Public domain Colaboradores: Circle taken from Image:Symbol support vote.svg Artista original: Paintman y Chabacano
Archivo:OED-LEXX-Bungler.jpg Fuente: http://upload.wikimedia.org/wikipedia/commons/9/9a/OED-LEXX-Bungler.jpg Licencia:
CC-BY-SA-3.0 Colaboradores: ? Artista original: ?
Archivo:Xml.gif Fuente: http://upload.wikimedia.org/wikipedia/commons/6/63/Xml.gif Licencia: Public domain Colaboradores: Trabajo
propio Artista original: User:Boly38
8.3
Content license