Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lenguajes de Marchas y Sistemas de Gestion de Informacion (Apuntes)
Lenguajes de Marchas y Sistemas de Gestion de Informacion (Apuntes)
MAPA CONCEPTUAL
Herramientas de edición.
Clasificación y características.
XML: estructura y sintaxis.
Identificación de ámbitos de aplicación.
GLOSARIO
ASCII. Sigla inglesa que significa “código estándar estadounidense para el intercambio de
información”. Código de caracteres basado en el alfabeto latino creado por el Comité
Estadounidense de Estándares en 1963.
JAVA EE. Lenguaje de programación interpretado y poco tipado, usado mayormente en el lado
del cliente junto con documentos HTML, haciéndolos dinámicos y mejorando su interfaz.
TEX. Sistema topográfico usado por los matemáticos, físicos e informáticos de distribución y
modificación libre escrito por Donald E. Kunth.
Unicode. Estándar de codificación de caracteres mantenido por el UCT, que asocia a cada
carácter un identificador numérico.
Visual Studio. Entorno de desarrollo que soporta los lenguajes C++, Java, C#, ASP.NET, etc.
W3C (World Wide Web Consortium). Consorcio internacional creado en 1994 para generar
estándares relacionados con la red informática mundial (www).
1.1. INTRODUCCION
El uso de internet por parte de los usuarios está creciendo en los últimos años. La gran mayoría
de los internautas navegan e intercambian información a través de la red, manejando las
páginas web que internamente hacen uso de los lenguajes de marcas y permitiendo que todo
fluya con normalidad, proceso que es transparente para los usuarios.
SABIAS QUE…
A principios de los años 90, Tim Berners-Lee desarrolla HTML, que permite visualizar la
información de páginas web en los distintos navegadores. Dos de los lenguajes de marcas que
se verán en próximos capítulos son HTML y XML.
Una herramienta fundamental que se usa para visualizar documentos XML, HTML, XHTML,
etc., es el navegador web o browser en inglés. Son aplicaciones instaladas en distintos
dispositivos cuya funcionalidad es dar acceso a la web, mostrando a los usuarios la
interpretación de los lenguajes de marcas. En los últimos años, han evolucionado a gran ritmo,
incorporando multitud de nuevas funciones.
Recuerda que navegador no es lo mismo que buscador. Hoy en día se usan para consultar el
correo electrónico y las páginas web, realizar búsquedas, acceder a la configuración del router,
etc.
En este apartado, se verá una clasificación de los lenguajes de marcas atendiendo a tres tipo
distintos y mostrando ejemplos de los más usados, así como describiendo las características
comunes que poseen.
El uso de los lenguajes de marcas es muy diverso. Se utilizan para mensajería XMPP (extensible
messaging and presence protocol), servicios web WSDL (web services description language),
SOAP (simple object Access protocol), páginas web HTML, WML (Wireless markup language),
sindicación de contenidos RSS (really simple syndication), Atom, gráficos vectoriales X3D,
documentación electrónica RTF (rich text format), TeX, wikitexto, etc.
En el ejemplo se observa una serie de etiquetas creadas para un documento XML que
almacena información relacionada con los exámenes de distintas materias de un ciclo. En este
caso concreto se han creado dos materiales de las que se almacenan el hombre, el número de
alumnos aprobados y suspensos y las unidades de cada una.
1.2.2 CARACTERÍSTICAS COMUNES
No todos los lenguajes de marcas comparten las mismas características debido a la gran
cantidad que pueden encontrarse de estos lenguajes como puede ser el uso de texto plano,
flexibilidad, interoperabilidad, etc.
Este tipo de documentos, también llamados texto sin formato o simple, no permite almacenar
información con formato (color, tipo de letra, negrita, tamaño, subrayados, etc.) tal y como
puede hacerlo un procesador de texto avanzado. Están formados exclusivamente por
caracteres (letras, números, caracteres especiales y de control).
Uno de los editores que pueden encontrarse en Windows para crear un documento de texto
plazo es el Bloc de notas (Notepad), cuya extensión es .txt, mientras que, si se usa Linux, Gedit
Vi o Nano pueden ser los más usados.
Tal y como se ha mencionado anteriormente, al estar formado por caracteres, se emplea una
codificación específica que suele ser ASCII, ISO 8859-1, Unicode o UTF-8. Estándares de
codificación permiten representar los distintos caracteres en todos los idiomas. ISO 8859-1 se
usa para la codificación del alfabeto latino (ñ, letras acentuadas, etc.). En el ejercicio resuelto
1.1. se verá que cada carácter que se escribe en un documento de texto plano ocupa un byte o
lo que es lo mismo 8 bits. Hay que recordar que el espacio en blanco también se considera
carácter.
B) Interoperabilidad o independencia
Se considera el texto plano como formato universal, ya que puede abrirse y editarse desde
cualquier máquina, aunque ha de tenerse en cuenta la codificación empleada. Son
independientes a la plataforma usada y a cualquier sistema de representación.
Aunque este apartado se estudiará con más profundidad en el capítulo 4, se mostrará una
introducción a su estructura y sintaxis para ir asimilando la terminología empleada.
Todo documento XML tiene estructura jerárquica arborescente y está compuesto por dos
partes fundamentales: prólogo, que será la primera parte del documento y estará compuesto
por una o varias líneas, y el cuerpo.
En este ejemplo de prólogo estaría compuesto por la primera línea donde se declara la versión
XML, así como la codificación empleada para representar los caracteres, mientras que el resto
del documento, el cuerpo, estaría compuesto por elementos anidados. Dentro de la etiqueta
<cine>, se incluyen las distintas películas de la cartelera. En este caso, se ha introducido una
película y se guarda información relativa al director, la duración y el título.
Las etiquetas van encerradas entre el signo menor que (<) y mayor que (>) y suelen ir
emparejadas, una de apertura y otra de cierre. También existen etiquetas vacías, tal y como se
aprecia en el ejemplo siguiente donde existe en la primera línea una etiqueta de apertura y
cierre para el elemento email y una etiqueta para el elemento casado con un atributo v con
valor “no”. Los atributos añaden propiedades a los elementos y van dentro de la etiqueta
apertura.
En este apartado, se tratan las herramientas básicas relacionadas con la edición de páginas
web, así como otras para la creación de documentos XML, estudiando algunas de mayor
prestación en capítuloas posteriores. Al ifual que para otro tipo de software, pueden
encontrarse tanto herramientas offline, que tienen que descargarse e instalarse en el
ordenador personar para poder usarlas, y online, donde el único requisito es disponer de una
conexión a internet y el uso de un navegador para acceder.
Gedit es un editor de texto de fácil uso para el entorno de escritorio GNOME, aunque también
está disponible para Windows. Suele emplearse como simple bloc de notas, utilizar las
características avanzadas y usarlo como entorno de desarrollo. Además de las características
generales que pueden tener cualquier editor de texto como copiar, guardar, abrir, imprimir,
etc., permite el coloreado de sintaxis dependiendo del lenguaje de programación usado, así
como la activación de la numeración de líneas, accediendo al menú Editar Preferencias
Ver y marcando la casilla “Mostrar los números de línea”.
1.5.3 NOTEPAD++
Es un potente editor de texto gratuito de licencia GPL para sistemas operativos Windows. Está
escrito en C++ usando la API Win32. Permite seleccionar multitud de lenguajes de
programación. Organiza el texto según el lenguaje seleccionado y muestra, entre otros
aspectos, numeración de líneas, color de texto en etiquetas según la sintaxis, aumento de
tamaño de letra, etc.
Entre sus características, destacan las siguientes: permite ampliar y reducir texto,
autocompletar, búsqueda y reemplazo, y resaltado de sintaxis.
Para poder elaborar un documento XML bien formado, es necesario seguir una serie de reglas,
entre las que destacan:
Sobre el mismo documento, van a realizarse algunas modificaciones para ver el resultado que
muestra el navegador:
Al ejecutar en el navegador, aparece la infromacion que se muestra en la figura que viene a
continuación, donde se indica que, en la línea 5, la etiqueta <nombre> no está especificada.
Como puede observarse, en la línea 5, se ha añadido una etiqueta de apertura que empieza
por minúsculas y de cierre con mayúsculas. Se arregla y vuelve a comprobarse si existen
errores, obteniendo como resultado un fallo en la línea 8. Se muestra en la figura a
continuación:
La etiqueta <email> empieza por un número. Se quita dicho número y vuelve a comprobarse si
existen errores. Esta vez, se obtiene el resultado correcto.
Otra alternativa es usar XML Copy Editor, que también permite comprobar si el documento
está bien formado, donde el mensaje se muestra en la parte inferior de la ventana.
1.7. UTILIZACION DE ESPACION DE NOMBRE EN XML
Los espacios de nombres son mecanismos que se usan para distinguir etiquetas que se
denominen igual al emplear varios documentos XML, evitando de esta manera la ambigüedad.
Se declara de la siguiente manera:
Se dispone de dos documentos XML distintos con un elemento banco que aparece tanto en el
documento XML1 como en el XML2, pero con estructura y significado distintos. El primer
elemento hace referencia a un banco para sentarse, mientras que el segundo, a una entidad
bancaria.
Documento XML1:
Documento XML2:
Si quieren usarse los elementos de los dos XML en otro documento, se actúa de la siguiente
manera, definiendo dos espacios de nombres de prefijos b1 y b2: