Está en la página 1de 8

Administración y Organización de Archivos ITSS

Administración y Organización de Archivos

Catedrático: M.I. Herschell Serna López

Unidad III. Organización de Archivos Actuales.

3.1. Procesamiento de archivos CSV.

Los ficheros CSV (del inglés comma-separated values) son un tipo de documento en formato
abierto sencillo para representar datos en forma de tabla, en las que las columnas se separan por
comas (o punto y coma en donde la coma es el separador decimal: España, Francia, Italia...) y las
filas por saltos de línea. Los campos que contengan una coma, un salto de línea o una comilla
doble deben ser encerrados entre comillas dobles.

El formato CSV es muy sencillo y no indica un juego de caracteres


concreto, ni cómo van situados los bytes, ni el formato para el salto
de línea. Estos puntos deben indicarse muchas veces al abrir el
fichero, por ejemplo, con una hoja de cálculo.

1,0,0 0,1,0 -1,0,0 0,-1,0 1,0,0

1,0,0 0,1,0 -1,0,0 0,-1,0 1,0,0

Los programas de hojas de cálculo como Microsoft Excel permiten crear y editar archivos CSV
fácilmente.

Catedrático: M.I. Herschell Serna López Página 1


Administración y Organización de Archivos ITSS

El formato de este archivo debe ser una tabla con una cabecera o línea de título que defina los
campos que contiene. Gmail admite varios campos de cabecera comunes como, por ejemplo,
nombre, dirección de correo electrónico, etc. Si vas a actualizar un archivo existente, es probable
que no necesites cambiar los nombres de los campos de cabeceras; si vas a crear un nuevo archivo
y necesitas alguna orientación, puedes usar cualquiera de los nombres de campos utilizados en los
ejemplos mostrados.

A continuación, te ofrecemos algunos consejos adicionales que te servirán a la hora de crear el


archivo:

 El archivo debe incluir un campo para la dirección de correo electrónico.

 El campo Nombre puede ser una única columna, como la siguiente:

 cabecera > nombre

 información del contacto > Marta López García

 Si lo prefieres, también puedes utilizar campos separados para el nombre, el primer


apellido y el segundo como, por ejemplo:

 cabecera > nombre primer apellido segundo apellido

 Inf. del contacto > Marta López García

 Cuando guardes esta tabla como archivo .csv y la importes a Gmail, se añadirá la entrada -
Marta López - a tu lista Contactos.

 Una vez que hayas introducido todos tus contactos en una tabla, guarda el documento y
selecciona CSV (delimitado por comas) (*.csv) como el tipo de archivo que deseas
guardar. Si el sistema te solicita que verifiques la selección, haz clic en Sí o en Aceptar.

 Si deseas obtener más información sobre los archivos CSV, consulta la Ayuda de Excel.

 Una vez que hayas guardado el archivo, ya puedes importar tu archivo CSV a Gmail.

Fuente: http://es.wikipedia.org/wiki/CSV, https://support.google.com/mail/answer/12119?hl=es

Catedrático: M.I. Herschell Serna López Página 2


Administración y Organización de Archivos ITSS

3.2. Procesamiento de archivos XML.

XML, siglas en inglés de eXtensible Markup Language ('lenguaje de marcas extensible'), es un


lenguaje de marcas desarrollado por el World Wide Web Consortium (W3C) utilizado para
almacenar datos en forma legible.

Deriva del lenguaje SGML y permite definir la gramática de lenguajes específicos (de la misma
manera que HTML es a su vez un lenguaje definido por SGML) para estructurar documentos
grandes. A diferencia de otros lenguajes, XML da soporte a bases de datos, siendo útil cuando
varias aplicaciones se deben comunicar entre sí o integrar información. (Bases de datos
Silberschatz).

XML no ha nacido sólo para su aplicación para Internet, sino que se propone como un estándar
para el intercambio de información estructurada entre diferentes plataformas. Se puede usar en
bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable.

XML es una tecnología sencilla que tiene a su alrededor otras que la complementan y la hacen
mucho más grande y con unas posibilidades mucho mayores. Tiene un papel muy importante en la
actualidad ya que permite la compatibilidad entre sistemas para compartir la información de una
manera segura, fiable y fácil.

Historia.

XML proviene de un lenguaje inventado por IBM en los años setenta, llamado GML (Generalized
Markup Language), que surgió por la necesidad que tenía la empresa de almacenar grandes
cantidades de información. Este lenguaje gustó a la ISO, por lo que en 1986 trabajaron para
normalizarlo, creando SGML (Standard Generalized Markup Language), capaz de adaptarse a un
gran abanico de problemas. A partir de él se han creado otros sistemas para almacenar
información.

Catedrático: M.I. Herschell Serna López Página 3


Administración y Organización de Archivos ITSS

En el año 1989 Tim Berners Lee creó la web, y junto con ella el lenguaje HTML. Este lenguaje se
definió en el marco de SGML y fue de lejos la aplicación más conocida de este estándar. Los
navegadores web sin embargo siempre han puesto pocas exigencias al código HTML que
interpretan y así las páginas web son caóticas y no cumplen con la sintaxis. Estas páginas web
dependen fuertemente de una forma específica de lidiar con los errores y las ambigüedades, lo
que hace a las páginas más frágiles y a los navegadores más complejos.

Ventajas del XML.

Es extensible: Después de diseñado y puesto en producción, es posible extender XML con la


adición de nuevas etiquetas, de modo que se pueda continuar utilizando sin complicación alguna.

El analizador es un componente estándar, no es necesario crear un analizador específico para cada


versión de lenguaje XML. Esto posibilita el empleo de cualquiera de los analizadores disponibles.
De esta manera se evitan bugs y se acelera el desarrollo de aplicaciones.

Si un tercero decide usar un documento creado en XML, es sencillo entender su estructura y


procesarla. Mejora la compatibilidad entre aplicaciones. Podemos comunicar aplicaciones de
distintas plataformas, sin que importe el origen de los datos, es decir, podríamos tener una
aplicación en Linux con una base de datos Postgres y comunicarla con otra aplicación en Windows
y Base de Datos MS-SQL Server.

Transformamos datos en información, pues se le añade un significado concreto y los asociamos a


un contexto, con lo cual tenemos flexibilidad para estructurar documentos.

Estructura de un documento XML.

<?xml version="1.0" encoding="UTF-8" ?>

<!DOCTYPE Edit_Mensaje SYSTEM "Edit_Mensaje.dtd">

<Edit_Mensaje>

<Mensaje>

<Remitente>

<Nombre>Nombre del remitente</Nombre>

<Mail> Correo del remitente </Mail>

Catedrático: M.I. Herschell Serna López Página 4


Administración y Organización de Archivos ITSS

</Remitente>

<Destinatario>

<Nombre>Nombre del destinatario</Nombre>

<Mail>Correo del destinatario</Mail>

</Destinatario>

<Texto>

<Asunto>

Este es mi documento con una estructura muy sencilla

no contiene atributos ni entidades...

</Asunto>

<Parrafo>

Este es mi documento con una estructura muy sencilla

no contiene atributos ni entidades...

</Parrafo>

</Texto>

</Mensaje>

</Edit_Mensaje>

Partes de un documento XML.

Un documento XML está formado por el prólogo y por el cuerpo del documento así como texto de
etiquetas que contiene una gran variedad de efectos positivos o negativos en la referencia
opcional a la que se refiere el documento, hay que tener mucho cuidado de esa parte de la
gramática léxica para que se componga de manera uniforme.

Prologo.

Aunque no es obligatorio, los documentos XML pueden empezar con unas líneas que describen la
versión XML, el tipo de documento y otras cosas. El prólogo de un documento XML contiene:

Catedrático: M.I. Herschell Serna López Página 5


Administración y Organización de Archivos ITSS

Una declaración XML. Es la sentencia que declara al documento como un documento XML.

Una declaración de tipo de documento. Enlaza el documento con su DTD (definición de tipo de
documento), o el DTD puede estar incluido en la propia declaración o ambas cosas al mismo
tiempo.

Uno o más comentarios e instrucciones de procesamiento.

EJEMPLO: <?xml version="1.0" encoding="UTF-8"?>

Cuerpo.

A diferencia del prólogo, el cuerpo no es opcional en un documento XML, el cuerpo debe contener
solo un elemento raíz, característica indispensable también para que el documento esté bien
formado. Sin embargo es necesaria la adquisición de datos para su buen funcionamiento.

EJEMPLO:

<Edit_Mensaje>

(...)

</Edit_Mensaje>

Elementos.

Los elementos XML pueden tener contenido (más elementos, caracteres o ambos), o bien ser
elementos vacíos.

Atributos.

Los elementos pueden tener atributos, que son una manera de incorporar características o
propiedades a los elementos de un documento. Deben ir entre comillas.

Por ejemplo, un elemento «estudiante» puede tener un atributo «Mario» y un atributo «tipo»,
con valores «come croquetas» y «taleno» respectivamente.

<Estudiante Mario="come croquetas" tipo="taleno">Esto es un día que Mario va


paseando…</Estudiante>.

Catedrático: M.I. Herschell Serna López Página 6


Administración y Organización de Archivos ITSS

Entidades predefinidas.

Entidades para representar caracteres especiales para que, de esta forma, no sean interpretadas
como marcado en el procesador XML.

Ejemplo: entidad predefinida: & carácter: &.

Secciones CDATA.

Es una construcción en XML para especificar datos utilizando cualquier carácter sin que se
interprete como marcado XML. No confundir con 2(#PCDATA) que es para los elementos. Permite
que caracteres especiales no rompan la estructura. Ejemplo:

<![CDATA[contenido especial: \n áéíóúñ&]]>.

Comentarios.

Comentarios a modo informativo para el programador que han de ser ignorados por el
procesador. Los comentarios en XML tienen el siguiente formato:

<!--- Esto es un comentario --->

<!-- Otro comentario -->.

Herramientas para trabajar con documentos XML.

De hecho cualquier procesador de texto, que sea capaz de producir archivos .txt es capaz de
generar XML, aunque en los entornos de desarrollo como Eclipse o Visual Studio, se facilita, ya que
reconoce los formatos y ayuda a generar un XML bien formado.

Fuente: http://es.wikipedia.org/wiki/Extensible_Markup_Language

3.3. Organizaciones de archivos no estructurados.

El hecho de que no tengan una estructura definida, obliga a que con cada dato se deba almacenar
información acerca de su contenido. Los registros tienen la forma que muestra la figura:

Catedrático: M.I. Herschell Serna López Página 7


Administración y Organización de Archivos ITSS

Cada registro está compuesto por el par identificador/valor con separadores entre ambos y, a su
vez, con separadores entre diferentes parejas. Por su propia naturaleza auto descriptiva el espacio
que ocupan con respecto a la información verdaderamente útil es excesivamente elevado. A
continuación vamos a describir en qué modo afecta la estructura de este tipo de organización a
las operaciones elementales que pueden realizarse con archivos.

 La inserción: tiene un coste computacional bajo ya que siempre se insertaran los nuevos
registros al final del último bloque en disco.  
 La lectura: es totalmente secuencial desde el comienzo y puede suponerla lectura del
archivo completo. Para cada registro accedido, antes de comparar con su valor hay que
localizar el identificador deseado según el criterio de búsqueda establecido. Es por tanto,
una operación costosa de eficiencia. La lectura consecutiva del registro siguiente (en
orden) dado su anterior es costosa ya que el archivo no mantiene orden alguno. Supondrá
la lectura de todo el archivo desde su inicio, y el orden de eficiencia es costoso. La
lectura exhaustiva es una operación poco costosa de eficiencia. La lectura ordenada, por
el contrario, es una operación muy costosa de eficiencia. Para cada dato hay que leer de
nuevo el archivo completo.
 El borrado consiste en marcar el registro con un carácter especial. No requiere ninguna
otra acción especial. Su eficiencia es baja.
 La actualización. Si el registro no cambia de tamaño, se actualiza directamente. En
cambio, si la longitud varía habrá que marcar el registro como borrado y realizar la
posterior inserción como si de uno nuevo se tratara. En cualquier caso, la eficiencia es
baja.
 La reorganización, o compactación requerida de un archivo auxiliar donde ir copiando los
registros válidos, comenzando por el primero hasta el final del archivo. Es una operación
bastante costosa de eficiencia.

Fuente: http://es.scribd.com/doc/146424533/Organizacion-de-archivos-no-estructurados#scribd

Catedrático: M.I. Herschell Serna López Página 8

También podría gustarte