Está en la página 1de 8

INSTITUTO TECNOLOGICO DE SAN LUIS POTOSI

ADMINISTRACION Y ORGANIZACION DE DATOS

UNIDAD 3

EQUIPO 3:

BAUTISTA BELMONTE ISAAC CADMIEL

VALDEZ GONZALEZ SERGIO DANIEL

ZAPATA ROJAS JORGE

DEPARTAMENTO DE SISTEMAS Y COMPUTACION


3.1 procesamiento de archivos csv
Archivos CSV

CSV (Comma-Separated Values) son un tipo de archivo en formato abierto, que se


pueden representar los datos en una tabla, donde las columnas son separadas por
comas y las filas por saltos de linea.

El formato de archivo CSV (*.csv) guarda únicamente el texto y los valores como
aparezcan en las celdas de la hoja de cálculo activa. Todas las filas y todos los
caracteres en cada celda se guardarán. Las columnas de datos se separan
mediante comas y cada fila termina en un retorno de carro. Si una celda contiene
una coma, el contenido de la celda se escribirá entre comillas dobles. Si las celdas
presentan fórmulas en vez de valores, éstas se convertirán como texto. Todo el
formato, gráficos, objetos y cualquier otro contenido de la hoja de cálculo se
perderán. El símbolo del euro se convertirá en signo de interrogación.

Previo a la creación del archivo CSV en Microsoft® Excel, se requiere definir


realizar la configuración regional del sistema operativo en los siguientes
parámetros:

 Separador de decimales: punto


 Separador de miles: coma
 Separador de lista: coma
Ejemplo de una estructura de formato CSV:
El formato RFC 4180, indica que cada registro se encuentra en una linea distinta,
puede tener una linea de cabecera opcional como primer linea que contiene el
mismo numero de campos. Dentro de la cabecera y los registros y se separan por
comas. Los espacios se consideran dentro del campo, y el ultimo campo no debe
tener coma. Se pueden usar las comillas dobles en los campos.

En el caso de que se encuentren comas en el mismo texto, entonces, se utilizan


las comillas dobles para citar la diferencia.

El borrado consiste en marcar el registro con un carácter especial, no requiere


ninguna otra acción especial. Para la actualización si el registro no cambia de
tamaño, se actualiza directamente, en cambio, si la longitud varia habrá que
marcar el registro como borrado y realizar la posterior inserción como si de uno
nuevo se tratara.

<?xml version="1.0" encoding="ISO-8859-1"?>

<!-- Edited by XMLSpy® -->

<notes>

<note type=“Post-it”>

<to>Paco</to>

<from>Juana</from>

<heading>Lista de la compra</heading>

<body>¡Acuérdate de la compra!</body>

</note>

<note type=“Correo electrónico”>

<to>Aurora</to>

<from>Manuel Esteban</from>

<heading>Re: Felicitación</heading>

<body>Gracias por tu felicitación...</body>

</note>

...
</notes>

Un programa en XML, es un lenguaje para estructurar documentos de manera


explicita, usando "marcas", tal como es HTML (Hypertext Markup Language,
Lenguaje de Marcas Hipertexto). HTML se utiliza para definir el contenido de una
pagina, y los elementos que se visualizan en un navegador.

Conocer, y aplicar cada uno de los métodos de búsqueda y ordenación de


archivos.

La reorganización, o compactación requerida de un archivo auxiliar donde ir


copiando los registros válidos, comenzando por el primero hasta el final del
archivo. Es una operación bastante costosa de eficiencia.

Documento Correcto de XML

Competencia:

Los archivos CSV (Comma-Separated Values), es un documento que contiene


información en un formato generalmente una tabla. Donde las columnas (campos,
se separan por comas), y las filas (registros, se separan por salto de linea).

Este tipo de formato es muy usado y se crea generalmente en un hoja de calculo,


pero puede ser cualquier procesador de datos. Este tipo de archivo utiliza, un
formato denominado RFC 4180, el cual da formato y tipo.

Usa una sintaxis estándar para todos lenguajes de marcado.

Existen varios lenguajes asociados DTD, XML schema, XSLT.

Herramientas y software Analizadores, Generadores, Interpretes y Editores.


El formato o la sintaxis básica es:

Ejemplo en MS Excel:
El hecho de que no tengan una estructura definida, obliga a que con cada dato se
deba almacenar información acerca de su contenido. Cada registro está
compuesto por el par identificador / valor con separadores entre ambos y a su vez
con separadores entre diferentes parejas. El espacio que ocupan con respecto a la
información verdaderamente útil es excesivamente elevado.

Actividades:

La lectura exhaustiva es una operación poco costosa de eficiencia. La lectura


ordenada, por el contrario, es una operación muy costosa de eficiencia. Para cada
dato hay que leer de nuevo el archivo completo.
3.2 procesamiento de archivos xml

Archivos XML

XML es un lenguaje de meta marcado que ofrece un formato para la descripción


de datos estructurados. Esto facilita unas declaraciones de contenido más
precisas y unos resultados de búsquedas más significativos en varias plataformas.
Además, XML habilitará una nueva generación de aplicaciones para ver y
manipular datos basadas en el Web.

XML ofrece una representación estructural de los datos que se puede implementar
ampliamente y es fácil de distribuir. XML es un subconjunto de SGML optimizado
para el Web. Definido por el World Wide Web Consortium (W3C) (en inglés), XML
garantiza que los datos estructurados sean uniformes e independientes de
aplicaciones o fabricantes. La interoperabilidad resultante está creando
rápidamente una nueva generación de aplicaciones de comercio electrónico en la
Web.

XML, que proporciona un estándar de datos que puede codificar el contenido, la


semántica y los esquemas de una gran variedad de casos, desde los más simples
a los más complejos, sirve para marcar lo siguiente:

Un documento normal.

Un registro estructurado, como un registro de citas o un pedido de compra.

Un objeto con datos y métodos, como el formulario permanente de un objeto Java


o de un control ActiveX.

Un registro de datos, como el conjunto de resultados de una consulta.

Metacontenido sobre un sitio Web, como el formato de definición de canal (CDF).

Representaciones gráficas, como la interfaz de usuario de una aplicación.

Entidades y tipos de esquema estándar.

Todos los vínculos entre datos y personas que hay en el Web.


3.3 Organizaciones de Archivos no Estructuradas
Ventajas:

Ejemplo en Python 2.6

XML (eXtensible Markup Language, Lenguaje de Marcas Extensible), es un


estándar para lenguaje de marcado del W3C

Diseñado para escribir documentos estructurados y cualquier información en


forma de texto.

Las marcas son etiquetas "< >"

Crea una estructura jerárquica "árbol"

Permite definir lenguajes de marcado específicos para una aplicación concreta.


Bibliografía
https://prezi.com/wxtvp-vvqqs7/unidad-3-organizacion-de-archivos-actuales/

http://gabomichel.blogspot.com/2012/02/archivos-csv-y-xml.html

También podría gustarte