Clase 10, 20042020

Modelo de datos
semiestructurados
BASES DE DATOS
Introducción
 Los datos semiestructurados son datos que no se han organizado en un repositorio especializado, como
una base de datos, pero que, sin embargo, tienen información asociada, como metadatos, que hace que
sea más fácil de procesar que los datos sin procesar.
Datos semiestructurados
 Los datos semiestructurados son una forma de datos estructurados que no se ajustan a la estructura formal de
los modelos de datos asociados con bases de datos relacionales u otras formas de tablas de datos , pero que,
sin embargo, contienen etiquetas u otros marcadores para separar los elementos semánticos y hacer cumplir
las jerarquías de Registros y campos dentro de los datos. Por lo tanto, también se conoce como estructura
autodescriptiva .
 En los datos semiestructurados, las entidades que pertenecen a la misma clase pueden tener
atributos diferentes aunque estén agrupados, y el orden de los atributos no es importante.
 Los datos semiestructurados se producen cada vez más desde la llegada de Internet, donde los
documentos de texto completo y las bases de datos ya no son las únicas formas de datos, y las
diferentes aplicaciones necesitan un medio para intercambiar información . En bases de datos
orientadas a objetos , a menudo se encuentran datos semiestructurados.
Diferencias
La diferencia entre datos estructurados, datos no estructurados y datos semiestructurados: los datos no estructurados
no se han organizado en un formato que facilite el acceso y el procesamiento. En realidad, muy pocos datos están
completamente desestructurados.
Incluso las cosas que a menudo se consideran datos no estructurados, como documentos e imágenes, se estructuran
en cierta medida.
Diferencias
 Los datos estructurados son básicamente lo opuesto a los no estructurados: se han reformateado
y sus elementos se han organizado en una estructura de datos para que los elementos se puedan
abordar, organizar y acceder en varias combinaciones para hacer un mejor uso de la información.
Los datos semiestructurados se encuentran en algún lugar entre los dos.
 No está organizado de una manera compleja que hace posible el acceso y el análisis
sofisticados; sin embargo, puede tener información asociada, como Etiquetado de metadatos ,
que permite abordar los elementos contenidos.
Tipos de datos semiestructurados
XML
 XML , otros lenguajes de marcado, correo electrónico y EDI son todas formas de datos
semiestructurados. OEM (Object Exchange Model) se creó antes de XML como un medio de
autodescripción de una estructura de datos. XML ha sido popularizado por servicios web que se
desarrollan utilizando los principios de SOAP.
 En vista de este hecho, se podría decir que XML tiene una “estructura flexible” capaz de un flujo y una
jerarquía centrados en el ser humano, así como una estructura de elementos y una tipificación de datos
altamente rigurosos.
Características
 Datos Irregulares que no poseen un esquema en particular y que solo poseen etiquetas que separan un
dato de otro, como por ejemplo ficheros XML que contienen datos de personas. Dichos campos están
definidos, pero pueden variar.
 Las características que se presentan en este tipo de datos, se debe a que cada quien persona publica los
datos a su manera, y esto es lo que se presenta en el internet; ya que al ingresar a cualquier sitio web o
página de internet se puede observar tal situación, es decir que no existe una estructura o formato
definido en 33 la presentación de estos datos y de esta forma se hace difícil realizar cualquier
procesamiento con este tipo de datos.
Ventajas
Los programadores que persisten los objetos desde su aplicación a una base de datos no tienen que
preocuparse por la falta de coincidencia de impedancia relacional del objeto , pero a menudo pueden
serializar objetos a través de una biblioteca liviana.
El soporte para datos anidados o jerárquicos a menudo simplifica los modelos de datos que representan
relaciones complejas entre entidades.
La compatibilidad con listas de objetos simplifica los modelos de datos al evitar las traducciones
desordenadas de las listas en un modelo de datos relacionales.
Desventajas
El modelo de datos relacionales tradicional tiene un lenguaje de consulta popular y listo, SQL .
Propenso a “basura en, basura fuera”; Al eliminar las restricciones del modelo de datos, hay menos
prelanzamientos necesarios para operar una aplicación de datos.
Aplicaciones
De hecho, la web es la mayor fuente de información que existe en la actualidad. Pero, ¿En qué modelo de
datos está basada la web? En general decimos que es el modelo de datos semi-estructurado. Además la
mayoría de las veces los datos semi-estructurados se refieren a datos con estructura arborescente y explicar
por qué las operaciones de navegación en árbol son importantes en formatos como XML y JSON.
Bibliografías:
http://repositorio.ug.edu.ec/bitstream/redug/16813/1/UG-FCMF-B-CINT-PTG-N.127.pdf
http://dc.sigedep.exactas.uba.ar/media/academic/grade/thesis/ilyef.pdf
http://spaceanalytics.blogspot.com/2016/11/datos-semiestructurados.html
https://pcweb.info/datos-semiestructurados-definicion-que-son-tipos-ventajas-y-desventajas/
https://ldc.usb.ve/~ruckhaus/materias/ci7453/clase3.pdf

Clase 10, 20042020

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 10, 20042020

Cargado por

Copyright:

Formatos disponibles

Modelo de datos

También podría gustarte