Documentos de Académico
Documentos de Profesional
Documentos de Cultura
30/06/2022 1
UNIVERSIDAD TECNOLÓGICA DE MÉXICO
Materia:
Arquitectura de la Información
Profesor: Mtro. Luis Alberto Guzmán Gtz
30/06/2022 2
Capitulo 5
Tipos de información
30/06/2022 3
Tipos de información
Cuando no se administran, los datos pueden volverse abrumadores, lo
cual dificulta obtener la información que se necesita en el momento en
que se necesita.
Vamos a ver tres tipos de datos con los que estás acostumbrado a
trabajar, prestando especial atención a sus diferencias.
Para ello, conviene saber, primero, cuáles son los tipos de datos más
habituales a las que las compañías deben enfrentarse.
siendo los terceros los más comunes, pero a la vez más complejos de
manejar, aunque no imposibles de controlar, ya que el desarrollo
tecnológico ha hecho más fácil su tratamiento.
30/06/2022 5
El 80 por ciento de la información relevante en las
compañías se origina en los datos semiestructurados
y sin estructurar, siendo lo ideal combinar la
información existente en ambas tipologías de datos
30/06/2022 6
¿Qué son datos estructurados?
Son aquellos que tienen campos fijos y por tanto, se especifican al detalle conformando las
llamadas bases de datos relacionales.
30/06/2022 8
Son archivos de tipo texto que se suelen mostrar en
filas y columnas con títulos. Son datos que pueden ser
ordenados y procesados fácilmente por todas
las herramientas de minería de datos.
30/06/2022 9
Los datos estructurados tienen perfectamente definido la longitud, el formato y el
tamaño de sus datos.
30/06/2022 10
UNIVERSIDAD TECNOLÓGICA DE MÉXICO
30/06/2022 12
Un ejemplo son los registros Web logs, ejemplos típicos son
el texto de las etiquetas de lenguajes XML y XTML
30/06/2022 13
30/06/2022 14
30/06/2022 15
VIDEO
30/06/2022 16
¿Qué son datos no estructurados?
Precisamente son muchas las voces cualificadas del sector que apuntan a
que es la información no estructurada la que ofrece un mayor
conocimiento.
30/06/2022 18
Las organizaciones necesitan una estrategia de gobierno de la información
que le permita acceder a toda el abanico de datos que puedan aportar
valor a la gestión de la información y esto se consigue a través de un
enfoque global de la gestión de la información, que comprende tanto la:
➢ Calidad de la información
➢ La protección
➢ Gestión del ciclo de vida de la información.
30/06/2022 19
Aunque parezca increíble, la base de datos con información estructurada
de una empresa, ni siquiera contiene la mitad de la información que hay
disponible en la empresa lista para ser usada.
30/06/2022 20
Una vez que se organizan, los elementos que conforman su contenido
pueden ser buscados y categorizados (al menos hasta cierto punto) para
obtener información.
30/06/2022 21
El término no estructurado se enfrenta a diferentes opiniones por
diversas razones.
Hay quien dice que aunque no se pueda identificar una estructura formal
en ellos, es posible que pueda estar implícita y, en ese caso, no debería
ser categorizado como no estructurado.
Sin embargo, por otro lado, si los datos tienen alguna forma de
estructura, pero ésta no es útil y no puede se utiliza para procesarlos,
estos deberían ser categorizados como no estructurados.
30/06/2022 22
Aunque los mensajes de correo electrónico pueden contener información
con alguna estructura implícita, es lógico pensar en ellos como
información no estructurada, ya que las herramientas normales de
minería de datos no están preparadas para procesarlos y analizarlos.
30/06/2022 23
Por ejemplo, siguiendo con el ejemplo del correo electrónico, un e-mail
contiene información como la hora de envío, la persona a quien se envía,
el remitente, etc.
La industria del Big Data sigue creciendo, pero existe un problema con los datos
no estructurados que todavía no están siendo utilizados.
30/06/2022 25
30/06/2022 26
VIDEO
30/06/2022 27
30/06/2022 28