Está en la página 1de 30

TIPOS DE DATOS

Mg. Evelyn Ayala


eayala@uigv.edu.pe
TRABAJOS 1. Caso de Estudio 5 V del Big Data.
DE LA
SESIÓN
ANTERIOR
Objetivo de la Sesión

Identifica los diferentes tipos


de datos existentes en Big
Data y el origen de los
mismos.
Origen de los datos
Datos estructurados
Datos no estructurados

Agenda Datos semi estructurados


Meta datos
Datos Abiertos
Lectura “Las TI ya no es importante”
Introducción
Introducción
Introducción
Los datos están en el centro de la sociedad y
economía del conocimiento

Towards a thriving data-driven economy


(Hacia una próspera economía basada en datos)
Communication SWD 2014
European Comission, July 2014

https://ec.europa.eu/digital-agenda/en/news/
communication-data-driven-economy
Origen de los Datos

Generados por
humanos:
Origen de los Datos

Generados por
Máquinas:
Origen de los Datos

Biométricas:

Crea UNAM lector genético portátil


https://www.youtube.com/watch?v=Xkk8fP4yO2g
Origen de los Datos

Transacciones de datos:
Origen de los Datos

Marketing
web:
Origen de los Datos

Web
Analytics:
Datos Estructurados
Los datos
estructurados se
ajustan a un modelo o
esquema de datos
definido y se
almacenan a menudo
en forma tabular.
Datos No Estructurados
Los datos que no
se ajustan a un
modelo de datos
o esquema de
datos se conocen
como datos no
estructurados.

80% de los datos dentro de la empresa.


Datos Semi Estructurados
Los datos semi-
estructurados tienen
un nivel definido de
estructura y
consistencia, pero no
son de naturaleza
relacional, estos datos
son jerárquicos.
DATOS
Estructurados, No
estructurados y
Semiestructurados

Universidad Complutense de
Madrid. ¿Qué es Big Data? [en
línea]. [Fecha de consulta: 10 de
agosto de 2018]
Disponible en
https://www.masterbigdataucm.co
m/que-es-big-data/
Trabajo

Describir cada uno de los


tipos de datos:

1. Estructurados
2. Semiestructurados
3. No estructurados

Presentarlo en diapositiva.
Meta Datos
Los metadatos proporcionan información sobre las características y
la estructura de un conjunto de datos.

• Etiquetas XML del autor y la fecha de


creación de un documento
• Atributos de tamaño de archivo y la
resolución de una fotografía digital
• Conceptos de negocio, información del
origen (job, fuentes).
Datos Abiertos
El Open Data es
una iniciativa
imparable a nivel
internacional, con
gran respaldo
institucional y que
cuenta ya con
políticas y marcos
normativos que lo
regulan.
Movimiento Open Data
Consiste en que los datos pueden ser utilizados, reutilizados y redistribuidos
libremente por cualquier persona, y que se encuentran sujetos, cuando más, al
requerimiento de atribución y de compartirse de la misma manera en que
aparecen.
Fuente: Definición de Open Data Handbook, de Open Knowledge Foundation, iniciativa financiada por el Banco Mundial. Mayor
información en link en español de http://opendatahandbook.org/guide/es/what-is-open-data/

Ventajas Desventajas
• Evita la pérdida de datos caros de • Uso incorrecto de los datos por
obtener terceros
• Se puede replicar y reanalizar • Difusión de datos “sensibles”
mejorando resultados • Tiempo y costo de publicar datos
• Se pueden realizar nuevos análisis • Financiamiento de la iniciativa
con la data disponible
Principios básicos de los Datos Abiertos
1. Completos:
• Todos los datos públicos se ponen a disposición. Los datos públicos
son datos que no están sujetos a limitaciones de privacidad,
seguridad o privilegios validos.

2. Primarios:
• Los datos abiertos tienen que ser detallados y vírgenes. Esto
significa datos en bruto, sin haber pasado ningún filtro o estar
procesados. Además, se debe facilitar información sobre cómo se
han obtenido los datos y donde están los documentos originales a
los que hacen referencia.
Principios básicos de los Datos Abiertos
3. Oportunos:
• Deben estar actualizados en todo momento y a disposición de los
usuarios. Hay que dar prioridad a la difusión de datos que sean
“time sensitive”.

4. Accesibles:
• Los datos están disponibles para la gama más amplia de usuarios
con la más amplia gama de propósitos. Deben publicarse con los
estándares y protocolos actuales que marca la industria, a la vez
que en formatos alternativos cuando así se requiera para la
reutilización de los mismos.
Principios básicos de los Datos Abiertos
5. Procesables por máquinas
• Para que los datos abiertos puedan ser utilizados, tienen que estar
debidamente codificados. Los textos libres no son un sustituto de
los datos tabulados y estructurados, de la misma forma no es lo
mismo la imagen de un texto que el propio texto.

6. No discriminatorios:
• Los datos abiertos deben estar disponibles a cualquier persona sin
necesidad de registrarse o identificarse previamente. El acceso
anónimo está permitido incluyendo el acceso a través de proxys
anónimos.
Principios básicos de los Datos Abiertos
7. No propietarios
• Los formatos en que se presenten los datos deben de ser
preferiblemente abiertos o al menos incluir entre los publicados
formatos abiertos. Los formatos propietarios añaden restricciones
innecesarias a quienes lo usan.

8. Libres de licencia:
• Los datos no están sujetos a ningún derecho de autor, patentes,
marcas o regulación. Se permiten restricciones razonables de
privacidad y seguridad.
Video de
https://www.youtube.com/watch?v=60D
Apoyo mNGktxM8
Trabajo
Seleccionar datasets de un
portal de datos abiertos
(nacional o internacional) e
indicar lo siguiente:

1. Contexto de los datos.


2. Describir cada uno de los
datos (considerados
importantes).

Presentarlo en diapositiva.
1. Tipos de datos.
2. Datos Abiertos.
TRABAJOS
DE LA
SESIÓN
Resumen

Datos semi estructurados


Origen de los datos
Meta datos
Datos estructurados
Datos Abiertos
Datos no estructurados

También podría gustarte