Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sistemas de Información
DATA MINING
Generar
modelos o
Seleccionar
Limpiarlos y Solucionar descubrir
un conjunto Prepararlos
depurarlos las omisiones patrones de
de datos
comporta-
miento
Datawarehousing • Analytics
Fundamentalmente Fundamentalmente
DESCRIPTIVO PREDICTIVO
Visualización y
OLAP Minería de Datos
Representación
Descubrimiento de productos.
• Relacionar documentos
• Las nuevas herramientas de Big data están introduciendo una nueva categoría
dentro de los datos no estructurados: los datos Semiestructurados. Entonces:
• No estructurados
• Semiestructurados
• Datos semiestructurados:
• Tienen un flujo y formato que pueden ser definidos
• No son fácilmente comprensibles por el usuario Web logs
• No tienen formato fijo pero contienen etiquetas y marcadores que permiten separarlos
• Se utilizan reglas complejas para proceder luego de la lectura de la información
• Datos no estructurados:
Videos,
• No tienen un tipo predefinido
audios y
• Se almacenan como documentos u objetos si estructura uniforme fotos
• Se tiene poco o ningún control sobre ellos
Sistemas de Información - Prof. Marcelo Tadey Pág. 19
Oportunidades de Negocio
• En un Big Data, la pieza clave es la integración de los
datos
• Los datos proceden de los flujos de clics, tuits, entradas de Facebook, contenidos diversos,
ejemplo YouTube, Picasa, Dropbox, One Drive. Etc.
• Biometría
• Huellas digitales, iris, escaneo de retina, reconocimiento facial, genética, ADN, reconocimiento
de voz, pulso y escritura a mano.