Big Data Generado Por Personas

Cargado por

JUAN DAVID BERNILLA CAMPOS

0% encontró este documento útil (0 votos)

18 vistas1 página

Big Data generado por personas

Título original

Big Data generado por personas

Derechos de autor

Formatos disponibles

TXT, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Big Data generado por personas

Copyright:

Formatos disponibles

Descargue como TXT, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

18 vistas1 página

Big Data Generado Por Personas

Cargado por

JUAN DAVID BERNILLA CAMPOS

Big Data generado por personas

Copyright:

Formatos disponibles

Descargue como TXT, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 1

Buscar dentro del documento

Big Data Generado Por Personas, El Reto Desestructurado.

La gente genera grandes

cantidades de datos cada día a través de sus actividades en varias redes sociales
como Facebook, Twitter y LinkedIn. O compartiendo fotografías en sitios como
Instagram, Flickr o Picasa. Y compartiendo vídeos en sitios web como Youtube.
Además, una enorme cantidad de información es generada por blogs y comentarios,
búsquedas en internet, más mensajes de texto, correos electrónicos y a través de
documentos personales. La mayoría de estos datos es texto denso y desestructurado,
que no se adecua a un modelo de datos bien definido. Podemos considerar estos datos
que contengan ocasionalmente alguna descripción adjunta. Esta gran actividad nos
lleva a un enorme crecimiento de datos. ¿ Sabías que en un solo día, los usuarios
de Facebook producen más datos que todas las búsquedas académicas en bibliotecas de
los Estados Unidos juntas? Veamos algunos volúmenes similares de datos diarios de
algunas de las mayores plataformas en red. Es sorprendente que estos números están
en el rango del Petabyte para la actividad diaria. Un Petabyte son mil Terabytes.
El verdadero tamaño de los datos mayoritariamente desestructurados generados por
humanos trae muchos retos. Datos desestructurados se refieren a datos que no
cumplen con un modelo de datos predefinido. Así que sin modelo relacional no
tenemos SQL. No hay prácticamente nada que no almacenemos en un tradicional sistema
de control de base de datos relacional. Considera un tique de compra de la tienda
de comestibles. Tiene una sección para la fecha, una sección para el nombre de la
tienda, y una sección para el total de la compra. Este es un ejemplo de estructura.
Los humanos generan gran cantidad de datos desestructurados en forma de texto. No
tienen un formato dado. Mira todos los documentos que has escrito hasta ahora. En
conjunto, son un grupo de datos desestructurado que has generado personalmente. De
hecho, del 80 al 90 % de todos los datos en el mundo son desestructurados y la
cantidad crece rápidamente. Ejemplos de datos desestructurados generados por
personas incluyen textos, imágenes, vídeos, audios, búsquedas en internet y correos
electrónicos. Además, debido a su rápido crecimiento los principales retos de los
datos desestructurados incluido los múltiples formatos de datos, como páginas web,
imágenes, PDFs, power point, XML y otros formatos que son principalmente
construidos para ser utilizados por humanos. Piensa en ello, aunque puedo ordenar
mi correo por fecha, emisor y título. Sería realmente difícil escribir un programa,
para categorizar todos mis mensajes de correo basándose en su contenido y
organizarlos para mi por lo tanto otro reto de datos generados por humanos es el
volumen y la rápida generación de datos, lo que nosotros llamamos velocidad.
Estudia por un momento este gráfico de información, y mira que ocurre en un minuto
en internet, y considera cuanto aporta. incluso, la confirmación de datos
desestructurados normalmente consume tiempo y es costoso. El coste y el tiempo del
proceso de adquirir, almacenar, limpiar, recuperar y procesar datos
desestructurados puede ser mucha inversión antes de que podamos comenzar a cosechar
valor del proceso. Puede ser bastante difícil encontrar las herramientas y gente
para implementar tal proceso y conseguir valor al fin. Resumiendo, aunque hay una
enorme cantidad de datos generados por personas, la mayoría de estos datos son
desestructurados. Los retos de trabajar con datos desestructurados no deberían ser
tomados a la ligera. A continuación, veremos cómo las empresas están abordando
estos retos para ganar conocimiento. Y así obtener valor de trabajar con datos
generados por personas.

También podría gustarte

Caracteristicas Big Data-Variedad
Documento2 páginas
Caracteristicas Big Data-Variedad
JUAN DAVID BERNILLA CAMPOS
Aún no hay calificaciones
Caracteristicas Big Data
Documento1 página
Caracteristicas Big Data
JUAN DAVID BERNILLA CAMPOS
Aún no hay calificaciones
Relacion Alumnos Arquitectura Empresarial
Documento2 páginas
Relacion Alumnos Arquitectura Empresarial
JUAN DAVID BERNILLA CAMPOS
Aún no hay calificaciones
ControlLecturaNro1 GC 2020-II G2
Documento2 páginas
ControlLecturaNro1 GC 2020-II G2
JUAN DAVID BERNILLA CAMPOS
Aún no hay calificaciones
TRABAJO - REDES - NILO - VF - Actual
Documento45 páginas
TRABAJO - REDES - NILO - VF - Actual
JUAN DAVID BERNILLA CAMPOS
Aún no hay calificaciones
Examen Parcial Finanzas
Documento4 páginas
Examen Parcial Finanzas
JUAN DAVID BERNILLA CAMPOS
Aún no hay calificaciones
HUAWEI Y7 Quick Start Guide - (TRT-LX3 - 01, Es-La)
Documento14 páginas
HUAWEI Y7 Quick Start Guide - (TRT-LX3 - 01, Es-La)
Jose Luis
Aún no hay calificaciones
TomTom GO Mobile RG Es Es
Documento99 páginas
TomTom GO Mobile RG Es Es
sanabressanabres
Aún no hay calificaciones
Manual de Trabajo Especial de Grado
Documento60 páginas
Manual de Trabajo Especial de Grado
Jose Alfredo
Aún no hay calificaciones
Las Nuevas Tecnologías de La Información Filomeno
Documento13 páginas
Las Nuevas Tecnologías de La Información Filomeno
Alma Ziramba
Aún no hay calificaciones
Maria Andreina Olivar (Anti Virus Actualidad Informatica)
Documento11 páginas
Maria Andreina Olivar (Anti Virus Actualidad Informatica)
AJ Macled
Aún no hay calificaciones
Prácticas 3er Parcial
Documento17 páginas
Prácticas 3er Parcial
Enrique Lerdo
Aún no hay calificaciones
Guía de Trabajo #02 - Grado 2°
Documento5 páginas
Guía de Trabajo #02 - Grado 2°
mificame
Aún no hay calificaciones
Tarea 2.1
Documento5 páginas
Tarea 2.1
Hoy Con Memy
Aún no hay calificaciones
EMV - Wikipedia daTA CC
Documento24 páginas
EMV - Wikipedia daTA CC
keyem
Aún no hay calificaciones
As 106024 VT5 DT VT3 Um 837MX KMX MX 1089 1
Documento126 páginas
As 106024 VT5 DT VT3 Um 837MX KMX MX 1089 1
CésaR Sánchez
Aún no hay calificaciones
ASIGNACION 2 INFORMATICA GERENCIAL. Resumen de Los Temas 1 - 2 y 3
Documento4 páginas
ASIGNACION 2 INFORMATICA GERENCIAL. Resumen de Los Temas 1 - 2 y 3
MiguelCabricesGuevara
Aún no hay calificaciones
Powerbi Reporte
Documento2 páginas
Powerbi Reporte
Anonymous xhwVf1axw
Aún no hay calificaciones
Cuestionario 3 Ccna 3
Documento7 páginas
Cuestionario 3 Ccna 3
Sergio Alexander Cortes Nuñez
Aún no hay calificaciones
Comisionamiento de La Duw PDF
Documento23 páginas
Comisionamiento de La Duw PDF
Grover David Perez Huanca
Aún no hay calificaciones
Test Introducción Al Data Warehouse
Documento2 páginas
Test Introducción Al Data Warehouse
FerNando Cedeño
100% (1)
Asociado Certificado de Tableau Desktop - Guía de Examen
Documento12 páginas
Asociado Certificado de Tableau Desktop - Guía de Examen
Chili Vitrol
Aún no hay calificaciones
Packet Tracer Using The Cisco IOS Show Commands
Documento3 páginas
Packet Tracer Using The Cisco IOS Show Commands
Deyser Mayler Elizalde Lopez
Aún no hay calificaciones
Gerencia Operativa de Transporte Terrestre Especificaciones Técnicas (Bienes)
Documento34 páginas
Gerencia Operativa de Transporte Terrestre Especificaciones Técnicas (Bienes)
Deyanira Murillo
Aún no hay calificaciones
CIO Vs CTO
Documento3 páginas
CIO Vs CTO
Brandon Garay
Aún no hay calificaciones
AS400 - Recuperar Un Dato Salvado
Documento12 páginas
AS400 - Recuperar Un Dato Salvado
Nico Menna
Aún no hay calificaciones
Sce Iot2040
Documento2 páginas
Sce Iot2040
Peli Jorro
Aún no hay calificaciones
PA02.Tarea
Documento2 páginas
PA02.Tarea
LUIS NT BELTRAN BERROCAL
Aún no hay calificaciones
Examen Unjbg Segunda Unidad
Documento2 páginas
Examen Unjbg Segunda Unidad
Andrea Monroy
Aún no hay calificaciones
DMR para Novatos PDF
Documento19 páginas
DMR para Novatos PDF
LUIS PONCE
Aún no hay calificaciones
Autoevaluación N°3 - Revisión de Intentos
Documento4 páginas
Autoevaluación N°3 - Revisión de Intentos
ELENA DAYSI MAMANI CHINO
Aún no hay calificaciones
Tutorial VirtualBox
Documento22 páginas
Tutorial VirtualBox
Edwar Oswaldo Alzate Gaviria
Aún no hay calificaciones
Investigacion BIM
Documento15 páginas
Investigacion BIM
Happy student
Aún no hay calificaciones
Folleto Delitos Informaticos JUAN CAMILO PEREZ PUERTO 7.-6
Documento4 páginas
Folleto Delitos Informaticos JUAN CAMILO PEREZ PUERTO 7.-6
angel daniel palencia puerto
Aún no hay calificaciones
Actividad 3 Herramientas Colaborativas
Documento1 página
Actividad 3 Herramientas Colaborativas
Liliana
Aún no hay calificaciones
Isic 1993 296
Documento1 página
Isic 1993 296
De Ce EMe
Aún no hay calificaciones