Está en la página 1de 1

¿Qué es exactamente la ciencia de datos?

Primero hay que comprender que es Big data. De acuerdo a la definición de gartner
realizada en el 2001: Big data es un conjunto de datos de una gran variedad y
formatos; que se acumulan en grandes volúmenes y a una velocidad cada vez mayor y
a esto se le conoce como las 3 v´s de la Big data de las que se hablara mas adelante.
Un dato es la representación simbólica de un atributo, que puede ser cualitativo o
cuantitativo, de la información de un objeto; persona; ser viviente; organización; etc.
Por ejemplo:
Para determinar la información de una persona, se podrían considerar los siguientes
atributos: edad; estatura; genero; estado de animo; color de ojos; etc. Esto nos arrojaría
un conjunto de condiciones o situaciones que de por si solos no aportan ninguna
información relevante; pero al ser agrupados y analizados se podría determinar cierto
valor o hecho que fuera relevante.
Estableciendo esto en un contexto simple; el concepto de Big data se refiere a datos
masivos y a menudo no estructurados, en los que las capacidades de procesamiento
de las herramientas tradicionales de gestión de datos resultan ser inadecuadas. Big
data puede ocupar terabytes y petabytes de espacio de almacenamiento en diversos
formatos, incluidos texto, video, sonido, imágenes y más.
A principios de la década de 2000, cuando Doug Laney, un analista de la industria
formuló la conocida definición de los tres V´s de la Big data:
Volumen. Las organizaciones recopilan datos de una amplia variedad de fuentes,
incluidas transacciones financieras, redes sociales, sensores o maquina a maquina.
Velocidad. Los datos fluyen a una velocidad sin precedentes y, por lo tanto, deben
gestionarse de manera oportuna. El uso cada ve mas frecuente de etiquetas RFID,
sensores y medición inteligente aumenta la necesidad de gestionar flujos de datos en
tiempo real o casi.
Variedad. Los datos llegan en cualquier formato, desde datos estructurados y
numéricos en bases de datos tradicionales a no estructurados, como documentos de
texto, correo electrónico, video, audio, datos de cotizaciones y transacciones
financieras

También podría gustarte