Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
Qu es el anlisis de datos?
De acuerdo al McKinsey Global Institute, los datos a gran escala (Big Data) se definen
como las bases de datos cuyo tamao est ms all de la capacidad que tiene el software
tradicional para su manejo en trminos de captura, almacenamiento, gestin y anlisis. El
reporte de EdTech en 2013 afirma que cada da creamos 2.5 quintillones (1020) de bytes
en datos. Es tan alto este volumen, que el 90% de los datos que existen en la actualidad
fueron creados tan slo en los ltimos dos aos. Estos datos provienen de una gran cantidad
de fuentes: de los sensores utilizados para juntar informacin del clima, de publicaciones en
redes sociales, de bsquedas en lnea, compras va sitios web, transacciones en el
supermercado, informacin leda por sensores, uso de redes sociales para interactuar y usar
el GPS de fotografas y videos digitales, archivos de transacciones de compras, por
nombrar slo algunas. En realidad, hemos estado acumulando datos desde el inicio de la
humanidad; no obstante -y conforme la tecnologa avanza- los datos se van acumulando a
una velocidad exponencial.
Ms all de referirse a la ola de la era de la informacin, los datos han sido considerados
como el nuevo petrleo de la economa actual, pues pueden ser empleados para diversos
propsitos de alto beneficio en las organizaciones.
Objetivos fundamentales
Existen tres objetivos fundamentales que debes aspirar a desarrollar en esta rea de
conocimiento.
Recuerda, que toda esta rea de conocimiento representa un pilar fundamental de la gestin
y administracin de organizaciones en el mundo actual, por lo que se requiere que
desarrolles los fundamentos necesarios para aplicar estos mtodos, identificar
oportunidades y sacar provecho de ellas.
La dimensin de volumen se refiere al tamao de los datos. Desde el inicio del tiempo
registrado y hasta el 2003 se haba creado cinco billones de gigabytes (exabytes) de datos.
Sin embargo, en 2011 la misma cantidad de datos fue creada casi cada dos das. En 2013, la
misma cantidad de datos era creada cada 10 minutos.
La tercera dimensin, variedad, se refiere a los diferentes tipos de datos que se recolectan.
Existen datos estructurados, no estructurados, datos en texto, datos numricos, datos en
imgenes o datos en audio y video, por mencionar solo algunos de ellos.
Referencias
Liu, Y. (2014). Big Data and Predictive Business Analytics. The Journal of Business
Forecasting, 33(4), 40.