Está en la página 1de 1

Fundamentacin prctica 9

Se denomina Big Data a la gestin y anlisis de enormes volmenes de datos


que no pueden ser tratados de manera convencional, ya que superan los
lmites y capacidades de las herramientas de software habitualmente utilizadas
para la captura, gestin y procesamiento de datos.
El objetivo de Big Data, es convertir el Dato en informacin que facilita la toma
de decisiones, incluso en tiempo real. Sin embargo, ms que una cuestin de
tamao, es una oportunidad de negocio. Las empresas ya estn utilizando Big
Data para entender el perfil, las necesidades y el sentir de sus clientes
respecto a los productos y/o servicios vendidos. Esto adquiere especial
relevancia ya que permite adecuar la forma en la que interacta la empresa con
sus clientes y en cmo les prestan servicio.
La herramienta big data utilizada fue apache hive que es un framework
originalmente creado por Facebook que sirve para trabajar con el HDFS
Hadoop Distributed File System que nos facilita enormemente el trabajo a la
hora de trabajar con los datos. Su funcionamiento es sencillo, a travs de
querys SQL (HiveQL) podemos lanzar consultas que sern traducidas a
trabajos MapReduce. Hive nos facilita enormemente este trabajo ya que
traduce consultas tipo SQL a trabajos MapReduce paralelizables contra el
dataset en un entorno completamente distribuido.
Se utiliz distintas fuentes de datos para la realizacin de la prctica, la misma
que fueron: postgresql, mysql, sql server, Oracle y mongoDB.

También podría gustarte