Está en la página 1de 4

HERRAMIENTAS

PARA EL ANÁLISIS
DE BIG DATA

Aplicando la Ciencia de
Datos en una organización

Pedro González Echeverría


Contenido
TEMAS ................................................................................................................................................................ 3
INTRODUCCIÓN .................................................................................................................................................. 3
OBJETIVO............................................................................................................................................................ 3
LENGUAJE DE PROGRAMACIÓN ........................................................................................................................ 3
PREDICCIONES.................................................................................................................................................... 3
BASE DE DATOS .................................................................................................................................................. 4
SERVICIO DE LA NUBE ........................................................................................................................................ 4
CONCLUSIONES .................................................................................................................................................. 4

Página 2 de 4
TEMAS
INTRODUCCIÓN

La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha


decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones.

OBJETIVO

Identificar las herramientas necesarias para el análisis; estructuras de datos y


servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como
apoyo a la toma de decisiones para una organización.

LENGUAJE DE PROGRAMACIÓN

Para el caso de esta librería, utilizaría el lenguaje Python, ya que incluye librerías para
el análisis de datos masivos y es muy rápido en el procesamiento.

PREDICCIONES

Para el análisis predictivo, separaré los libros por año de publicación

1: Los libros publicados en el 2008 tienen mas rating que los del 2010

Otro análisis es separar por lector los datos

2: El usuario que mas activo esta y es mas participativo y el que mas lee es el
usuario 2

Otro análisis es separar por años la información

3: Los meses que mas libros se leen son en periodo de vacaciones de verano

Página 3 de 4
BASE DE DATOS

Para la base de datos yo usaré mongodb, ya que contiene una versión en la nube que
ayuda al procesamiento de información y su estructura no-sql es factible para obtener
vistas o subtablas de los datos que se requieran

SERVICIO DE LA NUBE

El servicio para almacenar en la nube o repositorio será GitHub, porque lo


manejaremos por confidencialidad de manera privada, el costo se incluirá en el
reporte par que el usuario tenga seguridad y certeza de su información fluye de
manera confiable, se desarrollaran APIs para la administración de la información en
la nube.

CONCLUSIONES

Este ejercicio de ciencia de datos me sirvió para conocer como iniciar con un proyecto real
y como planificar las herramientas que van a utilizar de manera más eficiente.

Página 4 de 4

También podría gustarte