Documentos de Académico
Documentos de Profesional
Documentos de Cultura
II. SUMILLA.
La asignatura es de naturaleza teórico y práctico, tiene como propósito introducirse a
lo que es el Big Data y Ciencia de Datos. Definición de procesamiento en paralelo,
escalabilidad, cloud computing. Implementación de una plataforma de procesamiento
de grandes volúmenes de data empleando Hadoop, Spark y componentes asociados
para el procesamiento de datos estructurados y no estructurados. Breve introducción
entre la relación de Big Data Analytics & Inteligencia Artificial.
III OBJETIVOS.
OBJETIVOS GENERALES
OBJETIVOS ESPECÍFICOS
Instalación de
máquina virtual &
Hadoop.
VI ESTRATEGIAS METODOLÓGICAS
Durante las clases el profesor realizará una exposición del tema, utilizando
presentaciones y ejemplos, luego pasará a absolver las preguntas que formulen
los estudiantes; propiciará posteriormente la aplicación
de los conocimientos adquiridos en la computadora.
La asistencia al curso es obligatoria. Para aprobar el curso deberá asistir al 75% de las
sesiones de clase. Se registrará como “presente” si se encuentra en el aula en el momento
que se llame a lista, al comienzo de la sesión. Si el número de ausencias supera el 25%
de las sesiones, automáticamente el participante será considerado desaprobado con nota
final de 05, cualquiera fuere el promedio final que hubiese obtenido. Si la ausencia ocurre
en un día de rendición de una prueba o evaluación, el participante deberá justificarla ante
el Coordinador. En caso que el participante no justifique su inasistencia a la prueba o
evaluación, su calificación por la misma será de cero (0).
VIII BIBLIOGRAFÍA
• Drew, S., Chen, W.-C., Ostrouchov, G., & Patel, P. (2014). Speaking serial R
with a parallel accent. pbdR Core Team.
• Fernández. (2014). Python 3 al descubierto. México: Alfaomega.
• Husson. (2013). Análisis de Datos con R. Colombia: Escuela Colombiana de
Ingenería.
• Leskovec, J., Rajaraman, A., & Ullman, J. (2014). Mining of massive datasets.
• Miner, D., & Shook, A. (2013). MapReduce design patterns. United States of
America: O´Reilly Media.
• Pérez. (2015). R- Lenguaje de Programación y Análisis Estadístico de Datos.
España: Garceta Grupo Editorial.
• Schneider, R. (2012). Hadoop for dummies. United States of America: John
Wiley & Sons, Inc.
• Serrat, R. (2013). Big Data - Análisis de herramientas y soluciones. Barcelona:
Everis – Facultat d’Informàtica de Barcelona – UPC.
• Dean, Jared (2014). Big Data, Data Mining, and Machine Learning
• Achari, Shiva (2015). Hadoop Essentials
• Vladimir O. Safonov (2016). Trustworthy Cloud Computing
• Ema Iancuta, Kostas Sakellis, Kai Sasaki, Anikate Singh, Brennon York, Ilya
Ganelin, and Ema Orhian (2016) Professional Spark : Big Data Cluster
Computing in Production.
• Isson, J. P. (2018). Unstructured Data Analytics: How to Improve Customer
Acquisition, Customer Retention, and Fraud Detection and Prevention.
Hoboken, New Jersey, United States of America: John Wiley / Sons, Inc.
• RBC – Azure, Microsoft. (2021). https://customers.microsoft.com/en-
us/story/1356341973555285762-royalbankofcanada-banking-capital-
markets-azure.
• Schmarzo, B. (2016). Big Data MBA: Driving Business Strategies with Data
Science. Indianapolis, Indiana, United States of America: John Wiley & Sons,
Inc.