Silabo Big Data Unmsm

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE INGENIERÍA DE SISTEMAS E INFORMÁTICA
PROGRAMA DE TITULACION POR TRABAJO DE SUFICIENCIA PROFESIONAL

(PTTSP)
I. DATOS ADMINISTRATIVOS.
NOMBRE DEL CURSO : Ciencia de los Datos (Big - Data)
CÓDIGO ASIGNATURA : BIG-DATA
SEMESTRE ACADÉMICO : 2021-I
CICLO : Seminario
CRÉDITOS :
HORAS : 10
REQUISITOS : Ninguno
PROFESOR : Mg. Moises Mescua Salhuana
II. SUMILLA.
La asignatura es de naturaleza teórico y práctico, tiene como propósito introducirse a
lo que es el Big Data y Ciencia de Datos. Definición de procesamiento en paralelo,
escalabilidad, cloud computing. Implementación de una plataforma de procesamiento
de grandes volúmenes de data empleando Hadoop, Spark y componentes asociados
para el procesamiento de datos estructurados y no estructurados. Breve introducción
entre la relación de Big Data Analytics & Inteligencia Artificial.
III OBJETIVOS.
OBJETIVOS GENERALES
1. Proporcionar a los estudiantes de las competencias correspondientes, para el

manejo de grandes volúmenes de datos que no se pueden procesar con
técnicas ni softwares tradicionales.
OBJETIVOS ESPECÍFICOS
1. Introducirse al mundo del Big Data.

2. Introducción de bases de datos NoSQL.
3. Arquitectura de Big Data interacción con la nube.
4. Ejemplos de aplicaciones en el sector salud, seguridad cibernética, y lavado
de dinero.
5. Instalar un software por el procesamiento de datos no estructurados en un
virtual machine.
IV. CONTENIDOS TEMÁTICOS
Introducción al Big Data y Ciencia de Datos. Aplicaciones distribuidas.

Plataformas para procesamiento de grandes volúmenes de datos Big Data.
V. PROGRAMACION SEMANAL DE LOS CONTENIDOS
UNIDAD 1: INTRODUCCIÓN AL BIG DATA
Objetivo de la Unidad: Entender los componentes de procesamiento de grandes

volúmenes de datos, y aplicación en las organizaciones.
Sesión / Tema Actividades Semana
• Introducción, las cinco V. Búsqueda de casos 1

• Datos estructurados y no estructurados. exitosos al haber
• Arquitectura del Big Data & Hadoop empleado el Big Data
ecosystem. en Data center y la
nube (Cloud).
• Cloud computing.
• Aplicación de BDA, & Artificial
Intelligence.
UNIDAD 2: PROGRAMACIÓN BASICA E INTERMEDIA
Objetivo de la Unidad: Procesar y manejar grandes volúmenes de datos.
• La plataforma Hadoop, Spark y Entendiendo el DFS, y 1

análisis de sentimientos. programas asociados
• Instalación de Hadoop y componentes. a Hadoop, & Spark.
Instalación de
máquina virtual &
Hadoop.
UNIDAD 3: APLICACIONES DISTRIBUIDAS
Objetivo de la Unidad: Interactuar con la nube e introducirse a las plataformas

NoSQL.
• Hadoop y datos no estructurados. Desarrollar un caso 2

Ejemplo práctico. práctico de manejo
de datos no
estructurados.
Presentación trabajo
final grupal.
Evaluación Alumnos Examen Final 2
VI ESTRATEGIAS METODOLÓGICAS
El curso enfatiza en el uso de material bibliográfico e ilustrativo (con ejemplos

prácticos), por lo que incide en el trabajo individual de los alumnos graduados,
quienes deben asistir a cada clase habiéndo revisado el material a tratar durante
la misma y siendo capaces de plantear cuestiones al profesor sobre aspectos que
no hayan comprendido.
Durante las clases el profesor realizará una exposición del tema, utilizando
presentaciones y ejemplos, luego pasará a absolver las preguntas que formulen
los estudiantes; propiciará posteriormente la aplicación
de los conocimientos adquiridos en la computadora.
VII SISTEMA DE EVALUACION
• Examen Final (EF): 100%
La asistencia al curso es obligatoria. Para aprobar el curso deberá asistir al 75% de las
sesiones de clase. Se registrará como “presente” si se encuentra en el aula en el momento
que se llame a lista, al comienzo de la sesión. Si el número de ausencias supera el 25%
de las sesiones, automáticamente el participante será considerado desaprobado con nota
final de 05, cualquiera fuere el promedio final que hubiese obtenido. Si la ausencia ocurre
en un día de rendición de una prueba o evaluación, el participante deberá justificarla ante
el Coordinador. En caso que el participante no justifique su inasistencia a la prueba o
evaluación, su calificación por la misma será de cero (0).
VIII BIBLIOGRAFÍA
• Drew, S., Chen, W.-C., Ostrouchov, G., & Patel, P. (2014). Speaking serial R
with a parallel accent. pbdR Core Team.
• Fernández. (2014). Python 3 al descubierto. México: Alfaomega.
• Husson. (2013). Análisis de Datos con R. Colombia: Escuela Colombiana de
Ingenería.
• Leskovec, J., Rajaraman, A., & Ullman, J. (2014). Mining of massive datasets.
• Miner, D., & Shook, A. (2013). MapReduce design patterns. United States of
America: O´Reilly Media.
• Pérez. (2015). R- Lenguaje de Programación y Análisis Estadístico de Datos.
España: Garceta Grupo Editorial.
• Schneider, R. (2012). Hadoop for dummies. United States of America: John
Wiley & Sons, Inc.
• Serrat, R. (2013). Big Data - Análisis de herramientas y soluciones. Barcelona:
Everis – Facultat d’Informàtica de Barcelona – UPC.
• Dean, Jared (2014). Big Data, Data Mining, and Machine Learning
• Achari, Shiva (2015). Hadoop Essentials
• Vladimir O. Safonov (2016). Trustworthy Cloud Computing
• Ema Iancuta, Kostas Sakellis, Kai Sasaki, Anikate Singh, Brennon York, Ilya
Ganelin, and Ema Orhian (2016) Professional Spark : Big Data Cluster
Computing in Production.
• Isson, J. P. (2018). Unstructured Data Analytics: How to Improve Customer
Acquisition, Customer Retention, and Fraud Detection and Prevention.
Hoboken, New Jersey, United States of America: John Wiley / Sons, Inc.
• RBC – Azure, Microsoft. (2021). https://customers.microsoft.com/en-
us/story/1356341973555285762-royalbankofcanada-banking-capital-
markets-azure.
• Schmarzo, B. (2016). Big Data MBA: Driving Business Strategies with Data
Science. Indianapolis, Indiana, United States of America: John Wiley & Sons,
Inc.

Silabo Big Data Unmsm

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Silabo Big Data Unmsm

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE INGENIERÍA DE SISTEMAS E INFORMÁTICA

PROGRAMA DE TITULACION POR TRABAJO DE SUFICIENCIA PROFESIONAL

1. Proporcionar a los estudiantes de las competencias correspondientes, para el

1. Introducirse al mundo del Big Data.

Introducción al Big Data y Ciencia de Datos. Aplicaciones distribuidas.

V. PROGRAMACION SEMANAL DE LOS CONTENIDOS

UNIDAD 1: INTRODUCCIÓN AL BIG DATA

Objetivo de la Unidad: Entender los componentes de procesamiento de grandes

Sesión / Tema Actividades Semana

• Introducción, las cinco V. Búsqueda de casos 1

UNIDAD 2: PROGRAMACIÓN BASICA E INTERMEDIA

Objetivo de la Unidad: Procesar y manejar grandes volúmenes de datos.

Sesión / Tema Actividades Semana

• La plataforma Hadoop, Spark y Entendiendo el DFS, y 1

UNIDAD 3: APLICACIONES DISTRIBUIDAS

Objetivo de la Unidad: Interactuar con la nube e introducirse a las plataformas

• Hadoop y datos no estructurados. Desarrollar un caso 2

Evaluación Alumnos Examen Final 2

El curso enfatiza en el uso de material bibliográfico e ilustrativo (con ejemplos

VII SISTEMA DE EVALUACION

• Examen Final (EF): 100%

También podría gustarte