Está en la página 1de 10

Programa Certificado en

Big Data-Data Science


Modalidad Duración
Virtual 160 Horas

Introducción
Muchas organizaciones aún no conocen el poder de los datos y el enorme potencial que tienen estos en la toma de decisiones.
Esta gran cantidad de información es una revolución dentro de las empresas por su volumen, volatilidad y complejidad. Gracias
al sorprendente desarrollo de la computación, hoy disponemos de la capacidad de procesar grandes volúmenes de información
ofreciendo una nueva visión de la realidad en términos de: patrones, tendencias o asociaciones; especialmente en lo
relacionado con el comportamiento de los individuos y sus interacciones. Este conocimiento es el objeto de formación en
nuestro programa de Big Data.
Actualmente los profesionales de Big Data son ampliamente solicitados; están llamados a liderar la transformación del sector
empresarial aplicando el potencial de estas nuevas tecnologías.

Justificación
Mediante este Programa Certificado el estudiante se le proporcionará los fundamentos del análisis, la analítica empresarial
(BA), inteligencia de negocios (BI) y la arquitectura de tecnología, así como el diseño, desarrollo y gobernabilidad de
soluciones de Big Data para empresas en diferentes campos de acción: el periodismo de datos, ciudades inteligentes, internet
de las cosas, salud, administración, etc.
UdeCataluña

Objetivos
Ofrecer al estudiante una aproximación global y práctica de Big Data, en el cual se afiancen los conocimientos necesarios
en el análisis y gestión de datos para su comprensión, así como las herramientas y estrategias que le permitan entender y
rentabilizar el uso de Big Data.
Comprender las perspectivas a nivel económico y tecnológico en soluciones de Big Data.
Adquirir conocimientos sobre las diferentes soluciones de análisis para obtener beneficios en cualquier entorno empresarial.

Dirigido a
Profesionales en Estadística, Economía, Administración de Empresas, Matemáticas, Ingenierías o que cuenten con capacidades
básicas en métodos cuantitativos o experiencia laboral en ámbitos donde el manejo de datos se convierte en información estratégica.

Perfil Ocupacional
El profesional que se certifique en el diplomado podrá participar en proyectos de datos que involucren:

Manejo de grandes volúmenes de datos.


Minería de datos.
Implementación y análisis de estadísticas empresariales.
Inteligencia de negocios.
Analítica empresarial.

Conocimientos Previos
El aspirante al programa debe tener conocimientos básicos en estadística.
El aspirante al programa debe tener conocimientos en el uso y aplicación de métodos cuantitativos que le permitan a través
del uso de datos analizar, investigar y comprobar la información objeto de estudio.
UdeCataluña

Metodología
Metodología teórico - práctica, en la cual se cuenta con diferentes recursos y herramientas para fomentar el proceso de aprendizaje:
Clases Presenciales Virtuales: El docente explica los conceptos más relevantes para desarrollar la temática y
compartir con los estudiantes, asimismo interactúa en el ambiente de aprendizaje realizando preguntas y resolviendo
casos de uso con una duración promedio de una hora a hora y media.
Recursos Educativos Digitales: Dentro del proceso formativo se presentan diversos materiales didácticos que
contribuyen en la construcción del Conocimiento y aportan en actividades propuestas.
Referencia en la Web: Se basa en el aprendizaje colaborativo a través de la gran información que se encuentra
en la web que permiten afianzar y estructurar el conocimiento del participante.
Talleres y Casos prácticos: Se proponen ejercicios y talleres usando sistemas de información real, para que el
estudiante aplique lo analizado en el Material y las Clases Presenciales Virtuales y profundice sobre los temas del
Programa Certificado.
Foros y Wikis: El estudiante cuenta con espacios de debate y retroalimentación, donde se genere y se construya
una red de conocimiento en cada uno de las actividades que se proponen en el Proceso formativo.
Tutor Virtual: Dentro del Proceso de Aprendizaje se presentan diversos expertos temáticos que estarán en el
seguimiento continuo del estudiante para que realicen las actividades en cada unidad temática del Programa Certificado.

Certificado
Los estudiantes que culminen el Diplomado con un cumplimiento del 80% en las actividades programadas, se les otorgará, por
parte de la Corporación Universitaria de Cataluña, un certificado en
Programa Certificado en Big Data – Data Science.
UdeCataluña

Plan de Estudios
Módulo 1
Introducción a la Analítica Avanzada y Big Data.
Este módulo tiene como objetivo:
Conocer los diferentes tipos de analítica avanzada, el concepto de Big Data, sus características, combinaciones, crecimiento y
elementos que conllevan a respuestas o referencia de un proyecto relacionado a un gran volumen de datos que no se pueden
tratar con herramientas convencionales.

Datos, información y conocimiento en la toma de decisiones.


Introducción y conceptualización de Big Data.
Las Vs de Big Data.
Diferencias entre Big Data y Data Science.
Ejercicio de análisis de datos de un sistema real.

Módulo 2
Herramientas para Big Data - Introducción Cloud.
Este módulo tiene como objetivo:
Examinar las diferentes herramientas tradicionales y en la nube para Big Data que logren sacar el máximo valor y aspectos
fundamentales en el análisis de datos procedentes de diversas fuentes.

Ecosistema Big Data en la nuble.


Componentes de una plataforma Big Data: Ecosistema Hadoop.
Herramientas del ecosistema Apache Hadoop.
Arquitectura Big Data.
Apache Spark: Operaciones de transformación y acción en conjunto de datos RDD.
Bases de datos no SQL: ¿qué son? Mongo, Cassandra, HBase, Neo4j Teoría. Práctica
con Mongo Shell.
Apache Solr para indexar data no estructurada.
Práctica con la herramienta de análisis de datos Big Data en la nube “Databricks”.
UdeCataluña

Módulo 3
Obtención, Transformación y Limpieza en R & Python.
Este módulo tiene como objetivo:
Practicar con una completa gestión de datos, accediendo a diferentes fuentes para la recopilación, limpieza, preparación y
transformación de la data, cumpliendo así con la implementación de esta fase del proyecto.
Minería de Datos: Obtención, limpieza y transformación de datos.
Introducción a Data Frames.
R como dialecto de programación y como herramienta de analítica avanzada.
Python como lenguaje de programación y como herramienta de analítica avanzada.
Proceso KDD-Descubriendo el conocimiento a partir de los datos.
Taller práctico de obtención, transformación y Limpieza de datos de un sistema real.

Módulo 4
Análisis Descriptivo y Exploratorio.
Este módulo tiene como objetivo:
Presentar algunas técnicas de análisis descriptivo y exploratorio de datos relevantes dentro del proceso de entendimiento de
la información y en el pre-procesamiento de esta como insumo de un proceso analítico. Además, trabajar algunas técnicas de
visualización para la presentación de resultados del análisis de grandes conjuntos de datos.

Introducción al Análisis descriptivo y exploratorio.


Medidas de tendencia central, de posición o localización.
Tabla de frecuencias y diagramas con variables cualitativas y cuantitativas.
Análisis exploratorio de datos con R.
Análisis exploratorio de datos en Python.
Algoritmos de agrupamiento clustering.
Taller de Agrupamiento de datos (Aprendizaje no supervisado): Algoritmo K means en Spark.
UdeCataluña

Módulo 5
Análisis Interferencial de Datos (Machine Learning y Estadística).
Este módulo tiene como objetivo:
Profundizar en la presentación, tanto teórica como práctica, de técnicas de modelamiento derivadas de la estadística o de
Machine Learning.

Concepto de Machine Learning.


Machine Learning aplicado a la empresa.
Tipos de aprendizaje en Machine Learning.
Principios de Machine Learning.
Algoritmos de Machine Learning:
K Nearest Neighbours o K-NN.
Arboles de decisión.
Bosque aleatorio (Random Forest).
Redes neuronales artificiales – RNA.
Taller sobre Aprendizaje Supervisado.

Módulo 6
Investigación Reproducible, Técnicas de Implementación e
Introducción a la Inteligencia de Negocios con Power BI.
Este módulo tiene como objetivo:
Analizar problemas de reproducibilidad y técnicas de implementación desde el enfoque de los analistas de datos.

Reproducibilidad y Técnicas de Implementación.


Herramientas básicas para la reproducibilidad en R y RStudio.
Escribiendo informes reproducibles.
Git y github.
Ejercicio de construcción de un Dashboard en Power BI.
UdeCataluña

Módulo 7
Fases para un Proyecto de Big Data.
Este módulo tiene como objetivo:
Reconocer las principales etapas para un proyecto con una inmensa acumulación de datos, que no son posible gestionarlos
con facilidad y que requieren una metodología y herramientas sustentables y eficaces para su desarrollo.

Fases de un proyecto Big Data.


Metodología CRISP-DM para el Desarrollo de Proyectos en Big Data.
Tips para la implementación de un Proyecto Big Data.
Malas prácticas en la implementación de un Proyecto Big Data.
Proyecto final: implementación de un caso de negocio.

Valores Agregados
Curso Introductorio en Estadística.
Orientación de un proyecto de Big Data a través de la metodología CRISP-DM.

Nota: “La Corporación Universitaria de Cataluña se reserva el derecho de apertura o aplazamiento de los cursos, seminarios, diplomados en caso
de no contar con el número mínimo de inscritos. El grupo docente estará sujeto a cambios según disponibilidad de su agenda al igual que el
cronograma de actividades académicas.”
UdeCataluña

Conferencistas
Anderson Fajardo.

Ingeniero de Industrial, Especialista en Informática Industrial, Magister (c) en Ing. Industrial – Énfasis
Inteligencia Computacional. Con más de 18 años de experiencia en el manejo de datos, así como en el
análisis e interpretación de la misma para la toma de decisiones. Experto en TI del sector financiero,
actualmente forma parte de un equipo implementador de proyectos de datos en toda la gestión
funcional de una importante entidad financiera nivel Colombia.
Cuenta con el dominio de programas como Excel Avanzado, XLSTAT Software Estadístico para Excel,
STAT-FIT – Software de análisis estadístico de datos, R – Software para computación estadística y
gráficos, MYSQL WORKBENCH – Software para el modelado de datos y desarrollo de SQL, PYTHON
– Software para desarrollar modelos de aprendizaje automático y PYSPARK – Python sobre Spark.
CONTÁCTENOS
BOGOTÁ
Cra 18 B No 106 A 15
+57 (1) 489 47 83 - +57 (1) 489 47 86
www.UdeCatalunya.edu.co

Institución de educación superior sujeta a la inspección y vigilancia del Ministerio de Educación Nacional de Colombia.
Reconocimiento de personería jurídica como institución de educación superior con Resolución No 21329 de noviembre 15 de 2016
del Ministerio de Educación Nacional de Colombia. Código SNIES 9923.

También podría gustarte