Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Curso 2016/2017
PRESENTACIN
El Big Data permite almacenar, gestionar, analizar, compartir y entender los enormes
volmenes de datos que se estn recogiendo hoy en da, y tiene que ver con tecnologas como
Hadoop o MapReduce que permiten procesar grandes volmenes de datos de una forma
eficiente.
Por otro lado, el trmino Data science se utiliza para referirse a un nuevo campo
dedicado al anlisis y la manipulacin de los datos con el objetivo de extraer conocimiento a
partir de ellos. Esta nueva disciplina utiliza tcnicas y teoras de campos como la estadstica,
la probabilidad, el aprendizaje automtico, el reconocimiento de patrones o la visualizacin.
Las tcnicas de Data science pueden aplicarse en muy diversas reas como la biologa, la
salud, las ciencias sociales, la economa, los negocios y las finanzas.
Un cientfico de datos debe ser capaz de integrar datos de distintas fuentes, gestionar
grandes volmenes de datos, crear visualizaciones que permitan entender los datos, construir
modelos matemticos usando los datos, y presentar y comunicar las conclusiones extradas a
especialistas y cientficos.
Actualmente, los perfiles de cientfico de datos y de experto en Big Data son muy
demandados. La empresa Deloitte estima que sern necesarios entre 140.000 y 190.000
profesionales de Big Data cualificados en los EE.UU durante los prximos cinco aos.
El ttulo de experto que se propone tiene como objetivo fundamental formar a
profesionales TIC en estas dos reas tan demandadas en el mercado laboral.
OBJETIVO
El objetivo fundamental de este ttulo es formar a los estudiantes en los temas ms
relevantes sobre el Big Data que tienen que ver con la recoleccin, el almacenamiento y el
procesamiento de datos (Hadoop, Spark, etc.), las necesidades de infraestructura para Big
Data (virtualizacin, seguridad), el anlisis de datos (aprendizaje automtico) y la
visualizacin.
La iniciativa del ttulo viene respaldada por la Ctedra UAM/IBM por lo que se
impartir conjuntamente por profesores de la EPS y profesionales de IBM expertos en estas
reas. Tambin contaremos con profesionales de diversas empresas que nos hablarn de cmo
estn utilizado las tecnologas de Big Data en aplicaciones reales relacionadas con la minera
web, el anlisis de opiniones, el anlisis de textos, el anlisis de audio y vdeo, la biometra o
el uso del Big Data para el anlisis financiero.
La interaccin de los profesores con los profesionales aporta un gran valor al ttulo
propuesto y ofrece una perspectiva nica frente a otros ttulos cuyos contenidos se enfocan
solo desde la perspectiva acadmica.
Dirigido a
El ttulo est dirigido a profesionales, expertos y consultores en el mbito de la
ingeniera TIC y de cualquier sector en el que se requiera el anlisis de grandes volmenes de
datos. Tambin est dirigido a ingenieros, licenciados y graduados en ingenieras, ciencias
experimentales u otras titulaciones universitarias que justifiquen un perfil de ingreso
adecuado a las materias propias del ttulo de experto. Excepcionalmente podrn acceder
estudiantes prximos a la finalizacin de cualquiera de los estudios anteriormente
relacionados.
Estructura
Primer
cuatrimestre
Primer
ao
Segundo
cuatrimestre
Primer
cuatrimestre
Segundo
ao
Segundo
cuatrimestre
3 ECTS
3 ECTS
Fundamentos: lenguajes
3 ECTS
3 ECTS
3 ECTS
Estadstica
3 ECTS
6 ECTS
Ecosistema Spark
3 ECTS
Explotacin y visualizacin
3 ECTS
3 ECTS
6 ECTS
3 ECTS
3 ECTS
3 ECTS
Aplicaciones de anlisis
6 ECTS
Trabajo Fin de Mster
TOTAL
6 ECTS
60 ECTS
Programa
Seminarios de actualidad en Big Data
1. Aspectos generales sobre Big Data
1.1. Qu es el Big Data?
1.2. El Big Data en la empresa
1.3. Las tecnologas Big Data
2. Casos reales
3. Seminarios de actualidad sobre Big Data
Fundamentos: lenguajes
1. Python
1.1. Introduccin a python
1.1.1.Instalacin
1.1.2.Intrpretes: python, ipyhton, notebooks
1.1.3.Diferencias entre 2.7 y 3.0
1.2. Tipos bsicos: cadenas, listas, diccionarios, tuplas, etc.
1.3. Funciones, funciones lambda e imports.
1.4. Sentencias de control e iteracin
1.4.1.1.
1.4.1.2.
Loops e ifs
Algunas formas de utilizar programacin funcional: map, reduce.
4
Estadstica
1. Tema 1: Introduccin
1.1. Qu es la estadstica?
1.2. Modelo estadstico
1.3. Mtodo estadstico
1.4. Algunas herramientas de anlisis de datos mediante estadstica
2. Tema 2: Descripcin de los datos
2.1. Descripcin de una variable
2.2. Descripcin multivariante
3. Tema 3: Modelos en estadstica
3.1. Probabilidad y variables aleatorias
3.2. Modelos univariantes de distribucin de probabilidad
3.3. Modelos multivariantes de distribucin de probabilidad
4. Tema 4: Inferencia Estadstica
4.1. Estimacin puntual
4.2. Estimacin por intervalos
4.3. Estimacin bayesiana
4.4. Contraste de hiptesis
Ecosistema Spark
1. Fundamentos de Spark
1.1. Introduccin: arquitectura y organizacin
1.2. Datos en Spark: Resilient Distributed Datasets (RDDs)
1.3. Flujo de un programa spark
1.4. Entrada y salida de datos
1.5. Transformaciones
1.6. Persistencia
1.7. Acciones
1.8. Variables compartidas: broadcast y acumuladores
2. Tuning en Spark
3.
4.
5.
6.
Explotacin y visualizacin
1. Introduccin, importancia de la visualizacin
2. Visualizacin grfica eficiente
2.1 Terminologa
2.2 Finalidad de la visualizacin grfica
2.3 Alcance
2.4 Campos relacionados
3. Herramientas de visualizacin
3.1 IBM Cognos
3.2 Pentaho
3.3 Gephi
3.4 ManyEyes
3.5 Watson Analytics
4. Principales tipos de diagramas
5. Visualizacin de patrones
5.1 Visualizacin de relaciones y diferencias entre patrones
5.2 Patrones temporales
5.3 Informacin espacial y geogrfica
5.4 Otros tipos
6.4. Seguridad
7. Plataformas como servicio (PaaS): Bluemix
7.1. Concepto de Plataforma como Servicio
7.2. Utilidades y nuevos modelos de consumo de servicios
7.3. La plataforma Bluemix
7.4. Ejercicios prcticos con Bluemix.
Aplicaciones de anlisis
1. Business Analytics
1.1. Introduccin
1.2. Soluciones de data science para problemas de negocio
1.3. Evaluacin de modelos para negocio
1.4. Visualizacin del rendimiento de modelos
1.5. Ingeniera analtica
1.6. Evaluacin de propuestas
2. Finanzas
2.1. Series temporales en finanzas
2.2. Simulacin en finanzas
2.3. Riesgos en finanzas
3. Biomedicina y genmica
10
11
Direccin acadmica
Profesores
Aguirre Maeso, Carlos
Escuela Politcnica Superior
UAM
12
Gonzlez Rodrguez,
Joaqun
Escuela Politcnica Superior
UAM
Ordiz, Jos M
Arquitecto de Tecnologas
de Informacin
IBM
Rodrguez Rodrguez,
Manuel
Arquitecto de Tecnologas
de Informacin
IBM
Tabuenca, Daniel
Arquitecto de Tecnologas
de Informacin
IBM
13
Inscripcin y matriculacin
Tasas
Precio del curso: 5900
Aparte del abono total del Ttulo, existe la posibilidad de pago fraccionado en cuatro plazos
sin coste adicional alguno:
- Primer plazo (matrcula): 944
- Segundo plazo (febrero 2017): 1652
- Tercer plazo (noviembre 2017): 1652
- Cuarto plazo (febrero 2018): 1652
Requisitos de admisin
Los requisitos y condiciones de acceso exigen ser ingeniero, licenciado o graduado
universitario o excepcionalmente, estar prximo a la finalizacin de cualquiera de estos
estudios. Tambin podrn acceder aquellas personas que, aun no cumpliendo los requisitos
anteriores, cuenten con amplia experiencia, documentalmente acreditada, en el campo de las
tecnologas TIC.
Inscripcin
14
Se realizar tambin una entrevista personal (cuando se considere pertinente) y esta ser
determinante.
Matriculacin
Fecha de matriculacin: del 1 al 21 de julio de 2016.
Becas
Los alumnos que soliciten becas sern seleccionados entre los inscritos en el primer plazo en
base a los siguientes criterios:
Informacin y contacto
Para ms detalle e informacin contactar con secretaria.bigdata@uam.es
15