Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Finanzas
Generación de
FI-75301 Macrodatos y
Fintech conocimiento
M.Sc. Walter Jeremías López.
con Big Data.
Maestría en
Finanzas Objetivos de aprendizaje:
• Describir las principales
arquitecturas de Big Data en
FI-75301 Macrodatos y cuanto a la manera de
Fintech incorporarlas a sus entornos
laborales.
• Explorar las diferentes
M.Sc. Walter Jeremías López. plataformas disponibles en el
mercado para el análisis de Big
Data en las empresas.
Maestría en
Finanzas Competencias a desarrollar:
• El alumno conoce la manera
en que funcionan las
FI-75301 Macrodatos y arquitecturas de Big Data para
Fintech incorporarlas en su trabajo.
• El alumno conoce las
plataformas de Big Data
M.Sc. Walter Jeremías López.
disponibles en el mercado
para incorporarlas en su
empresa.
Maestría en
Finanzas Agenda:
Análisis
Generación Adquisición Almacenamiento Análisis
1) Los datos se generan de
múltiples y diversas fuentes.
Fase 1:
Generación
2) Según los objetivos estratégicos
Fases de la cadena planteados, se deben elegir las
de valor de los fuentes apropiadas donde se espera
macrodatos. obtener los datos que se necesitan
para alcanzarlos.
1) Recogida de datos – 2 enfoques:
◦ Pull.
Fase 2: ◦ Push.
Adquisición 2) Transmisión.
Minería de
Datos
Algoritmos de data
mining más
utilizados con datos
masivos.
Regresión lineal múltiple:
Minería de
Datos
Algoritmos de data
mining más
utilizados con datos
masivos.
Regresión
Minería de logística:
Datos
Algoritmos de data
Comparación:
mining más
utilizados con datos
masivos.
Árboles de decisión:
Minería de
Datos
Algoritmos de data
mining más
utilizados con datos
masivos.
Agrupamiento (clustering):
Minería de
Datos
Algoritmos de data
mining más
utilizados con datos
masivos.
Segmentación:
Minería de
Datos
Algoritmos de data
mining más
utilizados con datos
masivos.
Reglas de asociación:
Minería de
Datos
Algoritmos de data
mining más
utilizados con datos
masivos.
Extrae información de los enlaces,
contenidos de páginas web y logs de los
Minería recursos de Internet:
Web
Definición y tipos de 1. Estructura web (Web structure
Web Mining. mining).
2. Contenido web (Web content mining).
3. Uso de la web (Web usage mining).
Se fundamenta en lingüística
computacional, procesamiento de texto y
Minería de aprendizaje automático:
Governance
Ciclo de vida de la
gestión de la
Distribución Representación
información.
Recuperación Almacenaje
Determinación
FCV / Recursos
Governance
Ciclo de vida de la
inteligencia
Aplicación Filtro y análisis
competitiva.
Difusión de
Protección
resultados
Crear y
capturar
conocimiento
Data Evaluar
Governance
Contextualizar
Ciclo de la gestión
del conocimiento.
Adquirir y Diseminar y
aplicar compartir
conocimiento conocimiento
Actualizar
El análisis se puede hacer
desde 3 visiones:
Gestión
organizativa Perspectiva Prospectiva
o descriptiva o predictiva
Generación de
conocimiento para la
acción.
Prescriptiva
1. Alta gerencia: BSC con Big Data.
2. Mercadeo: clientes, fuerza de ventas.
Gestión
3. Producción: cadena de suministro,
organizativa líneas de producción.
Aplicaciones 4. Contabilidad, auditoría y finanzas:
sectoriales del Big prevención de fraude y lavado,
Data o por funciones análisis de transacciones, riesgos.
de negocio.
Vean Open Data: ODI
Ejemplos: data.gov data.gov.uk
Liderazgo
Gestión
organizativa Cultura Gestión del
Corporativa talento
Los 5 retos de la
gestión de datos
masivos en la
empresa.
Toma de
Tecnología
decisiones
Modelos
Gestión de
Macrodatos Arquitecturas
Infraestructur
as
Herramientas para la
Ecosistema
de
gestión de datos
macrodatos
masivos en la
empresa.
Protocolos Tecnologías
Deben proporcionar rendimiento de
R/W, acceso a datos simultáneos,
Gestión de creación de FS bajo demanda y
sincronizar archivos:
Macrodatos
1. Acceso distribuido y transparencia
Sistemas de archivo en la localización.
para datos masivos.
2. Gestión de fallos (Fault Tolerance).
3. Heterogeneidad.
4. Distribución definida de datos.
5. Tolerancia a la partición de la red.
No son relacionales ni utilizan SQL,
tienen las siguientes cualidades:
Gestión de 1. No siguen el esquema E-R (Entidad
Macrodatos – Relación). Por lo tanto carecen de
estructura prefijada en tablas y
Tecnologías de
relaciones.
bases de datos para
datos masivos. 2. Usan Lenguaje NoSQL, que
significa Not only SQL.
3. Implementaciones BigTable y
orientadas a grafos.
Los Macrodatos se almacenan en
cientos o miles de servidores, que
Gestión de operan con modelos de programación
Macrodatos paralelos (PPM):
1. Los modelos paralelos tradicionales
Modelos de
como MPI u OpenMP pueden ser
programación para
inadecuados para gran escala.
datos masivos.
2. Los nuevos modelos son:
MapReduce, Dyrad, Ajo-Pairs y
Pregel.
MapReduce:
Modelo de programación creado por
Gestión de aplicaciones que deben grandes
Macrodatos cantidades de datos de forma paralela,
dividiéndolos en grupos para
Modelos de
procesarlos distribuidos en diferente
programación para
HW, para luego combinar el resultado.
datos masivos.
Conclusiones
Para obtener datos, se pueden extraer
automáticamente mediante crawlers o enviar
bajo demanda (pull o push).
Conclusiones
Los datos procesados se deben limpiar,
eliminar la redundancia y luego almacenar.
Conclusiones
Para analizar y visualizar datos se usan
diferentes técnicas estadísticas, minería de
datos y algoritmos de aprendizaje automático
lo cual se conoce como ciencia de datos.
Las principal tecnología para gestión de
macrodatos son MapReduce y el ecosistema
Hadoop.
Conclusiones
Maestría en
Finanzas
¡Gracias por
FI-75301 Macrodatos y
Fintech.
su atención!
M.Sc. Walter Jeremías López. ¿Preguntas o comentarios?