Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ANÁLISIS DE DATOS
CON PYTHON
¿ POR QUÉ SER UN ANALISTA DE DATOS ?
DATA ANALYST
.
Profesionales que busquen incursionar y
desarrollar análisis de grandes cantidades de datos.
Crea un
PRE-REQUISITOS plan estratégico
- Nociones básicas en programación.
- Cálculo diferencial e integral.
aplicando análisis
estadístico
- Tener ganas de aprender y tener claro el alcance del curso.
OBJETIVO GENERAL
Conocer,dominar y aplicar técnicas
de Data Analytics generando valor
con los datos y obteniendo mayor
rentabilidad para las empresas,
mediante el desarrollo de
algoritmos desarrollados en
Python.
3
Comprender los conceptos esenciales de la estadística que te permitirán
entender y tomar decisiones correctas basadas en los datos.
OBJETIVOS
ESPECÍFICOS
2 Implementar cualquiera de los cinco principales modelos estadísticos sobre conjuntos
multivariados de datos.
1 Conocer las metodologías y adquirir los conocimientos necesarios sobre las herramientas existentes para implementar a
futuro proyectos de analítica de datos en su entorno laboral o académico.
TU EXPERIENCIA CON NOSOTROS
SERIES DE TIEMPO ANÁLISIS REGRESIÓN REGRESIÓN PRUEBAS DE ESTIMACIÓN MEDIDAS DE RESUMEN PROBABILIDAD Y
LINEAL Y REPRESENTACIÓN VARIABLES
MULTIVARIANTE LOGÍSTICA HIPÓTESIS DE DATOS ALEATORIAS
PROYECTO FINAL
Como segundo entregable , el alumno debe seleccionar la metodología para el análisis exploratorio univariable y multivariable del dataset; con el fin de presentar e
interpretar gráficos para comprender la naturaleza del set de datos . También debe indicar el preprocesamiento que se ha realizado.
matplotlib
3
ESTADÍSTICA DESCRIPTIVA E INFERENCIAL PROBABILIDAD Y
VARIABLES
ALEATORIAS
• Sistema de hipótesis.
eventos, operaciones de media, moda, mediana y cuantiles. • Distribución conjunta, marginal, • Tipos de error, nivel de
conjuntos. • Medidas de dispersión, rango, condicional. significación.
• Diagramas de Venn. varianza, desviación estándar. • Vector de esperanzas, matriz de • Estadístico de prueba, regla de
• Teorema de Bayes y demás • Tabla de datos. covarianzas, correlaciones. decisión.
teoremas sencillos de • Tabla de f recuencias. • Muestreo aleatorio. • Relación entre la prueba de
probabilidad. • Gráficos de barras, proporciones y • Función de verosimilitud. hipótesis y el intervalo de
• Variables aleatorias. líneas. • Teorema del límite central. confianza.
• Esperanza y varianza. • Histograma. • Distribuciones derivadas de la • Pruebas sobre la media.
• Distribuciones de probabilidad • Gráfico de dispersión y de cajas. normal. • Prueba sobre la varianza.
discretas. • Estimación de parámetros. • Prueba de la diferencia de medias.
• Distribuciones de probabilidad • Intervalos de confianza. • Prueba de independencia
continuas. • Chi-cuadrado.
Laboratorios
Laboratorio: Laboratorio:
Distribuciones de probabilidades Laboratorio:
Medidas de tendencia central y de Intervalos de confianza
discretas Pruebas de hipótesis
dispersión
Distribuciones de probabilidades
contínuas
matplotlib
SERIES DE TIEMPO
• Notación.
• Media móvil.
•
•
ANÁLISIS
MULTIVARIANTE
Análisis Discriminante.
Pruebas de hipótesis.
•
•
REGRESIÓN
LOGÍSTICA
MODELOS ESTADÍSTICOS
• Metodología para el modelado. • Principales (PCA). • Interpretación, pruebas de bondad
• Métodos de suavización • Aproximación geométrica. del ajuste, diagnóstico.
exponencial. • Aproximación algebraica. • Regresión lineal en Python.
• Modelo autorregresivo de media • Componentes principales.
móvil integrado (ARIMA). • Decisión sobre cuáles retener.
• Series de tiempo en Python. • Interpretación.
• Selección de variables.
• PCA y Discriminante en Python
Laboratorio:
Laboratorios Análisis discriminante lineal (LDA) Laboratorio: Laboratorio:
Series de Tiempo Regresión lineal multiple Regresión Logística Manejo de matrices
Análisis de Componentes
Principales (PCA)
Aplicar alguno(s) de los modelos estadísticos estudiados a un problema definido, de interés del alumno. Dicho problema puede estar incluido en su proyecto transversal
(durante el programa) o provenir de algún nuevo problema a definir.
matplotlib
5 •
•
INTRODUCCIÓN A
MACHINE LEARNING
Definición.
Historia.
•
•
FASES EN MACHINE
LEARNING
Fases en Aprendizaje de Máquina.
Recolección de datos.
•
•
APRENDIZAJE
SUPERVISADO
Introducción.
Técnicas para Regresión.
APRENDIZAJE NO
SUPERVISADO
• Introducción.
• Técnicas de Agrupamiento.
• Aplicaciones. • Preparación de datos. • Técnicas para Clasificación. • Algoritmos de particionamiento
• Tipos de aprendizaje. • Extracción de características. • Evaluación de Desempeño. (K-means, K-means++, K-medoides).
• Argot de Aprendizaje de Máquina. • Selección de un modelo. • Overfitting y underfitting. • CLARA (Agrupación de aplicaciones
• Áreas Relacionadas. • Entrenamiento y Evaluación. • Métricas de evaluación. grandes).
• Limitaciones. • Ajuste de hiperparámetros. • Teoría de Decisión. • Algoritmos de jerarquía
• Bibliotecas. • Predicción. (Aglomerativo y Divisivo).
• Principales Conferencias. • Basado en densidad (DBScan).
• Evaluación de Desempeño.
• Métricas de evaluación.
MACHINE LEARNING
PROYECTO FINAL
Como último entregable el alumno debe aplicar alguno(s) de los modelos de Machine Learning estudiados a un problema definido, de interés del alumno. Dicho
problema puede estar incluido en su proyecto transversal (durante el programa) o provenir de algún nuevo problema a definir.
matplotlib
CERTIFICACIÓN COMO ANALISTA DE DATOS
Certificación Parcial
5 certificados parciales por competencias adquiridas:
- Fundamentos para el análisis de datos
- Python para el análisis de datos
- Estadística descriptiva e inferencial
- Modelos estadísticos
- Machine Learning
Certificación Total
Alianzas con
grandes empresas
corporativas
Experiencia
Capacitaciones
capacitando a
especializadas
diversas empresas
con aplicación
de distintos
de Práctica
sectores
Inmediata
económicos
Generador de
impacto social
con la Ciencia
de Datos y la
Inteligencia
Artificial
¿Tienes dudas?
Síguenos: