Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aaaaaaaa
Aaaaaaaa
BUSINESS ANALYTICS
SESIÓN 2 – 6 de Enero
• Control de lectura N°1: “01. EjemploACP.pdf”
• Análisis Clúster: métodos jerárquicos.
• Análisis Clúster: métodos de particionamiento.
• Caso Aplicativo.
Programa de Especialización en Business Intelligence &
y Business
BusinessAnalytics
Analytics M.Sc. Richard Fernández
SESIÓN 3 – 12 de Enero
• Control de lectura N° 2: “02. Silueta.pdf”
• Modelos Supervisados I: Regresión Logística y Probit, Árboles de
decisión, KNN, Máquina de Soporte Vectorial y Redes Neuronales.
• Caso Aplicativo.
SESIÓN 4 – 13 de Enero
• Control de lectura N° 3: “03. Árboles.pdf”
• Modelos Supervisados II: Modelos Bagging, Boosting y Ensamble.
• Caso Aplicativo.
Programa de Especialización en Business Intelligence &
y Business
BusinessAnalytics
Analytics M.Sc. Richard Fernández
SESIÓN 5 – 20 de Enero
• Exposición de trabajos.
• Examen Final = 20%*Caso Virtual + 30%*Lecturas + 50%*Exposición
04. Boosting.pdf
04. CatBoost vs. Light GBM vs. XGBoost.pdf
04. Ensemble Learning.pdf
04. Random Forest.pdf
04. Xgboost vs Catboost vs Lightgbm which is best for price prediction.pdf
04. XGBoost.pdf
http://data.europa.eu/euodp/es/data/ http://www.gapminder.org/data/
2.- Portal de datos abiertos del Gobierno de USA 5.- Machine Learning Repository
https://www.data.gov/ https://archive.ics.uci.edu/ml/datasets.html
https://aws.amazon.com/es/datasets/ https://www.kdnuggets.com/datasets/index.html
7.- Kaggle
http://www.kaggle.com/datasets
- Prueba de Pearson
- Prueba de Kendall
- Prueba de Spearman
Distribución z
Distribución t
1
Estadística de Barlett: n 1 (2 p 5) ln R
2
c
6
N° Variable Definición
S ˆ j I Lˆ j 0
Autovalor Autovector
Var(Z ) Traza()
j 1
j
j 1
j
p
Si las variables están tipificadas: Var(Z ) Traza(R ) p
j 1
j p
j j
PVE p
x100 Si las variables están tipificadas: PVE x100
p
Var(Z
j 1
j )
k k
j 1
j
j 1
j
PVE k p
x100 Si las variables están tipificadas: PVE k x100
p
Var(Z j )
j 1
Criterio de la Si
h , entonces se retiene la componente principal h. Para
media aritmética p
variables tipificadas, se tiene que se retiene la componente h si: h 1 puesto
p
que:
j 1
j p
Scree Plot
4
Elección del
número de
componentes: 3
Gráfico de 2
Sedimentación
1
Eigenvalue
0
1 2 3 4 5 6 7 8 9
Component Number
Correlación entre
las componentes
principales y las
variables iniciales
Importance of components:
- La primera componente (PC1) explica el PC1 PC2 PC3 PC4
62% de la varianza, la segunda Standard deviation 1.57 0.995 0.5971 0.4164
componente (PC2) el 24.7%, la tercera Proportion of Variance 0.62 0.247 0.0891 0.0434
componente (PC3) el 8.9% y la cuarta Cumulative Proportion 0.62 0.868 0.9566 1.0000
componente (PC4) el 4.4%.
rfernandezv@uni.edu.pe @ricfer85