Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Federico Villarreal
EUPG
ESCUELA UNIVERSITARIADE
POSTGRADO
MAESTRIA EN INGENIERIA DE SISTEMAS
MENCIN: INTELIGENCIA EN PROCESOS EMPRESARIALES
BALANCED SCORECARD Y DATA MINING
TEMA: BUSINESS ANALYTICS
Docente:
Pgina 1
a) Evaluacin de resultados............................................................................................. 28
Fase 6: Utilizacin del Modelo ................................................................................................ 29
a) Planificacin de despliegue. ........................................................................................ 29
CONCLUSIONES ........................................................................................................................... 32
RECOMENDACIONES ................................................................................................................... 33
BIBLIOGRAFA .............................................................................................................................. 34
APNDICES 1................................................................................................................................ 35
APNDICES 2................................................................................................................................ 38
Pgina 2
INTRODUCCIN
Pgina 3
CAPTULO I: GENERALIDADES
Integrantes:
Pgina 4
CAPTULO II: DESCRIPTIVE ANALYTICS
b) Organigrama Actual
Pgina 5
c) Cartera de Negocios
i. CENTRO DE INFORMACIN
a. Atencin Telefnica
b. Atencin Virtual
c. Atencin Presencial
ii. BIBLIOTECA INSTITUCIONAL
a. Lectura en Sala
b. Servicio de Referencia
c. Servicio de Fotocopiado
d. Mdulos computarizados
Pgina 6
los perfiles del presente trabajo, en vista de que el acceso al Data
Warehouse es restringido.
PREDICCION_FINAL BD_CENSO_MAYORES_18
IDEPERS1 IDEPERS
NOMBRE UBIGEO
APELLIDO DEPARTAMENTO_
CORREO PROVINCIA_
[FECHA NACIMIENTO] DISTRITO_
UBIGEO AREA
DEPARTAMENTO ZONA
PROVINCIA SECCION
DISTRITO AEU
PAIS AERINI
AREA AERFIN
ZONA VIV
SECCION VHOGAR
AEU DEHOGAR
AERINI MANZANA
AERFIN MANZANAALF
VIV FRENTE
VHOGAR PNUM
DEHOGAR _PARENTESCO
MANZANA _SEXO
MANZANAALF _EDAD
FRENTE PARTIDADENACIMIENTO
PNUM _SEGURO
PARENTESCO _Idioma
SEXO _NivelEstudio
PARTIDADENACIMIENTO Religion
SEGURO _EstadoCivil
Idioma _TOTALDEHIJOS
NivelEstudio [_TIENE DNI]
Religion estratopoblacional
EstadoCivil _estratosocioeconomico
TOTALDEHIJOS trabaja
DNI
estratopoblacional
estratosocioeconomico
aasd
Pgina 7
Fase 3: Preparacin de los Datos
Fase 4: Modelamiento
Pgina 8
iii. Bayes Naives.- Es un clasificador probabilstico fundamentado en el
teorema de Bayes y algunas hiptesis simplificadoras adicionales.
Es a causa de estas simplificaciones, que se suelen resumir en la
hiptesis de independencia entre las variables productoras.
Parmetros:
Pgina 9
b. Asignacion de Tipo de Contenido y Tipo de datos:
Pgina 10
ii. Parametros segn los modelos:
a) rbol de Decisiones
c) Bayes Naives
Pgina 11
iii. Conjunto de pruebas: El aprendizaje del modelo se realizara en el
70 % de la tabla BD_CENSO_MAYORES_18, asimismo en el 30 %
restante se realizaran las pruebas del modelo aprendido dado que
no se ha restringido el nmero mximo de los casos de prueba.
Pgina 12
c) Evaluacin del modelo.
d) rbol de Decisiones
Pgina 13
e) Clster
f) Bayes Naives
Pgina 14
Fase 5: Evaluacin del Modelo
a) Evaluacin de resultados.
I. rbol de decisiones
Se han creado hasta 8 niveles de las ramificaciones del rbol
Pgina 15
El software tambin nos muestra las redes de dependencia,
donde se aprecia que la variable de entrada que ms
influyente es el sexo.
II. Clster
Se han creado 15 clusteres para la evaluacin del modelo:
Pgina 16
El cluster con mayor probabilidad de que la persona trabaje es el
Cluster 1 (LOS MAS TRABAJADORES) con una probabilidad del 78%
y los que menos trabajan se encuentran en el Cluster 14 (LOS
MENOS TRABAJADORES) donde la probabilidad de que trabajen es
de solo el 14%
Pgina 17
Perfil de los que ms trabajan
Pgina 18
Distincin para LOS MAS TRABAJADORES y LOS MENOS
TRABAJADORES.
Pgina 19
Y caso contrario se establece que la variable con menos vinculacin
es TIENE DNI.
Pgina 20
Los que trabajan
Pgina 21
Distincin entre los que trabajan (1) y los que no trabajan (0)
Pgina 22
CAPTULO III: PREDICTIVE ANALYTICS
Fase 4: Modelamiento
Pgina 23
En la matriz de clasificacin se aprecia la distribucin de casos que
trabajan y no trabajan (real) contra los que trabajan y no trabajan
segn el modelo. Por ejemplo 56,413 son los que no trabajan y que de
la aplicacin del modelo tampoco trabajan.
Pgina 24
b) Construccin de los modelos Predictivos.
En este punto seleccionamos el modelo con mayor puntuacin (Arbol).
Pgina 25
Luego Seleccionamos las conexiones entre las variables de nuestro
modelo y las variable de la tabla de prediccin.
Pgina 26
c) Evaluacin de los modelos.
Los Resultado de la predicion delas personas que trabajan se muestran
en la tabla de resultados.
Modelo Cluster:
Pgina 27
Modelo Buyes Naives:
a) Evaluacin de resultados.
Del tabla de Prediccin se puede observar, se elabor el histograma de
distribucin del nmero de casos segn las probabilidad, de lo cual se
aprecia que el valor mnimo de 0.5 es a partir del cual el modelo del rbol de
decisin considera como personas que trabajan. El total de personas que
trabajan es de 8,880.
2000
1500
1000 647
500 1
0
[0.5;0.6> [0.6;0.7> [0.7;0.8> [0.8;0.9> [0.9;1>
Pgina 28
Fase 6: Utilizacin del Modelo
a) Planificacin de despliegue.
Para la visualizacin de la distribucin de las personas que trabajan en
el mapa del Per se ha empleado el software Power Map.
Pgina 29
Seguidamente configuramos la visualizacin de las personas que
trabajan.
Grfico de barras.
Grafico de Calor
Pgina 30
Asimismo el programa nos permite la creacin de un video, el mismo
que se adjunta en el medio magntico.
Pgina 31
CONCLUSIONES
Pgina 32
RECOMENDACIONES
Pgina 33
APENDICE 1: PERFILES DE LOS CLUSTERES
LOS MAS LOS MENOS
Poblacin
Variables Estados TRABAJAD Clster 2 Clster 3 Clster 5 Clster 4 Clster 6 Clster 7 Clster 9 Clster 8 Clster 10 TRABAJADO Clster 12 Clster 11 Clster 13 Clster 15
(Todo)
ORES RES
Tamao 364678 37166 35301 33049 28447 27620 25644 23623 22709 20506 20220 19243 19123 18471 17715 15841
EDAD Promedio 39.76 42.38 32.2 19.46 24.54 65.57 24.67 34.93 37.15 37.46 52.38 58.58 28.07 48.51 42.99 68.35
EDAD Desviacin 16.7 9.26 7.56 1.29 2.83 11.52 3.95 5.6 5.79 8.8 8.84 11.54 6.07 13.17 11.24 13.16
Estado Civil Casado(a) 124363 0.781 0.045 0 0.003 0.56 0.134 0.619 0.425 0.024 0.869 0.791 0.035 0.738 0.105 0.07
Estado Civil Conviviente 104945 0.216 0.951 0.015 0.104 0.159 0.845 0.38 0.575 0.01 0.131 0.209 0.023 0.21 0.09 0.051
Estado Civil Soltero(a) 101108 0 0.002 0.984 0.891 0.094 0 0 0 0.819 0 0 0.882 0.004 0.317 0.059
Estado Civil Viudo(a) 17010 0 0 0 0 0.132 0 0 0 0.008 0 0 0.002 0.023 0.067 0.686
Estado Civil Separado(a) 14907 0.001 0.002 0.001 0.002 0.042 0.021 0.001 0 0.118 0 0 0.055 0.021 0.371 0.11
Divorciado(a
Estado Civil 2345 0.001 0 0 0 0.012 0 0 0 0.021 0 0 0.002 0.004 0.051 0.022
)
Estado Civil ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Estratosocio
Bajo 73401 0.201 0.203 0.204 0.202 0.197 0.204 0.201 0.203 0.199 0.197 0.201 0.202 0.195 0.207 0.201
economico
Estratosocio
Medio Bajo 73042 0.201 0.195 0.201 0.196 0.202 0.203 0.2 0.2 0.207 0.198 0.204 0.205 0.198 0.198 0.2
economico
Estratosocio
Alto 72832 0.2 0.2 0.198 0.204 0.208 0.197 0.199 0.203 0.193 0.2 0.198 0.199 0.201 0.196 0.197
economico
Estratosocio
Medio Alto 72720 0.201 0.202 0.199 0.197 0.196 0.197 0.202 0.198 0.199 0.195 0.204 0.197 0.202 0.202 0.202
economico
Estratosocio
Medio 72683 0.198 0.201 0.199 0.201 0.197 0.199 0.197 0.196 0.202 0.209 0.193 0.197 0.205 0.197 0.2
economico
Estratosocio
ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
economico
Idioma Castellano 300831 0.988 0.849 0.895 0.904 0.874 0.822 0.971 0.651 0.91 0.941 0.569 0.936 0.216 0.875 0.668
Idioma Quechua 52544 0.004 0.117 0.085 0.078 0.101 0.144 0.02 0.288 0.062 0.047 0.372 0.049 0.673 0.103 0.289
Idioma Aymar 7782 0.006 0.013 0.011 0.015 0.018 0.021 0.007 0.038 0.014 0.011 0.047 0.007 0.095 0.016 0.033
Otra lengua
Idioma 1899 0 0.014 0.004 0.002 0.002 0.009 0 0.016 0.002 0 0.008 0.002 0.011 0.002 0.004
nativa
Idioma Ashninka 787 0 0.006 0.002 0.001 0.001 0.004 0 0.006 0.001 0 0.003 0.001 0.005 0.001 0.002
APENDICE 1: PERFILES DE LOS CLUSTERES
LOS MAS LOS MENOS
Poblacin
Variables Estados TRABAJAD Clster 2 Clster 3 Clster 5 Clster 4 Clster 6 Clster 7 Clster 9 Clster 8 Clster 10 TRABAJADO Clster 12 Clster 11 Clster 13 Clster 15
(Todo)
ORES RES
Idioma
Idioma 427 0.002 0 0 0 0.003 0 0.001 0 0.004 0.002 0 0.002 0 0.002 0.002
extranjera
Es
Idioma 408 0 0 0.001 0 0.001 0 0 0 0.007 0 0.001 0.004 0 0.001 0.002
sordomudo
Idioma ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Nivel
Secundaria 125107 0.306 0.54 0.503 0.379 0.231 0.522 0.337 0.24 0.359 0.37 0.046 0.25 0.294 0.367 0.125
Estudio
Nivel
Primaria 87623 0.109 0.24 0.088 0.093 0.441 0.261 0.023 0.562 0.123 0.232 0.464 0.081 0.5 0.221 0.378
Estudio
Superior
Nivel
Univ. 38901 0.254 0.025 0 0.118 0.116 0.018 0.233 0.007 0.212 0.168 0.006 0.224 0.028 0.138 0.036
Estudio
completa
Superior No
Nivel
Univ. 33345 0.157 0.065 0.013 0.148 0.046 0.052 0.239 0.016 0.121 0.132 0.007 0.184 0.037 0.121 0.026
Estudio
completa
Nivel
Sin Nivel 29265 0.005 0.026 0.014 0.007 0.117 0.032 0.002 0.151 0.046 0.003 0.469 0.029 0.099 0.048 0.416
Estudio
Superior No
Nivel
Univ. 26070 0.082 0.067 0.184 0.113 0.021 0.077 0.098 0.016 0.069 0.05 0.006 0.113 0.027 0.06 0.01
Estudio
incompleta
Superior
Nivel
Univ. 24010 0.087 0.036 0.197 0.141 0.028 0.036 0.069 0.005 0.07 0.045 0.002 0.117 0.015 0.044 0.009
Estudio
incompleta
Nivel Educacin
357 0 0.002 0.001 0.001 0 0.002 0 0.003 0.001 0 0 0.002 0.001 0.001 0
Estudio Inicial
Nivel
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Estudio
PARENTESC
Jefe 140380 0.777 0.714 0.039 0.103 0.81 0.103 0.128 0.133 0.258 0.133 0.14 0.025 0.918 0.624 0.649
O
PARENTESC
Esposo(a) 86021 0.044 0.079 0 0 0.03 0.581 0.678 0.813 0 0.822 0.812 0 0.039 0 0
O
PARENTESC
Hijo(a) 77759 0.055 0.056 0.685 0.639 0.005 0.125 0.109 0.018 0.472 0.009 0.001 0.704 0.006 0.194 0.001
O
PARENTESC Otro(a)
24805 0.025 0.038 0.145 0.138 0.058 0.046 0.018 0.018 0.163 0.014 0.015 0.147 0.014 0.105 0.075
O pariente
PARENTESC
Yerno/nuera 9082 0.054 0.074 0 0 0 0.115 0.05 0.011 0 0.004 0 0 0.003 0.004 0.001
O
APENDICE 1: PERFILES DE LOS CLUSTERES
LOS MAS LOS MENOS
Poblacin
Variables Estados TRABAJAD Clster 2 Clster 3 Clster 5 Clster 4 Clster 6 Clster 7 Clster 9 Clster 8 Clster 10 TRABAJADO Clster 12 Clster 11 Clster 13 Clster 15
(Todo)
ORES RES
PARENTESC Padre/suegr
7200 0 0 0 0 0.071 0 0 0 0.001 0.01 0.031 0 0.002 0.008 0.252
O os
PARENTESC
Otro 7154 0.008 0.013 0.035 0.045 0.013 0.013 0.007 0.003 0.051 0.002 0.001 0.051 0.006 0.037 0.01
O
PARENTESC
#NULL! 6551 0.034 0.022 0.022 0.041 0.011 0.006 0.007 0.004 0.042 0.006 0 0.018 0.012 0.014 0.01
O
PARENTESC
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
O
SEGURO No 335299 0.977 0.917 0.936 0.961 0.946 0.829 0.969 0.797 0.966 0.976 0.854 0.952 0.811 0.925 0.907
SEGURO Si 29379 0.023 0.083 0.064 0.039 0.054 0.171 0.031 0.203 0.034 0.024 0.146 0.048 0.189 0.075 0.093
SEGURO ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SEXO Mujer 186229 0 0 0.447 0.137 0.033 1 1 1 0.134 1 1 0.999 0.001 1 1
SEXO Hombre 178449 1 1 0.553 0.863 0.967 0 0 0 0.866 0 0 0.001 0.999 0 0
SEXO ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
TIENE DNI si 352783 1 0.973 0.897 0.986 0.963 0.95 1 0.974 0.962 1 0.973 0.978 1 0.985 0.862
TIENE DNI no 11895 0 0.027 0.103 0.014 0.037 0.05 0 0.026 0.038 0 0.027 0.022 0 0.015 0.138
TIENE DNI ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
TOTALDEHIJ
0 209217 1 1 0.996 0.999 1 0.106 0.062 0.009 1 0.015 0.022 0.173 1 0 0.027
OS
TOTALDEHIJ
2 32788 0 0 0 0 0 0.287 0.451 0.12 0 0.219 0.033 0.03 0 0.294 0.077
OS
TOTALDEHIJ
1 31991 0 0 0.004 0 0 0.461 0.275 0.035 0 0.06 0.024 0.251 0 0.28 0.058
OS
TOTALDEHIJ
3 24061 0 0 0 0 0 0.094 0.196 0.239 0 0.279 0.05 0.002 0 0.19 0.107
OS
TOTALDEHIJ
4 15756 0 0 0 0 0 0.016 0.012 0.256 0 0.206 0.075 0.001 0 0.103 0.121
OS
TOTALDEHIJ
99 13334 0 0 0.001 0.001 0 0.034 0.003 0 0 0 0 0.543 0 0.069 0.027
OS
TOTALDEHIJ
5 10782 0 0 0 0 0 0 0 0.168 0 0.117 0.112 0 0 0.035 0.124
OS
TOTALDEHIJ
6 8034 0 0 0 0 0 0 0 0.096 0 0.067 0.129 0 0 0.018 0.112
OS
TOTALDEHIJ
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
OS
Trabaja 0 189947 0.218 0.27 0.637 0.392 0.56 0.756 0.56 0.762 0.31 0.679 0.842 0.463 0.404 0.505 0.831
Trabaja 1 174731 0.782 0.73 0.363 0.608 0.44 0.244 0.44 0.238 0.69 0.321 0.158 0.537 0.596 0.495 0.169
Trabaja ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
APENDICE 2: PERFILES DEL ATRIBUTO TRABAJA
Poblacin
Atributos Estados 0 1 ausente
(Todo)
Tamao 364678 189947 174731 0
Estado Civil Casado(a) 124363 0.351 0.331 0
Estado Civil Conviviente 104945 0.28 0.296 0
Estado Civil Soltero(a) 101108 0.259 0.298 0
Estado Civil Viudo(a) 17010 0.069 0.022 0
Estado Civil Separado(a) 14907 0.036 0.046 0
Estado Civil Divorciado(a) 2345 0.006 0.007 0
Estado Civil Ausente 0 0 0 0
TIENE DNI si 352783 0.956 0.98 0
TIENE DNI no 11895 0.044 0.02 0
TIENE DNI Ausente 0 0 0 0
Idioma Castellano 300831 0.797 0.855 0
Idioma Quechua 52544 0.168 0.118 0
Idioma Aymar 7782 0.023 0.02 0
Idioma Otra lengua nativa 1899 0.007 0.004 0
Idioma Ashninka 787 0.002 0.002 0
Idioma Idioma extranjera 427 0.001 0.001 0
Idioma Es sordomudo 408 0.002 0.001 0
Idioma Ausente 0 0 0 0
SEGURO No 335299 0.9 0.941 0
SEGURO Si 29379 0.1 0.059 0
SEGURO Ausente 0 0 0 0
Nivel Estudio Secundaria 125107 0.323 0.365 0
Nivel Estudio Primaria 87623 0.288 0.189 0
Nivel Estudio Superior Univ. completa 38901 0.066 0.15 0
Nivel Estudio Superior No Univ. completa 33345 0.067 0.118 0
Nivel Estudio Sin Nivel 29265 0.119 0.039 0
Nivel Estudio Superior No Univ. incompleta 26070 0.067 0.076 0
Nivel Estudio Superior Univ. incompleta 24010 0.069 0.062 0
Nivel Estudio Educacin Inicial 357 0.001 0.001 0
Nivel Estudio ... ... ... ... ...
PARENTESCO Jefe 140380 0.309 0.468 0
PARENTESCO Esposo(a) 86021 0.321 0.143 0
PARENTESCO Hijo(a) 77759 0.208 0.219 0
PARENTESCO Otro(a) pariente 24805 0.066 0.07 0
PARENTESCO Yerno/nuera 9082 0.022 0.028 0
PARENTESCO Padre/suegros 7200 0.032 0.006 0
PARENTESCO Otro 7154 0.014 0.026 0
PARENTESCO #NULL! 6551 0.014 0.022 0
PARENTESCO ... ... ... ... ...
TOTALDEHIJOS 0 209217 0.443 0.716 0
TOTALDEHIJOS 2 32788 0.112 0.066 0
TOTALDEHIJOS 1 31991 0.104 0.07 0
TOTALDEHIJOS 3 24061 0.086 0.044 0
TOTALDEHIJOS 4 15756 0.06 0.025 0
TOTALDEHIJOS 99 13334 0.035 0.038 0
TOTALDEHIJOS 5 10782 0.043 0.015 0
APENDICE 2: PERFILES DEL ATRIBUTO TRABAJA
Poblacin
Atributos Estados 0 1 ausente
(Todo)
TOTALDEHIJOS 6 8034 0.033 0.01 0
TOTALDEHIJOS ... ... ... ... ...
SEXO Mujer 186229 0.656 0.353 0
SEXO Hombre 178449 0.344 0.647 0
SEXO Ausente 0 0 0 0