Está en la página 1de 39

Universidad Nacional

Federico Villarreal

Profesionales formando profesionales

EUPG
ESCUELA UNIVERSITARIADE

POSTGRADO
MAESTRIA EN INGENIERIA DE SISTEMAS
MENCIN: INTELIGENCIA EN PROCESOS EMPRESARIALES
BALANCED SCORECARD Y DATA MINING
TEMA: BUSINESS ANALYTICS
Docente:

Dr. Javier Gamboa Cruzado


Alumno:
Prado Garca, Horacio Jess
Moreno Pea Juan Carlos A.
Risco Guevara Allen William
Lozano Zelada Winston
INDICE
INTRODUCCIN ............................................................................................................................. 3
CAPTULO I: GENERALIDADES ....................................................................................................... 4
Objetivos del Trabajo de Aplicacin .......................................................................................... 4
Integrantes: ............................................................................................................................... 4
CAPTULO II: DESCRIPTIVE ANALYTICS .......................................................................................... 5
Fase 1: Entendimiento del Negocio .......................................................................................... 5
a) Descripcin de la Empresa Diversificada....................................................................... 5
b) Organigrama Actual....................................................................................................... 5
c) Cartera de Negocios ...................................................................................................... 6
d) Identificacin del Proceso Crtico .................................................................................. 6
e) Flujograma del Proceso ................................................................................................. 6
f) Objetivos de Business Analytics .................................................................................... 6
Fase 2: Entendimiento de los Datos .......................................................................................... 6
a) Recopilacin inicial de datos: OLTP y Data Mart........................................................... 6
b) Descripcin de los datos: Tablas y Vistas ...................................................................... 7
Fase 3: Preparacin de los Datos .............................................................................................. 8
a) Seleccin y Limpieza de los datos. ................................................................................ 8
Fase 4: Modelamiento............................................................................................................... 8
a) Seleccin de la tcnica de modelado. ........................................................................... 8
b) Construccin de los modelos Descriptivos.................................................................... 9
c) Evaluacin del modelo. ............................................................................................... 13
Fase 5: Evaluacin del Modelo ................................................................................................ 15
a) Evaluacin de resultados............................................................................................. 15
CAPTULO III: PREDICTIVE ANALYTICS ......................................................................................... 23
Fase 4: Modelamiento............................................................................................................. 23
a) Seleccin de la tcnica de modelado. ......................................................................... 23
b) Construccin de los modelos Predictivos.................................................................... 25
c) Evaluacin de los modelos. ......................................................................................... 27
Fase 5: Evaluacin del Modelo ................................................................................................ 28

Pgina 1
a) Evaluacin de resultados............................................................................................. 28
Fase 6: Utilizacin del Modelo ................................................................................................ 29
a) Planificacin de despliegue. ........................................................................................ 29
CONCLUSIONES ........................................................................................................................... 32
RECOMENDACIONES ................................................................................................................... 33
BIBLIOGRAFA .............................................................................................................................. 34
APNDICES 1................................................................................................................................ 35
APNDICES 2................................................................................................................................ 38

Pgina 2
INTRODUCCIN

El propsito de este trabajo es proporcionar un prototipo de modelo de prediccin de las


personas que trabajan con una muestra de personas mayores de 18 aos a mas que se
obtuvo del Censo de Poblacin de Viviendas 2007 (CPV 2007) empleando la minera de
datos. Especficamente se plantea el uso de la tcnica de modelos y prediccin
provenientes de un modelo de minera de Datos como puede ser un rbol de Decisin,
Clusteres, Bayes, con el cual se logra predecir si las personas mayores de 18 aos a
mas trabajan en los departamentos del Per con el fin de ayudar a identificar y evaluar
al Gobierno en que departamentos hay ms probabilidad de tener ms PEAS y con los
resultados obtenidos apoyar a los entes del estado en la toma de decisiones.

El modelo de prediccin propuesto integra tcnicas de aprendizaje y de mquinas tales


como rbol de decisin y agrupamiento. De igual forma se desarroll un prototipo de
herramienta de software con fines acadmicos basado en el modelo propuesto. El
prototipo de herramienta construido sirve como base para futuras investigaciones y
desarrollos en el Per, ya que permite la integracin de nuevas tcnicas de aprendizaje
de manera sencilla. La implementacin del modelo de minera de datos se trabaj con
SQL SERVER 2014 y Microsoft Visual Studio 2014, cabe indicar que tambin se usa en
la actualidad el Software libre de minera de datos de R.

Pgina 3
CAPTULO I: GENERALIDADES

Objetivos del Trabajo de Aplicacin


Identificar las variables para la generacin de perfiles de la poblacin.
Identificar los perfiles de la poblacin econmicamente activa, en base al censo
realizado el ao 2007 por el INEI.
Predecir la poblacin que pasa a la PEA.

Integrantes:

Apellidos y Nombres Correo Celular


Moreno Pea Juan Carlos A. jca_28@hotmail.com *0089355/952228535
#989100855/RPC
Risco Guevara Allen William allenestad@gmail.com 956747318
Prado Garca Horacio Jess hpradog@uni.pe 988804701
Lozano Zelada Winston winstonlz23@gmail.com #951971923

Pgina 4
CAPTULO II: DESCRIPTIVE ANALYTICS

Fase 1: Entendimiento del Negocio

a) Descripcin de la Empresa Diversificada


El Instituto Nacional de Estadstica e Informtica (INEI), es un
organismo constitucional autnomo del Per. Se encarga de dirigir los
sistemas nacionales de estadstica y tambin de informtica del pas. Es
tambin encargado de los censos de poblacin, de vivienda, de empresas,
agrarios, universitarios, etc.

b) Organigrama Actual

Pgina 5
c) Cartera de Negocios
i. CENTRO DE INFORMACIN
a. Atencin Telefnica
b. Atencin Virtual
c. Atencin Presencial
ii. BIBLIOTECA INSTITUCIONAL
a. Lectura en Sala
b. Servicio de Referencia
c. Servicio de Fotocopiado
d. Mdulos computarizados

d) Identificacin del Proceso Crtico


La gestin de conocimiento, para la brindar soporte en la toma de decisin
del estado.

e) Flujograma del Proceso

f) Objetivos de Business Analytics


Predecir la poblacin de 18 aos a mas que se incorpora a la poblacin
econmicamente activa, en base a la informacin adquirida en el censo
nacional de vivienda 2007.

Fase 2: Entendimiento de los Datos

a) Recopilacin inicial de datos: OLTP y Data Mart


La informacin se obtuvo del censo de poblacin y vivienda CPV 2007,
para lo cual se extrajo una tabla con las variables de inters para realizar

Pgina 6
los perfiles del presente trabajo, en vista de que el acceso al Data
Warehouse es restringido.

b) Descripcin de los datos: Tablas y Vistas


Se cuenta con dos tablas con la informacin requerida, como se muestra a
continuacin.

PREDICCION_FINAL BD_CENSO_MAYORES_18
IDEPERS1 IDEPERS
NOMBRE UBIGEO
APELLIDO DEPARTAMENTO_
CORREO PROVINCIA_
[FECHA NACIMIENTO] DISTRITO_
UBIGEO AREA
DEPARTAMENTO ZONA
PROVINCIA SECCION
DISTRITO AEU
PAIS AERINI
AREA AERFIN
ZONA VIV
SECCION VHOGAR
AEU DEHOGAR
AERINI MANZANA
AERFIN MANZANAALF
VIV FRENTE
VHOGAR PNUM
DEHOGAR _PARENTESCO
MANZANA _SEXO
MANZANAALF _EDAD
FRENTE PARTIDADENACIMIENTO
PNUM _SEGURO
PARENTESCO _Idioma
SEXO _NivelEstudio
PARTIDADENACIMIENTO Religion
SEGURO _EstadoCivil
Idioma _TOTALDEHIJOS
NivelEstudio [_TIENE DNI]
Religion estratopoblacional
EstadoCivil _estratosocioeconomico
TOTALDEHIJOS trabaja
DNI
estratopoblacional
estratosocioeconomico
aasd

La tabla BD_CENSO_MAYORES_18 muestra la informacin con la


cual se va a generar los modelos para la prediccin.
La tabla PREDICCION FINAL es sobre la cual se va a predecir que
personas trabajan.

Pgina 7
Fase 3: Preparacin de los Datos

a) Seleccin y Limpieza de los datos.


Se verific que la informacin adquirida, descubriendo, corrigiendo y
eliminando de registros de datos errneos de la tabla.

Fase 4: Modelamiento

a) Seleccin de la tcnica de modelado.


En el presente trabajo se han seleccionado los siguientes modelos:

i. rbol de Decisiones.- es un modelo de prediccin utilizado en


diversos mbitos que van desde la inteligencia artificial hasta la
Economa. Dado un conjunto de datos se fabrican diagramas de
construcciones lgicas, muy similares a los sistemas de prediccin
basados en reglas, que sirven para representar y categorizar una
serie de condiciones que ocurren de forma sucesiva, para la
resolucin de un problema.
Parmetros:

ii. Clster.- Es un procedimiento de agrupacin de una serie de


vectores segn criterios habitualmente de distancia; se tratar de
disponer los vectores de entrada de forma que estn ms cercanos
aquellos que tengan caractersticas comunes.
Parmetros:

Pgina 8
iii. Bayes Naives.- Es un clasificador probabilstico fundamentado en el
teorema de Bayes y algunas hiptesis simplificadoras adicionales.
Es a causa de estas simplificaciones, que se suelen resumir en la
hiptesis de independencia entre las variables productoras.
Parmetros:

b) Construccin de los modelos Descriptivos.


Para la construccin de los modelos se seleccionaron las siguientes
variables:

i. Estructura para la minera de datos.


a. Se seleccionan las variables:
Clave: IDEPERS
Entrada: edad, estado civil, estrato socioeconmico, idioma, nivel
estudio, parentesco, seguro, sexo, tiene DNI y total de hijos.
Prediccin: trabaja.

Pgina 9
b. Asignacion de Tipo de Contenido y Tipo de datos:

Pgina 10
ii. Parametros segn los modelos:
a) rbol de Decisiones

b) Clster.- Se ha modificado la cantidad de clsteres a 15.

c) Bayes Naives

Pgina 11
iii. Conjunto de pruebas: El aprendizaje del modelo se realizara en el
70 % de la tabla BD_CENSO_MAYORES_18, asimismo en el 30 %
restante se realizaran las pruebas del modelo aprendido dado que
no se ha restringido el nmero mximo de los casos de prueba.

La semilla (HoldoutSeed) para evaluacin de los modelos


seleccionada es 12.

Pgina 12
c) Evaluacin del modelo.
d) rbol de Decisiones

Pgina 13
e) Clster

f) Bayes Naives

Pgina 14
Fase 5: Evaluacin del Modelo

a) Evaluacin de resultados.
I. rbol de decisiones
Se han creado hasta 8 niveles de las ramificaciones del rbol

La leyenda de minera de datos al seleccionar uno de las hojas


del rbol de decisiones nos muestra el nmero de escenarios
de las personas que trabajan (1) para las cuales hay un
85.51% y de las que no trabajan (0) tiene una probabilidad
14.49% lo cual tambin se ve reflejado en el diagrama,
asimismo tambin se visualiza la regla de decisin para dicha
hoja: SEXO = 'Hombre' and EDAD >= 42 and < 50 and Nivel
Estudio = 'Superior Univ. completa' and TIENE DNI = 'si'

Tambin se puede visualizar los datos que han sido considerados en


la rama.

Pgina 15
El software tambin nos muestra las redes de dependencia,
donde se aprecia que la variable de entrada que ms
influyente es el sexo.

Asimismo, la variable menos influyente es Tiene DNI.

II. Clster
Se han creado 15 clusteres para la evaluacin del modelo:

Pgina 16
El cluster con mayor probabilidad de que la persona trabaje es el
Cluster 1 (LOS MAS TRABAJADORES) con una probabilidad del 78%
y los que menos trabajan se encuentran en el Cluster 14 (LOS
MENOS TRABAJADORES) donde la probabilidad de que trabajen es
de solo el 14%

En el perfil de los cluster se muestran las caractersticas de cada


variable que se muestra en cada cluster y el tamao de la muestra,
para la variable continua edad no muestra la media y la desviacin
estndar, en el caso de las variable discretas se muestra el
porcentaje de la muestra segn los estados de cada variable.(Ver el
Apndice 1)

Pgina 17
Perfil de los que ms trabajan

Perfil de los que menos trabajan

Pgina 18
Distincin para LOS MAS TRABAJADORES y LOS MENOS
TRABAJADORES.

III. Bayes Naives


La variable de entrada TOTAL DE HIJOS tiene la mayor vinculacin
con la variable de salida Trabaja.

Pgina 19
Y caso contrario se establece que la variable con menos vinculacin
es TIENE DNI.

El perfil de atributos nos muestra nos muestra el tamao de los que


trabajan (1) y los que no trabajan (0), asimismo nos muestra la
distribucin de probabilidades de los estados de cada variable para
los que trabajan y los que no trabajan. (Ver Apndice 2)

Pgina 20
Los que trabajan

Los que no trabajan

Pgina 21
Distincin entre los que trabajan (1) y los que no trabajan (0)

Pgina 22
CAPTULO III: PREDICTIVE ANALYTICS

Fase 4: Modelamiento

a) Seleccin de la tcnica de modelado.


Para la seleccin se toma como valor de prediccin =1 los que trabajan.

Del anlisis del grafico de elevacin, seleccionamos el modelo del rbol


el cual cuenta con la mayor puntuacin de 0.84 en comparacin del
cluster (0.83) y Bayes Naives (0.81).

Pgina 23
En la matriz de clasificacin se aprecia la distribucin de casos que
trabajan y no trabajan (real) contra los que trabajan y no trabajan
segn el modelo. Por ejemplo 56,413 son los que no trabajan y que de
la aplicacin del modelo tampoco trabajan.

Pgina 24
b) Construccin de los modelos Predictivos.
En este punto seleccionamos el modelo con mayor puntuacin (Arbol).

Como tabla de entrada sobre la cual se va a predecir si las personas


trabajan, seleccionamos la tabla PREDICCION_FINAL.

Pgina 25
Luego Seleccionamos las conexiones entre las variables de nuestro
modelo y las variable de la tabla de prediccin.

Por ultimo seleccionamos los campos de salida, los cuales se van


mostrar en la tabla de resultados.

Pgina 26
c) Evaluacin de los modelos.
Los Resultado de la predicion delas personas que trabajan se muestran
en la tabla de resultados.

Modelo Arbol de desicin:

Modelo Cluster:

Pgina 27
Modelo Buyes Naives:

Fase 5: Evaluacin del Modelo

a) Evaluacin de resultados.
Del tabla de Prediccin se puede observar, se elabor el histograma de
distribucin del nmero de casos segn las probabilidad, de lo cual se
aprecia que el valor mnimo de 0.5 es a partir del cual el modelo del rbol de
decisin considera como personas que trabajan. El total de personas que
trabajan es de 8,880.

Distribucion Numero de Casos de las personas


que trabajan segun la prediccin.
3818
4000
3500
3000
2285
2500 2129

2000
1500
1000 647

500 1
0
[0.5;0.6> [0.6;0.7> [0.7;0.8> [0.8;0.9> [0.9;1>

Pgina 28
Fase 6: Utilizacin del Modelo

El presente trabajo en el cual se aplic la herramienta de minera de


datos, realizando los modelos y realizando la prediccin de las
personas que trabajan tomando como histrico el Censo de Poblacin
y Vivienda, nos va a servir para poder predecir en encuestas y registro
de viviendas la ms alta probabilidad de personas que trabajan en el
Per.

a) Planificacin de despliegue.
Para la visualizacin de la distribucin de las personas que trabajan en
el mapa del Per se ha empleado el software Power Map.

Para lo cual se selecciona la tabla y se inicializa el Power Map

El programa Power Map configuramos la entrada de las provincias y el


pas.

Pgina 29
Seguidamente configuramos la visualizacin de las personas que
trabajan.

Grfico de barras.

Grafico de Calor

Pgina 30
Asimismo el programa nos permite la creacin de un video, el mismo
que se adjunta en el medio magntico.

Pgina 31
CONCLUSIONES

Con este tipo de anlisis se pueden armar estrategias para conocer


mejor la situacin actual de la empresa.
Se puede pronosticar cual ser la PEA y de acuerdo a ello establecer
cul es la edad ms crtica en la que se debe incentivar el crecimiento
de puestos de trabajo, otro caso sera ver segn la cantidad de hijos
tienen probabilidad de encontrar un puesto de trabajo y los expertos
en el caso dar una solucin si existiera un problema.
Power Map, este complemento de Microsoft cuenta con potentes
caractersticas grficas en 3D que permite la representacin de datos
georeferenciados en presentaciones visualmente atractivas para los
usuarios.
Realizar un analices de datos nos permitir como parte del INEI ser un
gran frente de apoyo en las decisiones que tomara el Estado Peruano.

Pgina 32
RECOMENDACIONES

Para el anlisis de los datos se recomienda tener una data histrica de


la cual vamos a predecir, a ms cantidad de datos la prediccin de los
datos ser ms ptima.
Se recomienda utilizar la versin completa de SQL SERVER, para evitar
problemas en la implementacin del proyecto de BA.
El conjunto de datos debe contener al menos un atributo de "resultado"
que pueda usar para aprendizaje y prediccin.
Se recomienda definir con cuidado las variables de ubicacin para
georeferenciar en el Power Map.
Se recomienda tener equipos de gran capacidad para poder manejar
los grandes volmenes de informacin que se manejan en la actualidad.

Pgina 33
APENDICE 1: PERFILES DE LOS CLUSTERES
LOS MAS LOS MENOS
Poblacin
Variables Estados TRABAJAD Clster 2 Clster 3 Clster 5 Clster 4 Clster 6 Clster 7 Clster 9 Clster 8 Clster 10 TRABAJADO Clster 12 Clster 11 Clster 13 Clster 15
(Todo)
ORES RES

Tamao 364678 37166 35301 33049 28447 27620 25644 23623 22709 20506 20220 19243 19123 18471 17715 15841
EDAD Promedio 39.76 42.38 32.2 19.46 24.54 65.57 24.67 34.93 37.15 37.46 52.38 58.58 28.07 48.51 42.99 68.35
EDAD Desviacin 16.7 9.26 7.56 1.29 2.83 11.52 3.95 5.6 5.79 8.8 8.84 11.54 6.07 13.17 11.24 13.16
Estado Civil Casado(a) 124363 0.781 0.045 0 0.003 0.56 0.134 0.619 0.425 0.024 0.869 0.791 0.035 0.738 0.105 0.07
Estado Civil Conviviente 104945 0.216 0.951 0.015 0.104 0.159 0.845 0.38 0.575 0.01 0.131 0.209 0.023 0.21 0.09 0.051
Estado Civil Soltero(a) 101108 0 0.002 0.984 0.891 0.094 0 0 0 0.819 0 0 0.882 0.004 0.317 0.059
Estado Civil Viudo(a) 17010 0 0 0 0 0.132 0 0 0 0.008 0 0 0.002 0.023 0.067 0.686
Estado Civil Separado(a) 14907 0.001 0.002 0.001 0.002 0.042 0.021 0.001 0 0.118 0 0 0.055 0.021 0.371 0.11
Divorciado(a
Estado Civil 2345 0.001 0 0 0 0.012 0 0 0 0.021 0 0 0.002 0.004 0.051 0.022
)
Estado Civil ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Estratosocio
Bajo 73401 0.201 0.203 0.204 0.202 0.197 0.204 0.201 0.203 0.199 0.197 0.201 0.202 0.195 0.207 0.201
economico

Estratosocio
Medio Bajo 73042 0.201 0.195 0.201 0.196 0.202 0.203 0.2 0.2 0.207 0.198 0.204 0.205 0.198 0.198 0.2
economico

Estratosocio
Alto 72832 0.2 0.2 0.198 0.204 0.208 0.197 0.199 0.203 0.193 0.2 0.198 0.199 0.201 0.196 0.197
economico

Estratosocio
Medio Alto 72720 0.201 0.202 0.199 0.197 0.196 0.197 0.202 0.198 0.199 0.195 0.204 0.197 0.202 0.202 0.202
economico

Estratosocio
Medio 72683 0.198 0.201 0.199 0.201 0.197 0.199 0.197 0.196 0.202 0.209 0.193 0.197 0.205 0.197 0.2
economico

Estratosocio
ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
economico
Idioma Castellano 300831 0.988 0.849 0.895 0.904 0.874 0.822 0.971 0.651 0.91 0.941 0.569 0.936 0.216 0.875 0.668
Idioma Quechua 52544 0.004 0.117 0.085 0.078 0.101 0.144 0.02 0.288 0.062 0.047 0.372 0.049 0.673 0.103 0.289
Idioma Aymar 7782 0.006 0.013 0.011 0.015 0.018 0.021 0.007 0.038 0.014 0.011 0.047 0.007 0.095 0.016 0.033
Otra lengua
Idioma 1899 0 0.014 0.004 0.002 0.002 0.009 0 0.016 0.002 0 0.008 0.002 0.011 0.002 0.004
nativa
Idioma Ashninka 787 0 0.006 0.002 0.001 0.001 0.004 0 0.006 0.001 0 0.003 0.001 0.005 0.001 0.002
APENDICE 1: PERFILES DE LOS CLUSTERES
LOS MAS LOS MENOS
Poblacin
Variables Estados TRABAJAD Clster 2 Clster 3 Clster 5 Clster 4 Clster 6 Clster 7 Clster 9 Clster 8 Clster 10 TRABAJADO Clster 12 Clster 11 Clster 13 Clster 15
(Todo)
ORES RES

Idioma
Idioma 427 0.002 0 0 0 0.003 0 0.001 0 0.004 0.002 0 0.002 0 0.002 0.002
extranjera
Es
Idioma 408 0 0 0.001 0 0.001 0 0 0 0.007 0 0.001 0.004 0 0.001 0.002
sordomudo
Idioma ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Nivel
Secundaria 125107 0.306 0.54 0.503 0.379 0.231 0.522 0.337 0.24 0.359 0.37 0.046 0.25 0.294 0.367 0.125
Estudio
Nivel
Primaria 87623 0.109 0.24 0.088 0.093 0.441 0.261 0.023 0.562 0.123 0.232 0.464 0.081 0.5 0.221 0.378
Estudio
Superior
Nivel
Univ. 38901 0.254 0.025 0 0.118 0.116 0.018 0.233 0.007 0.212 0.168 0.006 0.224 0.028 0.138 0.036
Estudio
completa
Superior No
Nivel
Univ. 33345 0.157 0.065 0.013 0.148 0.046 0.052 0.239 0.016 0.121 0.132 0.007 0.184 0.037 0.121 0.026
Estudio
completa
Nivel
Sin Nivel 29265 0.005 0.026 0.014 0.007 0.117 0.032 0.002 0.151 0.046 0.003 0.469 0.029 0.099 0.048 0.416
Estudio
Superior No
Nivel
Univ. 26070 0.082 0.067 0.184 0.113 0.021 0.077 0.098 0.016 0.069 0.05 0.006 0.113 0.027 0.06 0.01
Estudio
incompleta
Superior
Nivel
Univ. 24010 0.087 0.036 0.197 0.141 0.028 0.036 0.069 0.005 0.07 0.045 0.002 0.117 0.015 0.044 0.009
Estudio
incompleta
Nivel Educacin
357 0 0.002 0.001 0.001 0 0.002 0 0.003 0.001 0 0 0.002 0.001 0.001 0
Estudio Inicial
Nivel
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Estudio
PARENTESC
Jefe 140380 0.777 0.714 0.039 0.103 0.81 0.103 0.128 0.133 0.258 0.133 0.14 0.025 0.918 0.624 0.649
O
PARENTESC
Esposo(a) 86021 0.044 0.079 0 0 0.03 0.581 0.678 0.813 0 0.822 0.812 0 0.039 0 0
O
PARENTESC
Hijo(a) 77759 0.055 0.056 0.685 0.639 0.005 0.125 0.109 0.018 0.472 0.009 0.001 0.704 0.006 0.194 0.001
O
PARENTESC Otro(a)
24805 0.025 0.038 0.145 0.138 0.058 0.046 0.018 0.018 0.163 0.014 0.015 0.147 0.014 0.105 0.075
O pariente
PARENTESC
Yerno/nuera 9082 0.054 0.074 0 0 0 0.115 0.05 0.011 0 0.004 0 0 0.003 0.004 0.001
O
APENDICE 1: PERFILES DE LOS CLUSTERES
LOS MAS LOS MENOS
Poblacin
Variables Estados TRABAJAD Clster 2 Clster 3 Clster 5 Clster 4 Clster 6 Clster 7 Clster 9 Clster 8 Clster 10 TRABAJADO Clster 12 Clster 11 Clster 13 Clster 15
(Todo)
ORES RES

PARENTESC Padre/suegr
7200 0 0 0 0 0.071 0 0 0 0.001 0.01 0.031 0 0.002 0.008 0.252
O os
PARENTESC
Otro 7154 0.008 0.013 0.035 0.045 0.013 0.013 0.007 0.003 0.051 0.002 0.001 0.051 0.006 0.037 0.01
O
PARENTESC
#NULL! 6551 0.034 0.022 0.022 0.041 0.011 0.006 0.007 0.004 0.042 0.006 0 0.018 0.012 0.014 0.01
O
PARENTESC
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
O
SEGURO No 335299 0.977 0.917 0.936 0.961 0.946 0.829 0.969 0.797 0.966 0.976 0.854 0.952 0.811 0.925 0.907
SEGURO Si 29379 0.023 0.083 0.064 0.039 0.054 0.171 0.031 0.203 0.034 0.024 0.146 0.048 0.189 0.075 0.093
SEGURO ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SEXO Mujer 186229 0 0 0.447 0.137 0.033 1 1 1 0.134 1 1 0.999 0.001 1 1
SEXO Hombre 178449 1 1 0.553 0.863 0.967 0 0 0 0.866 0 0 0.001 0.999 0 0
SEXO ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
TIENE DNI si 352783 1 0.973 0.897 0.986 0.963 0.95 1 0.974 0.962 1 0.973 0.978 1 0.985 0.862
TIENE DNI no 11895 0 0.027 0.103 0.014 0.037 0.05 0 0.026 0.038 0 0.027 0.022 0 0.015 0.138
TIENE DNI ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
TOTALDEHIJ
0 209217 1 1 0.996 0.999 1 0.106 0.062 0.009 1 0.015 0.022 0.173 1 0 0.027
OS
TOTALDEHIJ
2 32788 0 0 0 0 0 0.287 0.451 0.12 0 0.219 0.033 0.03 0 0.294 0.077
OS
TOTALDEHIJ
1 31991 0 0 0.004 0 0 0.461 0.275 0.035 0 0.06 0.024 0.251 0 0.28 0.058
OS
TOTALDEHIJ
3 24061 0 0 0 0 0 0.094 0.196 0.239 0 0.279 0.05 0.002 0 0.19 0.107
OS
TOTALDEHIJ
4 15756 0 0 0 0 0 0.016 0.012 0.256 0 0.206 0.075 0.001 0 0.103 0.121
OS
TOTALDEHIJ
99 13334 0 0 0.001 0.001 0 0.034 0.003 0 0 0 0 0.543 0 0.069 0.027
OS
TOTALDEHIJ
5 10782 0 0 0 0 0 0 0 0.168 0 0.117 0.112 0 0 0.035 0.124
OS
TOTALDEHIJ
6 8034 0 0 0 0 0 0 0 0.096 0 0.067 0.129 0 0 0.018 0.112
OS
TOTALDEHIJ
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
OS
Trabaja 0 189947 0.218 0.27 0.637 0.392 0.56 0.756 0.56 0.762 0.31 0.679 0.842 0.463 0.404 0.505 0.831
Trabaja 1 174731 0.782 0.73 0.363 0.608 0.44 0.244 0.44 0.238 0.69 0.321 0.158 0.537 0.596 0.495 0.169
Trabaja ausente 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
APENDICE 2: PERFILES DEL ATRIBUTO TRABAJA
Poblacin
Atributos Estados 0 1 ausente
(Todo)
Tamao 364678 189947 174731 0
Estado Civil Casado(a) 124363 0.351 0.331 0
Estado Civil Conviviente 104945 0.28 0.296 0
Estado Civil Soltero(a) 101108 0.259 0.298 0
Estado Civil Viudo(a) 17010 0.069 0.022 0
Estado Civil Separado(a) 14907 0.036 0.046 0
Estado Civil Divorciado(a) 2345 0.006 0.007 0
Estado Civil Ausente 0 0 0 0
TIENE DNI si 352783 0.956 0.98 0
TIENE DNI no 11895 0.044 0.02 0
TIENE DNI Ausente 0 0 0 0
Idioma Castellano 300831 0.797 0.855 0
Idioma Quechua 52544 0.168 0.118 0
Idioma Aymar 7782 0.023 0.02 0
Idioma Otra lengua nativa 1899 0.007 0.004 0
Idioma Ashninka 787 0.002 0.002 0
Idioma Idioma extranjera 427 0.001 0.001 0
Idioma Es sordomudo 408 0.002 0.001 0
Idioma Ausente 0 0 0 0
SEGURO No 335299 0.9 0.941 0
SEGURO Si 29379 0.1 0.059 0
SEGURO Ausente 0 0 0 0
Nivel Estudio Secundaria 125107 0.323 0.365 0
Nivel Estudio Primaria 87623 0.288 0.189 0
Nivel Estudio Superior Univ. completa 38901 0.066 0.15 0
Nivel Estudio Superior No Univ. completa 33345 0.067 0.118 0
Nivel Estudio Sin Nivel 29265 0.119 0.039 0
Nivel Estudio Superior No Univ. incompleta 26070 0.067 0.076 0
Nivel Estudio Superior Univ. incompleta 24010 0.069 0.062 0
Nivel Estudio Educacin Inicial 357 0.001 0.001 0
Nivel Estudio ... ... ... ... ...
PARENTESCO Jefe 140380 0.309 0.468 0
PARENTESCO Esposo(a) 86021 0.321 0.143 0
PARENTESCO Hijo(a) 77759 0.208 0.219 0
PARENTESCO Otro(a) pariente 24805 0.066 0.07 0
PARENTESCO Yerno/nuera 9082 0.022 0.028 0
PARENTESCO Padre/suegros 7200 0.032 0.006 0
PARENTESCO Otro 7154 0.014 0.026 0
PARENTESCO #NULL! 6551 0.014 0.022 0
PARENTESCO ... ... ... ... ...
TOTALDEHIJOS 0 209217 0.443 0.716 0
TOTALDEHIJOS 2 32788 0.112 0.066 0
TOTALDEHIJOS 1 31991 0.104 0.07 0
TOTALDEHIJOS 3 24061 0.086 0.044 0
TOTALDEHIJOS 4 15756 0.06 0.025 0
TOTALDEHIJOS 99 13334 0.035 0.038 0
TOTALDEHIJOS 5 10782 0.043 0.015 0
APENDICE 2: PERFILES DEL ATRIBUTO TRABAJA
Poblacin
Atributos Estados 0 1 ausente
(Todo)
TOTALDEHIJOS 6 8034 0.033 0.01 0
TOTALDEHIJOS ... ... ... ... ...
SEXO Mujer 186229 0.656 0.353 0
SEXO Hombre 178449 0.344 0.647 0
SEXO Ausente 0 0 0 0

También podría gustarte